Home Nieuws Deze top 30 AI-agenten bieden een mix van functies en autonomie

Deze top 30 AI-agenten bieden een mix van functies en autonomie

4
0
Deze top 30 AI-agenten bieden een mix van functies en autonomie

Olena Malik/Moment via Getty Images

Volg ZDNET: Voeg ons toe als voorkeursbron op Google.


De belangrijkste conclusies van ZDNET

  • MIT heeft een lijst gepubliceerd met de beste AI-agenten en hun functionaliteiten.
  • Het grootste deel richt zich op de werkprocessen van het bedrijf.
  • Onderzoek en informatiesynthese zijn het meest populaire gebruik.

Welke autonome of semi-autonome agenten hebben tegenwoordig de grootste impact op de wereld (en mogelijk ook op uw werk)? Bepaalde agenten zijn de laatste tijd volop in het nieuws, maar er zijn een aantal functiespecifieke agenten beschikbaar voor ontwikkelaars en gebruikers.

MIT’s CSAIL – het laboratorium van de universiteit dat zich toelegt op AI-onderzoek – wilde de achtergrond en capaciteiten van deze agenten identificeren en documenteren, met zijn bevindingen gedetailleerd in de nieuwste AI Agent Index. De onderzoekers voerden een ecosysteembrede analyse uit van geavanceerde AI-agenten op 1.350 datapunten.

Ook: AI-agenten zijn snel, losjes en onbeheersbaar, zo blijkt uit een MIT-onderzoek

Wat is de functionaliteit en herkomst van leading agents? De onderzoekers ontdekten dat interfaces het meest worden gebruikt, op de voet gevolgd door zakelijke workflowplatforms. Ze brachten ook risico’s aan het licht die door deze agenten werden gedeeld, zoals onderzocht door mijn ZDNET-collega Tiernan Ray.

Agenten in de MIT Index zijn onder meer:

  • Antropische Claude/Claude Codex
  • Google Gemini/Gemini CLI
  • AI-handschoen
  • OpenAI ChatGPT/ChatGPT Agent/Codex/AgentKit
  • Verwarring
  • Alibaba MobileAgent
  • ByteDance-agent TARS
  • De komeet van verwarring
  • IBM Watsonx Orchestrate
  • Microsoft 365 Copiloot
  • SAP Joule Studio
  • Salesforce Agentforce
  • ServiceNow AI-agenten

Dit zijn de drie belangrijkste categorieën middelen die door de onderzoekers zijn geïdentificeerd:

Enterprise-workflowagenten (13 systemen van de 30 gedekte systemen): Dit zijn platforms met agentmogelijkheden voor het automatiseren van zakelijke taken. Voorbeelden hiervan zijn Microsoft 365 Copilot en ServiceNow Agent.

Chatapplicaties met agenttools (12 systemen): Deze categorie omvat volgens de onderzoekers vooral chatinterfaces met uitgebreide toegang tot tools. Voorbeelden hiervan zijn codeermiddelen voor algemene doeleinden, zoals Claude Code, maar ook middelen die zijn ingebed in bredere producten zoals Manus AI en ChatGPT Agent.

Ook: ik liet de AI-agent van Chrome het winkelen, onderzoeken en e-mailen voor mij doen – zo ging het

Browsergebaseerde agenten (5 systemen): Dit zijn agenten waarvan de primaire interface browser- of computergebruik is, met uitgebreide browser/computer-interactietools. “Ze verschillen van chatagenten met webzoekmogelijkheden (ChatGPT-webzoekopdracht, Claude-webzoekopdracht) die voornamelijk gegevens ophalen en samenvatten”, aldus de onderzoekers. “Browsergebaseerde agenten brengen hogere risico’s met zich mee door uitvoering op de achtergrond, gebeurtenistriggers en directe transacties.” Voorbeelden hiervan zijn Perplexity Comet, ChatGPT Atlas, ByteDance Agent TARS.

Wat zijn de meest populaire toepassingen voor AI-agenten?

De belangrijkste gebruiksscenario’s voor AI-agenten die de bovenstaande categorieën doorkruisen, zijn onder meer onderzoek en informatiesynthese, zoals blijkt uit 12 van de 30 behandelde agenten, die zowel consumentenchatassistenten als bedrijfsplatforms omvatten. Vlak achter deze functionaliteit bevindt zich workflowautomatisering voor bedrijfsfuncties – zoals HR, verkoop, ondersteuning en IT – mogelijk gemaakt door 11 agenten, voornamelijk te vinden in bedrijfsproducten. Agenten met een focus op GUI of browserfuncties die worden gebruikt voor taken zoals formulieren, bestellen en boeken zijn aanwezig in zeven van de modellen.

Ook: 6 redenen waarom zelfstandige bedrijven nog steeds meer een visie zijn dan een realiteit

De niveaus van autonomie variëren aanzienlijk, ontdekten de onderzoekers. Chat-first-assistenten behouden het laagste niveau van autonomie. Deze zijn gebaseerd op turn-based interacties en omvatten Anthropic Claude, Google Gemini en OpenAI ChatGPT, die “een enkele reeks acties uitvoert en wacht op de volgende gebruikersprompt.”

Aan de hogere kant van de autonomie bieden browseragenten meer “beperkte mogelijkheden voor tussenkomst tijdens de uitvoering”. Deze omvatten Perplexity’s Comet, die taken autonoom uitvoert wanneer daarom wordt gevraagd. “Zodra een zoekopdracht is verzonden, kunnen gebruikers niet meer eenvoudig ingrijpen of de agent controleren totdat deze is voltooid.”

Enterprise-platforms zijn verdeeld als het gaat om de autonomie van agenten. “Tijdens de ontwerpfase configureren gebruikers handmatig triggers, acties en vangrails met behulp van visuele canvassen”, schreven de onderzoekers. Anderen kunnen AI-hulp bieden bij dit proces. Eenmaal ingezet, opereren deze agenten vaak op een hoger niveau van autonomie, “geactiveerd door gebeurtenissen zoals een nieuwe e-mail of een databasewijziging, zonder enige menselijke tussenkomst tijdens de daadwerkelijke taakuitvoering.” Dergelijke agenten zijn onder meer Glean, Google Gemini Enterprise, IBM watsonx, Microsoft 365 Copilot, n8n en OpenAI AgentKit.

Ook: met Google Workspace kunt u nu AI-agents maken om uw werk te automatiseren. Hier leest u hoe u aan de slag gaat

Een paar aanbiedingen worden beschouwd als ontwikkelaars-/opdrachtregelinterface-agenten (CLI-agenten) die expliciete bevestiging vereisen voor gevoelige bewerkingen zoals bestandsbewerkingen en opdrachtuitvoering. Sommige agenten bieden een ‘kijkmodus’ voor realtime monitoring van kritieke acties, waaronder ChatGPT Agent/Atlas en Opera Neon.

Agent-ontwikkelaars zijn geconcentreerd in de VS en China, met een beperkte vertegenwoordiging uit andere regio’s, zo blijkt ook uit het onderzoek.



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in