- Claude wordt veel meer gebruikt door ontwikkelaars dan door klantenservice, verkoop, financiën of e-commerce
- Het werkt nu autonomer dan ooit, inclusief complexe taken
- Claude verduidelijkt details meer dan mensen deze onderbreken
Anthropic heeft onthuld dat ongeveer de helft van alle openbare API-hulpoproepen afkomstig is van softwareontwikkeling, terwijl andere sectoren zoals klantenservice, verkoop, financiën en e-commerce elk slechts een paar procentpunten voor hun rekening nemen.
Daarnaast bleek Claude Code langer zelfstandig te werken dan ooit tevoren, nu ruim 45 minuten vergeleken met minder dan 25 minuten slechts drie maanden geleden.
OpenAI zegt dat de toename van de autonomie niet alleen betrekking heeft op de nieuwste, krachtige modellen, wat duidt op een bredere verschuiving naar agent AI in plaats van op proeven met de nieuwere modellen.
Agentic AI is er, en komt het meest voor bij het coderen
In een nieuwe blogpostOpenAI schetste hoe gebruikers vertrouwen beginnen op te bouwen in AI naarmate taken ambitieuzer worden, maar er blijft een ‘implementatieoverhang’ bestaan waarbij modellen nog steeds beter in staat zijn dan gebruikers momenteel toestaan. Uit externe evaluaties blijkt ook dat modellen onder ideale omstandigheden veel langere taken aankunnen.
Claude helpt ook op het gebied van vertrouwen, waarbij hij meer pauzeert om verhelderende vragen te stellen dan dat mensen hem onderbreken.
In termen van coderen lijkt het erop dat hoe complexer de taak, hoe minder menselijk toezicht er is. Complexe taken zoals het ontdekken van exploits en het schrijven van compilers zorgen voor ongeveer 67% menselijke monitoring, vergeleken met 87% monitoring voor eenvoudige API-taken.
Claude stelt ook ongeveer twee keer zoveel vragen over taken met een hoge complexiteit dan over eenvoudige.
In de toekomst besprak Anthropic het belang van trainingsmodellen om onzekerheid te herkennen en proactief verhelderende vragen te stellen. Het bedrijf raadt ook af om handmatige goedkeuring voor elke actie verplicht te stellen, met het argument dat dit voor wrijving zorgt zonder dat de beveiliging noodzakelijker wordt.
Volg TechRadar op Google Nieuws En voeg ons toe als voorkeursbron om ons deskundig nieuws, recensies en meningen in uw feeds te krijgen. Klik dan zeker op de knop Volgen!
En jij kunt dat natuurlijk ook Volg TechRadar op TikTok voor nieuws, recensies, video-unboxings en ontvang regelmatig updates van ons WhatsAppen Ook.


