Anthropic is uit met een nieuw model genaamd Werk afsluiten 4.6een upgrade naar het topmodel Opus 4.5 dat in november werd gelanceerd. De nieuwe release zou nieuwe mogelijkheden kunnen toevoegen aan de codeerassistent Claude Code van Anthropic, die wordt geconfronteerd met toenemende concurrentiedruk van OpenAI’s Codex.
Anthropic zegt dat Opus 4.6 de codeer- en planningsmogelijkheden van zijn voorganger verbetert, en misschien wel het allerbelangrijkste: het vermogen om duidelijker te redeneren bij het omgaan met grote hoeveelheden informatie. Met Opus 4.6 waarop Claude Code draait, kan de codeeragent grotere codebases begrijpen en beter geïnformeerde beslissingen nemen over hoe en waar nieuwe code moet worden toegevoegd, zegt het bedrijf.
Meer langetermijngeheugen
AI Labs zijn druk bezig met het bouwen van modellen met langere contextvensters, wat betekent de hoeveelheid informatie die een model voor een bepaalde taak in aanmerking kan nemen. Maar modellen hebben vaak moeite gehad om die informatie effectief te gebruiken in hun output, een beperking die Anthropic erkent.
“In het verleden zagen we dingen als: misschien verdwijnt het model in het midden, of misschien vergeet het details”, zegt productmanager Dianne Na Penn tegen Opus. Snel bedrijf. “Ik zou niet zeggen dat Opus 4.6 perfect is – mensen en andere eerdere modellen zijn niet perfect – maar we denken dat de kwaliteitsverbetering behoorlijk aanzienlijk is.”
Dankzij het langere geheugen van Opus kan het ook gedurende langere tijd aan complexe taken werken, waardoor Claude Code-gebruikers teams van agenten kunnen samenstellen die aan taken samenwerken. Anthropic zegt ook dat de tool verbeterde codebeoordelings- en foutopsporingsfuncties biedt waarmee het zijn eigen bugs kan opsporen.
Opus 4.6 komt naarmate het gebruik van AI-coderingstools blijft toenemen en de concurrentie tussen Anthropic en OpenAI voor softwareontwikkelaars heviger wordt. OpenAI’s Codex-coderingstool is onlangs gelanceerd als een zelfstandige app, mogelijk gemaakt door het GPT-5.2-model, en heeft overwegend enthousiaste recensies ontvangen van ontwikkelaars.
Een model voor alledaagse taken
Naast coderen is het nieuwe antropische model ontworpen om de prestaties van alledaagse werktaken te verbeteren, zoals het uitvoeren van financiële analyses, het uitvoeren van onderzoek en het maken of gebruiken van documenten, spreadsheets en presentaties. Opus 4.6 zal ook het algemene werkinstrument van Anthropic, Cowork, aandrijven, waardoor multitasking met minimaal menselijk toezicht mogelijk wordt.
Anthropic zegt dat Opus 4.6 topscores behaalde in verschillende benchmarktests in de branche en de hoogste scores tot nu toe behaalde in meerdere evaluaties. Deze omvatten Humanity’s Last Exam, een complexe interdisciplinaire redeneringstest; Terminal-Bench 2.0, een evaluatie van agentcodering; en de GDPval-AA, die de prestaties meet op economisch waardevolle kenniswerktaken op economisch, juridisch en ander gebied. Anthropic zegt ook dat Opus 4.6 beter presteert dan alle andere modellen op OpenAI’s BrowseComp, dat het vermogen van een model meet om moeilijk te vinden informatie online te vinden.
Anthropic zegt dat het Opus 4.6-model beschikbaar is voor ontwikkelaars die Claude Code gebruiken voor dezelfde prijs per miljoen tokens als Opus 4.5. Het nieuwe model is nu standaard voor Claude Code Pro-abonnees en is als optie beschikbaar voor alle andere abonnees.


