Anthropic lanceerde zijn nieuwste model, de Claude Opus 4.5, waarmee het bedrijf weer bovenaan de benchmarkranglijst staat voor AI software codering.
Opus 4.5 scoort ruim 80% op de veelgebruikte SWE-bank, die modellen test op vaardigheden op het gebied van software-engineering. GooglenDe indrukwekkende Gemini 3 Pro, die vorige week werd gelanceerd, behaalde kortstondig de topscore met 76,2%.
Anthropics Claude productmanager Scott White vertelt Snel bedrijf dat het model ook hoger scoorde dan enig mens op het technische huiswerk dat het bedrijf aan technische sollicitanten geeft.
Natuurlijk doet Opus 4.5 veel meer dan coderen. Antropisch zegt dat het ook het “beste model ter wereld” is voor het uitvoeren van AI-agents en voor het besturen van een computer, en dat het aanzienlijk beter presteert dan andere modellen voor taken als diepgaand onderzoek en het werken met dia’s en spreadsheets.
Opus 4.5 behaalde ook state-of-the-art (beste) scores in verschillende andere belangrijke benchmarks, waaronder “agentische codering SWE-bench geverifieerd”, “agentische toolgebruik T-2-bench” en “nieuwe probleemoplossende ARC-AGI-2.”
Een grote uitdaging bij het toepassen van kunstmatige intelligentie in echte werkomgevingen is het vermogen van het model om met complexiteit en dubbelzinnigheid om te gaan. White zegt dat Anthropic-klanten vinden dat de Opus 4.5 beter is dan eerdere modellen in het omgaan met onzekerheid en het omgaan met afwegingen zonder veel handwringing door menselijke werknemers.
Enterprise-klanten gebruiken steeds vaker antropische modellen voor het automatiseren van kantoortaken, financiële modellering en het maken van documenten, zegt White. Fundamental Research Labs rapporteerde 20% nauwkeurigheidsverbeteringen en 15% efficiëntiewinst voor Excel-automatiseringstaken met behulp van het nieuwe model, voegt hij eraan toe.
Anthropic is de afgelopen maanden op een sprint geweest en heeft Claude Sonnet 4.5 en Haiku 4.5 uitgebracht, evenals nieuwe producten zoals Claude Skills, Claude Code en branchespecifieke versies voor financiële dienstverlening en levenswetenschappen.
Opus 4.5 wordt het nieuwe standaardmodel voor abonnees van een gevorderd abonnement en zal beschikbaar zijn als vervolgkeuzelijst voor Pro-, Standard-, Team- en Enterprise-gebruikers. Het is ook beschikbaar voor ontwikkelaarsklanten via de application programming interface (API) van het bedrijf en via de Amazon Bedrock-, Google Vertex- en Microsoft Azure-clouds.
Anthropic zegt dat het ook de toegang tot een bètaversie van de Claude-plug-in uitbreidt Chroomdie in beperkte preview is geweest, voor alle Mac-gebruikers. Het bedrijf maakt Claude voor Excel ook beschikbaar voor Mac Team- en Enterprise-gebruikers in bèta, een uitbreiding die verder gaat dan de vorige preview die alleen op uitnodiging beschikbaar was.
De uiterste deadline voor Fast Company’s Wereldveranderende ideeënprijzen is vrijdag 12 december om 23:59 uur PT. Solliciteer vandaag nog.


