Home Nieuws OpenAI klapt terug op Google’s Gemini 3

OpenAI klapt terug op Google’s Gemini 3

20
0
OpenAI klapt terug op Google’s Gemini 3

OpenAI heeft donderdag zijn reactie op het indrukwekkende Gemini 3 Pro-model van Google vrijgegeven –GPT-5.2– en als we naar enkele onderlinge benchmarktestresultaten kijken, lijkt het een winnaar. Het nieuwe model behaalde de hoogste score op een reeks benchmarktests op het gebied van coderen, wiskunde, wetenschap, gereedschapsgebruik en visie. (Benchmarks moeten uiteraard worden gecombineerd met gebruik in de echte wereld om het volledige verhaal te vertellen. Maar toch…)

OpenAI zegt dat GPT-5.2, een redeneermodel, prestatiescores op expertniveau behaalde op zijn eigen GDPval-benchmark, die de prestaties evalueert op 44 echte professionele taken, waaronder zaken als het maken van spreadsheets, het maken van documenten, het bouwen van presentaties en meer.

De GPT-5.2 stond bovenaan de Gemini 3 Pro in de SWE-Bench Pro-benchmark (software-engineeringtaken) met een score van 55,6% (tegenover de Gemini 3 Pro’s 43,3%). Het scoorde een 86,2% op de ARC-AGI-1 benchmark voor abstract redeneren, vergeleken met de 75% score van de Gemini 3 Pro. Het scoorde 92,4% op de GPQA Diamond-benchmark (wetenschappelijke vragen), vergeleken met de Gemini 3 Pro’s score van 91,9%.

Het nieuwe model is verkrijgbaar in drie varianten. GPT-5.2 Instant is goed voor het zoeken naar informatie en how-to’s, het opbouwen van vaardigheden en studies en loopbaanbegeleiding. GPT-5.2 Thinking is goed voor moeilijkere professionele taken zoals het opmaken van spreadsheets en het maken van diavoorstellingen. Het bedrijf zegt dat de GPT-5.2 Pro er langer over doet om antwoorden te genereren, maar het is het “slimste en meest geloofwaardige” model voor het genereren van nauwkeurige antwoorden in complexe domeinen zoals programmeren.

Voor de vele ontwikkelaars die nu agents bouwen, zegt OpenAI dat GPT-5.2 met Reasoning het sterkste aanbod tot nu toe is, met “significante verbeteringen op het gebied van algemene intelligentie, begrip van lange contexten, aanroepen van agentische tools en visie.”

OpenAI drong er naar verluidt op aan om GPT-5.2 vóór het einde van het jaar uit te brengen, zodat het de release van Google’s Gemini 3 kon tegengaan. Het bedrijf bracht GPT-5 in augustus uit en luidde het in als de volgende grote sprong voorwaarts in zijn carrière. AI onderzoek. GPT-5 was een ‘systeem’ van modellen dat een ‘router’ gebruikte om de juiste vragen naar gespecialiseerde modellen te sturen. Het verwijst naar GPT-5.2 als een “verenigd systeem dat automatisch kiest hoe te reageren op basis van de complexiteit van de taak.”

De verhoogde capaciteit van het GPT-5.2-model voor het verwerken en redeneren rond multimodale invoer (audio, video, afbeeldingen, tekst, enz.) is aanzienlijk omdat Google Gemini 3 dit heel goed doet.

Het nieuwe model werd bijvoorbeeld gevraagd om de kenmerken van een afbeelding van een printplaat te analyseren en vervolgens alle kleine componenten te identificeren en te labelen. OpenAI zegt dat GPT-5.2 dit met veel meer details en nauwkeurigheid deed dan het vorige GPT-5.1-model dat kon. Wanneer redeneren wordt geïntroduceerd, kan het model mogelijk problemen in mechanische systemen diagnosticeren door de visuele signalen te herkennen.

Alle drie de varianten van GPT-5.2 zijn vandaag beschikbaar in ChatGPT, te beginnen met betaalde abonnees en beschikbaar voor ontwikkelaars via de API. Microsoft, een grote investeerder in OpenAI, zegt dat het GPT-5.2 vandaag naar gebruikers van Microsoft 365 Copilot en Copilot Studio wereldwijd brengt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in