Donderdag werd OpenAI vrijgegeven GPT-5.3-codexeen nieuw model dat de Codex-coderingsagent uitbreidt tot meer dan het schrijven en beoordelen van code om een veel breder scala aan taken uit te voeren. De release komt terwijl de concurrentie tussen de spelers blijft toenemen kunstmatige intelligentie bedrijven die strijden om marktaandeel op het gebied van door AI aangedreven codeertools.
OpenAI zegt dat GPT-5.3 de codeerprestaties van de GPT-5.2 Codex combineert met de redenering en expertise van GPT-5.2, terwijl het 25% sneller werkt. Hierdoor kan de GPT-5.3 Codex langlopende taken uitvoeren die betrekking hebben op onderzoek, het gebruik van tools zoals zoeken op internet of databaseoproepen, en complexe uitvoering en planning voor zowel algemene werktaken als softwareontwikkeling.
Codex heeft meer dan 1 miljoen ontwikkelaars bereikt, beweert OpenAI. En hoewel de Claude Code van Anthropic ook snel wordt toegepast, zijn de gegevens die de twee tools met elkaar vergelijken nog steeds schaars. Semi-analyse rapporten dat 4% van de publieke commits van GitHub, of nieuwe code die naar repositories wordt geüpload, momenteel wordt geschreven door Claude Code, en het voorspelt dat dit aantal tegen eind 2026 20% of meer zou kunnen bereiken.
Benchmark one-upmanship
OpenAI zegt dat de GPT-5.3 Codex nu de beste score heeft van elk model op SWE-Bench Pro, een benchmark die software-engineering in de echte wereld in vier programmeertalen evalueert. Hetzelfde geldt voor Terminal-Bench 2.0, dat de terminalvaardigheden meet die codeeragenten nodig hebben.
Anthropic zegt dat het nieuw is Claude Opus 4.6-modelmaakte ook donderdag bekend en behaalde topscores op verschillende branchebenchmarks, waaronder Humanity’s Last Exam (complex multidisciplinair redeneren), GDPval-AA (financieel waardevol kenniswerk) en BrowseComp (moeilijk te vinden informatie zoeken).
OpenAI zegt dat zijn nieuwe model in staat is om rekening te houden met grotere hoeveelheden informatie tijdens het werken aan een taak, en om langere tijd over die taken na te denken zonder menselijke tussenkomst. Tijdens het testen zegt OpenAI dat de GPT-5.3 Codex autonoom de game-ontwikkeling herhaalde over miljoenen tokens met behulp van generieke aanwijzingen zoals “repareer de bug” of “verbeter het spel”.
Op dezelfde manier zegt Anthropic dat het nieuwe Opus 4.6-model grotere codebases kan begrijpen en beter geïnformeerde beslissingen kan nemen over hoe nieuwe code moet worden toegevoegd.
OpenAI zegt dat de GPT-5.3 Codex is gebouwd om de volledige levenscyclus van software te ondersteunen, inclusief het debuggen, implementeren en monitoren van code, het schrijven van productvereistendocumenten en het uitvoeren van onderzoek.
Naast coderen voor kenniswerk
Dezelfde agentmogelijkheden die de codeervaardigheden van Codex uitbreiden, kunnen van toepassing zijn op taken die veel verder gaan dan het domein van softwareontwikkeling, zegt OpenAI, en zich uitstrekken tot functies als het maken van diapresentaties en het analyseren van gegevens in spreadsheets.
Op GDPval, een OpenAI-evaluatie die de prestaties meet op goed gespecificeerde kenniswerktaken in 44 beroepen, komt GPT-5.3 Codex overeen met GPT-5.2 terwijl er sterkere codeermogelijkheden worden toegevoegd. Op OSWorld-Verified, dat computergebruik in een visuele desktopomgeving test, behaalde GPT-5.3 Codex een nauwkeurigheid van 64,7% vergeleken met 38,2% voor zijn voorganger.
Anthropic heeft zijn Claude Code-tool in dezelfde richting gestuurd: om een bredere groep informatiewerkers te helpen met een veel bredere reeks zakelijke taken.
De GPT-5.3 Codex is het eerste model dat OpenAI classificeert als “hoge capaciteit” voor cybersecurity-gerelateerde taken onder zijn Preparedness Framework, en het eerste dat het bedrijf rechtstreeks heeft getraind om softwarekwetsbaarheden te identificeren. OpenAI heeft 10 miljoen dollar aan API-kredieten (Application Programming Interface) beschikbaar gesteld om de cyberverdediging te versnellen, met name voor open source-software en kritieke infrastructuursystemen.
GPT-5.3-Codex is nu beschikbaar voor betalende ChatGPT-abonnees in de Codex-app, in de opdrachtregelinterface, als IDE-extensie en op internet. OpenAI zegt dat het eraan werkt om binnenkort API-toegang (gebruikt door bedrijven en onafhankelijke ontwikkelaars) tot het model mogelijk te maken.



