Home Nieuws Enterprise AI-codering laat tanden groeien: GPT-5.2 Codex verweeft beveiliging in grootschalige software-refactoring

Enterprise AI-codering laat tanden groeien: GPT-5.2 Codex verweeft beveiliging in grootschalige software-refactoring

16
0
Enterprise AI-codering laat tanden groeien: GPT-5.2 Codex verweeft beveiliging in grootschalige software-refactoring

Met de nieuwste release van GPT 5.2OpenAI heeft andere gerelateerde modellen bijgewerkt, waaronder het populaire codeermodel Codex, waardoor er meer agentische gebruiksscenario’s zijn ontstaan.

GPT-5.2-Codex, die OpenAI noemt in een blogpost “het meest geavanceerde agentcoderingsmodel tot nu toe voor complexe software-ingenieurs in de echte wereld”, is geoptimaliseerd voor langdurig werk met agenten en zal sterkere cyberbeveiligingsmogelijkheden hebben.

Het model is een uitloper van GPT-5.2, geoptimaliseerd voor het bouwen van agenten.

“De GPT-5.2 Codex vertegenwoordigt een stap voorwaarts in de manier waarop geavanceerde kunstmatige intelligentie real-world softwaretechnologie en gespecialiseerde domeinen zoals cybersecurity kan ondersteunen – waardoor ontwikkelaars en verdedigers complex werk op de lange termijn kunnen aanpakken en de tools kunnen versterken die beschikbaar zijn voor verantwoord beveiligingsonderzoek”, aldus het bedrijf in zijn blogpost.

Bedrijven hebben toegang tot het nieuwe Codex-model “op alle Codex-oppervlakken voor betaalde ChatGPT-gebruikers en werken de komende weken aan veilige toegang tot de GPT-5.2 Codex voor API-gebruikers.” Het bedrijf voert ook een pilot uit met een programma voor vertrouwde gebruikers, dat alleen op uitnodiging toegankelijk is, om toegang te krijgen tot “meer tolerante modellen voor goedgekeurde professionals en organisaties” voor defensief cyberbeveiligingswerk om een ​​evenwicht tussen toegankelijkheid en veiligheid te bepalen.

Cyberbeveiliging bevorderen met modellen

OpenAI noemt de GPT-5.2 Codex het sterkste cyberbeveiligingsmodel tot nu toe. Maar naarmate de capaciteiten toenemen, zegt het bedrijf dat het een implementatieaanpak moet ontwerpen die rekening houdt met toekomstige groei en defensieve cyberbeveiliging ondersteunt.

“Terwijl onze modellen zich langs de inlichtingengrens blijven ontwikkelen, hebben we gemerkt dat deze verbeteringen zich ook vertalen in sprongen in capaciteiten in gespecialiseerde domeinen zoals cyberbeveiliging”, aldus het bedrijf.

zei Open AI in zijn systeemkaart dat het het model heeft getest op drie benchmarks: Capture-the-Flag (CTF) evaluaties, CVE-Bench en Cyber ​​Range.

GPT-5.2 Codex werd het best presterende model van het bedrijf in CTF-evaluaties, wat ze toeschreven aan compressie, of “het vermogen van het model om coherent te werken in meerdere contextvensters.”

Het model scoorde 87% in CVE-Bench en presteerde daarmee beter dan andere modellen, met GPT-5.1-Codex-Max op een goede tweede plaats. Deze toename zou nuttig zijn voor taken waarbij opdrachten worden uitgevoerd rond het ontdekken van kwetsbaarheden en het testen van tools “met een bijna brute-force-aanpak.”

In de lange Cyber ​​Range-test had het model een gecombineerd slagingspercentage van 72,7%. GPT-5.1-Codex-Max scoorde 81,8%.

Implementatieproject cyberveiligheid

OpenAI zei dat sommige gebruikers van zijn GPT-5.1-Codex-Max, die in november werd gelanceerdontdekte een kwetsbaarheid in de broncodeblootstelling in React en rapporteerde dit vervolgens. Volgens OpenAI gebruikte Andrew MacPherson, een beveiligingsonderzoeker bij Privy, GPT-5.1-Codex-Max om te beoordelen hoe goed het model kwetsbaarheidsonderzoek in de echte wereld zou kunnen ondersteunen. In plaats daarvan verscheen het model op onverwacht gedrag.

Met verbeteringen in de cyberbeveiligingsmogelijkheden voor de GPT-5.2 Codex en mogelijk ook voor modellen die daarna komen, zei OpenAI dat het de implementatie van grensmodellen in evenwicht moet brengen met de noodzakelijke hulpmiddelen voor defensieve cyberbeveiliging. Hoewel de GPT-5.2 Codex “geen hoog niveau van cybercapaciteiten bereikt binnen ons gereedheidskader”, is het bedrijf van plan om geselecteerde gebruikers de beveiligingsmogelijkheden te laten testen. (OpenAI’s Noodkader om potentiële schade van AI aan mensen te meten en te volgen)

“Beveiligingsteams kunnen beperkingen tegenkomen bij het nabootsen van bedreigingsactoren, het analyseren van malware om herstel te ondersteunen of het testen van kritieke infrastructuur. We ontwikkelen een Trusted Access-pilot om deze wrijving voor gekwalificeerde gebruikers en organisaties weg te nemen en vertrouwde verdedigers in staat te stellen grensoverschrijdende AI-cybercapaciteiten te gebruiken om de cyberverdediging te versnellen.” zei Open AI.

Grenzen van agentschappen

GPT-5.2 al kreeg lof van gebruikers voor gebruik in zakelijke taken en workflows. Met de Codex-versie kunnen sommige van deze mogelijkheden worden overgedragen, vooral omdat bedrijven van plan zijn het model te gebruiken om hun agenten te coderen.

Het bedrijf zegt dat het model het werk op de lange termijn verbetert door middel van compressie en sterke prestaties biedt voor uitgebreide codewijzigingen. Het heeft ook verbeterde prestaties op Windows.

In benchmarktests presteerde GPT-5.2-Codex het beste op het gebied van nauwkeurigheid vergeleken met de vorige versies.

SWE-Bench Pro
Terminalbank 2.0

“Dankzij deze verbeteringen is Codex beter in staat om in grote repository’s te werken gedurende langere sessies met de volledige context intact. Het kan complexe taken zoals grote refactoren, codemigraties en feature-builds betrouwbaarder uitvoeren – en blijven herhalen zonder het overzicht te verliezen, zelfs als plannen veranderen of pogingen mislukken”, aldus OpenAI.

Sinds de lancering in voorproefje in meiCodex heeft geholpen de acceptatie van agent- en vibe-codering in de AI-bouwerruimte van ondernemingen in te luiden. Samen met Windsurf, Cursor, Claude Code en de vele codeeragenten van Google heeft het platform LLM’s verplaatst van het eenvoudig voltooien van code naar het genereren en lanceren van asynchrone codeerprojecten voor gebruikers.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in