Tot voor kort leek de praktijk van het bouwen van AI-agenten een beetje op het trainen van een langeafstandsloper met een geheugen van 30 seconden.
Ja, je zou je AI-modellen hulpmiddelen en instructies kunnen geven, maar na enkele tientallen interacties (enkele rondjes op het circuit, om onze hardloopanalogie uit te breiden) zou het onvermijdelijk de context verliezen en gaan hallucineren.
Met De nieuwste updates van OpenAI naar de zijne Reacties-API – de applicatieprogrammeerinterface die ontwikkelaars op het OpenAI-platform toegang geeft tot meer agenttools zoals zoeken op internet en bestanden zoeken met een enkele oproep – het bedrijf geeft aan dat het tijdperk van de beperkte agent aan het afnemen is.
De vandaag aangekondigde updates omvatten Server-side Compaction, Hosted Shell Containers en implementatie van de nieuwe “Vaardigheden“standaard voor agenten.
Met deze drie belangrijke updates biedt OpenAI agenten effectief een permanent bureaublad, terminal en niet-vervagend geheugen dat agenten moet helpen zich verder te ontwikkelen tot betrouwbare digitale werkers voor de lange termijn.
Technologie: ‘contextgeheugenverlies’ overwinnen
De grootste technische hindernis voor autonome agenten is altijd de ‘rommel’ van langlopende taken geweest. Elke keer dat een agent een tool aanroept of een script uitvoert, groeit de gespreksgeschiedenis.
Uiteindelijk bereikt het model zijn tokenlimiet en wordt de ontwikkelaar gedwongen het verhaal in te korten, waarbij vaak de ‘rechtvaardiging’ wordt gewist die de agent nodig heeft om de klus te klaren.
Het antwoord van OpenAI is server-side compactie. In tegenstelling tot eenvoudige inkorting zorgt compressie ervoor dat het geld uren of zelfs dagen kan blijven lopen.
Vroege gegevens van e-commerceplatform Drievoudige Walvis suggereert dit is een doorbraak in stabiliteit: hun agent, Moby, navigeerde met succes door een sessie met 5 miljoen tokens en 150 tooloproepen zonder dat de nauwkeurigheid daalde.
In praktische termen betekent dit dat het model zijn eigen acties uit het verleden kan ‘samenvatten’ in een gecomprimeerde staat die de essentiële context levend houdt en tegelijkertijd de ruis verwijdert. Het transformeert het model van een vergeetachtige assistent naar een volhardend systeemproces.
Beheerde cloud-sandboxen
Met de introductie van de Shell-tool begeeft OpenAI zich naar het domein van managed computing. Ontwikkelaars kunnen nu kiezen container_auto, die een door OpenAI gehoste Debian 12-omgeving biedt.
Dit is niet zomaar een tolk: het geeft elke agent zijn eigen volledige terminalomgeving, vooraf geladen met:
-
Native uitvoeringsomgevingen inclusief Python 3.11, Node.js 22, Java 17, Go 1.23 en Ruby 3.1.
-
Aanhoudende opslag via
/mnt/datawaarmee agenten artefacten kunnen genereren, opslaan en downloaden. -
Netwerkopties waarmee agenten verbinding kunnen maken met internet om bibliotheken te installeren of te communiceren met API’s van derden.
Hosted Shell en zijn volharding /mnt/data storage biedt een beheerde omgeving waarin agenten complexe datatransformaties kunnen uitvoeren met behulp van Python of Java zonder dat het team voor elk AI-project aangepaste ETL-middleware (Extract, Transform, Load) hoeft te bouwen en te onderhouden.
Door gebruik te maken van deze gehoste containers kunnen data-ingenieurs krachtige computertaken inzetten en tegelijkertijd de ‘meerdere verantwoordelijkheden’ minimaliseren die gepaard gaan met het beheren van aangepaste infrastructuur, het elimineren van bouwkosten en het beveiligen van hun eigen sandboxes. OpenAI zegt feitelijk: ‘Geef ons de instructies, wij zorgen voor de computer.’
De vaardigheden van OpenAI versus de vaardigheden van Anthropic
Zowel OpenAI als Anthropic ondersteunen nu “vaardigheden”, instructies aan agenten om specifieke operaties uit te voeren en zijn geconvergeerd op dezelfde open standaard – a SKILL.md (markdown) manifest met YAML-frontmatter.
Een vaardigheid die voor beide is gebouwd, zou theoretisch kunnen worden verplaatst naar VS Code, Marker of een ander platform dat de specificatie overneemt
Eigenlijk de populaire nieuwe open source AI-agent Open Klauw precies dit overgenomen SKILL.md manifest- en mapgebaseerde verpakkingen, waardoor het een schat aan gespecialiseerde procedurele kennis kan erven die oorspronkelijk voor Claude was ontworpen.
Deze architecturale compatibiliteit heeft geleid tot een door de gemeenschap aangestuurde ‘vaardigheidsgroei’ op platforms als ClawHub, die nu meer dan 3.000 door de gemeenschap gebouwde uitbreidingen host, variërend van slimme thuisintegraties tot complexe zakelijke workflowautomatiseringen.
Deze kruisbestuiving laat zien dat de ‘vaardigheid’ een draagbaar, versiegewijs bezit is geworden in plaats van een door de leverancier vergrendelde functie. Omdat OpenClaw meerdere modellen ondersteunt, waaronder OpenAI’s GPT-5-serie en lokale Llama-instanties, kunnen ontwikkelaars nu een vaardigheid één keer schrijven en deze inzetten in een heterogeen landschap van agenten.
Bde onderliggende strategieën van OpenAI en Anthropic onthullen uiteenlopende visies op de toekomst van werk.
De aanpak van OpenAI geeft prioriteit aan een “programmeerbaar substraat” dat is geoptimaliseerd voor de snelheid van ontwikkelaars. Door de shell, het geheugen en de vaardigheden van de Responses API samen te brengen, bieden ze een kant-en-klare ervaring voor het snel bouwen van complexe agenten.
Er wordt al een AI-zoekopdracht voor bedrijven gelanceerd Verzamel rapporteerde een sprong in de gereedschapsnauwkeurigheid van 73% naar 85% met behulp van het Skills-framework van OpenAI.
BDoor de open standaard te koppelen aan de eigen Responses API, biedt het bedrijf een krachtig, kant-en-klaar substraat.
Het is niet alleen het lezen van de vaardigheid; het host het in een beheerde Debian 12-shell, regelt het netwerkbeleid en past compressie op de server toe om ervoor te zorgen dat de agent niet verdwaalt tijdens een sessie van vijf miljoen tokens. Dit is de “hoge prestatie” keuze voor ingenieurs die langdurige, autonome werknemers moeten inzetten zonder een aangepaste uitvoeringsomgeving te hoeven bouwen.
Anthropic heeft zich ondertussen geconcentreerd op de ‘marktplaats van expertise’. Hun kracht ligt in een volwassen portfolio van kant-en-klare partnerplaybooks van b.v. Atlassian, Figma en Streep.
Implicaties voor de technische besluitvormers van het bedrijf
Voor ingenieurs die zich richten op “snelle implementatie en afstemming”, biedt de combinatie van server-side compaction en skills een enorme productiviteitsboost
In plaats van aangepast statusbeheer te bouwen voor elke uitgevoerde agent, kunnen technici ingebouwde compressie gebruiken om taken van meerdere uren af te handelen.
Vaardigheden maken ‘verpakte IP’ mogelijk, waarbij specifieke verfijning of gespecialiseerde procedurele kennis kan worden gemodulariseerd en hergebruikt in verschillende interne projecten.
Voor degenen die AI moeten verplaatsen van een ‘chatbox’ naar een workflow op productieniveau: de aankondiging van OpenAI markeert het einde van het tijdperk van ‘op maat gemaakte infrastructuur’.
Historisch gezien vereiste het orkestreren van een agent aanzienlijke handmatige ondersteuning: ontwikkelaars moesten aangepaste statusbeheerlogica bouwen om lange gesprekken af te handelen en veilige, vluchtige sandboxes om code uit te voeren.
De uitdaging is niet langer: “Hoe geef ik deze agent een terminal?” maar “Welke vaardigheden zijn goedgekeurd voor welke gebruikers?” en “Hoe controleren we de artefacten die in het gehoste bestandssysteem worden geproduceerd?” OpenAI heeft de motor en het chassis geleverd; de taak van de orkestrator is nu om de verkeersregels te definiëren.
Voor managers van Security Operations (SecOps) is het een belangrijke ontwikkeling om een AI-model een shell- en netwerktoegang te geven. OpenAI’s gebruik van domeingeheimen en organisatietoelatingslijsten biedt een diepgaande verdedigingsstrategie die ervoor zorgt dat agenten API’s kunnen aanroepen zonder ruwe inloggegevens bloot te stellen aan de context van het model.
Maar nu agenten gemakkelijker kunnen worden ingezet via ‘Skills’, moet SecOps op zijn hoede zijn voor ‘kwaadwillige vaardigheden’ die snelle injectiekwetsbaarheden of ongeoorloofde data-exfiltratiepaden kunnen introduceren.
Hoe moeten bedrijven beslissen?
OpenAI verkoopt niet langer alleen maar een ‘brein’ (het model); het is om het ‘kantoor’ (de container), het ‘geheugen’ (compressie) en het ‘trainingshandboek’ (vaardigheden) te verkopen. Voor bedrijfsleiders wordt de keuze duidelijk:
Selecteer de Responses-API van OpenAI als uw agenten krachtige, statige executie vereisen. Als je een beheerde cloudcontainer nodig hebt die urenlang kan draaien en meer dan 5 miljoen tokens kan verwerken zonder contextverslechtering, dan is de geïntegreerde stack van OpenAI het “High-Performance OS” volgens de agentskills.io-standaard.
Selecteer Antropisch als uw strategie afhankelijk is van een directe partnerverbinding. Als uw workflow zich concentreert op bestaande, voorverpakte integraties van een breed portfolio van externe leveranciers, biedt het volwassen ecosysteem van Anthropic een meer plug-and-play-ervaring voor dezelfde open standaard.
Uiteindelijk geeft deze convergentie aan dat AI het tijdperk van de ‘walled garden’ heeft verlaten. Door te standaardiseren op agentskills.io verandert de industrie ‘prompt spaghetti’ in een gedeelde, versiebeheerde en werkelijk draagbare architectuur voor de toekomst van digitaal werken.
Update 10 februari om 18:52 uur EN: dit artikel is sindsdien bijgewerkt om fouten in een eerdere versie met betrekking tot de overdraagbaarheid van OpenAI’s Skills vergeleken met die van Anthropic te corrigeren. Onze excuses voor de fouten.



