Home Nieuws Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit...

Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit is niet het model)

11
0
Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit is niet het model)

Gen AI in softwaretechnologie is veel verder gegaan dan alleen automatisch aanvullen. De nieuwe grens is codering van agenten: AI-systemen die veranderingen kunnen plannen, deze in meerdere fasen kunnen uitvoeren en kunnen herhalen op basis van feedback. Ondanks de hype rond ‘AI-agents die coderen’ presteren de meeste bedrijfsimplementaties ondermaats. De beperkende factor is niet langer het model. Het is context: De structuur, geschiedenis en bedoeling van de code die wordt gewijzigd. Met andere woorden, bedrijven worden nu geconfronteerd met een systeemontwerpprobleem: ze hebben de omgeving waarin deze agenten opereren nog niet ontwikkeld.

De verschuiving van hulpverlening naar agency

Het afgelopen jaar heeft er een snelle evolutie plaatsgevonden van hulpprogramma’s voor coderen naar agentische workflows. Onderzoek begint te formaliseren wat agentisch gedrag in de praktijk betekent: het vermogen om te redeneren over ontwerp, testen, uitvoering en validatie in plaats van geïsoleerde fragmenten te genereren. Werk zoals dynamische actie herbemonstering laten zien dat het toestaan ​​van agenten om hun eigen beslissingen te vertakken, te heroverwegen en te herzien de prestaties in grote, onderling afhankelijke codebases aanzienlijk verbetert. Op platformniveau bouwen providers zoals GitHub nu speciale agent-orkestratieomgevingen, zoals Copilootagent en agenthoofdkwartierter ondersteuning van de samenwerking tussen meerdere agenten in echte ondernemingspijplijnen.

Maar vroege veldresultaten vertellen een waarschuwend verhaal. Wanneer organisaties agenttools introduceren zonder aandacht te besteden aan de workflow en de omgeving, kan de productiviteit afnemen. Uit een gerandomiseerde controlestudie van dit jaar bleek dat ontwikkelaars die AI-ondersteuning gebruikten in ongewijzigde workflows taken langzamer uitvoerden, grotendeels als gevolg van verificatie, herbewerking en verwarring over de intentie. De les is duidelijk: autonomie zonder orkestratie levert zelden efficiëntie op.

Waarom context-engineering de echte ontsluiting is

Bij elke mislukte implementatie die ik heb waargenomen, kwam de mislukking voort uit de context. Wanneer agenten geen gestructureerd begrip hebben van een codebase, met name de relevante modules, afhankelijkheidsgrafiek, testharnas, architecturale conventies en veranderingsgeschiedenis. Ze genereren vaak output die er correct uitziet, maar losstaat van de realiteit. Te veel informatie overweldigt de agent; omdat weinig het dwingt om te raden. Het doel is niet om het model met meer tokens te voeden. Het doel is om te bepalen wat zichtbaar moet zijn voor de agent, wanneer en in welke vorm.

De teams die betekenisvolle winst zien, beschouwen context als een technisch oppervlak. Ze creëren tools voor snapshotting, compressie en versiebeheer werkgeheugen van de agent: Wat blijft bestaan ​​in de bochten, wat wordt weggegooid, wat wordt samengevat en wat is gekoppeld in plaats van inline. Ze ontwerpen overwegingsstappen in plaats van sessies uit te lokken. Ze maken van de specificatie een eersteklas artefact, iets dat kan worden beoordeeld, getest en in bezit kan worden genomen, en niet een voorbijgaand chatverhaal. Deze verschuiving komt overeen met een bredere trend die sommige onderzoekers omschrijven als ‘specificaties die de nieuwe bron van waarheid worden’.

De workflow moet naast de tool worden gewijzigd

Maar context alleen is niet genoeg. Bedrijven moeten de workflows rond deze agenten herstructureren. Naad McKinsey’s rapport uit 2025 “Een jaar met Agent AI” Merk op dat productiviteitswinst niet voortkomt uit het aanbrengen van lagen op bestaande processen, maar uit het heroverwegen van het proces zelf. Wanneer teams simpelweg een agent in een ongewijzigde workflow laten vallen, ontstaat er wrijving: ingenieurs besteden meer tijd aan het verifiëren van door AI geschreven code dan ze zelf zouden hebben besteed aan het schrijven ervan. De agenten kunnen alleen versterken wat al gestructureerd is: geteste, modulaire codebases met duidelijk eigendom en documentatie. Zonder deze fundamenten verandert autonomie in chaos.

Veiligheid en bestuur vereisen ook een mentaliteitsverandering. Door AI gegenereerde code introduceert nieuwe soorten risico’s: ongecontroleerde afhankelijkheden, subtiele licentieschendingen en ongedocumenteerde modules die aan peer review ontsnappen. Volwassen teams beginnen de activiteiten van agenten rechtstreeks in die van hen te integreren CI/CD-pijplijnendat agenten behandelt als onafhankelijke bijdragers wier werk dezelfde statische analyse, auditregistratie en goedkeuringspoorten moet doorstaan ​​als elke menselijke ontwikkelaar. De eigen documentatie van GitHub benadrukt dit traject, waarbij Copilot Agents niet worden gepositioneerd als vervanging voor engineers, maar als georkestreerde deelnemers aan veilige, transparante workflows. Het doel is niet om een ​​AI ‘alles te laten schrijven’, maar om ervoor te zorgen dat wanneer hij handelt, hij dit binnen gedefinieerde vangrails doet.

Waar de besluitvormers van het bedrijf zich nu op moeten concentreren

Voor technische leiders begint de weg voorwaarts met paraatheid in plaats van met een hype. Monolieten met beperkte tests leveren zelden nettowinst op; Agents gedijen goed waar tests gezaghebbend zijn en iteratieve verfijning kunnen stimuleren. Dit is precies de lus Antropisch vraagt ​​om coderingsmiddelen. Pilots in strak gedefinieerde domeinen (testgeneratie, modernisering van legacy, geïsoleerde refactoren); behandel elke implementatie als een experiment met expliciete statistieken (defectvrijgavepercentage, PR-cyclustijd, foutpercentage van wijzigingen, verlaagde beveiligingsscores). Naarmate uw implementatie groeit, moet u agents behandelen als een data-infrastructuur: elk plan, context-snapshot, actielogboek en testrun zijn gegevens die zijn samengevoegd in een doorzoekbaar geheugen met technische bedoelingen en een blijvend concurrentievoordeel.

Onder de motorkap is agentcodering minder een gereedschapsprobleem dan een gegevensprobleem. Elke contextsnapshot, testiteratie en coderevisie wordt een vorm van gestructureerde gegevens die moeten worden opgeslagen, geïndexeerd en hergebruikt. Naarmate deze agenten zich steeds meer verspreiden, zullen bedrijven merken dat ze een geheel nieuwe laag aan gegevens moeten beheren: een laag die niet alleen vastlegt wat er is gebouwd, maar ook hoe daarover werd geredeneerd. Deze verschuiving verandert technische logboeken in een kennisgrafiek van intentie, besluitvorming en validatie. In de loop van de tijd zullen de organisaties die dit contextuele geheugen kunnen doorzoeken en opnieuw afspelen, de organisaties overtreffen die code nog steeds als statische tekst behandelen.

Het komende jaar zal waarschijnlijk bepalen of agentcodering een hoeksteen van de bedrijfsontwikkeling wordt of een andere opgeblazen belofte. Het verschil hangt af van context-engineering: hoe intelligent teams de informatiebasis ontwerpen waarop hun agenten vertrouwen. De winnaars zullen degenen zijn die autonomie niet als magie zien, maar als een verlengstuk van gedisciplineerd systeemontwerp: duidelijke workflows, meetbare feedback en rigoureus bestuur.

Kortom

Platformen convergeren op het gebied van orkestratie en bewaking, en onderzoek blijft de contextcontrole op het moment van inferentie verbeteren. De winnaars van de komende 12 tot 24 maanden zullen niet de teams met het meest opvallende model zijn; het zullen degenen zijn die context als een troef ontwikkelen en de workflow als het product behandelen. Doe het, en autonomieverbindingen. Sla het over en het doet de beoordelingswachtrij.

Context + agent = hefboomwerking. Sla de eerste helft over en de rest valt samen.

Dhyey Mavani versnelt generatieve kunstmatige intelligentie op LinkedIn.

Lees meer van onze gastschrijvers. Of overweeg om uw eigen bericht in te dienen! Zie de onze richtlijnen hier.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in