AI codeeragenten zijn een van de snelstgroeiende categorieën in bedrijfssoftware geworden. In slechts een paar jaar zijn deze ontwikkelingstools geëvolueerd van eenvoudige autocomplete-assistenten naar autonome systemen die in staat zijn de volledige softwareontwikkelingscyclus over te nemen, allemaal via natuurlijke taalprompts.
Nu vibe-coding een vlucht neemt, hebben tools van startups als Cursor en Claude Code van Anthropic snel omzetcijfers van meerdere miljarden dollars bereikt. Cursor zou in 2025 naar verluidt de $1 miljard aan jaarlijkse terugkerende inkomsten (ARR) hebben overschreden en heeft sindsdien de $2 miljard in het eerste kwartaal van 2026 benaderd. Claude Code van Anthropic is nog sneller opgeschaald en bereikte in het eerste jaar een geschatte jaarlijkse run rate van $2,5 miljard, waardoor het een van de snelst groeiende producten is voor een groot aandeel van $1 miljard ARR.
Toch is het schrijven van code in grote bedrijven zelden het moeilijkste deel van het werk. Datawetenschappers, ingenieurs en analisten besteden een groot deel van hun tijd aan het onderhouden en uitbreiden van pijpleidingen in plaats van aan het bouwen van nieuwe. Het echte knelpunt bij enterprise AI is daarom niet per se de softwareontwikkeling, maar de werking van complexe datasystemen in de productie.
Databricks CEO en mede-oprichter Ali Ghodsi gelooft dat deze kloof de volgende grens voor AI-automatisering vertegenwoordigt. Volgens hem zal de volgende generatie AI-agenten niet alleen software schrijven, maar ook de datasystemen beheren waarvan moderne bedrijven afhankelijk zijn.
Die strategische inspanning ligt ten grondslag aan Genie Code, een systeem van autonome AI-agenten dat vandaag is onthuld en is ontworpen voor data-engineering, datawetenschap en analyseactiviteiten. Het systeem breidt het bestaande Genie-platform-ecosysteem van het bedrijf uit, waardoor kenniswerkers in natuurlijke taal vragen kunnen stellen over bedrijfsgegevens. (Meer dan 20.000 organisaties maakten al gebruik van Databricks tools voor gegevensbeheer en analyse; De ARR van het bedrijf bedroeg in februari meer dan $ 5,4 miljard aan jaaromzet.)
“In plaats van alleen maar als codeerassistent op te treden of te helpen sneller code te genereren, begrijpen deze agenten daadwerkelijk de structuur van de gegevens en bestaande gegevensproblemen”, zegt Ali Ghodsi. “Het kan automatisch pijplijnen opzetten, analyseren waarom iets mislukt, en problemen begrijpen zoals wanneer een datasetschema verandert of wanneer machtigingen veranderen.”
Genie Code kan bijvoorbeeld helpen bepalen hoe een dataset moet worden voorbereid voor modellering: de gegevens willekeurig worden gemaakt, een deel ervan in een testset wordt gescheiden of een model op het resterende deel wordt getraind. Na de training kan het systeem de resultaten helpen evalueren met behulp van meetgegevens zoals de F1-score of het gebied onder de curve, en deze vervolgens analyseren om te bepalen of het model goed presteert of verbetering behoeft.
“Het zou kunnen voorstellen om verschillende benaderingen uit te proberen – misschien het model opnieuw te trainen of plots en grafieken te genereren om de prestaties te visualiseren en redeneringen bloot te leggen over welke veranderingen de resultaten zouden kunnen verbeteren”, legt Ghodsi uit. “Het gaat niet alleen om het genereren van willekeurige stukjes code, maar om het begrijpen van de hele structuur van het dataprobleem en het doorlopen van de modelleringsworkflow op dezelfde manier als een datawetenschapper of -ingenieur zou doen.”
Databricks en ondernemingscontext
Een belangrijke reden waarom veel AI-codeeragenten het moeilijk hebben in bedrijfsdataomgevingen is de context. De meeste ontwikkelaarstools trainen voornamelijk op openbare codeopslagplaatsen en algemene programmeervoorbeelden. Bedrijfsdatasystemen voegen echter nog een extra laag complexiteit toe. Data dragen zakelijke semantiek, governanceregels en toegangsbeleid met zich mee die bepalen hoe informatie kan worden gebruikt. Zonder die context kan een AI-agent technisch correcte code genereren die faalt zodra deze in productie wordt geïmplementeerd.
Genie Code probeert dit probleem op te lossen door rechtstreeks te integreren met Unity Catalog, het datamanagementframework van Databricks. Dankzij deze integratie kan het systeem de dataafkomst, toegangsrechten en organisatiebeleid in het gehele datalandschap van een bedrijf begrijpen.
“Het onderhouden van pijpleidingen en ervoor zorgen dat ze betrouwbaar zijn en altijd actief zijn, is een groot deel van het werk van een data-ingenieur, en dat is waar Genie Code ze enorm kan uitbreiden”, zegt Ghodsi. “Het kan systemen continu monitoren en onmiddellijk reageren als er iets kapot gaat, zelfs midden in de nacht, complexe sporen analyseren en diagnosticeren wat er is gebeurd, zodat de pijpleiding kan worden gerepareerd en betrouwbaar kan blijven draaien.”
De architectuur is gebaseerd op een multi-agentarchitectuur die wordt aangestuurd door meerdere AI-modellen. Ghodsi legt uit dat het systeem LLM’s van aanbieders als Anthropic, OpenAI en Google combineert met kleinere open source-modellen die zijn geoptimaliseerd voor specifieke taken. “Er zijn veel dingen in een workflow waarbij je geen groot model nodig hebt; je hebt alleen iets snels nodig dat een heel specifieke bewerking betrouwbaar kan uitvoeren.”
De grotere modellen bieden de redenering die nodig is voor het oplossen en plannen van complexe problemen. Kleinere open source-modellen zijn getraind om meer routinematige handelingen snel en efficiënt af te handelen. Bovendien is de architectuur opgebouwd rond meerdere samenwerkende agenten in plaats van een enkel monolithisch AI-systeem. Elke agent is gespecialiseerd in bepaalde functies, zoals het diagnosticeren van pijplijnstoringen of het analyseren van gegevenspatronen. Deze agenten delen context, geheugen en vaardigheden, waardoor ze hun acties kunnen coördineren en complexe workflows over de hele gegevensstapel kunnen uitvoeren.
Databricks beschrijft deze aanpak als ‘agentisch datawerk’. In plaats van een AI-assistent om kleine stukjes code te vragen, kunnen gebruikers hele doelen aan het systeem delegeren.
Een andere uitdaging met autonome AI-systemen is het handhaven van betrouwbare prestaties in productieomgevingen in de loop van de tijd, omdat agenten vaak onbekende scenario’s tegenkomen die de prestaties verslechteren. Om dit probleem op te lossen heeft Databricks Quotient AI overgenomen, een startup die gespecialiseerd is in evaluatie- en versterkingsleren voor AI-agenten. De technologie van het bedrijf helpt bij het evalueren van het gedrag van agenten, het continu meten van de uitvoerkwaliteit en het detecteren van achteruitgang voordat deze productiefouten veroorzaken. De oprichters van Quotient AI hebben eerder gewerkt aan het verbeteren van de kwaliteit van GitHub Copilot, waardoor ze diepgaande expertise kregen in het evalueren van AI-coderingssystemen.
Vibe-codering voor datasystemen
De opkomst van vibe-coding heeft een nieuw slagveld gecreëerd voor agentische AI-aangedreven codeertools en het competitieve landschap van software-infrastructuur opnieuw vormgegeven. Databricks benadert de markt vanuit een andere richting. Ghodsi zegt dat de markt voor AI-codering en de markt voor bedrijfsdata-automatisering zich parallel maar in verschillende richtingen ontwikkelen.
Terwijl tools als Cursor en de codeeragenten van Anthropic de manier waarop ontwikkelaars software schrijven hervormen, richt Databricks zich op het transformeren van de manier waarop bedrijven hun datasystemen beheren en exploiteren. “Hoewel onze productnaam ‘code’ bevat, richt het zich eigenlijk op datawerk”, zegt Ghodsi.
Genie Code richt zich op de workflows die plaatsvinden nadat gegevens het platform van een organisatie binnenkomen. Door zich te concentreren op de gegevenslaag wil het bedrijf problemen oplossen waarvoor algemene codeerassistenten niet zijn ontworpen. “De andere tools op de markt helpen software-ingenieurs bij het schrijven van applicatiecode, wat geweldig is”, zegt Ghodsi, “maar voor ons is het einddoel de data: data betrouwbaar transformeren en organisaties helpen met hun data te werken.”
Verschillende organisaties, waaronder SiriusXM en Repsol, zijn al begonnen met experimenteren met de technologie. SiriusXM gebruikt Genie Code om interne dataproducten te bouwen en te onderhouden, SQL-query’s te genereren en pijplijnen te debuggen. Volgens Ghodsi heeft het bedrijf ongeveer 20% gerapporteerd productiviteit verbeteringen in data-engineeringtaken. Genie Code helpt ingenieurs bij het creëren van dataproducten met gedefinieerde Service Level Agreements en betrouwbaarheidsgaranties.
Op dezelfde manier gebruikt het multinationale energie- en petrochemische bedrijf Repsol de technologie om prognoses en productieworkflows te versnellen. In plaats van notebooks, pijplijnen en modellen tussen verschillende systemen handmatig met elkaar te verbinden, kunnen ingenieurs erop vertrouwen dat Genie Code deze processen automatisch orkestreert. Ghodsi voegde eraan toe dat duizenden andere klanten al met de technologie experimenteren, hoewel veel implementaties zich nog in de beginfase bevinden.
De toekomst van menselijke techniek
Ghodsi verwacht niet dat autonome agenten menselijke ingenieurs zullen vervangen. In plaats daarvan besteden ingenieurs mogelijk minder tijd aan het schrijven van code en meer tijd aan het ontwerpen van architecturen, het monitoren van geautomatiseerde systemen en het garanderen dat AI-aangedreven workflows betrouwbaar werken.
“De kosten van automatisering dalen en de tools worden gemakkelijker te gebruiken, dus de vraag naar automatisering neemt uiteraard toe. Als je al naar enkele cijfers kijkt, bestaat een groot percentage van de activiteit op machines eigenlijk uit agenten die op de achtergrond opereren”, zegt hij.
Volgens het bedrijf is onlangs vrijgegeven Staat van AI-agenten Volgens het rapport creëren AI-agenten nu 80% van de databases en 97% van de test- en ontwikkelomgevingen op het Databricks-platform. Nog maar twee jaar geleden registreerden agenten nauwelijks enige databaseactiviteit, terwijl menselijke ontwikkelaars bijna al dat werk voor hun rekening namen.
“Het zou mij niet verbazen als dat aantal in korte tijd van 80% naar 99% gaat. Maar dat betekent niet dat mensen uit het proces verdwijnen”, legt Ghodsi uit. “Je moet ook nadenken over juridische verantwoordelijkheid en kwaliteitsgaranties. Dit zijn gebieden waar je nog steeds een mens nodig hebt.”



