In het 3e kwartaal van 2025 realiseerde Bot Auto zijn eerste ‘driver-out’ run op de openbare weg: een rit waarbij de vrachtwagen zelf reed zonder mens achter het stuur, en in ons geval helemaal geen mensen in de cabine. Dit is een mijlpaal die slechts door een klein handjevol AV-truckingprogramma’s wordt bereikt. Vanaf de oprichting van het bedrijf tot aan die mijlpaal hebben we slechts $212.552 uitgegeven aan één categorie werk die doorgaans erg duur is in AI: mensen betalen om trainingsgegevens handmatig te labelen (door bijvoorbeeld kaders rond auto’s en voetgangers te tekenen) zodat een neuraal netwerk ervan kan leren.
Voor veel mensen klinkt dat aantal niet als een doorbraak. Het klinkt alsof er iets ontbreekt: een prijs die niet wordt meegeteld, een regelitem dat niet wordt onthuld, of een slimme manoeuvre die net buiten het frame is verborgen.
Dergelijk scepticisme is logisch, omdat annotatie bij AI meestal geen afrondingsfout is; het is een groot regelitem. Om te zien waarom dit belangrijk is, kun je nuScenes overwegen, een bekende dataset op het gebied van autonoom rijden. In totaal bevat het slechts ongeveer 5,5 uur aan rijgegevens. Keyframe voor keyframe moesten menselijke annotators elk voertuig, elke voetganger en elk object in de scène identificeren en nauwkeurig labelen. Dat werk duurde naar verluidt 7.937 uur en kostte ongeveer $ 100.000.
Het ontbrekende stuk staat niet in de rekeningen. Het zit in de aannames.
Wat veel mensen hebben gemist zijn geen verborgen kosten, maar een nieuw tijdperk: een verschuiving in de manier waarop intelligentie wordt geproduceerd. We gaan van één datagedreven regime waar vooruitgang afhangt van de door mensen geannoteerde labels, tot a computergestuurd regime waarbij computing zelf het werk op schaal doet.
Wanneer een industrie met zo’n fundamentele paradigmaverschuiving te maken krijgt, wordt de oude lens niet alleen onvolledig. Het zal misleidend zijn.
VAN WERKPLAATS TOT FABRIEK
Het grootste deel van het afgelopen decennium heeft toegepaste kunstmatige intelligentie, en met name autonomie, als werkplaats gediend. Er loopt een workshop over menselijke inspanning. Als u wilt dat uw systeem leert, moet u dat doen huur mensen om gegevens te labelen, randgevallen te labelen en een hele pijplijn rond menselijke arbeid op te bouwen. De schaarse hulpbron bestaat niet uit ruwe data, aangezien ruwe data overal aanwezig zijn. De schaarse hulpbron is gelabeld signaal. Menselijke arbeid is wat machine learning bij elkaar houdt.
Een fabrieksmodel verandert de krachtbron. Tijdens de Industriële Revolutie verving stoom de spieren, daarna verving elektriciteit de stoom. Op dezelfde manier vervangt een AI-bedrijf uit de fabriek de menselijke energie voor etikettering door computers. In plaats van mensen te betalen om alles met de hand te voelen, gebruikt het modellen om toezicht op schaal te genereren. Mensen doen er nog steeds toe, maar hun rol gaat steeds verder omhoog: van het handmatig tekenen van kaders tot systeemverificatie en kwaliteitscontrole. Dat is de echte verschuiving: het gelabelde signaal is niet langer schaars en het plafond voor intelligentie begint te stijgen.
Dit gebeurt niet alleen omdat een bedrijf meer GPU’s koopt. Het is een nieuwe industriële mogelijkheid, en nog steeds zeldzaam. Pas de laatste paar jaar werd het waarschijnlijk dat computers een deel van het handmatige annotatiewerk zouden kunnen overnemen, en niet alleen maar zouden helpen. Spraakmakende modellen zoals Meta’s Segment Anything waren de eersten die op grote schaal aantoonden dat deze verschuiving reëel was. Zelfs nu nog kan slechts een klein aantal grensverleggende bedrijven dit daadwerkelijk doen – en het goed genoeg doen om er toe te doen.
DE REVOLUTIE IN MEERDERE VISIES
We hebben deze fabrieksreset al een keer uitgevoerd, maar de meeste mensen merkten niet wat de echte reden was dat het werkte.
De wereld spreekt over ChatGPT als een toepassingswonder: het schrijft, codeert en bestuurt uw huisthermostaat. Maar de diepere doorbraak verborgen in het volle zicht. ChatGPT werd niet slim omdat mensen alles wat het las een label gaven. Het heeft zichzelf geleerd door tekst op internet te lezen en te leren voorspellen welk woord het volgende zal zijn. Toen het knelpunt losser werd, explodeerde de schaal. Modellen konden groeien totdat ze een nieuw plafond bereikten: computergebruik. En met die verschuiving kwam er een stapsgewijze verandering in de capaciteit.
Hetzelfde patroon zagen we in een ander domein. AlphaGo was datagedreven: het leerde van menselijke spelletjes. AlphaZero doorbrak het plafond door die afhankelijkheid weg te nemen, alleen te beginnen met de regels, en zijn eigen ervaring te genereren door middel van zelfspel. Omdat leren niet langer beperkt werd door een beperkt archief van menselijke voorbeelden, verschoof het plafond. Als gevolg hiervan was het nieuwe systeem niet alleen een verbetering ten opzichte van het oude regime. Dat maakte het overbodig.
DE ENIGE VRAAG DIE BELANGRIJK IS
Richard Feynman schreef: “Voor een succesvolle technologie moet de werkelijkheid voorrang krijgen op public relations, want de natuur kan niet bedriegen.” Het is de echte test voor dit tijdperk van AI. Elk marketing team probeert zijn bedrijf te presenteren als AI-native, futuristisch en gebouwd voor het nieuwe tijdperk. Maar niets daarvan vertelt je wat er werkelijk achter het gordijn zit.
De vraag die de moeite waard is om vandaag de dag aan elk AI-bedrijf te stellen is simpel: waar komt het getagde signaal vandaan? Als het antwoord nog steeds een enorme factuur van de etiketteringsleverancier is, loopt de workshop nog steeds, ongeacht wat er in het persbericht staat. Als compute productiemonitoring op grote schaal is, is de fabriek begonnen. De kloof tussen deze twee antwoorden is geen detail. Dat is het hele spel.
Xiaodi Hou is de oprichter en CEO van Bot Auto.


