Terwijl velen van ons de afgelopen dagen bezorgd waren dat onze president een einde zou maken aan een ‘hele beschaving”, waarschuwde een technologiebedrijf uit Silicon Valley, zonder veel waarschuwing dat dit per ongeluk zou kunnen ontwrichten alle beschaving zoals wij die kennen.
Dat maakte technologiebedrijf Anthrophic uit San Francisco dinsdag bekend dat was het niet om een nieuwe versie van zijn Claude AI-superbrein uit te brengen – omdat het zo krachtig is dat het de mogelijkheid heeft om vrijwel elk computersysteem te hacken, hoe veilig ook, in een kwestie van dagen, zo niet uren.
“De gevolgen – voor de economieën, de openbare veiligheid en de nationale veiligheid – kunnen ernstig zijn”, zegt Anthropic zei in een verklaring.
Bezorgdheid over AI is niets nieuws. We maken ons zorgen over het feit dat kunstmatige intelligentie banen overneemt, over speelgoed dat te echt lijkt voor onze kinderen, over massaal toezicht op al onze bewegingen. Maar de waarschuwing van Anthropic over zijn eigen product is groter dan al deze bijzondere problemen. Het is een oproep vanuit het huis dat het onheil om de hoek op de loer ligt. Het klinkt vreselijk afschuwelijk en overdreven, ik weet het. Maar het punt is: dat is het niet.
Anthropic, zoals u zich wellicht herinnert, is het bedrijf van de Amerikaanse ‘minister van Oorlog’ Pete Hegseth is rundvlees inbegrepen omdat hij niet wilde dat Claude zonder toezicht de strijd aan zou gaan en misschien zoiets zou doen per ongeluk kleine meisjes op een school bombarderen.
Nu heeft het bedrijf dit gepubliceerd coole waarschuwing: De bestaande Claude die de onrust veroorzaakte is verouderd en schokkend minder krachtig dan de nieuwe. Hij doet zijn uiterste best om niet los te laten – hoewel deze nieuwe Claude, genaamd Claude Mythos Previewis al minstens één keer op eigen kracht ontsnapt. Daarover straks meer: er is maar een beperkte mate van existentiële angst die een mens aankan.
“We moeten ons allemaal zorgen maken”, vertelde Roman Yampolskiy me over deze nieuwste vooruitgang in een technologie die zeker de loop van de mensheid zal veranderen. Hij is een van de landen van het land vooraanstaande AI-beveiligingsonderzoekersen een professor aan de Universiteit van Louisville in Kentucky.
“We creëren algemene superintelligentie, en dat bedreigt de mensheid als geheel”, zei Yampolskiy.
‘Al het andere doet er niet toe’, voegde hij eraan toe, voordat hij suggereerde dat ik mezelf niet langer een idioot zou noemen omdat ik de technisch zware delen van dit debat niet begrijp. Mijn simplistische visie, zo verzekerde hij mij, was ‘een redelijke manier om het uit te leggen’.
Dus alsjeblieft.
Dit is geen ‘echt slim computergenie dat hier misbruik van zou kunnen maken’, een scenario of een ‘iedereen wordt werkloos‘-scenario, of zelfs een ‘het zou per ongeluk kinderen kunnen bombarderen’-scenario, wat een werkelijk verschrikkelijk scenario is.
Dit is een “uw tienerzoon zou het kunnen gebruiken om het plaatselijke schooldistrictssysteem te hacken om met vrijwel minimale kennis een personage te veranderen en per ongeluk het elektriciteitsnet van Californië te vernietigen”.
Of misschien kan een land dat ons niet mag – ik kan er wel een paar bedenken – de bankrekening van elke Amerikaanse burger leeghalen en tegelijkertijd de automatische sloten van de gevangeniscellen inklikken, onze rioolwaterzuiveringsinstallaties afsluiten en de luchtcontrolesystemen overnemen. Of misschien doet Claude Mythos het gewoon alleen.
bijv. antropomorf gezegd dat Claude Mythos in een populair besturingssysteem dat het testte en dat door duizenden bedrijven, waaronder Netflix en Sony, werd gebruikt, een bug vond die al 17 jaar onopgemerkt bestond. Vervolgens bedachten ze op eigen kracht – zonder menselijke begeleiding of hulp – hoe ze deze bug konden gebruiken om de controle over te nemen over elke server waarop het besturingssysteem draait, met behulp van elke computer, waar dan ook ter wereld.
Het is maar een grapje, maar als bijna geen enkel veiligheidssysteem veilig is, zijn de mogelijkheden voor sociale, economische en algemene chaos werkelijk grenzeloos. En om eerlijk te zijn, elke veiligheidsexpert zal je vertellen dat enkele van Amerika’s grootste zwakke plekken op het gebied van cyberveiligheid lokale en deelstaatregeringen zijn, omdat vreemd genoeg de topexperts geen vijfcijferige banen hebben voor steden op de Great Plains.
Op basis van eigen tests, Antropische voorspeller het zou “meer dan duizend kritieke kwetsbaarheden en duizenden meer ernstige kwetsbaarheden kunnen vinden.”
Dit betekent dat Claude Mythos onze infrastructuur in gevaar brengt, nou ja, overal – omdat zoveel via achterdeurtjes met elkaar verbonden is waar de meesten van ons nooit over nadenken, en er maar één zwak systeem nodig is om de deur te openen voor honderden andere. Maar het is vrijwel onmogelijk om al deze systemen snel genoeg en robuust genoeg te beschermen en te repareren om bescherming te bieden tegen dit soort kunstmatige intelligentie.
En dat is alleen nog maar het cyberveiligheidsrisico, zei Yampolskiy. Een AI met de kenmerken van Claude Mythos zou op zoveel meer manieren kunnen worden gebruikt om een sprong voorwaarts te maken.
“We zien hetzelfde gebeuren met synthetische biologie. We zullen hetzelfde zien met chemische wapens, mogelijk iets nieuws in de vorm van massavernietigingswapens”, zei hij.
Tot grote eer van Anthropic liet het een waarschuwing horen over de creatie ervan en creëerde het, zo niet een oplossing, dan toch een soort spelplan – Project GlasvleugelIk veronderstel dat dit de naam krijgt, want hoe erg dit ook wordt, we gaan het laten klinken als een thriller met een spannend einde.
Project Glasvleugel had beter Project Headstart kunnen heten, want dat is het. Voordat Mythos in het wild wordt vrijgegeven, geeft Anthropic het vrij aan ongeveer 40 technologiebedrijven, waaronder Apple, Google en Nvidia, om te zien of ze gezamenlijk eventuele kwetsbaarheden kunnen patchen voordat het publiek er de kans toe krijgt. Het is een beetje zoals in films waarin de moordenaar het slachtoffer 15 seconden de tijd geeft om weg te rennen.
Ik bedoel, ik neem die 15 seconden en hoop dat ze echt zijn. Maar, zoals Anthropic ook in een verklaring zei: “Het werk ter verdediging van de cyberinfrastructuur in de wereld kan jaren duren; de grensoverschrijdende AI-capaciteiten zullen zich de komende maanden waarschijnlijk aanzienlijk ontwikkelen. Als we willen dat cyberverdedigers voorop lopen, moeten we nu handelen.”
En hebben we echt 15 seconden? Een van de supervisors van Claude Mythos plaatste onlangs op sociale media dat hij toen in een park had geluncht Mythos stuurde hem een e-mail – hoewel het niet de bedoeling is dat het toegang heeft tot internet. Wetenschappers hadden Mythos de opdracht gegeven om uit zijn niet-verbonden ‘zandbak’ te ontsnappen, en dat gebeurde ook.
Het is nog een probleem met Mythos en andere kunstmatige intelligentie – ze doen zelden wat we verwachten en vind stiekeme manieren om de regels te omzeilen. Van vrijwel elk gecreëerd AI-superbrein is aangetoond dat het liegt, bedriegt en zich in het algemeen op verontrustende en onethische manieren gedraagt, wanneer het onder de juiste omstandigheden wordt geplaatst.
Zelfs Claude, die wordt beschouwd als een van de meest ethische AI-superhersenen die er zijn, vertoont slecht gedrag. Antropische trots het is het ‘best uitgelijnde model’ dat het ooit heeft gemaakt – dat technisch gesproken is voor het volgen van menselijke waarden en intenties, maar ook erkent dat het ‘waarschijnlijk het grootste uitlijningsrisico met zich meebrengt’, wat technisch gesproken is, nou ja, misschien niet.
Dus, althans voorlopig, is het meest ethische AI-superbrein een beetje hetzelfde als de meest ethische seriemoordenaar zijn. Ren, mensen, ren.
Nogmaals bedankt Anthropic (en zijn CEO, Dario Amodidie vaak waarschuwt voor de gevaren van wat hij creëert, voor wat het waard is) om ons niet zonder waarschuwing in de mondiale chaos te storten, omdat ik durf te wedden dat andere bedrijven misschien wel hun super-AI op de samenleving hebben losgelaten en de vernietiging hebben laten vallen waar het kan. Er bestaat weinig twijfel dat er andere AI-hersenen komen die zo capabel zijn als Mythos, en binnenkort was Anthropic de eerste met dit vaardigheidsniveau, maar het heeft slechts 15 seconden voorsprong op de concurrentie.
Maar het idee dat de technologie-industrie deze problemen zelf zal – of zou moeten – oplossen is een absurd, grof plichtsverzuim en plichtsverzuim namens grote en kleine regeringen om hun bevolking te beschermen. Dit is geen race om dominantie zoals president Trump het heeft beschreven. Het is een race om onszelf tegen onszelf te beschermen – en tegen de meerderheid van de superrijke titanen van de industrie die het zakenleven en de commercie consequent boven het sociale belang lijken te plaatsen.
We zijn nog bezig met de laatste 15 seconden voordat AI alles verandert. Ofwel eisen we nu toezicht en regulering, ofwel laten we technologiebedrijven over het lot van de wereld beslissen.



