Home Nieuws Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent gek werd op haar inbox

Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent gek werd op haar inbox

2
0
Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent gek werd op haar inbox

De nu virale X-post van Meta AI-beveiligingsonderzoeker Summer Yue leest in eerste instantie als satire. Ze vroeg haar OpenClaw AI-agent om haar overvolle e-mailinbox te controleren en voor te stellen wat ze moest verwijderen of archiveren.

De agent bleef amok maken. Het begon al haar e-mail te verwijderen in een “snelle run” terwijl het haar opdrachten van haar telefoon negeerde om te zeggen dat het moest stoppen.

“Ik moest naar mijn Mac mini RENNEN alsof ik een bom onschadelijk wilde maken”, schreef ze, terwijl ze foto’s van de genegeerde stopaanwijzingen als ontvangstbewijs plaatste.

De Mac Mini, een betaalbare Apple-computer die plat op een bureau staat en past in de palm van je handis tegenwoordig het favoriete apparaat geworden om OpenClaw uit te voeren. (De Mini verkoopt ‘als warme broodjes’, vertelde een ‘verwarde’ Apple-medewerker mij blijkbaar de beroemde AI-onderzoeker Andrej Karpathy toen hij er een kocht om een ​​OpenClaw-alternatief te gebruiken genaamd NanoClaw.)

Open Klauw is natuurlijk de open source AI-agent die bekendheid verwierf via Moltbook, een sociaal netwerk dat alleen uit AI bestaat. OpenClaw-agenten stonden daarin centraal nu grotendeels ontkrachte aflevering op Moltbook, waar het leek alsof de AI’s tegen mensen samenzweerden.

Maar de missie van OpenClaw, volgens zijn GitHub-paginais niet gericht op sociale netwerken. Het is bedoeld om een ​​persoonlijke AI-assistent te zijn die op uw eigen apparaten draait.

Mensen in Silicon Valley zijn zo verliefd geworden op OpenClaw dat het ‘klauwt’ en ‘jeukt’ favoriete modewoorden voor agenten die op persoonlijke hardware draaien. Andere dergelijke middelen omvatten ZeroClaw, IJzerklauwEn Picoklauw. Het podcastteam van Y Combinator verscheen zelfs op die van hen laatste aflevering gekleed in kreeftenkostuums.

Techcrunch-evenement

Boston, MA
|
9 juni 2026

Maar de post van Yue dient als waarschuwing. Zoals anderen op X opmerkten: als een AI-beveiligingsonderzoeker dit probleem zou tegenkomen, welke hoop hebben gewone stervelingen dan?

‘Heb je met opzet de bumper getest of een beginnersfout gemaakt?’ vroeg een softwareontwikkelaar haar bij X.

“Rookie error tbh,” antwoordde ze. Ze had haar agent getest met een kleinere ‘speelgoed’-inbox, zoals ze het noemde, en die had goed gewerkt voor minder belangrijke e-mails. Het had haar vertrouwen gewonnen, dus dacht ze dat ze het op het echte werk zou loslaten.

Yue gelooft dat de grote hoeveelheid gegevens in haar echte inbox ‘compressie teweegbracht’, schreef ze. Compressie vindt plaats wanneer het contextvenster (de doorlopende registratie van alles wat de AI tijdens een sessie is verteld en gedaan) te groot wordt, waardoor de agent het gesprek begint samen te vatten, te comprimeren en te beheren.

Op dat moment kan de AI instructies overslaan die de mens nogal belangrijk vindt.

In dit geval heeft het apparaat mogelijk haar laatste prompt overgeslagen (waarin ze zei dat het niet moest handelen) en is het teruggekeerd naar de instructies vanuit de ‘speelgoed’-inbox.

Net als verschillende anderen op X opgemerkt, aanwijzingen zijn niet te vertrouwen om als beveiliger op te treden. Modellen kunnen deze verkeerd begrijpen of negeren.

Verschillende mensen kwamen met suggesties, variërend van de exacte syntaxis die Yue had moeten gebruiken om de agent te stoppen tot verschillende methoden om een ​​betere naleving van de antiblokkering te garanderen, zoals het schrijven van instructies naar speciale bestanden of het gebruik van andere open source-tools.

In het belang van volledige transparantie kon TechCrunch niet onafhankelijk verifiëren wat er met de inbox van Yue was gebeurd. (Ze reageerde niet op ons verzoek om commentaar, hoewel ze wel reageerde op veel vragen en opmerkingen die haar op X werden gestuurd.)

Maar het maakt niet uit.

Het punt van het verhaal is dat middelen die zich richten op kenniswerkers in hun huidige ontwikkelingsfase riskant zijn. Mensen die zeggen dat ze ze met succes gebruiken, verzamelen methoden om zichzelf te beschermen.

Op een dag, misschien binnenkort (in 2027? 2028?), zijn ze misschien klaar voor wijdverbreid gebruik. God weet dat velen van ons graag hulp zouden willen hebben bij het e-mailen, het bestellen van boodschappen en het plannen van tandartsafspraken. Maar die dag is nog niet gekomen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in