Home Nieuws Duizenden mensen verkopen hun identiteit om AI te trainen – maar tegen...

Duizenden mensen verkopen hun identiteit om AI te trainen – maar tegen welke prijs? | AI (kunstmatige intelligentie)

2
0
Duizenden mensen verkopen hun identiteit om AI te trainen – maar tegen welke prijs? | AI (kunstmatige intelligentie)

EILANDVorig jaar ging Jacobus Louw op een ochtend op pad voor zijn dagelijkse buurtwandeling om de meeuwen te voeren die hij onderweg tegenkwam. Behalve deze keer nam hij verschillende video’s op van zijn voeten en het uitzicht terwijl hij op het trottoir liep. De video leverde hem $14 op, ongeveer tien keer het minimumloon van het land, of voor Louw, een 27-jarige uit Kaapstad, Zuid-Afrikaboodschappen voor een halve week.

De video was voor een ‘Urban Navigation’-taak die Louw vond op Kled AI, een app die bijdragers betaalt om hun gegevens, zoals video’s en foto’s, te uploaden om modellen voor kunstmatige intelligentie te trainen. Binnen een paar weken verdiende Louw $ 50 door foto’s en video’s van zijn dagelijks leven te uploaden.

Duizenden kilometers verderop in Ranchi, IndiëSahil Tigga, een 22-jarige student, verdient regelmatig geld door Silencio, dat audiogegevens crowdsourcet voor AI-training, toegang te geven tot de microfoon van zijn telefoon om omgevingsgeluid in de stad op te vangen, zoals in een restaurant of verkeer op een druk kruispunt. Hij uploadt ook opnames van zijn stem. Sahil reist om unieke omgevingen vast te leggen, zoals hotellobby’s, die nog niet op de kaarten van Silencio zijn gedocumenteerd. Hij verdient hiermee meer dan $ 100 per maand, genoeg om al zijn voedselkosten te dekken.

En in Chicago verdiende Ramelio Hill, een 18-jarige lasleerling, een paar honderd dollar door zijn privételefoonchats met vrienden en familie te verkopen aan Neon Mobile, een conversatie-AI-trainingsplatform dat $ 0,50 per minuut betaalt. Voor Hill was de berekening eenvoudig: hij dacht dat technologiebedrijven al zoveel van zijn privégegevens in handen hadden dat hij net zo goed een deel van de winst zou kunnen krijgen.

Deze giga-AI-trainers – die alles uploaden, van scènes om hen heen tot foto’s, video’s en audio van zichzelf – staan ​​in de frontlinie van een nieuwe wereldwijde data-goudkoorts. Nu de honger van Silicon Valley naar hoogwaardige data van menselijke kwaliteit groter is dan wat er uit het open internet kan worden gehaald, is er een bloeiende industrie van datamarktplaatsen ontstaan ​​om de kloof te overbruggen. Van Kaapstad tot Chicago geven duizenden mensen nu microlicenties voor hun biometrische identiteit en intieme gegevens om de volgende generatie kunstmatige intelligentie te trainen.

Maar deze nieuwe gig-economie brengt afwegingen met zich mee. In ruil voor een paar dollar voeden de docenten een industrie die hun vaardigheden uiteindelijk overbodig zou kunnen maken, terwijl sommigen van hen kwetsbaar blijven voor een toekomst van deepfakes, identiteitsdiefstal en digitale uitbuiting die ze nog maar net beginnen te begrijpen.

Houdt het AI-wiel draaiende

De taalmodellen van AI, zoals ChatGPT en Gemini, vereisen enorme hoeveelheden leermateriaal om te verbeteren, maar ze worden geconfronteerd met een datadroogte. De meest gebruikte trainingsbronnen, zoals C4, RefinedWeb en Dolma, die goed zijn voor een kwart van de datasets van de hoogste kwaliteit op internet, zijn nu beperkend generatieve AI-bedrijven uit trainingsmodellen met hun data. Onderzoekers discretie Al in 2026 zullen AI-bedrijven geen nieuwe, hoogwaardige tekst meer hebben om op te trainen. Hoewel sommige laboratoria hun toevlucht hebben genomen tot het terughalen van de synthetische gegevens die hun AI genereert, kan een dergelijk recursief proces leiding modellen om met fouten gevulde slop te produceren die hun ineenstorting veroorzaken.

Gig AI-trainers, die alles uploaden, van scènes om hen heen tot foto’s, video’s en audio van zichzelf, lopen voorop in een nieuwe wereldwijde data-goudkoorts. Foto: Arun Sankar/AFP via Getty Images

Dit is waar apps als Kled AI en Silencio in beeld komen. Op dit soort datamarktplaatsen verdienen miljoenen mensen geld met hun identiteit om AI te voeden en te trainen. Naast Kled AI, Silencio en Neon Mobile zijn er veel opties voor AI-trainers: Luel AI, ondersteund door de beroemde startup-incubator Y-Combinator, pikt meertalige gesprekken op voor ongeveer $ 0,15 per minuut. Met ElevenLabs kunt u uw stem digitaal klonen en door iedereen laten gebruiken voor een basistarief van $ 0,02 per stem. minuut.

Gig AI-training is een nieuwe opkomende functiecategorie en zal aanzienlijk groeien, zegt Bouke Klein Teeselink, hoogleraar economie aan King’s College London.

AI-bedrijven weten dat het betalen van mensen om hun gegevens in licentie te geven het risico van auteursrechtgeschillen helpt voorkomen als ze volledig zouden vertrouwen op inhoud die van internet wordt geschrapt, aldus Tesselink. Deze bedrijven hebben ook gegevens van hoge kwaliteit nodig om nieuw, verbeterd gedrag in hun systemen te modelleren, zegt Veniamin Veselovsky, een AI-onderzoeker. “Menselijke gegevens zijn momenteel de gouden standaard voor testen buiten de distributie van het model”, voegde Veselovsky eraan toe.

De mensen die gepassioneerd zijn door de machines, vooral die in de ontwikkelingslanden, hebben het geld vaak nodig en hebben weinig andere mogelijkheden om het te verdienen. Voor veel AI-trainers is dit werk een pragmatisch antwoord op economische ongelijkheid. In landen met een hoge werkloosheid en gedevalueerde valuta is het verdienen van Amerikaanse valuta vaak stabieler en lonender dan lokale banen. Sommigen van hen hebben moeite om banen op instapniveau veilig te stellen en uit noodzaak AI te trainen. Zelfs in rijkere landen hebben de stijgende kosten van levensonderhoud ervoor gezorgd dat jezelf verkopen een logische economische spil is geworden.

De valkuilen van gig-AI-training kunnen echter onzichtbaar zijn. Op sommige AI-marktplaatsen verlenen datatrainers onherroepelijke, royaltyvrije licenties waarmee bedrijven ‘afgeleide werken’ kunnen maken, wat betekent dat een stemopname van 20 minuten vandaag de dag een AI-klantenservicebot de komende jaren van energie zou kunnen voorzien, waarbij de trainer nooit meer een cent zal zien. Bovendien kan het gezicht van een gebruiker, vanwege het gebrek aan transparantie op deze marktplaatsen, terechtkomen in een gezichtsherkenningsdatabase of in een niet-overeenkomende advertentie aan de andere kant van de wereld, waar vrijwel geen legale toegang is.

Louw, de AI-trainer in Kaapstad, is zich bewust van de privacy-trade-off. En hoewel het inkomen onregelmatig is en niet voldoende om zijn volledige maandelijkse uitgaven te dekken, is hij bereid deze voorwaarden te accepteren om geld te verdienen. Hij kampte jarenlang met een zenuwziekte en kon geen baan krijgen, maar dankzij het geld dat hij verdiende op AI-marktplaatsen, waaronder Kled AI, kon hij sparen voor een spa-cursus van $ 500 om masseuse te worden.

“Als Zuid-Afrikaan is het meer waard om in USD betaald te worden dan mensen denken”, aldus Louw.

Mark Graham, hoogleraar internetgeografie aan de Universiteit van Oxford en auteur van Het voeden van de machineerkende dat het geld voor individuen in ontwikkelingslanden op de korte termijn zinvol kan zijn, maar waarschuwde dat “dit werk structureel precair, niet-progressief en in feite een doodlopende weg is”.

AI-marktplaatsen zijn afhankelijk van een ‘race naar de bodem van de lonen’, voegde Graham eraan toe, en een ‘tijdelijke vraag naar menselijke gegevens’. Zodra die vraag verandert, “hebben werknemers geen bescherming, geen overdraagbare vaardigheden en geen vangnet”.

De enige winnaar die naar voren komt, zei Graham, zijn “de platforms in het mondiale noorden (die) alle blijvende waarde vastleggen”.

Kaapstad, Zuid-Afrika. Foto: Peter Titmuss/Universal Images Group/Getty Images

Carte blanche-vergunningen

Hill, de in Chicago gevestigde AI-trainer, had gemengde gevoelens over het verkopen van zijn privételefoongesprekken aan Neon Mobile. Voor ongeveer 11 uur bellen verdiende hij $ 200, maar hij zei dat de app vaak offline ging en achterstallige betalingen niet vrijgaf. “Neon was voor mij altijd duister, maar ik bleef het gebruiken om wat extra, gemakkelijk geld te krijgen voor rekeningen en andere diverse uitgaven,” zei Hill.

Nu heroverweegt hij hoe gemakkelijk dat geld was. In september, slechts enkele weken na de lancering, ging Neon Mobile offline TechCrunch ontdekte een beveiligingsfout waardoor iedereen toegang kon krijgen tot telefoonnummers, gespreksopnamen en transcripties van gebruikers. Hill zei dat Neon Mobile hem hierover nooit heeft geïnformeerd, en nu maakt hij zich zorgen over de manier waarop zijn stem op internet kan worden misbruikt.

Wat Jennifer King, een privacyonderzoeker bij het Stanford Institute for Human-Centered Artificial Intelligence, verontrustend vindt, is dat AI-marktplaatsen onduidelijk zijn over hoe en waar de gegevens van gebruikers zullen worden ingezet. Zonder te onderhandelen of hun rechten te kennen, zo voegde ze eraan toe, “lopen consumenten het risico dat hun gegevens worden hergebruikt op een manier die ze niet leuk vinden of die ze niet begrijpen of voorzien, en als dat het geval is, zullen ze weinig verhaal hebben.”

Wanneer AI-trainers hun gegevens delen op Neon Mobile en Kled AI, verlenen ze een carte blanche-licentie (wereldwijd, exclusief, onherroepelijk, overdraagbaar en royaltyvrij) om hun beeltenis te verkopen, gebruiken, publiekelijk tentoon te stellen en op te slaan – en er zelfs afgeleide werken van te maken.

De oprichter van Kled AI, Avi Patel, zei dat de dataovereenkomsten van zijn bedrijf het gebruik beperken tot AI-training en onderzoeksdoeleinden. “Het hele bedrijf is afhankelijk van het vertrouwen van gebruikers. Als de bijdragers denken dat hun gegevens kunnen worden misbruikt, stopt het platform met werken.” Hij zei dat zijn bedrijf bedrijven onderzoekt voordat het datasets verkoopt, om te voorkomen dat er wordt samengewerkt met mensen met ‘dubieuze bedoelingen’, zoals pornografie, en met ‘overheidsinstanties’ waarvan het gelooft dat ze de gegevens kunnen gebruiken op manieren die in strijd zijn met dat vertrouwen.

Neon Mobile heeft niet gereageerd op een verzoek om commentaar.

Volgens Enrico Bonadio, hoogleraar rechten aan City St George’s, Universiteit van Londen, stellen de voorwaarden van deze overeenkomsten de platforms en hun klanten in staat om “bijna alles met dat materiaal te doen, voor altijd, zonder verdere betaling en zonder realistische manier voor de contribuant om zijn toestemming in te trekken of op zinvolle wijze opnieuw te onderhandelen”.

Zorgwekkender risico’s zijn onder meer dat trainergegevens worden gebruikt voor deepfakes en nabootsing van identiteit. Hoewel datamarktplaatsen beweren de gegevens te ontdoen van elke identificatie, zoals naam en locatie, voordat ze deze verkopen, zijn biometrische patronen inherent moeilijk om in robuuste zin te anonimiseren, voegde Bonadio eraan toe.

Spijt van de verkoper

Zelfs als AI-trainers in staat zijn om te onderhandelen over meer genuanceerde beschermingsmaatregelen voor de manier waarop hun gegevens zullen worden gebruikt, kunnen ze daar nog steeds spijt van hebben. Toen Adam Coy, een acteur uit New York, zijn personage in 2024 voor $ 1.000 verkocht aan Captions, een door AI aangedreven video-editor die nu Mirage heet, zorgde zijn overeenkomst ervoor dat zijn identiteit niet zou worden gebruikt voor enig politiek fonds of om alcohol, tabak of pornografie te verkopen, en dat de licentie binnen een jaar zou aflopen.

Captions reageerde niet op een verzoek om commentaar.

Niet lang daarna begonnen Adams vrienden hem video’s door te sturen die ze online hadden gevonden van zijn gezicht en stem, die miljoenen keren bekeken werden. In een van deze video’s wordt a Instagram-wielAdam’s AI-replica beweert een “vaginale arts” te zijn en maakt reclame voor onbewezen medische supplementen voor zwangere vrouwen en postpartumvrouwen.

“Het voelde beschamend om het aan mensen uit te leggen”, zei Coy.

“De reacties zijn raar om te lezen omdat ze commentaar geven op mijn fysieke verschijning, maar ik ben het niet echt”, voegde Coy eraan toe. “Mijn gevoel (toen ik besloot mijn beeltenis te verkopen) was dat de meeste modellen (tenminste) het internet zouden afstruinen naar gegevens en gelijkenissen, zodat ze er net zo goed voor betaald konden worden.”

Coy zei dat hij zich sindsdien niet meer heeft aangemeld voor AI-computeroptredens. Hij zou het alleen overwegen, zei hij, als een bedrijf een grotere compensatie zou bieden.



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in