Home Nieuws Deze AI-aangedreven machine verandert foto’s in geuren

Deze AI-aangedreven machine verandert foto’s in geuren

3
0
Deze AI-aangedreven machine verandert foto’s in geuren

Stel je een herinnering uit je kindertijd voor, een herinnering die echt en nostalgisch aanvoelt, maar op de een of andere manier net buiten bereik ligt: ​​misschien een familie-uitje naar het strand, of een moment midden in de schommel op de speelset, of een middagje op jacht naar klavertje vier. Stel je nu eens voor dat je dat gouden moment in een geur zou kunnen stoppen.

Een wetenschapper weet het METCyrus Clarke werkt eraan om precies dat te doen. Samen met een team van collega-onderzoekers heeft Clarke een fysieke machine ontwikkeld, genaamd Het Anemoia-apparaatwie gebruikt er een generatief AI-model een stockfoto analyseren, in een korte zin beschrijven en na eigen inbreng van de gebruiker deze beschrijving omzetten in een unieke geur.

Het woord “anemoia” was uitgevonden door auteur John Koenig en opgenomen in zijn boek uit 2021, Het woordenboek van duistere smarten. Het verwijst naar een specifiek gevoel van nostalgie naar een tijd of plaats die je zelf nog nooit hebt ervaren – en dat is precies wat het team van Clarke hoopt vast te leggen met het Anemoia-apparaat.

Volgens een papier De eenheid, gepubliceerd door het team, onderzoekt het concept van ‘uitgebreid geheugen’, of het idee dat geheugen in het digitale tijdperk steeds vaker wordt opgeslagen en toegankelijk wordt gemaakt via externe media, zoals digitale archieven.

Studies hebben dat al aangetoond die herinnering kan plaatsvervangend worden gevormd – zoals wanneer een verhaal uit de tweede hand, misschien van een ouder, de eigen herinneringen vormgeeft – maar het Anemoia-apparaat is een heerlijk fysiek, interactief experiment in hoe AI kunnen gebruikers een herinnering laten ervaren aan een verleden waarin ze nooit echt hebben geleefd.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Het Anemoia-apparaat

De Anemoia-eenheid ziet eruit als iets dat je zou vinden in de medische ruimte van een retro sci-fi ruimteschip. Het is een slank ding van metaal en plastic dat wordt benadrukt door een uniek neongroen display en een eenvoudige rij van drie fysieke wijzerplaten. Onderaan wacht een glazen beker om de laatste geur op te vangen.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Om te beginnen voegt een gebruiker een afbeelding in het apparaat in. Een ingebouwd vision-taalmodel (VLM) analyseert de afbeelding en genereert een eerste bijschrift op basis van wat het vindt. Voor een afbeelding van toeristen in China, een voorbeeld dat in de krant wordt gebruikt, zou de entiteit kunnen schrijven: ‘Een toerist in zwarte korte broek en een kind poseert in de deuropening langs de Chinese Muur met de iconische stenen trappen en het bergachtige landschap dat zich uitstrekt tot aan de hemel.’

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Gebruikers kunnen vervolgens de parameters van het bijschrift aanpassen met de drie draaiknoppen: één om te bepalen welke persoon of object op de foto het onderwerp moet zijn; een andere om de leeftijd van het onderwerp te beschrijven; en een derde om de sfeer van de scène te beschrijven.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

“Persoonlijk ben ik erg geïnteresseerd in het uitvinden van nieuwe fysieke interfaces voor generatieve AI”, zegt Clarke. “Generatieve AI begint meestal met een lege prompt. De draaiknoppen vervangen dat door een fysieke, gemakkelijk te begrijpen grammatica. Je probeert niet ‘het juiste te zeggen’ tegen een algoritme, het lijkt meer op het afstemmen van een instrument.”

Een taalleermodel, gebouwd op basis van ChatGPT-4o, combineert het originele bijschrift en de gebruikersinvoer tot een kort, poëtisch verhaal. Als je de Grote Muur zelf zou kiezen als onderwerp van de eerder genoemde prompt, zou het resultaat zoiets zijn als: ‘Eeuwenlang, van de Strijdende Staten tot de Ming, heb ik met vreugde de loop van de tijd en talloze reizigers op mijn weg van steen, baksteen en hout gadegeslagen.’

Vervolgens komt de meest indrukwekkende taak van de LLM: het omzetten van dit geschreven gedicht in een tastbare geur.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Ruikt naar een geheugenportaal

Het geurontwikkelingsproces is niet alleen afhankelijk van het identificeren van de juiste geurnoten, maar ook van het oproepen van de juiste emoties.

Het team van Clarke trainde het model om te kiezen uit een geurbibliotheek met 39 verschillende geuren (sindsdien uitgebreid naar een breder portfolio van 50 geuren), variërend van oude boeken tot leer en vuil. Elke geur werd gecodeerd met een reeks descriptoren die hen labelden met details zoals hun primaire noten, bijbehorende concepten en sterkste gevoelens. Het grote taalmodel (LLM) gebruikt zijn training om de juiste geuren te selecteren en te bepalen hoeveel van elk ervan in het uiteindelijke brouwsel moet worden gebruikt.

Al die informatie wordt naar een aangepast reukscherm gestuurd, dat vier pompen gebruikt om de benodigde vloeistof uit hun flesjes en in de wachtende beker te zuigen (de uiteindelijke formule voor de geur van de Grote Muur omvat kampvuur, vuil, cederhout en bamboe). Het Anemoia-apparaat kan een vrijwel oneindig aantal geuren opvangen de geur van een zandstrand op een warme zomerdag in de jaren 80 naar de geur van een stel dat geniet van een peer in een schilderachtige tuin.

Uiteindelijk, zo concludeert de studie, is het apparaat een provocatie die de vraag stelt ‘wat het betekent om te onthouden wanneer de herinnering zelf kan worden gegenereerd, wat het betekent om te voelen als dat gevoel samen met een machine wordt gecreëerd, en wat het betekent om mens te zijn als we mooie, geurige ficties kunnen maken over een verleden dat we nooit hebben geleefd.’

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in