Home Nieuws Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op...

Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op documentatie

3
0
Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op documentatie

Jarenlang is de ‘laatste kilometer’ van de digitale transformatie bezaaid met vergeten pdf’s en genegeerde trainingshandleidingen.

Organisaties geven miljoenen uit aan geavanceerde software zoals SAP of Salesforce, waarbij medewerkers moeite hebben met de basisnavigatie. Nu het tijdperk van agent-AI aanbreekt, worden bedrijven geconfronteerd met een tweesnijdend zwaard: ze moeten menselijke werknemers leren samenwerken met AI en tegelijkertijd AI-agenten leren navigeren door de labyrintische interfaces van de moderne onderneming.

Eén idee dat steeds meer terrein lijkt te winnen onder bedrijven die vooruitstrevend zijn op het gebied van AI: het gebruik van schermafbeeldingen en tutorials/walkthroughs van een persoon die een zakelijke taak uitvoert (of het nu gaat om het maken van een nieuw ticket of het verwerken van een factuur) en het trainen van AI om de stroom te repliceren op basis van de schermafbeelding. Deze week belde er een startup Standard Intelligence ging viraal op X toont een vroege demo van een open versie hiervan voor de fysieke en digitale wereld.

Maar de waarheid is dat er al actoren zijn die dit probleem voor het bedrijf zelf aanpakken: case-in-point, Begeleideen Israëlische startup geboren in de videocentrische jaren van de COVID-19-pandemie, heeft vandaag een overinschrijving van $50 miljoen in de Series B aangekondigd financieringsronde onder leiding van PSG Equity om deze kennisinfrastructuurcrisis aan te pakken.

In plaats van een agent een statische pdf-handleiding te overhandigen, levert Guidde kwalitatief hoogwaardige “Video Ground Truth” – een rijke stroom aan gegevens die zijn vastgelegd door echte menselijke experts terwijl ze door complexe software navigeren.

De investering signaleert een verschuiving in de manier waarop de technologie-industrie documentatie beschouwt – niet als een statisch bijproduct van werk, maar als de kritische telemetrie die nodig is om de volgende generatie autonome digitale agenten te trainen.

Technologie: van video-opname tot wereldmodellen

In de kern is Guidde een AI Digital Adoption Platform (ADAP). De technologische doorbraak ligt echter in wat er achter de schermen gebeurt tijdens een shoot.

Guidde neemt niet alleen pixels op; het legt elke klik, scroll en latente interactie met de HTML-pagina vast– de subtiele pauzes, de specifieke roldieptes en de correcties die een mens maakt als een systeem achterloopt. Deze telemetrie verandert onbewerkte video in een Vision-Language-Action (VLA) trainingsset.

Ondertussen verbergt de Magic Redaction van het platform automatisch gevoelige gegevens zoals wachtwoorden of creditcardnummers tijdens het vastleggen, waardoor materialen veilig blijven en HIPAA-compatibel blijven.

“Elke keer dat je op een knop klikt, sleept en neerzet, scrolt, typt, verzamelen we de interactie… alles, we ruimen het op – er is geen privé-informatie”, legde Guidde mede-oprichter en CEO Yoav Einav uit in een exclusief interview met VentureBeat.

Onder de motorkap legt het platform de onderliggende metadata en DOM-wijzigingen (Document Object Model) synchroon met videoframes vast. De differentiator is de telemetrie die onder het oppervlak verborgen is.

Deze rijke metadata creëren een ‘digitaal wereldmodel’ van bedrijfssoftware. En omdat elk bedrijf zijn eigen unieke mix van apps en processen gebruikt, Guidde creëert een datamijn waarmee bedrijfsagenten door verouderde gebruikersinterfaces kunnen redeneren met hetzelfde ruimtelijke inzicht als een mens, zodat automatisering daadwerkelijk werkt in een productieomgeving in plaats van alleen maar in een laboratoriumdemo.

Voor een mens is het een tutorial. Voor een AI-agent is het een hifi-kaart van de interface. Hierdoor kunnen agenten complexe gebruikersinterfaces ‘zien’ en doorzoeken zoals mensen dat doen, waardoor de ‘laatste mijl’ van automatisering wordt opgelost waar agenten voorheen faalden vanwege een gebrek aan specifieke zakelijke en in-situ gebruikscontext.

In zekere zin bouwt Guidde een ‘zelfrijdende auto’ zoals een Waymo voor computergebruik.

Product: drie pijlers in Guidd-ance

Het platform is geëvolueerd naar drie verschillende producten die zijn ontworpen om mee te groeien met de volwassenheid van een organisatie:

  1. Gids creëren: De engine voor vakexperts om workflows binnen enkele minuten om te zetten in documentatie.

  2. Begeleiden uitzending: een gepersonaliseerde aanbevelingsengine – vaak vergeleken met Netflix – die antwoorden levert binnen de tools die mensen daadwerkelijk gebruiken. Het weet wie de gebruiker is en op welke afdeling deze zich bevindt, zodat relevante inhoud precies wordt weergegeven wanneer dat nodig is.

  3. Begeleide ontdekking: De onlangs gelanceerde “agentic” pijler. Net zoals Waze wegen in kaart brengt door chauffeurs te observeren, brengt Discover-software routes in kaart door bij te houden hoe werknemers werken. Het begrijpt de workflow, creëert de inhoud en werkt deze automatisch bij wanneer de gebruikersinterface verandert.

Mensen trainen in het gebruik van AI – en AI door mensen in te zetten

Het meest niet voor de hand liggende aspect van de groei van Guidde is de missie met twee doelen. “Wij zijn het enige platform dat zowel mensen als agenten traint”, zei Einav.

Terwijl bedrijven AI-tools zoals Microsoft 365 Copilot of ServiceNow-agents uitrollen, stuiten ze op een vaardigheidskloof. Een van Guidde’s grootste klanten onthulde dat ze meer dan $ 1 miljoen per jaar betaalden voor een geavanceerde AI-tool, maar “niemand weet hoe ze deze moeten gebruiken omdat ze een trainingssessie van 30 minuten leuk vinden en dat is alles.” Guidde dicht dit gat door hapklare video-tutorials in de workflow aan te bieden.

Tegelijkertijd trainen deze video’s de AI-agenten zelf. Basismodellen zoals Gemini of GPT-4 hallucineren vaak wanneer ze specifieke bedrijfsworkflows moeten uitvoeren, omdat ze niet zijn getraind in de zeer specifieke, interne ‘vanilla-workflows’ die te vinden zijn in systemen van particuliere ondernemingen. Guidde levert het “startpunt”, “metadata” en “x,y-coördinaten van de knop” die een agent nodig heeft om een ​​actie te voltooien zonder vast te lopen.

Het multimodale voordeel

Om dit nauwkeurigheidsniveau te behouden, maakt Guidde gebruik van een multimodale infrastructuur. Het systeem is niet afhankelijk van één model; in plaats daarvan gebruikt het een “vloot” van modellen die elkaar evalueren.

  • Google Tweelingen: Over het algemeen gebruikt voor visuele taken zoals het analyseren van PDF’s of PowerPoints.

  • Antropische Claude: Wordt gebruikt om het verhaal en de verhalende scripts te schrijven.

  • Feedbacklussen: Wanneer een gebruiker een video bewerkt, worden deze gegevens teruggekoppeld naar het model om te voorkomen dat dezelfde fouten bij toekomstige opnames optreden.

Met deze aanpak kan Guidde een oude stapel van zes of zeven losgekoppelde tools – Loom voor opnemen, Adobe Premiere voor bewerken, elf Labs voor tekst-naar-spraak en Synthesia voor avatars – vervangen door één enkel AI-native platform. “We verpakken vrijwel alles voor u”, zegt Einav, “en automatiseren het hele proces op basis van uw merkrichtlijnen.”

Video-eerste oorsprongsverhaal

De oorsprong van Guidde ligt in een frustratie die iedere productmanager kent. Voordat Einav en mede-oprichter Dan Sahar het bedrijf oprichtten, waren ze jarenlang bezig met het beheersen van het videoverkeer bij Qwilt, een bedrijf dat ze in 2010 startten om te analyseren hoe mensen naar Netflix en Disney+ keken.

Toen COVID-19 toesloeg, zagen ze een enorme kans om deze video-expertise op de werkvloer toe te passen. Ze merkten op dat korte video-uitleggers de conversies van gratis naar betaalde accounts met 30% konden verhogen, maar dat de problemen bij het maken ervan onhoudbaar waren.

In een interview herinnerde Einav zich het ‘saaie werk’ in de oude wereld: ‘Mijn team in Israël deed de inhoud, iemand in de VS met een Amerikaans accent deed de vertelling, iemand in het marketingteam schreef het script… en iemand in het activeringsteam zou de montage doen.’ Door deze gefragmenteerde workflow duurde de productie van één video twee tot drie weken. “En dan twee weken later verandert het product en moet je het helemaal opnieuw doen”, voegde Einav toe.

Guidde is gebouwd om deze cyclus binnen enkele seconden te laten ineenstorten. Door de ‘Magic Capture’ van een workflow te automatiseren, genereert het platform direct een gestructureerd verhalend script en een professionele AI-voice-over. Dit neemt het redactionele knelpunt weg en verandert vakexperts in ’trainingskrachtcentrales’.

Licenties en marktimpact

De prijsstructuur van Guidde weerspiegelt de overgang van een nutsbedrijf naar een kernonderdeel van de infrastructuur van het bedrijf:

  • Vrij: $0 (maximaal 25 video’s, ondersteuning voor webapps).

  • Pro: $ 18/maker/maand (onbeperkt aantal video’s, tags ingesteld).

  • Bedrijf: $39/maker/maand (onbeperkt tekst-naar-spraak, analyse).

  • Onderneming: Aangepaste prijzen (meertalige vertaling, SSO, magische redactie).

De impact van het platform is al zichtbaar in de cijfers: 41% reductie in de tijd voor het maken van video’s En 34% minder inkomende supporttickets.

Voor klanten als Emerson betekent dit een 40-60% snellere creatie van wizards. Vooral ondersteuningsteams merken dat ze 80% van hun ticketvolume kunnen overdragen aan agenten, maar alleen als die agenten de inhoud hebben die nuttig is.

“De agent zonder de inhoud is nutteloos”, waarschuwt Einav, waarbij hij opmerkt dat de meeste documentatie van het bedrijf jaren verouderd is of volledig ongedocumenteerd is.

Vroege ontvangst door de gemeenschap en de industrie

Guidde heeft al 4.500 zakelijke klanten en wil dit aantal uitbreiden met een nieuwe financieringsronde. Support- en operations-managers hebben zich uitgesproken over het gebruiksgemak van het platform. Christopher Cummings, VP Client Experience bij DocNetwork, benadrukte het vermogen om “snelle, gepersonaliseerde videoreacties op vragen van klanten” te bieden.

Ondertussen merkte Wren Cotrone, directeur klantenondersteuning, op: “Als je de branding eenmaal hebt ingesteld zoals jij dat wilt, kun je echt door deze dingen heen zoomen.”

Ronen Nir, CEO van PSG, vatte de investeringsthese samen: “Guide lost een van de grootste obstakels op voor een succesvolle adoptie van AI: de kennisinfrastructuur.”

Waarom dit nu belangrijk is

De paradigmaverschuiving van op tekst gebaseerde LLM’s naar video-intelligentie voor agenten is de bepalende trend van 2026. Guiddes Series B signaleert dat de ‘grondwaarheid’ voor zakelijke agenten voortkomt uit ruwe video-observatie, en niet uit statische documentatie.

Door vast te leggen hoe werk wordt gedaan in tientallen miljoenen workflows, bouwt Guidde een dataset op die maar weinig anderen bezitten.

Zoals Einav het verwoordde: “Het begint met mensen die op de hoogte zijn en evolueert in de loop van de tijd naar volledige autonomie.” Voor de moderne onderneming is de kaart niet langer een statisch document; het is een levende, ademende video-intelligentielaag die zowel het personeel als de agenten die hen ondersteunen begeleidt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in