Volgens het management van het bedrijf is het bouwen van een AI-bedrijf op een ‘drijfzandfundament’ de centrale uitdaging waarmee oprichters vandaag de dag worden geconfronteerd Palona.
Vandaag maakt de in Palo Alto gevestigde startup – geleid door voormalige ingenieursveteranen van Google en Meta – een beslissende verticale stap in de restaurant- en horecaruimte met de lancering van vandaag van Palona Vision en Palona Workflow.
Het nieuwe aanbod transformeert de multimodale agentensuite van het bedrijf in een real-time besturingssysteem voor restaurantactiviteiten – dat camera’s, oproepen, gesprekken en gecoördineerde taakuitvoering omvat.
Het nieuws markeert een strategisch keerpunt voor het bedrijf debuut begin 2025toen het voor het eerst verscheen met $ 10 miljoen aan startfinanciering om emotioneel intelligente verkoopagenten op te bouwen voor brede direct-to-consumer-bedrijven.
Nu hij zijn focus beperkt tot een ‘multimodale ingebedde’ benadering van restaurants, biedt Palona een blauwdruk voor AI-bouwers over hoe ze verder kunnen gaan dan ‘dunne wikkels’ en diepgaande systemen kunnen bouwen die met grote inspanningen problemen in de fysieke wereld oplossen.
“Je bouwt een bedrijf op een fundament dat uit zand bestaat – geen drijfzand, maar stuifzand”, zegt mede-oprichter en CTO Tim Howes, verwijzend naar de instabiliteit van het huidige LLM-ecosysteem. “Dus hebben we een orkestratielaag gebouwd waarmee we modellen kunnen verhandelen op het gebied van prestaties, vloeibaarheid en prijs.”
VentureBeat sprak onlangs persoonlijk met Howes en mede-oprichter en CEO Maria Zhang op – waar anders? – een restaurant in NYC over de technische uitdagingen en harde lessen van hun lancering, groei en spil.
Het nieuwe aanbod: Visie en workflow als ‘digitale GM’
Voor de eindgebruiker – de restauranteigenaar of exploitant – is Palona’s nieuwste release ontworpen om te fungeren als een geautomatiseerde ’top operations manager’ die nooit slaapt.
Palona Vision maakt gebruik van beveiligingscamera’s in de winkel om operationele signalen te analyseren, zoals wachtrijlengtes, tafelverloop, knelpunten in de voorbereiding en netheid, zonder dat daarvoor nieuwe hardware nodig is.
Het monitort gegevens aan de voorkant, zoals de lengte van wachtrijen, het wisselen van tafels en de netheid, en identificeert ook problemen aan de achterkant, zoals vertragingen bij de voorbereiding of fouten bij het instellen van de stations.
Palona Workflow vult dit aan door operationele processen in meerdere stappen te automatiseren. Dit omvat het beheren van cateringbestellingen, het openen en sluiten van checklists en het uitvoeren van voedselbereidingen. Door videosignalen van Vision te correleren met Point-of-Sale (POS)-gegevens en personeelsbezetting, zorgt Workflow voor een consistente uitvoering op meerdere locaties.
“Palona Vision is alsof je elke locatie een digitale GM geeft”, zegt Shaz Khan, oprichter van Tono Pizzeria + Cheesesteaks, in een persbericht aan VentureBeat. “Het signaleert problemen voordat ze escaleren en bespaart mij uren per week.”
Ga verticaal: lessen in domeinexpertise
Palona’s reis begon met een met sterren bezaaide selectie. CEO Zhang was eerder VP Engineering bij Google en CTO van Tinder, terwijl mede-oprichter Howes de mede-uitvinder is van LDAP en voormalig CTO van Netscape.
Ondanks deze achtergrond was het eerste jaar van het team een les in de noodzaak van focus.
Aanvankelijk bediende Palona mode- en elektronicamerken, waarbij ze ‘wizard’- en ‘surfer guy’-persona’s creëerde om de verkoop af te handelen. Het team realiseerde zich echter al snel dat de restaurantindustrie een unieke kans van een biljoen dollar bood die ‘verrassend recessiebestendig’ was, maar ‘geplaagd’ werd door operationele inefficiënties.
“Advies aan oprichters van startups: ga niet multi-industrieel”, waarschuwde Zhang.
Door te verticaliseren evolueerde Palona van een ‘dunne’ chatlaag naar het bouwen van een ‘multisensorische informatiepijplijn’ die zicht, stem en tekst in tandem verwerkt.
Deze duidelijkheid van de focus maakte toegang mogelijk tot bedrijfseigen trainingsgegevens (zoals voorbereidingsplaybooks en gesprekstranscripties) terwijl het schrapen van generieke gegevens werd vermeden.
1. Bouwen op ‘verstuivingszand’
Om tegemoet te komen aan de realiteit van de AI-implementaties van ondernemingen in 2025 – waarbij er bijna wekelijks nieuwe, verbeterde modellen verschijnen – heeft Palona een orkestratielaag ontwikkeld waarvoor patent is aangevraagd.
In plaats van te worden ‘gebundeld’ met een enkele provider zoals OpenAI of Google, stelt Palona’s architectuur hen in staat modellen voor een dubbeltje uit te wisselen op basis van prestaties en kosten.
Ze gebruiken een mix van eigen en open source-modellen, waaronder Gemini voor benchmarks voor computervisie en specifieke taalmodellen voor taalgebruik in het Spaans of Chinees.
Voor bouwers is de boodschap duidelijk: laat de kernwaarde van uw product nooit de afhankelijkheid van één enkele leverancier zijn.
2. Van woorden naar ‘wereldmodellen’
De lancering van Palona Vision vertegenwoordigt een verschuiving van het begrijpen van woorden naar het begrijpen van de fysieke realiteit van een keuken.
Terwijl veel ontwikkelaars moeite hebben om afzonderlijke API’s samen te voegen, transformeert Palona’s nieuwe visiemodel bestaande camera’s in de winkel in operationele assistenten.
Het systeem identificeert in realtime “oorzaak en gevolg” – herkent of een pizza niet gaar is vanwege de “lichtbeige” kleur of waarschuwt een manager als een vitrine leeg is.
“In woorden gezegd betekent natuurkunde niets”, legde Zhang uit. “Maar eigenlijk laat ik de telefoon vallen, hij gaat altijd uit… we willen heel graag weten wat er aan de hand is in deze wereld van restaurants”.
3. De ‘Muffin’-oplossing: aangepaste geheugenarchitectuur
Een van de belangrijkste technische hindernissen waarmee Palona te maken kreeg, was geheugenbeheer. In een restaurantcontext is herinnering het verschil tussen een frustrerende interactie en een ‘magische’ interactie waarbij de agent de ‘gebruikelijke’ bestelling van een diner onthoudt.
Het team gebruikte aanvankelijk een niet-gespecificeerde open source-tool, maar ontdekte dat deze in 30% van de gevallen fouten opleverde. “Ik denk dat adviserende ontwikkelaars altijd het geheugen uitschakelen (op consumenten-AI-producten) omdat dit garandeert dat alles wordt vernietigd”, waarschuwde Zhang.
Om dit op te lossen bouwde Palona Muffin, een eigen geheugenbeheersysteem genaamd als een knipoog naar webcookies. In tegenstelling tot standaard vectorgebaseerde benaderingen die worstelen met gestructureerde gegevens, is Muffin ontworpen om met vier verschillende lagen om te gaan:
-
Gestructureerde gegevens: Stabiele feiten zoals afleveradressen of allergie-informatie.
-
Langzaam veranderende dimensies: loyaliteitsvoorkeuren en favoriete items.
-
Voorbijgaande en seizoensherinneringen: aanpassing aan verschuivingen, zoals de voorkeur voor koude dranken in juli boven warme chocolademelk in de winter.
-
Regionale context: standaardinstellingen zoals tijdzones of taalvoorkeuren.
De les voor bouwers: als de beste beschikbare tool niet goed genoeg is voor uw specifieke branche, wees dan bereid om uw eigen tool te bouwen.
4. Betrouwbaarheid door ‘GRACE’
In een keuken is een AI-fout niet zomaar een typefout; het is een verspilde bestelling of een veiligheidsrisico. Een recent incident op Stefanina’s Pizzeria in Missouri, waar een kunstmatige intelligentie nepaanbiedingen hallucineerde tijdens een dinerrushbenadrukt hoe snel het merkvertrouwen kan verdwijnen als er geen waarborgen zijn.
Om een dergelijke chaos te voorkomen, volgen de ingenieurs van Palona de interne onderdelen ervan GRACE-frame:
-
Vangrails: harde limieten voor het gedrag van agenten om ongeautoriseerde campagnes te voorkomen.
-
Red Teaming: Proactieve pogingen om de AI te ‘breken’ en potentiële hallucinatietriggers te identificeren.
-
App Sec: vergrendel API’s en integraties van derden met TLS, tokenisatie en systemen voor aanvalspreventie.
-
Naleving: Aardt elk antwoord op geverifieerde, gecontroleerde menugegevens om nauwkeurigheid te garanderen.
-
Escalatie: Leid complexe interacties door naar een menselijke manager voordat een gast onjuiste informatie ontvangt.
Deze betrouwbaarheid wordt geverifieerd door middel van grootschalige simulatie. “We hebben een miljoen manieren gesimuleerd om pizza te bestellen”, zei Zhang, waarbij hij de ene AI gebruikte om als klant op te treden en de andere om de bestelling op te nemen, waarbij hij de nauwkeurigheid meette om hallucinaties te elimineren.
Kortom
Met de lancering van Vision en Workflow gokt Palona erop dat de toekomst van enterprise AI niet in brede assistenten ligt, maar in gespecialiseerde ‘besturingssystemen’ die binnen een specifiek domein kunnen zien, horen en denken.
In tegenstelling tot AI-agenten voor algemene doeleinden, is het systeem van Palona ontworpen om restaurantworkflows uit te voeren en niet alleen te reageren op vragen. Het kan klanten onthouden, hen hun ‘gebruikelijke gerechten’ horen bestellen en de restaurantactiviteiten monitoren om er zeker van te zijn dat ze het eten aan de klant bezorgen volgens hun interne processen en richtlijnen, en signaleren wanneer er iets misgaat of cruciaal is. ontstoken fout gaan.
Voor Zhang is het doel om menselijke operators zich op hun vak te laten concentreren: “Als je het heerlijke eten vast hebt zitten… zullen we je vertellen wat je moet doen.”



