Home Nieuws Intercom’s nieuwe, opnieuw getrainde Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet...

Intercom’s nieuwe, opnieuw getrainde Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet 4.6 op het gebied van klantenservice

2
0
Intercom’s nieuwe, opnieuw getrainde Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet 4.6 op het gebied van klantenservice

Intercom neemt een ongewone onderneming voor een oud softwarebedrijf: het bouwen van een eigen AI-model.

Het 15 jaar oude enorme klantenserviceplatform heeft Fin Apex 1.0 aangekondigd Donderdag kwam een ​​klein, op maat gemaakt AI-model naar voren dat volgens het bedrijf beter presteert dan toonaangevende frontier-modellen van OpenAI en Anthropic op het gebied van de statistieken die het belangrijkst zijn voor klantenondersteuning.

Het model geeft kracht Intercom’s bestaande Fin AI-agentdat al meer dan twee miljoen klantoproepen per week afhandelt.

Volgens benchmarks gedeeld met VentureBeat bereikt Fin Apex 1.0 een oplossingspercentage van 73,1% – het percentage klantproblemen dat volledig wordt opgelost zonder menselijke tussenkomst – vergeleken met 71,1% voor zowel GPT-5.4 als Claude Opus 4.5, en 69,6% voor Claude Sonnet 4.6. De marge van grofweg 2 procentpunt klinkt misschien bescheiden, maar is groter dan de typische kloof tussen opeenvolgende generaties Frontier-modellen.

Fin Apex 1.0 geselecteerde benchmarks-vergelijkingstabel. Krediet: intercom

“Als je grootschalige serviceactiviteiten uitvoert en 10 miljoen klanten of een miljard dollar aan inkomsten hebt, is een delta van 2% of 3% een heel groot aantal klanten, interacties en inkomsten”, vertelde Intercom-CEO Eoghan McCabe eerder deze week aan VentureBeat in een videogesprek.

Het model laat ook aanzienlijke verbeteringen zien in snelheid en nauwkeurigheid. Fin Apex levert reacties in 3,7 seconden – 0,6 seconden sneller dan de volgende snelste concurrent – ​​en toont een vermindering van 65% in hallucinaties vergeleken met de Claude Sonnet 4.6.

Misschien wel het meest opvallend voor zakelijke kopers: het kost ongeveer een vijfde van de kosten voor het gebruik van frontier-modellen en is opgenomen in de bestaande “per-outcome”-prijsstructuur van Intercom voor zijn bestaande klantplannen.

Wat is het basismodel? Maakt het überhaupt uit?

Maar er is een addertje onder het gras. Toen hem werd gevraagd om te specificeren op welk basismodel de Apex was gebouwd – en de parametergrootte ervan – weigerde Intercom.

“We delen het basismodel dat we voor Apex 1.0 hebben gebruikt niet – om concurrentieredenen en ook omdat we van plan zijn de basismodellen in de loop van de tijd te veranderen”, vertelde een woordvoerder van het bedrijf aan VentureBeat. Het bedrijf zou alleen bevestigen dat het model “de omvang heeft van honderden miljarden parameters.”

FTer vergelijking: Meta’s Llama 3.1 varieert van 8 miljard tot 405 miljard parameters, en grotere grensmodellen zoals GPT-5.4 lopen vermoedelijk in de biljoenen.

Of de prestatieclaims van Apex in die context passen – of dat de benchmarks optimalisaties weerspiegelen die alleen mogelijk zijn in beperkte, domeinspecifieke applicaties – is nog steeds een open vraag.

Intercom zegt daarvan te hebben geleerd de tegenslag AI-codering opstarten De cursor wijst toen critici de codeerassistent ervan beschuldigden het feit te begraven dat zijn Composer 2-model was gebouwd op verfijnde open gewichtsmodellen in plaats van op eigen technologie. Maar de les die Intercom heeft geleerd zal de sceptici misschien niet bevredigen: het bedrijf is transparant dat het een open gewichtsbasis heeft gebruikt, maar niet welke een.

“We zijn heel transparant dat we” een open gewichtsmodel hebben gebruikt, zei de woordvoerder. Toch is het weigeren om het model een naam te geven en tegelijkertijd transparantie te claimen een tegenstrijdigheid die waarschijnlijk de aandacht zal trekken – vooral omdat steeds meer bedrijven ‘gepatenteerde’ AI-equivalenten aanprijzen bij post-getrainde open source-stichtingen.

Voortgezet onderwijs als de nieuwe grens

Het argument van Intercom is dat het basismodel er simpelweg niet zoveel meer toe doet.

“Pre-training is nu een soort handelswaar”, zei McCabe. “De limiet ligt eigenlijk in de post-training. Na de training is het moeilijkste deel. Je hebt bedrijfseigen gegevens nodig. Je hebt bedrijfseigen bronnen van waarheid nodig.”

Het bedrijf heeft de gekozen basis opnieuw getraind met behulp van jarenlange eigen klantenservicegegevens die zijn verzameld via Fin, dat nu 2 miljoen klantvragen per week beantwoordt. Dat proces omvatte meer dan alleen het invoegen van transcripties in een model. Intercom bouwde versterkende leersystemen op basis van echte oplossingsresultaten die het model leren hoe succesvolle klantenservice er eigenlijk uitziet: de juiste toon, oordeelsoproep, gespreksstructuur en, kritisch, hoe te herkennen wanneer een probleem echt is opgelost en wanneer een klant nog steeds gefrustreerd is.

“De generieke modellen zijn getraind op generieke gegevens op internet. De specifieke modellen zijn getraind op hyperspecifieke domeingegevens”, legt McCabe uit. “Het is daarom logisch dat de intelligentie van de generieke modellen generiek is en de intelligentie van de specifieke modellen domeinspecifiek is en daarom op een veel betere manier werkt voor die use case.”

Als McCabe gelijk heeft dat de magie allemaal in de post-training zit, wordt de onwil om de basis te benoemen moeilijker te rechtvaardigen. Als de stichting werkelijk fungibel is, welk concurrentievoordeel beschermt geheimhouding dan?

Een inzet van $100 miljoen loont

De aankondiging komt terwijl Intercom’s AI-eerste draaipunt lijkt te werken. Fin nadert $100 miljoen aan jaarlijks terugkerende omzet en groeit met 3,5x, waardoor het het snelst groeiende segment is van de $400 miljoen ARR-activiteiten van het bedrijf. Fin zal naar verwachting begin volgend jaar de helft van de totale omzet van Intercom vertegenwoordigen.

Dat traject betekent een opmerkelijke ommekeer. Toen Fin werd gelanceerd, bedroeg het oplossingspercentage slechts 23%. Tegenwoordig bedraagt ​​dit gemiddeld 67% bij klanten, waarbij sommige implementaties bij grote ondernemingen oplopen tot wel 75%.

Om dit mogelijk te maken, heeft Intercom zijn AI-team de afgelopen drie jaar uitgebreid van ongeveer zes naar zestig onderzoekers – een aanzienlijke investering voor een bedrijf waarvan McCabe toegeeft dat het zich vóór de AI-spil “in een hele slechte positie” bevond. Het gemiddelde groeipercentage voor publieke softwarebedrijven ligt rond de 11%; Intercom verwacht dit jaar een groei van 37% te realiseren.

“We zijn veruit de eersten in de categorie die ons eigen model trainen”, zei McCabe. “Er is niemand anders die dit een jaar of langer wil.”

De specificatie en specialisatie van AI

De stelling van McCabe sluit aan bij een bredere trend die Andrej Karpathy, voormalig AI-leider bij Tesla en OpenAI, onlangs omschreef als de ‘speciatie’ van AI-modellen – een proliferatie van gespecialiseerde systemen die zijn geoptimaliseerd voor beperkte taken in plaats van algemene intelligentie.

Klantenservice is volgens McCabe bij uitstek geschikt voor deze aanpak. Het is een van de slechts twee of drie gebruiksscenario’s voor zakelijke AI die tot nu toe echte economische tractie hebben gevonden, naast codeerassistenten en mogelijk legale AI. Het heeft meer dan een miljard dollar aan durfkapitaal aangetrokken voor concurrenten als Decagon en Sierra, waardoor de ruimte, in de woorden van McCabe, ‘meedogenloos concurrerend’ is geworden.

De vraag is of domeinspecifieke modellen een blijvend voordeel vertegenwoordigen of een tijdelijke arbitrage die grenslaboratoria uiteindelijk zullen sluiten. McCabe is van mening dat de laboratoria te kampen hebben met structurele beperkingen.

“Misschien is de toekomst dat Anthropic een groot aanbod van veel verschillende gespecialiseerde modellen heeft. Misschien lijkt het daar wel op”, zei hij. “Maar de realiteit is dat ik denk dat de generieke modellen op dit moment niet in staat zullen zijn de domeinspecifieke modellen bij te houden.”

Naast efficiëntie te ervaren

De vroege adoptie van AI bij bedrijven was sterk gericht op kostenreductie, waarbij dure menselijke agenten werden vervangen door goedkopere geautomatiseerde agenten. Maar McCabe ziet het gesprek verschuiven naar de kwaliteit van de ervaring.

“Aanvankelijk dacht ik: ‘Holy shit, we kunnen dit echt veel goedkoper doen.'” En nu denken ze: ‘Wacht, nee, we kunnen klanten een veel betere ervaring bieden’, zei hij.

De visie gaat verder dan het eenvoudig oplossen van zoekopdrachten. McCabe stelt zich AI-agenten voor die optreden als consultants: een bot van een schoenenwinkel die niet alleen verzendvragen beantwoordt, maar ook stylingadvies geeft en klanten laat zien hoe verschillende opties er uit zouden kunnen zien.

“De klantenservice is altijd behoorlijk slecht geweest”, zei McCabe botweg. “Zelfs bij de allerbeste merken sta je te wachten op een telefoontje, je springt rond op verschillende afdelingen. Er is nu een kans om een ​​werkelijk perfecte klantervaring te bieden.”

Prijs en beschikbaarheid

Voor bestaande Fin-klanten brengt de upgrade naar Apex geen extra kosten met zich mee. Intercom bevestigde dat de klanttarieven ongewijzigd blijven: gebruikers zullen net als voorheen per resultaat blijven betalen, tegen $ 0,99 per losse interactie, en profiteren automatisch van het nieuwe model.

Apex is niet beschikbaar als zelfstandig model of via een externe API. Het is alleen beschikbaar via Fin, wat betekent dat bedrijven het model niet zelfstandig kunnen licentiëren of in hun eigen producten kunnen integreren. Deze beperking beperkt wellicht het vermogen van Intercom om geld te verdienen met het model buiten het bestaande klantenbestand, maar houdt de technologie in praktische zin ook eigen, ongeacht wat het onderliggende basismodel blijkt te zijn.

Wat is het volgende

Intercom is van plan om Fin uit te breiden van de klantenservice naar verkoop en marketing en het te positioneren als een directe concurrent van de Agentforce-visie van Salesforce, die tot doel heeft AI-agenten te leveren gedurende de hele levenscyclus van de klant.

Voor de bredere SaaS-industrie roept de stap van Intercom ongemakkelijke vragen op. Als een 15-jarig klantenservicebedrijf een model kan bouwen dat beter presteert dan OpenAI en Anthropic in zijn domein, wat betekent dat dan voor leveranciers die nog steeds afhankelijk zijn van generieke API-aanroepen? En als ‘geavanceerd onderwijs de nieuwe grens is’, zoals McCabe benadrukt, zullen bedrijven die doorbraken claimen dan onder druk komen te staan ​​om hun werk te laten zien – of zich blijven verschuilen achter concurrentiegeheim terwijl ze transparantie aanprijzen?

McCabe’s antwoord op de eerste vraag: gepresenteerd in een recent LinkedIn-berichtis scherp: “Als je geen agentbedrijf kunt worden, heeft je CRUD-appbedrijf een beperkte toekomst.”

Het antwoord op de tweede vraag valt nog te bezien.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in