Home Nieuws Waarom MongoDB gelooft dat beter ophalen – en niet grotere modellen –...

Waarom MongoDB gelooft dat beter ophalen – en niet grotere modellen – de sleutel is tot betrouwbare zakelijke AI

7
0
Waarom MongoDB gelooft dat beter ophalen – en niet grotere modellen – de sleutel is tot betrouwbare zakelijke AI

Agentsystemen en enterprise search zijn afhankelijk van krachtig gegevensherstel dat efficiënt en nauwkeurig werkt. De databaseprovider MongoDB denkt dat dit de nieuwste is nestende modellen helpen de afnemende kwaliteit van het ophalen aan te pakken naarmate er meer AI-systemen in productie worden genomen.

Naarmate agent- en RAG-systemen in productie gaan, komt de kwaliteit van het ophalen naar voren als een stil faalpunt – een punt dat de nauwkeurigheid, de kosten en het gebruikersvertrouwen kan ondermijnen, zelfs als de modellen zelf goed presteren.

Het bedrijf lanceerde vier nieuwe versies van zijn inbedding en herpositionering van modellen. Voyage 4 zal beschikbaar zijn in vier modi: Voyage-4-embedded, Voyage-4-large, Voyage-4-lite en Voyage-4-nano.

MongoDB zei dat de inbedding van Voyage 4 als algemeen model dient; MongoDB beschouwt de Voyage-4-large als zijn vlaggenschipmodel. Voyage-4-lite richt zich op taken die een lage latentie en lagere kosten vereisen, en Voyage-4-nano is bedoeld voor meer lokale ontwikkel- en testomgevingen of voor het ophalen van gegevens op het apparaat.

De Voyage-4-nano is ook het eerste open gewichtsmodel van MongoDB. Alle modellen zijn beschikbaar via een API en op het Atlas-platform van MongoDB.

Het bedrijf zei dat de modellen beter presteren dan vergelijkbare modellen van Google en Cohere op de RTEB-benchmark. Gezichten knuffelen RTEB-benchmark plaatst de Voyage 4 als het beste nestmodel.

“Het inbedden van modellen is een van die onzichtbare keuzes die AI-ervaringen echt kunnen maken of breken”, zei Frank Liu, productmanager bij MongoDB, in een briefing. “Als je ze verkeerd begrijpt, zullen je zoekresultaten nogal willekeurig en oppervlakkig aanvoelen, maar als je ze goed hebt, voelt het plotseling alsof je applicatie je gebruikers en je gegevens begrijpt.”

Hij voegde eraan toe dat het doel van de Voyage 4-modellen is om het ophalen van gegevens uit de echte wereld te verbeteren, wat vaak mislukt wanneer agent- en RAG-pijpleidingen in productie gaan.

MongoDB heeft ook een nieuw multimodaal inbeddingsmodel uitgebracht, Voyage-multimodal-3.5, dat documenten kan verwerken die tekst, afbeeldingen en video bevatten. Dit model vectoriseert de gegevens en extraheert de semantische betekenis uit tabellen, afbeeldingen, figuren en dia’s die doorgaans in zakelijke documenten voorkomen.

Problemen met de inbedding van ondernemingen

Voor bedrijven is een agentsysteem slechts zo goed als zijn vermogen om op betrouwbare wijze de juiste informatie op het juiste moment op te halen. Deze vereiste wordt moeilijker naarmate de workloads groter worden en de contextvensters fragmenteren.

Verschillende modelaanbieders richten zich op deze laag van agent-AI. Die van Google Gemini Embedding-model bovenaan ze integreerden klassementen, en Cohere lanceerde de zijne Integreer 4 multimodale modellendie documenten van meer dan 200 pagina’s verwerkt. Mistral zei dat zijn coderingsinbeddingsmodel, Codestrale inbeddinghet overtreft Cohere, Google en zelfs MongoDB’s Voyage Code 3. MongoDB beweert dat benchmarkprestaties alleen niet de operationele complexiteit aanpakken waarmee bedrijven in de productie worden geconfronteerd.

MongoDB zei dat veel klanten hebben ontdekt dat hun datastacks de contextbewuste, ophaalintensieve werklasten in de productie niet aankunnen. Het bedrijf zei dat het meer fragmentatie ziet, waarbij bedrijven ongelijksoortige oplossingen moeten samenvoegen om databases te verbinden met een ophaal- of herschikkingsmodel. Om klanten te helpen die geen gefragmenteerde oplossingen willen, biedt het bedrijf zijn modellen aan via één enkel dataplatform, Atlas.

MongoDB’s weddenschap is dat het ophalen niet langer kan worden behandeld als een losse verzameling van de beste componenten. Om bedrijfsagenten betrouwbaar op schaal te laten werken, moeten inbedding, herschikking en de gegevenslaag functioneren als een nauw geïntegreerd systeem in plaats van als een samengevoegde stapel.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in