Home Nieuws Ai2 brengt Olmo 3 open modellen uit die concurreren met Meta, DeepSeek...

Ai2 brengt Olmo 3 open modellen uit die concurreren met Meta, DeepSeek en anderen op het gebied van prestaties en efficiëntie

21
0
Ai2 brengt Olmo 3 open modellen uit die concurreren met Meta, DeepSeek en anderen op het gebied van prestaties en efficiëntie

GeekWire-afbeelding / Todd Bishop

Allen Instituut voor AI (Ai2) heeft een nieuwe generatie vlaggenschipmodellen voor grote talen uitgebracht, ontworpen om directer te concurreren met industriële en academische zwaargewichten.

De in Seattle gevestigde non-profitorganisatie onthulde Olmo 3een verzameling open taalmodellen die naar eigen zeggen beter presteren dan volledig open modellen zoals Stanford’s Marin en commerciële open-weight-modellen zoals Meta’s Llama 3.1.

Eerdere versies van Olmo zijn in de eerste plaats ontworpen als wetenschappelijke hulpmiddelen om te begrijpen hoe AI-modellen worden gebouwd. Met Olmo 3 verbreedt Ai2 zijn focus en positioneert de modellen als krachtige, efficiënte en transparante systemen die geschikt zijn voor gebruik in de echte wereld, inclusief commerciële toepassingen.

“Olmo 3 bewijst dat openheid en prestaties samen kunnen evolueren”, zei Ali Farhadi, CEO van Ai2, donderdagochtend in een persbericht waarin hij de nieuwe modellen aankondigde.

Het maakt deel uit van een bredere ontwikkeling in de AI-wereld. Het afgelopen jaar zijn steeds krachtigere open modellen van bedrijven en universiteiten – waaronder Meta, DeepSeek, Qwen en Stanford – gaan concurreren met de prestaties van propriëtaire systemen van grote technologiebedrijven.

Veel van de nieuwste open modellen zijn ontworpen om hun redenering stap voor stap weer te geven – gewoonlijk ‘denkmodellen’ genoemd – die een centrale maatstaf in het veld zijn geworden.

Ai2 brengt de Olmo 3 uit in verschillende versies: Olmo 3 Base (het kernfunderingsmodel); Olmo 3 Instrueer (ingesteld om de gebruikershandleiding te volgen); Olmo 3 Think (ontworpen om explicieter redeneren te tonen); en Olmo 3 RL Zero (een experimenteel model getraind met versterkend leren).

Open modellen hebben terrein gewonnen bij startups en ondernemingen die meer controle willen over kosten en gegevens, samen met een duidelijker inzicht in hoe de technologie werkt.

Ai2 gaat nog verder door de volledige ‘modelflow’ achter Olmo 3 vrij te geven – een reeks snapshots die laten zien hoe het model tijdens elke trainingsstap evolueerde. Bovendien zal een bijgewerkte OlmoTrace-tool onderzoekers in staat stellen de redeneerstappen van een model terug te koppelen aan de specifieke gegevens en trainingsbeslissingen die daarop van invloed zijn geweest.

In termen van energie- en kostenefficiëntie zegt Ai2 dat het nieuwe Olmo-basismodel 2,5x efficiënter is om te trainen dan Meta’s Llama 3.1 (gebaseerd op GPU-uren per token, waarbij Olmo 3 Base wordt vergeleken met Meta’s 8B post-trained model). Een groot deel van deze winst komt voort uit het trainen van de Olmo 3 met veel minder tokens dan vergelijkbare systemen, in sommige gevallen zes keer minder dan concurrerende modellen.

Naast andere verbeteringen zegt Ai2 dat Olmo 3 veel langere documenten in één keer kan lezen of analyseren, met ondersteuning voor invoer tot 65.000 tokens, ongeveer de lengte van een kort boekhoofdstuk.

Ai2, opgericht in 2014 door wijlen Microsoft-medeoprichter Paul Allen, heeft lange tijd gefunctioneerd als een op onderzoek gerichte non-profitorganisatie die open source-tools en -modellen ontwikkelde, terwijl grotere commerciële laboratoria de schijnwerpers domineerden. Dit jaar heeft het instituut een aantal maatregelen genomen om zijn profiel te vergroten en tegelijkertijd zijn missie te behouden om AI te ontwikkelen om de grootste problemen ter wereld op te lossen.

In augustus was Ai2 gekozen door de National Science Foundation en Nvidia voor een baanbrekend initiatief van $152 miljoen om volledig open multimodale AI-modellen voor wetenschappelijk onderzoek te bouwen, waardoor het instituut een belangrijke bijdrage kan leveren aan de AI-ruggengraat van het land.

Het fungeert ook als de belangrijkste technische partner voor Kanker AI Alliantiehelpt Fred Hutch en andere vooraanstaande Amerikaanse kankercentra bij het trainen van AI-modellen op basis van klinische gegevens zonder patiëntendossiers prijs te geven.

Olmo 3 is nu beschikbaar op Hugging Face en Ai2’s modelspeeltuin.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in