Home Nieuws MiniMax’s nieuwe open M2.5 en M2.5 Lightning zijn bijna de nieuwste en...

MiniMax’s nieuwe open M2.5 en M2.5 Lightning zijn bijna de nieuwste en kosten 1/20 van de Claude Opus 4.6

3
0
MiniMax’s nieuwe open M2.5 en M2.5 Lightning zijn bijna de nieuwste en kosten 1/20 van de Claude Opus 4.6

Chinese AI-startup MiniMaxmet het hoofdkantoor in Shanghai, heeft vandaag schokgolven door de AI-industrie gestuurd met de release van zijn nieuwe M2.5 taalmodel in twee smaken, die beloven geavanceerde kunstmatige intelligentie zo goedkoop te maken dat u zich misschien helemaal geen zorgen meer hoeft te maken over de rekening.

Er wordt ook gezegd dat “open source-code“, hoewel de gewichten (instellingen) en code nog niet zijn vrijgegeven, noch het exacte licentietype of de exacte licentievoorwaarden hebben. Maar het doet er bijna niet toe, gezien hoe goedkoop MiniMax het aanbiedt via zijn API en partners.

De afgelopen jaren was het gebruik van de krachtigste AI ter wereld hetzelfde als het inhuren van een dure consultant: het was briljant, maar je hield voortdurend de klok in de gaten (en het aantal tokens). M2.5 verandert die wiskunde, De marginale kosten kunnen met maar liefst 95% worden verlaagd.

Door prestaties te leveren die kunnen wedijveren met de topmodellen van Google en Anthropic, tegen een fractie van de kosten, vooral bij het gebruik van agenttools voor zakelijke taken, waaronder creatie van Microsoft Word-, Excel- en PowerPoint-bestandenMiniMax gokt erop dat de toekomst niet alleen gaat over hoe slim een ​​model is, maar ook over hoe vaak je het je kunt veroorloven om het te gebruiken.

Met het oog hierop zegt MiniMax feitelijk te hebben samengewerkt “met senior professionals op terreinen als financiën, recht en sociale wetenschappen” om ervoor te zorgen dat het model werk in de echte wereld kon uitvoeren volgens hun specificaties en normen.

Deze release is belangrijk omdat het een verschuiving signaleert van AI als ‘chatbot’ naar AI als ‘werker’. Wanneer intelligentie ’te goedkoop wordt om te meten’, stoppen ontwikkelaars met het bouwen van eenvoudige vraag- en antwoordtools en beginnen ze met het bouwen van ‘agents’: software die urenlang autonoom complexe projecten kan coderen, onderzoeken en organiseren zonder veel geld uit te geven.

MiniMax heeft dit model zelfs al in zijn eigen activiteiten geïmplementeerd. Momenteel, 30% van alle taken op het hoofdkantoor van MiniMax wordt uitgevoerd door M2.5en een duizelingwekkende 80% van hun nieuwe vastgelegde code wordt gegenereerd door M2.5!

Zoals het MiniMax-team schrijft in hun releaseblogpost: “wij geloven dat M2.5 vrijwel onbeperkte mogelijkheden biedt voor de ontwikkeling en werking van agenten in de economie.”

Technologie: lean power en de CISPO-doorbraak

Het geheim van de effectiviteit van M2.5 ligt in de Mixture of Experts (MoE)-architectuur. In plaats van alle 230 miljard parameters uit te voeren voor elk woord dat het genereert, ‘activeert’ het model er slechts 10 miljard. Hierdoor kan het de redeneerdiepte van een enorm model behouden, terwijl het beweegt met de behendigheid van een veel kleiner model.

Om dit complexe systeem te trainen heeft MiniMax een eigen Reinforcement Learning (RL)-framework ontwikkeld, genaamd Forge. MiniMax-ingenieur Olijf zong vermeld op ThursdAI-podcast op YouTube dat deze techniek een belangrijke rol speelde bij het opschalen van de prestaties, zelfs bij gebruik van het relatief kleine aantal parameters, en dat het model gedurende een periode van twee maanden werd getraind.

Forge is ontworpen om het model te helpen leren van ‘omgevingen uit de echte wereld’ – waardoor de AI in feite kan oefenen met coderen en tools kan gebruiken in duizenden gesimuleerde werkruimten.

“Wat we ons realiseerden is dat er veel potentieel is met een klein model als dit als we er versterkend leren op trainen met een groot aantal omgevingen en agenten”, zei Song. “Maar het is niet zo eenvoudig om te doen”, eraan toevoegend dat ze er “veel tijd” aan hebben besteed.

Om het model tijdens deze intensieve training stabiel te houden, gebruikten ze een wiskundige aanpak genaamd CISPO (Clipping Importance Sampling Policy Optimization) en deelden ze de formule op hun blog.

Deze formule zorgt ervoor dat het model tijdens de training niet overcorrigeert, waardoor het kan ontwikkelen wat MiniMax een “Architect Mindset” noemt. In plaats van meteen code te gaan schrijven, heeft M2.5 geleerd eerst proactief de structuur, functies en interface van een project te plannen.

State-of-the-art (en dichtbij) benchmarks

De resultaten van deze architectuur worden weerspiegeld in de nieuwste brancheranglijsten. De M2.5 is niet alleen verbeterd; het is doorgedrongen tot het hoogste niveau van codeermodellen en nadert het nieuwste model van Anthropic, Claude Opus 4.6, slechts een week geleden uitgebrachten laat zien dat Chinese bedrijven nu slechts enkele dagen verwijderd zijn van een inhaalslag met veel betere middelen (in de vorm van GPU’s) in Amerikaanse laboratoria.

MiniMax M2.5-lijndiagram waarin de prestaties van verschillende modellen in de loop van de tijd worden vergeleken op de SWE-benchmark. Krediet: MiniMax

Hier zijn enkele van de nieuwe MiniMax M2.5 benchmark-hoogtepunten:

  • SWE-Bench geverifieerd: 80,2% — Komt overeen met Claude Opus 4.6-snelheden

  • BladerenComp: 76,3% — Toonaangevend zoek- en toolgebruik.

  • Multi-SWE-bank: 51,3% — SOTA bij meertalige codering

  • BFCL (utiliteitsoproep): 76,8% — Zeer nauwkeurige workflows voor agenten.

MiniMax M2.5 verschillende benchmarks vergelijkingsstaafdiagrammen

MiniMax M2.5 verschillende benchmarks vergelijkingsstaafdiagrammen. Krediet: MiniMax

Op de ThursdAI-podcast wees gastheer Alex Volkov erop dat MiniMax M2.5 extreem snel werkt en daarom minder tokens gebruikt om taken uit te voeren, in de orde van $ 0,15 per token. opdracht vergeleken met $ 3,00 voor Claude Opus 4.6.

Het doorbreken van de kostenbarrière

MiniMax biedt via zijn API twee versies van het model aan, beide gericht op productie in grote volumes:

  • M2.5-Bliksem: Geoptimaliseerd voor snelheid en levert 100 tokens per seconde. Het kost $0,30 per 1M invoertokens en $2,40 per 1M uitvoertokens.

  • Standaard M2.5: Geoptimaliseerd voor de kosten, draait op 50 tokens per seconde. Het kost de helft van de Lightning-versie ($0,15 per 1 miljoen invoertokens / $1,20 per 1 miljoen uitvoertokens).

In gewone taal: MiniMax beweert dat je voor ongeveer $ 10.000 een heel jaar lang vier ‘agenten’ (AI-werknemers) continu kunt laten werken.

Voor zakelijke gebruikers is deze prijs ongeveer 1/10 tot 1/20 van de prijs van concurrerende eigen modellen zoals de GPT-5 of Claude 4.6 Opus.

Model

Invoer

Productie

Totale kosten

Bron

Qwen3 Turbo

$ 0,05

$ 0,20

$ 0,25

Alibaba-wolk

deepseek-chat (V3.2-Exp)

$ 0,28

$ 0,42

$ 0,70

Diepzoeken

diepgaande redenen (V3.2-Exp)

$ 0,28

$ 0,42

$ 0,70

Diepzoeken

Grok 4.1 Snel (redeneren)

$ 0,20

$ 0,50

$ 0,70

xAI

Grok 4.1 Snel (niet redenerend)

$ 0,20

$ 0,50

$ 0,70

xAI

MiniMax M2.5

$ 0,15

$ 1,20

$ 1,35

MiniMax

MiniMax M2.5 Bliksem

$ 0,30

$ 2,40

$ 2,70 USD

MiniMax

Gemini 3 Flash-voorbeeld

$ 0,50

$ 3,00

$ 3,50

Googlen

Kimi-k2.5

$ 0,60

$ 3,00

$ 3,60

Maanschot

GLM-5

$ 1,00

$ 3,20

$ 4,20

Z.ai

ERNIE 5.0

$ 0,85

$ 3,40

$ 4,25

Baidu

Claude Haiku 4.5

$ 1,00

$ 5,00

$ 6,00

Antropisch

Qwen3-Max (23-01-2026)

$ 1,20

$ 6,00

$ 7,20

Alibaba-wolk

Gemini 3 Pro (≤200K)

$ 2,00

$ 12,00

$ 14,00

Googlen

GPT-5.2

$ 1,75

$ 14,00

$ 15,75

Open AI

Claude Sonnet 4.5

$ 3,00

$ 15,00

$ 18,00

Antropisch

Gemini 3 Pro (>200K)

$ 4,00

$ 18,00

$ 22,00

Googlen

Werk afsluiten 4.6

$ 5,00

$ 25,00

$ 30,00

Antropisch

GPT-5.2 Pro

$ 21,00

$ 168,00 USD

$ 189,00 USD

Open AI

Strategische implicaties voor bedrijven en managers

Voor technisch managers vertegenwoordigt M2.5 meer dan alleen een goedkopere API. Het verandert momenteel het operationele draaiboek voor bedrijven.

De druk om te ‘optimaliseren’ stimuleert het besparen van geld is verdwenen. U kunt nu high-context, high-sense modellen inzetten voor routinetaken die voorheen kostbaar waren.

De snelheidsverbetering van 37% bij het voltooien van end-to-end taken betekent dat de ‘agentische’ pijplijnen die worden gewaardeerd door AI-orkestrators – waar modellen met andere modellen praten – eindelijk snel genoeg bewegen voor realtime gebruikerstoepassingen.

Bovendien suggereert de hoge score van M2.5 op het gebied van financiële modellering (74,4% op MEWC) dat het bedrijf met minimaal toezicht overweg kan met de ‘stilzwijgende kennis’ van gespecialiseerde sectoren zoals recht en financiën.

Omdat M2.5 is gepositioneerd als een open source-model, kunnen organisaties mogelijk intensieve, geautomatiseerde code-audits uitvoeren op een schaal die voorheen onmogelijk was zonder massale menselijke tussenkomst, terwijl ze tegelijkertijd een betere controle over de gegevensbescherming behouden. Maar totdat de licentievoorwaarden en -gewichten worden gepubliceerd, zal dit slechts een bijnaam blijven.

De MiniMax M2.5 is een signaal dat de grens van AI niet langer alleen gaat over wie het grootste brein kan bouwen, maar wie van dat brein de nuttigste – en betaalbare – werker in de ruimte kan maken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in