Uren nadat OpenAI zijn vlaggenschipfunderingsmodel heeft bijgewerkt GPT-5 tot GPT-5.1dat belooft minder tokengebruik in het algemeen en een aangenamere persoonlijkheid met meer vooraf ingestelde opties, Chinese zoekgigant Baidu onthulde zijn volgende generatie funderingsmodel, ERNIE 5.0, samen met een reeks AI-productupgrades en strategische internationale uitbreidingen.
Het doel: zichzelf positioneren als een mondiale concurrent in de steeds competitiever wordende zakelijke AI-markt.
Aangekondigd tijdens het Baidu World 2025-evenement van het bedrijf, is ERNIE 5.0 een eigen, origineel omnimodaal model dat is ontworpen om gezamenlijk inhoud te verwerken en te genereren in de vorm van tekst, afbeeldingen, audio en video.
In tegenstelling tot de onlangs uitgebrachte Baidu ERNIE-4.5-VL-28B-A3B-Denkendat open source is onder een ondernemingsvriendelijke en tolerante Apache 2.0-licentie, ERNIE 5.0 is een eigen model en is alleen beschikbaar via Baidu’s ERNIE Bot site (ik moest het handmatig selecteren in de vervolgkeuzelijst Modelkiezer) en Qianfan cloudplatform application programming interface (API) voor zakelijke klanten.
Naast de modellancering introduceerde Baidu belangrijke updates voor zijn digitale menselijke platform, tools zonder code en AI-agents voor algemene doeleinden – allemaal gericht op het uitbreiden van zijn AI-voetafdruk buiten China.
Het bedrijf introduceerde ook de ERNIE 5.0 Preview 1022, een variant die is geoptimaliseerd voor tekstintensieve taken, samen met het algemene preview-model dat over de verschillende modaliteiten heen balanceert.
Baidu benadrukte dat ERNIE 5.0 een verschuiving vertegenwoordigt in de manier waarop intelligentie op grote schaal wordt ingezet, waarbij CEO Robin Li verklaarde: “Wanneer je AI internaliseert, wordt het een ingebouwde mogelijkheid en transformeert intelligentie van een kostenpost in een bron van productiviteit.”
Waar ERNIE 5.0 GPT-5 en Gemini 2.5 Pro overtreft
De benchmarkresultaten van ERNIE 5.0 suggereren dat Baidu pariteit (of bijna pariteit) heeft bereikt met de beste westerse funderingsmodellen voor een breed scala aan taken.
In openbare benchmarkdia’s die tijdens het Baidu World 2025-evenement werden gedeeld, overtrof of evenaarde ERNIE 5.0 Preview OpenAI’s GPT-5-High en Google’s Gemini 2.5 Pro in multimodaal redeneren, documentbegrip en beeldgebaseerde kwaliteitsborgingterwijl ook demonstreert sterke vaardigheden op het gebied van taalmodellering en code-uitvoering.
Het bedrijf benadrukte zijn vermogen om gemeenschappelijke inputs en outputs over verschillende modaliteiten heen te verwerken, in plaats van te vertrouwen op post-hoc modaliteitsfusie, die het omschreef als een technische differentiator.
Op het gebied van visuele taken behaalde ERNIE 5.0 leidende scores op OCRBench, DocVQA en ChartQA, drie benchmarks die documentherkenning, -begrip en gestructureerde data-redenering testen.
Baidu beweert dat het model zowel de GPT-5-High als de Gemini 2.5 Pro versloeg op deze op documenten en grafieken gebaseerde benchmarks, gebieden die het beschrijft als de kern van bedrijfstoepassingen zoals geautomatiseerde documentverwerking en financiële analyses.
Bij het genereren van afbeeldingen evenaarde of overtrof ERNIE 5.0 Google’s Veo3 in categorieën, waaronder semantische uitlijning en beeldkwaliteit, volgens Baidu’s interne, op GenEval gebaseerde evaluatie. Baidu beweerde dat de multimodale integratie van het model het mogelijk maakt om visuele inhoud te genereren en te interpreteren met een groter contextueel bewustzijn dan modellen die afhankelijk zijn van modaliteitsspecifieke encoders.
Voor audio- en spraaktaken demonstreerde ERNIE 5.0 concurrerende resultaten op de MM-AU- en TUT2017-benchmarks voor audiobegrip, en beantwoordde het vragen over gesproken taalinvoer. De audioprestaties, hoewel niet zo zwaar benadrukt als visie of tekst, suggereren een brede capaciteitsvoetafdruk die bedoeld is om multimodale toepassingen met een volledig spectrum te ondersteunen.
Bij taaltaken liet het model sterke resultaten zien in termen van het volgen van instructies, het beantwoorden van feitelijke vragen en wiskundig redeneren – kerngebieden die het zakelijke nut van grote taalmodellen bepalen.
De Preview 1022-variant van ERNIE 5.0, op maat gemaakt voor tekstuele prestaties, liet zelfs sterkere taalspecifieke resultaten zien in Early Developer Access. Hoewel Baidu geen brede superioriteit claimt in het redeneren van algemene talen, suggereren de interne evaluaties dat ERNIE 5.0 Preview 1022 de kloof met Engelstalige modellen overbrugt en deze overtreft in Chineestalige prestaties.
Hoewel Baidu niet alle benchmarkdetails of ruwe scores publiekelijk heeft vrijgegeven, suggereert de positionering van de prestaties een bewuste poging om de ERNIE 5.0 niet als een multimodaal nichesysteem te framen, maar als een vlaggenschipmodel dat concurreert met de grootste gesloten-lusmodellen voor algemene doeleinden.
Waar Baidu beweert dat hij een duidelijke voorsprong heeft, is het gestructureerd begrijpen van documenten, het redeneren van visuele diagrammen en de integratie van meerdere modaliteiten in één enkele, native modelleringsarchitectuur. Onafhankelijke verificatie van deze resultaten is nog in behandeling, maar de breedte van de geclaimde capaciteiten positioneert ERNIE 5.0 als een serieus alternatief in het multimodale funderingsmodellandschap.
De prijsstrategie van het bedrijf
ERNIE 5.0 bevindt zich op prijs einde van Baidu’s modelprijsstructuur. Het bedrijf heeft specifieke prijzen vrijgegeven voor API-gebruik op zijn Qianfan-platform, waardoor de kosten in lijn worden gebracht met andere topaanbiedingen van Chinese concurrenten zoals Alibaba.
|
Model |
Invoerprijs (per 1.000 tokens) |
Uitvoerkosten (per 1.000 tokens) |
Bron |
|
ERNIE 5.0 |
$ 0,00085 (¥ 0,006) |
USD 0,0034 (¥0,024) |
|
|
ERNIE 4.5 Turbo (bijv.) |
$ 0,00011 (¥ 0,0008) |
$ 0,00045 (¥ 0,0032) |
|
|
Qwen3 (voorbeeld codeur) |
$ 0,00085 (¥ 0,006) |
USD 0,0034 (¥0,024) |
Het contrast in kosten tussen de ERNIE 5.0 en eerdere modellen zoals de ERNIE 4.5 Turbo onderstreept Baidu’s strategie om onderscheid te maken tussen modellen met een hoog volume, lage kosten en modellen met hoge capaciteit die zijn ontworpen voor complexe taken en multimodaal redeneren.
Vergeleken met andere Amerikaanse alternatieven blijft het qua prijs gemiddeld:
|
Model |
Invoer (/1 miljoen tokens) |
Uitvoer (/1 miljoen tokens) |
Bron |
|
GPT-5.1 |
$ 1,25 |
$ 10,00 |
|
|
ERNIE 5.0 |
$ 0,85 |
$ 3,40 |
|
|
ERNIE 4.5 Turbo (bijv.) |
$ 0,11 |
$ 0,45 |
|
|
Werk afsluiten 4.1 |
$ 15,00 |
$ 75,00 |
|
|
Tweeling 2.5 Pro |
$ 1,25 (≤200.000) / $ 2,50 (>200.000) |
$ 10,00 (≤200.000) / $ 15,00 (>200.000) |
|
|
Grok 4 (grok-4-0709) |
$ 3,00 |
$ 15,00 |
Mondiale expansie: producten en platforms
In lijn met de modelrelease breidt Baidu zich internationaal uit:
-
GenFlow 3.0is nu met meer dan 20 miljoen gebruikers de grootste AI-agent voor algemene doeleinden van het bedrijf en beschikt over verbeterd geheugen en multimodaal taakbeheer.
-
Bekendeen zichzelf ontwikkelend middel dat complexe problemen dynamisch kan oplossen, is nu op uitnodiging commercieel verkrijgbaar.
-
Angstde internationale versie van Baidu’s codeloze bouwer Miaoda is wereldwijd live via medo.dev.
-
Oreaateen productiviteitswerkruimte met ondersteuning voor documenten, dia’s, afbeeldingen, video en podcast, heeft wereldwijd meer dan 1,2 miljoen gebruikers bereikt.
Het digitale menselijke platform van Baidu, dat al in Brazilië is uitgerold, maakt ook deel uit van de wereldwijde push. Volgens bedrijfsgegevens maakte 83% van de livestreamers tijdens het “Double 11” winkelevenement van dit jaar in China gebruik van de digitale menselijke technologie van Baidu, wat bijdroeg aan een stijging van 91% in GMV.
Ondertussen heeft Baidu’s autonome rijdienst Apollo Go de grens van 17 miljoen ritten overschreden, beheert het zelfrijdende wagenparken in 22 steden en claimt de titel van ’s werelds grootste robottaxinetwerk.
Het open source visie-taalmodel trekt de aandacht van de industrie
Twee dagen voor het vlaggenschip ERNIE 5.0-evenement bracht Baidu ook een open source multimodaal model uit onder de Apache 2.0-licentie: ERNIE-4.5-VL-28B-A3B-Denken.
Naad gerapporteerd door mijn collega Michael Nuñez bij VentureBeatactiveert het model slechts 3 miljard parameters met behoud van een totaal van 28 miljard, met behulp van een Mixture-of-Experts (MoE)-architectuur voor efficiënte gevolgtrekking.
De belangrijkste technische innovaties zijn onder meer:
-
“Denken met afbeeldingen”, dat dynamische, op zoom gebaseerde visuele analyse mogelijk maakt
-
Ondersteuning voor diagraminterpretatie, documentbegrip, visuele verankering en temporeel bewustzijn in video
-
Runtime op één enkele GPU van 80 GB, waardoor deze toegankelijk is voor middelgrote organisaties
-
Volledige compatibiliteit met Transformers, vLLM en Baidu’s FastDeploy-toolkit
Deze release verhoogt de druk op closed source-concurrenten. Met Apache 2.0-licenties wordt de ERNIE-4.5-VL-28B-A3B-Thinking een levensvatbaar basismodel voor commerciële toepassingen zonder licentiebeperkingen – iets wat maar weinig krachtige modellen in deze klasse bieden.
Communityfeedback en de reactie van Baidu
Na de lancering van ERNIE 5.0 heeft ontwikkelaar en AI-evaluator Lisan al Gaib (@scaling01) schreef een gemengde recensie over X. Hoewel ze aanvankelijk onder de indruk waren van de benchmarkprestaties van het model, rapporteerden ze een aanhoudend probleem waarbij ERNIE 5.0 herhaaldelijk tools aanriep – zelfs als er expliciet werd opgedragen dat niet te doen – tijdens taken voor het genereren van SVG.
“ERNIE 5.0 benchmarks zagen er gek uit totdat ik het testte… helaas heeft RL hersenbeschadiging of hebben ze een ernstig probleem met hun chatplatform/systeemprompt”, schreef Lisan.
Binnen enkele uren, Baidu’s op ontwikkelaars gerichte ondersteuningsaccount, @ErnieforDevs, antwoordde:
“Bedankt voor de feedback! Het is een bekende bug – bepaalde syntaxis kan deze consistent activeren. We werken aan een oplossing. Je kunt proberen de prompt opnieuw te formuleren of te wijzigen om deze voorlopig te vermijden.”
De snelle ommekeer weerspiegelt de toenemende nadruk van Baidu op communicatie met ontwikkelaars, vooral omdat het internationale gebruikers beheert via zowel eigen als open source-aanbiedingen.
Vooruitzichten voor Baidu en zijn ERNIE-oprichtende LLM-familie
Baidu’s ERNIE 5.0 markeert een strategische escalatie in de wereldwijde race naar funderingsmodellen. Met prestatie-eisen die het op één lijn stellen met de meest geavanceerde systemen van OpenAI en Google, en een mix van premium prijzen en open access-alternatieven, geeft Baidu blijk van zijn ambitie om niet alleen een binnenlandse AI-leider te worden, maar een geloofwaardige mondiale infrastructuuraanbieder.
In een tijd waarin zakelijke AI-gebruikers steeds meer multimodale prestaties, flexibele licenties en implementatie-efficiëntie eisen, kan Baidu’s tweesporenaanpak – premium gehoste API’s en open source releases – de aantrekkingskracht ervan vergroten binnen zowel ondernemingen als ontwikkelaarsgemeenschappen.
Of de prestatieclaims van het bedrijf stand houden bij tests door derden valt nog te bezien. Maar in een landschap dat wordt gevormd door stijgende kosten, modelcomplexiteit en computerknelpunten, geven ERNIE 5.0 en het ondersteunende ecosysteem Baidu een concurrentiepositie in de volgende golf van AI-implementatie.



