Home Nieuws Het bedrijf uit Bengaluru onthult twee AI-taalmodellen

Het bedrijf uit Bengaluru onthult twee AI-taalmodellen

3
0
Het bedrijf uit Bengaluru onthult twee AI-taalmodellen

Sarvam AI mede-oprichter Pratyush Kumar met premier Narendra Modi tijdens de inauguratie van India AI Impact Expo in Bharat Mandapam in New Delhi. Fotocredit: PMO via PTI-foto

Een paar maanden nadat de vakbondsregering had aangekondigd dat India zijn eigen grote taalmodel (LLM) zoals ChatGPT en DeepSeek zou creëren, onthulde het in Bengaluru gevestigde Sarvam AI hier op woensdag (18 februari 2026) twee taalmodellen op de AI Impact Summit. De modellen, genaamd Vikram, zullen open source zijn, zegt Pratyush Kumar, mede-oprichter van Sarvam.

India AI Summit 2026 Hoogtepunten dag 3

De heer Kumar presenteerde ze tijdens een keynote-toespraak tijdens het AI Research Symposium van de top. Beide modellen, zei hij, hadden andere vergelijkbare modellen van over de hele wereld verslagen op het gebied van industriële benchmarks.

Het trainen van een groot taalmodel is een reken- en vaardigheidsintensief proces dat soms miljoenen dollars aan werk met zich meebrengt door grafische verwerkingseenheden (GPU’s) die samenwerken in datacenters. Het ministerie van Elektronica en Informatietechnologie heeft in plaats daarvan de nadruk gelegd op gevolgtrekking (eigenlijk vragen om een ​​getraind model) in plaats van op training. In de periode na de lancering van de Chinese LLM DeepSeek R1 zei IT-minister Ashwini Vaishnaw echter dat een Indiaas bedrijf ook een LLM zou kunnen opleiden.

Sarvam kreeg de hulp van particuliere investeerders zoals Peak XV en Khosla Ventures, die samen tot 50 miljoen dollar in het bedrijf stopten. Het had ook de toegang tot GPU’s gesubsidieerd in het kader van het gezamenlijke computerprogramma van de IndiaAI Mission.

Een hoofddoel van de modellen was het verbeteren van Indiase talen, die niet erg goed presteren op de meeste AI-modellen vanwege de relatieve schaarste aan tekstuele inhoud die beschikbaar is in Indiase talen en die zou kunnen worden gebruikt om modellen te trainen. De heer Kumar gaf een demonstratie en vertaalde de Engelse inhoud in Indiase talen.

De lancering van de langverwachte modellen – een parametermodel van 35 miljard en een parametermodel van 105 miljard – wordt gezien als een mijlpaal voor de AI-ontwikkeling in India.

Deze zijn nog niet openbaar gemaakt. Een bericht op de website van Sarvam zegt dat er “binnenkort” een chatfunctie beschikbaar zal zijn.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in