Home Nieuws DeepSeek zal het langverwachte AI-model uitbrengen in een nieuwe uitdaging voor Amerikaanse...

DeepSeek zal het langverwachte AI-model uitbrengen in een nieuwe uitdaging voor Amerikaanse rivalen

3
0
DeepSeek zal het langverwachte AI-model uitbrengen in een nieuwe uitdaging voor Amerikaanse rivalen

Ontgrendel Editor’s Digest gratis

DeepSeek zal volgende week zijn nieuwste grote taalmodel uitbrengen, meer dan een jaar sinds de laatste grote release, in een nieuwe test van China’s ambities om Amerikaanse rivalen op het gebied van kunstmatige intelligentie uit te dagen.

Het in Hangzhou gevestigde laboratorium is van plan de V4 te onthullen, een ‘multimodaal’ model met mogelijkheden voor het genereren van afbeeldingen, video en tekst, volgens twee mensen die bekend zijn met de materie.

zeiden ze Diepzoeken had samengewerkt met de Chinese AI-chipmakers Huawei en Cambricon om V4 te optimaliseren voor hun nieuwste producten, aldus twee mensen met kennis van deze regelingen.

Deze stap duidt op een bredere Chinese poging om de afhankelijkheid van marktleider Nvidia te vermijden AI chips die onderworpen zijn aan exportcontroles in Washington, bedoeld om de technologische vooruitgang van het land te vertragen.

De nieuwe release van DeepSeek wordt getimed voorafgaand aan de jaarlijkse parlementaire ‘Two Sessions’-bijeenkomsten van volgende week, die op 4 maart beginnen. De spraakmakende politieke bijeenkomst zou de status van DeepSeek als nationaal AI-kampioen verder kunnen versterken.

Het zal de eerste grote modellancering van DeepSeek zijn sinds januari 2025, toen het zijn R1-redeneringsmodel onthulde. Het bedrijf beweerde een systeem te hebben gebouwd dat vergelijkbaar is met de toonaangevende modellen uit Silicon Valley, waarbij slechts een fractie van de rekenkracht werd gebruikt.

Deze stap veroorzaakte schokgolven door de Amerikaanse technologieaandelen, die door sommige experts werden omschreven als een ‘Spoetnik’-moment dat de snelle vooruitgang van China als AI-macht aankondigde.

Sindsdien heeft DeepSeek incrementele updates uitgebracht in plaats van een volledig nieuwe modellancering, waardoor binnenlandse rivalen, waaronder Alibaba en Moonshot, de vraag naar goedkope, open-source Chinese modellen konden veroveren.

De inspanningen van DeepSeek om V4 te optimaliseren voor chips van Chinese makelij zullen naar verwachting de lokale vraag naar zijn halfgeleiders versterken en de verschuiving van de Amerikaanse chipmakers Nvidia en AMD naar ‘gevolgtrekking’ versnellen – het genereren van antwoorden op basis van een getraind model.

Reuters was de eerste die berichtte over het werk van DeepSeek met Huawei en Cambricon.

DeepSeek heeft niet met Nvidia samengewerkt om zijn model voor zijn producten te optimaliseren, aldus een andere persoon die bekend is met de zaak.

Nvidia blijft de markt voor trainingschips domineren, vooral voor de rekenintensieve pre-trainingsfase waarin modellen enorme hoeveelheden gegevens verbruiken.

De FT meldde eerder dat DeepSeek had geprobeerd deze initiële training op Huawei-hardware uit te voeren, maar op technische problemen stuitte.

De R1-release van vorig jaar werd gepubliceerd naast een gedetailleerd technisch rapport over de technische technieken van DeepSeek die Nvidia-chips efficiënter gebruikten om het model te trainen en uit te voeren.

DeepSeek werd geprezen voor het delen van zijn trainingsmethoden om een ​​‘redeneermodel’ te ontwikkelen, waardoor andere laboratoria hun bevindingen konden bestuderen en implementeren. Redeneringsmodellen zijn ontworpen om complexe problemen op te lossen door ze in kleinere stappen op te splitsen.

Verwacht wordt dat DeepSeek volgende week naast V4 een kortere technische nota zal publiceren, gevolgd door een uitgebreider rapport ongeveer een maand later, volgens een persoon met directe kennis van de plannen.

Eerder deze week, Antropisch beschuldigde DeepSeek en twee andere Chinese AI-laboratoria met ‘destillatie-aanvallen’ op zijn modellen, een praktijk waarbij kleinere modellen worden getraind op de output van meer geavanceerde systemen, waardoor ze de prestaties van het Amerikaanse bedrijf kunnen repliceren zonder dezelfde computerbronnen te gebruiken.

Huawei, DeepSeek en Cambricon reageerden niet op verzoeken om commentaar.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in