Home Nieuws Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen...

Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen te bouwen

1
0
Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen te bouwen

Het Chinese bedrijf Moonshot AI heeft zijn systeem geüpgraded open source Kimi K2-modeldat het transformeert in een coderings- en visiemodel met een architectuur die de orkestratie van een agentenzwerm ondersteunt.

Het nieuwe model, Moonshot Kimi K2.5, is een goede optie voor bedrijven die agenten willen die automatisch acties kunnen doorgeven in plaats van een frame te hebben dat als centrale beslisser fungeert.

Het bedrijf typeerde de Kimi K2.5 als een “alles-in-één model” dat zowel visuele als tekstinvoer ondersteunt, waardoor gebruikers het model kunnen gebruiken voor meer visuele codeerprojecten.

Moonshot heeft het aantal parameters van de K2.5 niet publiekelijk bekendgemaakt, maar het Kimi K2-model waarop het is gebaseerd had in totaal 1 biljoen parameters en 32 miljard ingeschakelde parameters dankzij de mix van deskundige architectuur.

Dit is het nieuwste open source-model dat een alternatief biedt voor de meer gesloten opties van Google, OpenAI en Anthropic, en het presteert beter dan deze op belangrijke statistieken, waaronder agentische workflows, codering en visie.

Op Het laatste examen van de mensheid (HLE) benchmark scoorde Kimi K2.5 50,2% (met tools) die beter presteert dan OpenAI’s GPT-5.2 (xhigh) en Claude Opus 4.5. Het bereikte ook 76,8% op SWE-bank geverifieerdwat zijn status als coderingsmodel van het hoogste niveau bevestigt, hoewel GPT-5.2 en Opus 4.5 het hier inhalen op respectievelijk 80 en 80.9.

Kimi K2.5 Thinking benchmark-vergelijkingstabel. Krediet: Moonshot AI

Moonshot zei in een persbericht dat het tussen september en november een toename van 170% in gebruikers heeft gezien voor Kimi K2 en Denkt Kimi K2die begin november werd uitgebracht.

Agentenzwerm en ingebouwde orkestratie

Moonshot wil gebruik maken van autonome agenten en het agentenzwermparadigma dat is ingebouwd in Kimi K2.5. Agentzwermen worden aangeprezen als volgende front in de AI-ontwikkeling van het bedrijf en agent-gebaseerde systemen. Het heeft de afgelopen maanden veel aandacht getrokken.

Voor bedrijven betekent dit dat als ze agent-ecosystemen bouwen met Kimi K2.5, ze efficiënter kunnen opschalen. Maar in plaats van het ‘opschalen’ of vergroten van modelgroottes om grotere agenten te creëren, ligt de nadruk op het maken van meer agenten die zichzelf in wezen kunnen orkestreren.

Kimi K2.5 “creëert en coördineert een zwerm gespecialiseerde agenten die parallel werken.” Het bedrijf vergeleek het met een bijenkorf, waarbij elke agent een taak uitvoert en tegelijkertijd bijdraagt ​​aan een gemeenschappelijk doel. Het model leert maximaal 100 subagenten zelf aan te sturen en kan parallelle workflows van maximaal 1.500 tooloproepen uitvoeren.

“Benchmarks vertellen slechts de helft van het verhaal. Moonshot AI is van mening dat AGI uiteindelijk moet worden geëvalueerd op zijn vermogen om taken in de echte wereld efficiënt uit te voeren onder reële tijdsbeperkingen. De echte maatstaf waar ze om geven is: hoeveel van je dag heeft de AI je daadwerkelijk teruggegeven? Door parallel te draaien, wordt de tijd die nodig is voor een complexe dagelijkse werkdag aanzienlijk verminderd, die nu in minuten kan worden gedaan en die het bedrijf in minuten kan voltooien.”

Bedrijven die hun orkestratiestrategieën overwegen, beginnen te kijken naar agentplatforms waarop agenten communiceren en taken delegeren, in plaats van een rigide orkestratieframework te volgen dat dicteert wanneer een actie is voltooid.

Hoewel Kimi K2.5 een aantrekkelijke optie kan bieden voor organisaties die dit soort orkestratie willen gebruiken, voelen sommigen zich misschien meer op hun gemak bij het vermijden van op agenten gebaseerde orkestratie in het model ingebakken en in plaats daarvan een ander platform gebruiken om de modeltraining te onderscheiden van de agenttaak.

Dit komt omdat bedrijven vaak meer flexibiliteit willen in de modellen waaruit hun agenten bestaan, zodat ze een ecosysteem van agenten kunnen opbouwen met behulp van LLM’s die het beste werken voor specifieke acties.

Sommige agentplatforms, zoals Salesforce, AWS Bedrock en IBM, bieden afzonderlijke tools voor observatie, beheer en monitoring waarmee gebruikers AI-agents kunnen orkestreren die met verschillende modellen zijn gebouwd en hen in staat stellen samen te werken.

Multimodale codering en visuele foutopsporing

Met het model kunnen gebruikers visuele lay-outs coderen, inclusief gebruikersinterfaces en interacties. Het redeneert over afbeeldingen en video’s om taken te begrijpen die zijn gecodeerd in visuele invoer. K2.5 kan bijvoorbeeld de code van een website reconstrueren door simpelweg een video-opname van de website in actie te analyseren en visuele aanwijzingen te vertalen in interactieve lay-outs en animaties.

“Interfaces, lay-outs en interacties die moeilijk precies in taal te beschrijven zijn, kunnen worden gecommuniceerd via schermafbeeldingen of schermafbeeldingen die het model kan interpreteren en omzetten in volledig functionele websites. Dit maakt een nieuwe klasse van sfeercoderingservaringen mogelijk”, aldus Moonshot.

Deze functie is geïntegreerd in Kimi Code, een nieuwe terminalgebaseerde tool die werkt met IDE’s zoals VSCode en Cursor.

Het ondersteunt “autonome visuele foutopsporing”, waarbij het model zijn eigen uitvoer visueel inspecteert – zoals een weergegeven webpagina – verwijst naar documentatie en de code herhaalt om lay-outwijzigingen of esthetische fouten op te lossen zonder menselijke tussenkomst.

In tegenstelling tot andere multimodale modellen die afbeeldingen kunnen creëren en begrijpen, kan Kimi K2.5 front-end interacties voor websites bouwen met beeldmateriaal, en niet alleen met de code erachter.

API-prijzen

Moonshot AI heeft de K2.5 API agressief geprijsd om te concurreren met grote Amerikaanse laboratoria, wat aanzienlijke kortingen biedt in vergelijking met het vorige K2 Turbo-model.

  • Invoer: 60 cent per miljoen tokens (a 47,8% verminderen).

  • Gecachte invoer: 10 cent per miljoen tokens (a 33,3% verminderen).

  • Productie: $3 per miljoen tokens (a 62,5% verminderen).

De lage kosten van in de cache opgeslagen invoer ($0,10/M tokens) zijn vooral relevant voor de “Agent Swarm”-functies, die vaak het onderhouden van grote contextvensters over meerdere subagenten en uitgebreide tools vereisen.

Gewijzigde MIT-licentie

Hoewel Kimi K2.5 open source is, wordt het uitgebracht onder een aangepaste MIT-licentie die een specifieke clausule bevat die gericht is op “hyperscale” commerciële gebruikers.

De licentie biedt standaardmachtigingen voor het gebruiken, kopiëren, wijzigen en verkopen van de software.

Het bepaalt echter dat als de software of enig afgeleid werk wordt gebruikt voor een commercieel product of dienst met meer dan 100 miljoen maandelijkse actieve gebruikers (MAU) of meer dan $ 20 miljoen USD aan maandelijkse inkomsten, het apparaat “Kimi K2.5” prominent moet weergeven op de gebruikersinterface.

Deze clausule zorgt ervoor dat, hoewel het model gratis en open blijft voor de overgrote meerderheid van de ontwikkelaarsgemeenschap en startups, grote technologiegiganten de technologie van Moonshot niet kunnen whitelabelen zonder zichtbare attributie te bieden.

Het is niet volledig “open source”, maar het is beter dan Meta’s soortgenoten Licentievoorwaarden voor lama’s vanwege zijn ‘open source’-familie van modellen, waarbij bedrijven met 700 miljoen of meer maandelijkse gebruikers een speciale bedrijfslicentie van het bedrijf moesten verkrijgen.

Wat het betekent voor moderne AI-bouwers van ondernemingen

Voor beoefenaars die de moderne AI-stack definiëren – van LLM-beslissers die implementatiecycli optimaliseren tot AI-orkestratiemanagers die agenten en door AI aangedreven geautomatiseerde bedrijfsprocessen opzetten – vertegenwoordigt Kimi K2.5 een fundamentele verschuiving in de versnelling.

Door zwermorkestratie rechtstreeks in het model te integreren, geeft Moonshot AI deze bouwers met beperkte middelen effectief een synthetisch personeelsbestand, waardoor een enkele ingenieur honderd autonome subagenten net zo gemakkelijk kan aansturen als een enkele prompt.

Deze ‘scale-out’-architectuur pakt direct het dilemma van databeslissers aan om complexe pijplijnen in evenwicht te brengen met beperkt personeel, terwijl de afgeslankte prijsstructuur high-context computing transformeert van een budgetbrekende luxe naar een routineproduct.

Uiteindelijk stelt K2.5 een toekomst voor waarin de belangrijkste beperking van een technisch team niet langer het aantal handen op de toetsenborden is, maar het vermogen van de leiders om een ​​zwerm te choreograferen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in