Home Nieuws Microsoft lanceert MAI-Image-2-Efficient, een goedkoper en sneller AI-beeldmodel

Microsoft lanceert MAI-Image-2-Efficient, een goedkoper en sneller AI-beeldmodel

5
0
Microsoft lanceert MAI-Image-2-Efficient, een goedkoper en sneller AI-beeldmodel

Microsoft vandaag gelanceerd MAI-Afbeelding-2-Effectiefeen goedkopere, snellere variant van zijn vlaggenschip tekst-naar-beeldmodel die volgens het bedrijf productieklare kwaliteit levert voor bijna de helft van de prijs. De release, onmiddellijk beschikbaar in Microsoft-gieterij En MEI Speeltuin zonder wachtlijst, markeert de snelste ommekeer tot nu toe van het interne AI-superintelligentieteam van Microsoft – en het duidelijkste signaal dat Redmond serieus is over het bouwen van een zelfvoorzienende AI-stack die niet afhankelijk is van OpenAI.

Het nieuwe model kost $5 per miljoen tekstinvoertokens en $19,50 per miljoen beelduitvoertokens, een 41% reductie van MAI-Image-2’s prijzen van respectievelijk $ 5 en $ 33 voor dezelfde niveaus. Microsoft zegt dat het model 22% sneller werkt dan zijn vlaggenschip en een 4x grotere doorvoerefficiëntie per GPU behaalt, gemeten op NVIDIA H100-hardware met een resolutie van 1024×1024. Het bedrijf beweert ook dat het beter presteert dan concurrerende hyperscaler-modellen, waarbij het specifiek die van Google noemt Gemini 3.1 Flitser, Gemini 3.1 Flash-afbeeldingEn Gemini 3 Pro-afbeelding — gemiddeld 40% op p50-latentiebenchmarks.

Het model rolt ook horizontaal uit Tweede piloot En BingZei Microsoft, en er zullen nog meer productoppervlakken volgen.

De tweemodellenstrategie van Microsoft leent een pagina uit het AI-prijsboek

Microsoft positioneert zichzelf MAI-Afbeelding-2-Effectief en zijn vlaggenschip MEI-Foto-2 als complementaire tools in plaats van elkaar te vervangen: een gelaagde combinatie die is ontworpen om het volledige spectrum van behoeften op het gebied van het genereren van bedrijfsimages te dekken.

MAI-Afbeelding-2-Effectief richt zich op grote, kostengevoelige productieworkloads: productfotografie, marketingmateriaal, UI-mockups, merkactieve pijplijnen en realtime interactieve toepassingen. Het verwerkt korte tekst in afbeeldingen zoals kopteksten en labels netjes, aldus Microsoft, en is gebouwd om te werken binnen de strakke latentie- en budgetbeperkingen van batchverwerkingsomgevingen. MEI-Afbeelding-2ondertussen blijft het het precisie-instrument van het bedrijf – het model waar je naar streeft als kort de hoogste fotorealistische getrouwheid, complexe stilering zoals anime of illustratie, of langere, meer ingewikkelde typografie in het beeld vereist. Microsoft vertelt zakelijke klanten effectief: gebruik het efficiënte model voor uw assemblagelijn en het vlaggenschip voor uw winkelpui.

Deze aanpak weerspiegelt prijsstrategieën die in de hele AI-industrie hebben gewerkt: OpenAI’s GPT-modellagenAntropisch Haiku-Sonnet-Opus-opstellingDie van Google Flash-Pro-onderscheiding – maar past het specifiek toe op het genereren van afbeeldingen, een domein waar de kosten-per-afbeelding-economie de productie-implementatie op schaal kan maken of breken.

Zo heeft Microsoft in minder dan een maand een voor productie geoptimaliseerd beeldmodel uitgebracht

De snelheid van deze release verdient aandacht. MAI-Image-2 zelf debuteerde voor het eerst op MAI Playground op 19 maart zoals VentureBeat eerder melddemet een bredere toegankelijkheid overal Microsoft-gieterij arriveert op 2 april, samen met twee andere nieuwe funderingsmodellen: MAI-transcriptie-1 (een spraak-naar-tekstmodel dat 25 talen ondersteunt) en MAI-stemming-1 (een geluidsgeneratiemodel). Nog geen maand later heeft Microsoft een geoptimaliseerde productievariant op de markt gebracht.

Die cadans doet vermoeden MAI-superinlichtingenteam – de onderzoeksgroep onder leiding van Mustafa Suleyman, CEO van Microsoft AI, opgericht in november 2025 – functioneert meer als een startup die iteratieve producten levert dan als een traditioneel bedrijfsonderzoekslaboratorium dat artikelen publiceert. Zoals Suleyman in zijn blogpost van 2 april schreef dat het team “het bouwen van humanistische AI‘ Gefocust op ‘het optimaliseren van de manier waarop mensen daadwerkelijk communiceren, training voor praktisch gebruik’, lijkt hij het letterlijk te hebben bedoeld: de modellen worden niet alleen verzonden, ze worden snel genoeg verzonden om productroutekaarten te hebben.

De vroege ontvangst voor MEI-Foto-2 is uiterst positief geweest. Decoderen gerapporteerd in zijn praktijkgerichte beoordeling dat het model de nummer 3-positie al had bereikt Arena.ai-klassement voor het genereren van afbeeldingen, pas daarna Google en OpenAI. De recensent van Decrypt merkte op dat het fotorealisme van het model “een echte kracht” was en dat de tekstweergave “een legitiem hoogtepunt” was dat “complexe typografie met veel meer consistentie verwerkte dan we hadden verwacht.” Uit het onderzoek bleek ook dat in sommige directe vergelijkingen MEI-Foto-2 presteerde beter dan OpenAI’s GPT-Image in termen van beeldkwaliteit en tekstweergave, ondanks dat het daaronder op het scorebord stond – een observatie die onderstreept hoe benchmark-ranglijsten niet altijd de echte wereld weerspiegelen.

Dat gezegd hebbende, werd het originele model geleverd met aanzienlijke beperkingen die door Decrypt werden gemarkeerd: een afkoelperiode van 30 seconden tussen generaties, een dagelijkse limiet van 15 afbeeldingen in de oorspronkelijke gebruikersinterface, een beeldverhouding van slechts 1:1, geen beeld-naar-beeld-mogelijkheden en agressieve inhoudfiltering die zelfs onschadelijke creatieve aanwijzingen blokkeerde. Ontstoken MAI-Afbeelding-2-Effectief Het overnemen of versoepelen van een van deze beperkingen wordt niet behandeld in de aankondiging van vandaag, en zakelijke klanten die toegang krijgen tot het model via de Foundry API zullen waarschijnlijk te maken krijgen met andere beperkingen dan speeltuingebruikers.

Binnen de gerafelde Microsoft-OpenAI-relatie die interne modellen onvermijdelijk maakte

De lancering van vandaag kan niet op zichzelf worden begrepen. Het komt op een moment dat de relatie tussen Microsoft En Open AI – ooit het bepalende partnerschap van het generatieve AI-tijdperk – is zichtbaar gerafeld.

Gisteren meldde CNBC dat de nieuw aangestelde Chief Revenue Officer van OpenAI, Denise Dresser, een bericht stuurde interne memo aan het personeel stelt uitdrukkelijk dat het Microsoft-partnerschap “ook ons ​​vermogen heeft beperkt om bedrijven te ontmoeten waar ze zich bevinden.” In de nota werd naar verluidt de nieuwe alliantie van OpenAI met Amazon Web Services en het Bedrock-platform aangeprezen als een belangrijke groeimotor, waarbij de inkomende vraag van klanten werd omschreven als “eerlijk gezegd onthutsend” sinds de samenwerking eind februari werd aangekondigd. Microsoft heeft OpenAI toegevoegd aan zijn lijst met concurrenten in haar jaarverslag medio 2024. Ondertussen heeft OpenAI zijn cloudinfrastructuur gediversifieerd KernWeef, GooglenEn Orakelwaardoor de afhankelijkheid van Microsoft Azure afneemt.

De MAI-familiemodel is de meest tastbare uitdrukking van Microsofts kant van de strategische ontkoppeling. Wanneer Microsoft afbeeldingen van productiekwaliteit kan genereren met zijn eigen model voor $ 19,50 per miljoen outputtokens, verschuift de berekening voor het blijven licentiëren van de afbeeldingsmodellen van OpenAI – en het betalen van OpenAI een deel van de resulterende inkomsten – dramatisch. Elk MAI-model dat productiekwaliteit bereikt, is een regelitem dat Microsoft mogelijk van de balans van OpenAI naar zijn eigen balans kan verplaatsen.

De organisatorische infrastructuur om deze verschuiving te ondersteunen is al aanwezig. Op 17 maart, zoals onthuld in mededelingen gepubliceerd op De officiële blog van MicrosoftCEO Satya Nadella kondigde een ingrijpende reorganisatie aan waarbij de consumenten- en commerciële Copilot-inspanningen van het bedrijf onder één managementteam werden verenigd, waarbij Jacob Andreou werd verheven tot EVP van Copilot en rechtstreeks rapporteerde aan Nadella. Cruciaal was dat de reorganisatie ook de rol van Suleyman veranderde. Zoals Nadella in zijn boodschap aan de werknemers schreef: “Het bedrijf verdubbelt onze superintelligentiemissie met het talent en de berekening om modellen te bouwen die een echte productimpact hebben in termen van evaluaties, COGS-reductie en het verleggen van de grens.” Deze zinsnede – ‘COGS-reductie’ – is bedrijfstaal voor het verlagen van de kosten van verkochte goederen, en verwijst rechtstreeks naar de economische motivatie achter modellen als MAI-Image-2-Efficient. Elke cent die Microsoft bespaart door eigen modellen te gebruiken in plaats van licenties van partners, vloeit direct naar de brutomarge.

Waarom goedkope, snelle beeldgeneratie het geheime ingrediënt is voor de agentische AI-toekomst van Microsoft

Er is nog een dimensie die de release van vandaag van strategisch belang maakt, en misschien wel de belangrijkste: de opkomst van AI-agenten.

Dat meldt TechCrunch Gisteren heeft Microsoft manieren getest om OpenClaw-achtige functies te integreren in Microsoft 365 Copilot, en zo te bouwen aan een altijd actieve agent die taken in meerdere stappen over langere perioden kan uitvoeren. Het bedrijf heeft ook Copilot Cowork gelanceerd (een agent die acties uitvoert in Microsoft 365-apps), Copilot Tasks (een agent om persoonlijke productiviteitstaken in meerdere stappen uit te voeren) en Agent 365 (waarnaar wordt verwezen in Nadella’s reorganisatiememo van maart). Verwacht wordt dat Microsoft deze agentmogelijkheden zal presenteren tijdens de Build-conferentie in juni.

In een agentenwereld – waar AI-systemen niet alleen vragen beantwoorden, maar autonoom complexe workflows uitvoeren – wordt het genereren van afbeeldingen een primitief dat agenten programmatisch noemen, en niet een op zichzelf staand product waar gebruikers handmatig mee communiceren. Een bedrijfsagent die een marketingcampagne opzet, moet mogelijk tientallen productafbeeldingen genereren, sociale media-items creëren, presentatieafbeeldingen produceren en ontwerpconcepten herhalen, allemaal zonder menselijke tussenkomst bij elke stap. De economie van die workflow wordt uitsluitend bepaald door de prijs en de latentie per token, en dat is precies waar MAI-Image-2-Efficient voor optimaliseert. Als de visie van Microsoft voor Copilot inhoudt dat agenten afbeeldingen genereren als een routinematige subtaak binnen grotere workflows, hebben die agenten een beeldgeneratie nodig die snel genoeg is om geen knelpunten te creëren en goedkoop genoeg om de kosten niet te laten oplopen als ze duizenden keren per dag worden gebeld. De viervoudige efficiëntieverbeteringen en de prijsverlaging van 41% zijn niet alleen mooie marketingcijfers; het zijn architectonische vereisten voor de agentische toekomst waar Microsoft op inzet.

Wat Microsoft nog steeds niet heeft beantwoord over zijn nieuwe imaging-model

Verschillende belangrijke vragen blijven onbeantwoord in de aankondiging van vandaag. Microsoft heeft niet bekendgemaakt of MAI-Afbeelding-2-Effectief pakt de beperkingen van de beeldverhouding en agressieve inhoudfiltering aan die recensenten in het oorspronkelijke model signaleerden. Het bedrijf specificeerde ook niet of de wisselwerking tussen kwaliteit en snelheid zichtbare verslechtering met zich meebrengt op basis van complexe aanwijzingen. In de aankondiging worden ‘productieklare kwaliteit’ en ‘vlaggenschipkwaliteit’ door elkaar beschreven, maar bij welke distillatiemodellen dan ook is doorgaans sprake van enige kwaliteitsconcessie.

De voetnoten in het persbericht onthullen ook de strikte voorwaarden waaronder de benchmarkclaims werden getest: prestatiecijfers werden gemeten op de NVIDIA H100 op 1024×1024 met “geoptimaliseerde batchgroottes en overeenkomende latentiedoelen”, en de latentievergelijkingen met Google-modellen werden gedaan op p50 (mediaan) in plaats van p99 p95 of prestaties. Enterprise-klanten die verschillende workloads op verschillende gelijktijdigheidsniveaus uitvoeren, kunnen verschillende resultaten zien. MAI Playground is momenteel alleen beschikbaar in geselecteerde markten, waaronder de VS, waarbij de beschikbaarheid in de EU wordt vermeld als ‘binnenkort beschikbaar’. De integratie van de copiloot is bezig, maar nog niet voltooid. En de bedrijfs-API via Foundry bevindt zich, terwijl deze live is, nog in de beginfase.

Maar het veld is niet te vergissen. Nog geen vijf maanden geleden MAI-superinlichtingenteam werd aangekondigd, heeft Microsoft een vlaggenschip beeldmodel, drie extra funderingsmodellenen nu één kostengeoptimaliseerde productievariant – en dat terwijl de hele Copilot-organisatie werd gereorganiseerd, een verdeeldheid zaaiende relatie met de belangrijkste AI-partner ontstond en de basis werd gelegd voor agentische AI-mogelijkheden die de bedrijfsproductiviteit opnieuw zouden kunnen definiëren. Of dit alles snel genoeg is om het momentum van Anthropic te veroveren, de drang van OpenAI tegen Amazon te ondermijnen en een koersdoel van $600 te rechtvaardigen, is de vraag van honderden miljarden dollars. Maar voor een bedrijf dat de eerste twee jaar van het generatieve AI-tijdperk voornamelijk de technologie van anderen heeft doorverkocht, doet Microsoft nu iets dat het al heel lang niet meer heeft gedaan op het gebied van AI: zijn eigen werk verzenden, volgens zijn eigen schema, tegen zijn eigen prijs – en de markt uitdagen om te volgen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in