OpenAI lanceerde een nieuw AI-model voor beeldgeneratie dinsdag, genaamd ChatGPT Images 2.0. Dit model kan uit één enkele prompt meer dan één afbeelding genereren, zoals een heel studieboekje, en ook tekst uitvoeren, ook in niet-Engelse talen zoals Chinees en Hindi. Deze release is wereldwijd beschikbaar voor ChatGPT En Codex gebruikers met een krachtigere versie beschikbaar voor betalende abonnees.
Wanneer een groot AI-bedrijf een nieuw beeldmodel uitbrengt, kan dit de interesse doen herleven en het gebruik vergroten, vooral als gebruikers van sociale media een memebar-trend omarmen die beelden van zichzelf transformeert. Vorig jaar was de lancering door Google van het Nano Banana-model een groot moment voor het bedrijf, vooral toen gebruikers begonnen met posten hyperrealistische figuren zelf online. Eerder dit jaar maakte ChatGPT Images furore op sociale media toen gebruikers deelden AI gegenereerde karikaturen.
Wat is anders?
Omdat het nieuwe model kan profiteren van de “redeneringsmogelijkheden” van ChatGPT, kan Images 2.0 op internet zoeken naar de nieuwste informatie en meer dan één afbeelding tegelijk genereren. In wezen kan de bot aanvullende stappen gebruiken om grondiger generaties uit één enkele prompt te halen. Afbeeldingen 2.0 heeft ook een nieuwere uiterste datum voor kennis: december 2025.
Dit betekent ook dat de output van het nieuwe model gedetailleerder is. Ik heb bijvoorbeeld een infographic gemaakt met de weersvoorspelling van San Francisco voor de volgende dag, evenals activiteiten die de moeite waard zijn om te doen. Het beeld dat ChatGPT genereerde, bevatte nauwkeurige weersdetails voor de regenachtige dag, samen met nauwkeurige tekeningen van het Ferry Building, Castro Theater, Painted Ladies-huizen en de Transamerica Pyramid.
Bovendien is Afbeeldingen 2.0 beter aanpasbaar voor gebruikers die unieke afbeeldingsformaten willen voor de uitvoer van afbeeldingen. Het nieuwe model kan afbeeldingen genereren van 3:1 breed tot 1:3 hoog, en gebruikers kunnen de grootte van de afbeelding aanpassen als onderdeel van hun prompt voor de AI-tool.
Eerste indruk
Na een paar uur afbeeldingen genereren met het nieuwe model, was ik over het algemeen onder de indruk van de tekstweergavemogelijkheden, tenminste in het Engels. Nog niet zo lang geleden bevatte de uitvoer van afbeeldingen met tekst, van een van de grote modellen, vaak talloze verkeerd opgemaakte tekens of woorden met losse extra letters. ChatGPT moeite gehad om te voelen afbeeldingen precies twee jaar eerder, dus de schonere, complexere uitvoer van Afbeeldingen 2.0 is een teken van voortdurende verbetering. Google heeft zich ook gericht op het verbeteren van de beelduitvoer die tekst bevat nieuwste iteraties van Nanobanaan.




