Googles KI-Modell Gemini wurde von Beginn an mit einem multimodalen Ansatz entwickelt und kann nicht nur Bilder analysieren, sondern natürlich auch erstellen – dank der Unterstützung von Imagen. Jetzt kündigt Google den Rollout von Imagen 3 an, das im Laufe der nächsten Tage auch für deutsche Nutzer zur Verfügung steht und sowohl qualitativ als auch funktionell große Schritte macht.
Der in Google Gemini integrierte Bildgenerator Imagen wird jetzt in der Version 3 für viele Nutzer ausgerollt – auch in Deutschland. Das neue Modell erzeugt laut Googles Ankündigung qualitativ hochwertige Bilder, die von Nutzern in allen verfügbaren Sprachen erstellt werden können. Laut Google setzt man einen neuen Standard für Bildqualität und generiert die Bilder mit nur wenigen Worten. Imagen 3 unterstützt dabei auch verschiedene Stile vom fotorealistischen Landschaften über strukturierte Ölgemälde bis hin zu skurrilen Claymation-Szenen.
Imagen 3 bringt erweiterte Bildgenerierungsfunktionen mit integrierten Sicherheitsvorkehrungen und entspricht natürlich Googles vor langer Zeit veröffentlichten Produktdesignprinzipien. In vielen Benchmarks schneidet Imagen 3 im Vergleich zu anderen verfügbaren Bildgenerierungsmodellen gut ab. Gut, nicht sehr gut oder überragend. Und wie schon bei Imagen 2 verwendet man SynthID, ein Tool für Wasserzeichen und zum Identifizieren von KI-generierten Bildern.
Googles Designprinzipien besagen: Die Nutzer behalten von Anfang bis Ende die Kontrolle über den kreativen Prozess. Wenn das erste Bild, das ihr erhaltet, nicht euren Erwartungen entspricht, sagt Gemini einfach, was ihr ändern möchtet, und ihr erhaltet ein neues Bild.
Letzte Aktualisierung am 2024-12-17 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!