Gemini: Googles Bildgenerator Imagen 3 kann jetzt Fotos von Menschen erzeugen – mit strengen Regeln

Googles Bildgenerator Imagen 3 hat zuletzt große Fortschritte gemacht und konnte nicht zuletzt durch den neuen Unterbau von Gemini 2.0 auch einen starken Leistungssprung machen. Dieser ermöglicht es nun, allen Nutzern ein Feature anzubieten, das man vor längerer Zeit aufgrund von komplexen Problemen zurückziehen musste: Geminis Imagen kann jetzt wieder für alle Nutzergruppen Fotos von Personen erstellen.

Mit KI-Bildgeneratoren wie Googles Imagen lassen sich beliebige Motive erstellen, deren Inhalt zwar an den Prompt angepasst ist, aber dennoch immer wieder einer Wundertüte gleicht. Das gilt sowohl für die Darstellung als auch die gewählten Objekte, Szenerien als auch die Gesamtkomposition. Natürlich kann man durch komplexe Strings vieles in die richtigen Bahnen lenken, aber das Endergebnis ist dennoch nicht absehbar. Und das gilt nicht nur für die Nutzer, sondern auch für Google.
Dementsprechend dürfte man damals eine böse Überraschung erlebt haben, als der Bildgenerator bei vielen Nutzern problematische Fotos von Menschen ausgespuckt hat, die aufgrund einer Vielzahl von faktischen und subjektiven Unstimmigkeiten für Diskussionen sorgten. Das ist ein Problem, mit dem alle Bildgeneratoren zu kämpfen haben und hatten, sodass für das Erstellen von Fotos von Menschen strenge Maßstäbe gesetzt werden. Google hatte gar vollständig die Notbremse gezogen und das Feature vollständig aus Gemini entfernt.
Im Herbst letzten Jahres gab es dann das Comeback, mit dem Geminis Imagen 3 wieder in der Lage war, erste Motive von Menschen zu erstellen. Zwar mit strenger Kontrolle und vielen nicht näher benannten Einschränkungen, aber die Motive waren grundsätzlich wieder verfügbar. Zunächst allerdings nur für Nutzer der kostenpflichtigen Varianten in Gemini Workspace Business sowie Gemini Advanced.
Gemini kann jetzt wieder für alle Nutzer Menschenfotos generieren
Offenbar war der mehrmonatige Testlauf mit der Gruppe von Advanced-Nutzern erfolgreich, sodass man die Funktion jetzt für alle Nutzer öffnen kann. Gemini ist nun bei vielen Nutzern (möglicherweise noch nicht allen) wieder in der Lage, Personenfotos zu erstellen. Allerdings weiter mit der Einschränkung, dass die abgebildeten Menschen eher als ein weiteres „Objekt“ betrachtet und zufällig ausgewählt werden. Es ist nicht möglich, konkrete Menschenfotos zu erstellen.
Google schreibt: „Die Erzeugung fotorealistischer, identifizierbarer Personen, die Darstellung von Minderjährigen oder übermäßig blutiger, gewalttätiger oder sexueller Szenen wird von uns nicht unterstützt. Natürlich wird nicht jedes Bild, das Gemini erstellt, perfekt sein, aber wir werden weiterhin auf das Feedback unserer Nutzer*innen hören und die Funktion weiter verbessern.“
Durch den Ausschluss von identifizierbaren Personen, minderjährigen Personen sowie der Darstellung von übermäßiger Gewalt und sexuellen Abbildungen hat man schon mal viele Grenzen gesetzt. Aber auch solche Grenzen könnten irgendwann aufgeweicht werden. Gewalt und sexuelle Darstellungen sicherlich niemals (zumindest nicht in der öffentlichen Variante), aber detaillierter beschriebene Personen oder Kinder sind sicherlich etwas, auf das man (in guter Absicht!) langfristig nicht verzichten will oder kann. Das gilt dann auch für den Magic Editor, der bekanntlich auch Personen verschieben, ausblenden oder neuerdings durch Add Me-Funktion auch einblenden kann. Bis zum „verändern“ von Personen ist es nur noch ein kleiner Schritt.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter