Text zu Bild-KI: Google-Tools erzeugen beeindruckend realistische Fotos aus Text – aber Bing war schneller

Jens

» Web-Version «
vor 2 Jahren

Google beschäftigt sich seit vielen Jahren mit der Künstlichen Intelligenz und setzt diese auch im Bereich der Bilderkennung, Bildbearbeitung und ähnlicher Aufgaben ein. Schon im letzten Jahr hatte man gleich drei Projekte präsentiert, mit denen sich Fotos vollständig dynamisch generieren lassen. Damit hat man starke Technologien in der Hinterhand, die ganz neue Möglichkeiten schaffen, aber bisher nicht eingesetzt werden. Doch das dürfte sich in Kürze ändern.

Wir haben euch in den letzten Wochen die drei noch jungen Google-Projekte Imagen, Parti und Muse vorgestellt, die alle drei denselben Zweck erfüllen und auf unterschiedlichen Ansätzen basieren. Alle drei Technologien können dynamisch auf Grundlage einer Beschreibung ein Bild oder Foto generieren, das dem Wunsch des Nutzers entsprechen sollte. Man hat umfangreiche Demo-Galerien und auch kleine Testbereiche veröffentlicht, sodass sich jeder selbst einen Eindruck von diesen Technologien schaffen kann.

Die Ergebnisse sind wirklich beeindruckend, denn zumindest auf den ersten Blick bemerkt man bei fast keinem Bild, dass es eigentlich gar nicht existiert, sondern dynamisch von der KI erstellt wurde. Es geht deutlich über das Zusammenwürfeln bekannter Motive hinaus, sondern scheint tatsächlich selbst den digitalen Pinsel zu schwingen und passende Formen / Objekte / Szenen zu generieren. Man sich der potenziellen Gefahr einer solchen Technologie bewusst und bietet diese daher bisher nur sehr beschränkt und nicht öffentlich zum Einsatz an. Vorerst soll niemand außerhalb des Projekt-Teams Bilder vollständig dynamisch erstellen können.

Doch jetzt ist die Technologie da und Google wird sie nicht dafür entwickeln und perfektionieren, um sie dann unter Verschluss zu halten. Insbesondere der am Mittwoch erfolgte Start des Bing Image Creator wird Google unter Druck setzen, denn schon wieder ist Bing in einem Bereich zum Vorreiter geworden, in dem Google seit vielen Jahren forscht und brauchbare Ergebnisse liefert. Man wird also fast schon gezwungen, eines dieser Tools schon sehr bald zu öffnen.

Google plant(e) langsamen Start
Noch vor wenigen Wochen hieß es, dass man die Technologien sehr behutsam in den Markt bringen und auf keinen Fall den vollständigen Generator für alle Nutzer veröffentlichen will. Kurz darauf wurden erste Funktionen wie der Pixel Wallpaper-Creator oder auch ein Grafik-Generator für Google Slides bekannt. Der Anfang wäre damit gemacht, doch rund um das GPT-Universum und Bing hat man vor wenigen Tagen nachgelegt, sodass Google wohl kaum weiterhin auf der Bremse stehen kann.

Auch bei Microsoft ist man sich der Gefahr solcher Generatoren bewusst und hat daher bereits in der ersten Testphase umfangreiche Stopplisten von Motiven oder Kombinationen, die sich nicht erstellen lassen. Auch Fotos von Prominenten oder beliebige Menschen lassen sich nicht erstellen oder verwenden. Für Google dürfte es ein großes Problem sein, ähnliche Filter anzuwenden und dann das eigene Tool für die Massen anzubieten.

Das verspricht in den nächsten Jahren auf jeden Fall sehr viel Spannung und vielleicht gilt auch irgendwann die Regel, dass man nicht alles entwickeln und erforschen muss, was technisch möglich ist. Denn wir dürfen nicht vergessen, dass wir noch ganz am Anfang dieser Technologien stehen, die vieles verändern können. Was ist ein Fotobeweis heute noch wert, wenn sich jedes Motiv in sekundenschnelle einfach erstellen lässt? Photoshop war nichts dagegen.

» Bing Image Creator: Neues Microsoft-Tool erzeugt Bilder aus Text – ab sofort für alle Nutzer verfügbar

» Google Assistant & Bard: Die beiden Produkte werden in wenigen Wochen zusammengeführt – sagt Bard

Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | Jetzt den GoogleWatchBlog-Newsletter abonnieren