Künstliche Intelligenz: Neues Google-Projekt erzeugt überraschend realistische Bilder aus Text (Galerie)
Google arbeitet seit vielen Jahren an der Bilderkennung und setzt diese Technologien in zahlreichen Produkten ein. Oftmals ging es der Vergangenheit darum, Bild in Text zu verwandeln – also das Bild und dessen Inhalt zu beschreiben. Doch man arbeitet auch in die andere Richtung und hat vor einigen Monaten eine Vorschau veröffentlicht, die zu einer ganzen Gruppe von Projekten gehört. Mit Parti lässt sich Text in Bild verwandeln. Aus einer Beschreibung wird dynamisch ein Bild erzeugt.
Bildmanipulation und Bilderzeugung sind große Themen, die in Zukunft eine immer größere Rolle spielen werden – und offenbar ist auch Google wenigstens in diesem Bereich vorn mit dabei. Man hat kürzlich das Projekt Parti angekündigt, das auf Basis von einfachen beschreibenden Sätzen dynamisch ein Bild erzeugen kann. Dabei geht es aber nicht nur um einfache Formen oder die Kombination mehrerer Elemente als Collage, sondern um realistische Darstellungen.
Googles Forscher haben sehr viele Beispielbilder sowie eine interaktive Webseite veröffentlicht, auf der sich jeder interessierte Nutzer von den Möglichkeiten und der Qualität überzeugen kann. Ich persönlich würde mir nicht zutrauen, den Unterschied zwischen einem solchen dynamischen Bild und einem echten Bild zu erkennen – mit Ausnahmen. Auf den Bildern ist genau das zu sehen, was beschrieben wurde und sogar der Stil kann in der Anfrage festgelegt werden. Möchte man ein Foto, eine Grafik oder ein Kunstwerk angelehnt an den Stil eines berühmten Künstlers?
Für dieses Projekt stoßen viele KI-Bereiche zusammen: Text erkennen und verstehen, Zusammenhänge verstehen, Objekte in der Bilddatenbank finden oder erzeugen und anschließend zu einem fertigen Bild zusammensetzen. Der letzte Schritt ist vermutlich der mit Abstand schwerste und das Kernprodukt von Parti. Schaut euch einmal die folgenden Beispielbilder an.
Man muss festhalten, dass all diese Bilder nicht als Original existieren. Sie wurden von den Algorithmen zusammengesetzt, ohne dass man das (meiner Meinung nach) sehen kann. Größen, Farben, Schatten, Überlappungen oder sonstige Interaktionen zwischen mehreren Objekten sind sehr gut umgesetzt und sorgen dafür, dass man nicht auf die Idee kommen würde, dass es ein künstlich erzeugtes Bild ist. Aus diesem Grund ist jedes Bild auch mit einem kleinen Wasserzeichen versehen, um diese unterscheiden zu können.
Eine solche Technologie ist aber nicht nur beeindruckend, sondern hat ein hohes Missbrauchspotenzial. Man könnte praktisch beliebige Szenerien erzeugen, die andere Menschen in Verruf bringen können. Schon seit vielen Jahren ist es dank Photoshop & Co bekanntlich möglich, Fotos extrem realistisch zu fälschen oder zumindest anzupassen. Doch Tools wie Parti sind da noch einmal auf einem völlig anderen Level und können die Grundlage für Fälschungen liefern.
Daher hat man sich bei Google entschieden, diese Technologie zwar zu präsentieren, aber noch nicht vollwertig nutzbar zu machen. Man möchte Sicherheitsbeschränkungen einführen, die noch nicht näher benannt sind, bevor so etwas freigegeben wird. Früher oder später wird es sicherlich Tools geben, die so etwas für Jedermann nutzbar machen, aber noch ist es nicht soweit. Schaut euch die Webseite einmal an, dort gibt es auch Beispielbildern mit Fehlern, die die aktuellen Limits und Stolpersteine der Technologie aufzeigen.
» Parti
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter