Googles Algorithmen sind seit Jahren recht gut darin, Inhalte von Fotos oder auch Video zu erkennen und diese entsprechend einzuordnen oder zu beschreiben. In Forschungsprojekten geht man längst den umgekehrten Weg, denn mit der Plattform Imagen lässt sich jetzt auch Video aus Text erstellen. Als Nutzer muss man lediglich den visuellen Wunsch in Textform eingeben und die KI entwickelt daraus ein Kurzvideo. Die Beispiele wissen zu beeindrucken.
Bildbearbeitung ist heute keine große Sache mehr, Bilderkennung ebenfalls nicht. Videobearbeitung ist schon ein anderes Kaliber und Videoerkennung trotz einiger Erfolge wohl noch in den Kinderschuhen. Es geht aber noch deutlich experimenteller, denn Googles Forscher arbeiten daran, Videos dynamisch und ohne jegliche Vorlage zu erstellen, rein auf Basis eines kurzen Beschreibungstexts. Gezeigt wird das auf Basis der Imagen-Plattform.
Wir haben euch Imagen und ähnliche Google-Plattformen erst vor wenigen Tagen ausführlich vorgestellt. Dabei handelt es sich um eine in Entwicklung befindliche KI, die Bild aus Text generiert. Die Ergebnisse sind beeindruckend und spätestens durch den vor einigen Wochen gestarteten Bing Image Creator im Massenmarkt angekommen – wenn auch bisher nur potenziell. Offenbar ist die Imagen-Technologie aber noch zu höherem fähig, denn nun hat man mit Imagen Video eine Schwesterplattform gestartet, die das Ganze mit Video umsetzt.
Auf Imagen Video zeigt man einige Beispiele, die laut Angaben der Entwickler dynamisch erstellt worden sind und somit der KI entspringen. Ich binde diese Videos hier nicht ein, aber ihr könnt euch im folgenden redaktionellen Beitrag viele Details und Erklärungen ansehen oder direkt auf Googles Webseite die Beispielvideos abrufen.
Auf der Imagen Video-Webseite wird die Technologie ein wenig erklärt und auch die Limits der aktuellen Umsetzung erläutert. Man befindet sich noch ganz am Anfang und dürfte noch Jahre davon entfernt sein, diese Technologie in der Praxis einzusetzen oder gar den Nutzern zur Verfügung zu stellen. Dennoch ist damit ein Fundament geschaffen, auf dem man mit zahlreichen KI-Trainings, zusätzlichen Bilddaten und Qualitätsverbesserungen aufbauen kann.
Genauso wie Imagen für Bilder, steht auch Imagen Video nicht als öffentlicher Test zur Verfügung. Das ist aber nicht mit dem Stand der Technik zu erklären, sondern mit den noch zu klärenden Fragen zum Umgang mit solchen Technologien. Denn mit Plattformen wie Imagen wird die Bildfälschung und Videofälschung auf ein völlig neues Level gehoben und vielleicht soweit perfektioniert, dass es nicht mehr erkennbar ist. Daher hat man derzeit auch gar nicht vor, das offen anzubieten. Schaut es euch dennoch einmal an.
» Google Assistant & Bard: Eine schwere Beziehung – die Teams arbeiten zusammen und gegeneinander