Google hat vor wenigen Tagen das neue Filmtool Gemini Flow vorgestellt, das vielleicht etwas untergegangen ist, aber sich rückblickend sicherlich als Meilenstein der Videogeneratoren erweisen wird. Es basiert auf den aktuellen Generationen der Bild- und Videogeneratoren und schlägt eine Richtung ein, mit der Filmschaffende von ihrem Schreibtisch ganze Filme produzieren könnten. Ein absoluter Wahnsinn.
Google will rund um die Infotainment-Plattform Android Auto nach einer etwas längeren Pause wieder größere Schritte machen und hat in diesen Tagen gleich zwei interessante Ankündigungen machen können. Beide zielen darauf ab, dass der Funktionsumfang der Plattform ausgebaut wird und sich nicht mehr nur hauptsächlich auf Navigation und Musik konzentriert. Auch das Verweilen während des Parkens spielt eine Rolle.
Google hat mit Gemini von Beginn an auf ein multimodales KI-Modell gesetzt, das alle Inhaltstypen gleichwertig behandelt und daher große Stärken im Medienbereich aufbauen kann - und die zeigt man jetzt. Vor wenigen Tagen wurden mit den Bild- und Videogeneratoren rund um Imagen, Veo und Flow echte Meilensteine geschaffen, die sowohl die Bild-, als auch Video-, und Filmproduktion revolutionieren können.
Die Plattform Google Shopping ist ein wichtiger Bestandteil der Google Websuche und für viele Menschen eine wichtige Anlaufstelle auf der Suche nach Produkten - sowohl bewusst als auch eher zufällig. In diesen Tagen bekommt die Plattform mit Try it on eine starke neue KI-Funktion, die zuerst im Modebereich und später in vielen weiteren Kategorien zum echten Gamechanger werden könnte.
Schon sehr bald dürfen sich viele Nutzer von Android Auto auf einen neuen Sprachassistenten freuen, der viele neue Möglichkeiten mitbringen wird. Mittlerweile hat Google den Start von Gemini Live offiziell gemacht und jetzt zeigt sich der Assistant-Nachfolger in vielen Hands-on-Videos. Der Funktionsumfang wird perspektivisch und auch direkt nach dem Start deutlich steigen.
Mit dem KI-ChatBot Gemini können Nutzer Antworten auf Fragen erhalten, Texte in beliebiger Form erstellen, Bilder erstellen, je nach Paket Videos erstellen und einiges mehr. Nur die wenigsten Nutzer dürften wissen, dass Gemini auch Web-Anwendungen automatisch konzipieren, erstellen und mit Inhalten füllen kann. Jetzt hat Google eine interessante Demo-App veröffentlicht, die die wichtigsten Kennzahlen der Google I/O zusammenfasst.
Google arbeitet mit Hochdruck daran, den KI-ChatBot Gemini auf alle Plattformen zu bringen, wobei natürlich die Android-Ableger im Fokus stehen. Bisher ist Gemini hauptsächlich auf Smartphones und Tablets verfügbar - mit nahezu identischen Oberflächen. Jetzt zeigt sich eine neue Tablet-optimierte Oberfläche, die zusätzlich zur Konversation auch die Hauptnavigation auf die großen Displays bringen kann.
Google hat in den letzten Tagen sehr viele Ankündigungen rund um Gemini gemacht, von denen viele Funktionen recht zeitnah für die Nutzer freigegeben werden sollen. Ein großer Bestandteil davon ist natürlich das immer breiter verfügbare Gemini Live, das nach einem langsamen Rollout in den letzten Wochen jetzt für alle Nutzer inklusive Display- und Kamerafreigabe verfügbar sein sollte.
Google setzt bei der KI-Plattform Gemini verstärkt auf die mediale Komponente und will es den Nutzern so leicht wie möglich machen, Fotos und Videos zu erzeugen. Doch weil es gar nicht so einfach ist, den passenden Prompt zu finden und diesen optimal zu formulieren, gibt es seit einiger Zeit ein starkes Tool, das diesen wichtigen Schritt erleichtern soll. Mit Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt feilen zu müssen.
Google hat zur Promotion rund um Gemini vor einigen Monaten das Zeitalter der KI-Agenten ausgerufen und ist der Meinung, dass dieses spezielle KI-Konzept schon sehr bald eine bedeutende Rolle spielen wird. In dieser Woche hat man endlich gezeigt, wie man sich die erste Generation dieser Agenten vorstellt und welche Möglichkeiten diese schon sehr bald bieten werden. Der neue Gemini Agent Modus steht bereits in den Startlöchern.
Google hat mit dem KI-Videogenerator Veo schon seit längerer Zeit ein starkes Gemini-Tool im Portfolio, das vielen Nutzern die Möglichkeit gibt, knappe Videos durch Eingabe eines Prompts zu erstellen. Jetzt hat man ein neues Tool gestartet, mit dem die Videogenerierung auf eine ganz neue Stufe gehoben wird: Das KI-Filmtool Flow ermöglicht es mit einfachen und dennoch detaillierten Schritten, ganze Kurzfilme zu erstellen.
Google will den Smart Glasses endlich zum Durchbruch verhelfen und bringt dafür natürlich die eigenen Produkte in Stellung, die noch in diesem Jahr auf den ersten Geräten starten sollen. Jetzt hat man Android XR mit Gemini erneut vorgestellt und dabei nicht nur einen groben Zeitplan umrissen, sondern auch neue Smart Glasses-Partner genannt und weitere Hands-on bzw. in diesem Fall Eyes-on-Aufnahmen von der Oberfläche veröffentlicht.
Googles KI-Modell Gemini besitzt seit einiger Zeit einen eigenen Videogenerator, der in dieser Woche als Veo 3 in einer neuen Generation erschienen ist. Die dritte Generation setzt auf dem weiterhin verfügbaren Vorgänger auf und hält neben dessen Verbesserungen auch einen großen Schritt bereit, der über die Qualitätssteigerungen hinausgeht: Denn erstmals lassen sich Videos mit Ton oder gar Dialogen erzeugen.
Google hat erst vor wenigen Monaten den KI-Videogenerator Veo 2 veröffentlicht, der schon damals gewaltige Schritte bei der Qualität der Videos machen konnte. Jetzt hat man das Tool noch einmal deutlich verbessert und eine aktualisierte Version veröffentlicht, die den Nutzern sehr viel mehr Einfluss auf das Gesamtwerk gibt. Von der Kameraführung über Referenzbilder bis hin zum Hinzufügen und Entfernen von Objekten ist einiges dabei.
Der KI-Bildgenerator Imagen befindet sich bei Google schon seit langer Zeit in Entwicklung und ist in dieser Woche in der neuesten Generation erschienen, die wieder einen großen Schritt nach vorn macht. Mit dem neuen Imagen 4 will man die Gesamtqualität steigern, in dem vielen wichtigen Details mehr Beachtung geschenkt wird - von Texturen bis Text. Aber auch die Bildgröße lässt sich erstmals festlegen.