Gemini Live: Google bringt starke neue Videofunktionen – Display freigeben und Videos hochladen (Videos)

google 

Das KI-Modell Gemini wurde von Beginn an multimodal entwickelt, um sowohl mit Text als auch Audio und Video umgehen zu können und diese weitgehend gleichwertig zu behandeln. Mit dem noch recht jungen Gemini Live laufen all diese Fähigkeiten zusammen, wobei in Kürze ein großer Schwung an Video-Verbesserungen ansteht. Jetzt hat Google erneut die Gemini-Interaktion per Video vorgestellt und erstmals gezeigt.


gemini live

Mit Gemini Live hat Google die Grundlage dafür geschaffen, die Interaktion mit dem KI-ChatBot reibungsloser zu gestalten und eine permanente Kommunikation zu ermöglichen – und das nicht nur per Text. Die Audio-Interaktion ist ein wichtiger Bestandteil von Gemini Live und in Kürze wird das auch für Video der Fall sein. Laut der gestern erfolgten Ankündigung soll Gemini Live mit Video-Unterstützung noch in diesem Monat starten.

Nutzer werden die Möglichkeit haben, ein Video oder die gesamte Smartphone-Oberfläche in Form eines Displaystreamings für Gemini freizugeben und sich mit dem KI-Bot über die Inhalte zu unterhalten. Auch dabei kann Gemini nicht nur Fragen beantworten, sondern bei Bedarf selbst Rückfragen stellen, laufende Informationen liefern oder sich auch auf Dinge beziehen, die gar nicht mehr zu sehen sind. In den unten eingebundenen Videos könnt ihr das in Form kurzer Videos sehen.

Beide Funktionen stärken die Videofunktionalität des KI-ChatBots, dessen darunterliegendes KI-Modell zwar für solche Anwendungen ausgelegt ist, diese bisher aber noch nicht in Gänze genutzt hatte.




Die vom Gemini-Team eingeschlagene Richtung geht damit klar in die Richtung, den KI-Bot zu einem ständigen Begleiter zu machen, der dank Smartphone und in Zukunft auch anderen Geräteklassen dauerhaft zur Verfügung steht. Schon jetzt wird sehr deutlich, dass Gemini mit der Live-Umgebung auf dem Smartphone auf dem Weg ist, das für die smarten AR-Brillen gezeigte Interface nachzubauen. Mit der Videoanalyse, der permanenten Kommunikation und der Displayfreigabe ist der Weg bereitet und der Start auf den Brillen wohl sehr viel näher, als wir zunächst vermutet hatten.

Wir haben euch Gemini auf den Android XR-Brillen bereits vorgestellt und auch wenn das Demovideo sich noch deutlich von Gemini Live am Smartphone unterscheidet, kommen dieselben Technologien und Schritte zum Einsatz. Ob der Nutzer sein Smartphone-Display oder sein Brillendisplay mit Real World-Darstellung freigibt, macht gar keinen so großen Unterschied mehr. Daher lehne ich mich wohl nicht zu weit aus dem Fenster, wenn ich Gemini Live als Produkt bezeichne, das schon bald auf den smarten KI-Brillen zum Einsatz kommt.

» Gemini Veo: Googles Videogenerator ist absurd teuer – oder etwa nicht? Die Preisgestaltung unter der Lupe

[Google-Blog]

Letzte Aktualisierung am 2025-04-03 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!




Teile diesen Artikel:

Facebook twitter Pocket Pocket