Das KI-Modell Gemini wurde von Beginn an multimodal entwickelt, um sowohl mit Text als auch Audio und Video umgehen zu können und diese weitgehend gleichwertig zu behandeln. Mit dem noch recht jungen Gemini Live laufen all diese Fähigkeiten zusammen, wobei in Kürze ein großer Schwung an Video-Verbesserungen ansteht. Jetzt hat Google erneut die Gemini-Interaktion per Video vorgestellt und erstmals gezeigt.
Zur bequemen Nutzung des KI-ChatBots können alle Nutzer seit einiger Zeit auf Gemini Live setzen, das eine permanente Konversation ermöglicht. Das ist sehr komfortabel und wurde zuletzt funktionell stark ausgebaut, doch ein wichtiger Punkt fehlt bisher noch, der laut eines aktuellen Teardowns wohl in Kürze umgesetzt wird: Untertitel für die Ausgabe.
Google hat mit Gemini Live eine neue Form der Kommunikation in den KI-ChatBot gebracht, die die Nutzer dazu animieren soll, diesen deutlich häufiger und auch länger in Anspruch zu nehmen. Die jüngsten Updates zeigen, dass man dabei vor allem auf eine Karte setzen will, die den allermeisten ChatBots bisher nicht unbedingt zugerechnet werden kann: Menschlichkeit.
Im vergangenen Jahr hat Google das neue Produkt Gemini Live gestartet, das die Kommunikation mit dem KI-ChatBot auf eine neue Ebene heben soll, die einer natürlichen Konversation gleicht. Jetzt kündigt man den Rollout eines verbesserten Sprachmodells an, das die Unterhaltung noch dynamischer und spannender gestalten sowie noch mehr unterschiedliche Eingabeformen ermöglichen soll.