Google arbeitet seit langer Zeit am Project Astra, das es sich zum Ziel gesetzt hat, einen universellen visuellen Assistenten zu entwickeln - allen voran für die Nutzung auf den künftigen Smart Glasses. Jetzt hat man einen interessanten Schritt verkündet, der aufgrund der engen Verzahnung aber zu erwarten war: Das Team von Project Astra wandert unter das Dach von Gemini und soll dort an den Live-Funktionalitäten arbeiten.
Google dürfte schon bald den KI-ChatBot Gemini für Android Auto starten und auch der Infotainment-Plattform den Abschied vom bisher genutzten Google Assistant einläuten. Wir haben euch bereits viele Bilder und Videos von Gemini auf dem Fahrzeugdisplay gezeigt und jetzt ist es erstmals gelungen, auch Gemini Live zu aktivieren, das sein eigenes Widget erhält.
Das KI-Modell Gemini wurde von Beginn an multimodal entwickelt, um sowohl mit Text als auch Audio und Video umgehen zu können und diese weitgehend gleichwertig zu behandeln. Mit dem noch recht jungen Gemini Live laufen all diese Fähigkeiten zusammen, wobei in Kürze ein großer Schwung an Video-Verbesserungen ansteht. Jetzt hat Google erneut die Gemini-Interaktion per Video vorgestellt und erstmals gezeigt.
Zur bequemen Nutzung des KI-ChatBots können alle Nutzer seit einiger Zeit auf Gemini Live setzen, das eine permanente Konversation ermöglicht. Das ist sehr komfortabel und wurde zuletzt funktionell stark ausgebaut, doch ein wichtiger Punkt fehlt bisher noch, der laut eines aktuellen Teardowns wohl in Kürze umgesetzt wird: Untertitel für die Ausgabe.
Google hat mit Gemini Live eine neue Form der Kommunikation in den KI-ChatBot gebracht, die die Nutzer dazu animieren soll, diesen deutlich häufiger und auch länger in Anspruch zu nehmen. Die jüngsten Updates zeigen, dass man dabei vor allem auf eine Karte setzen will, die den allermeisten ChatBots bisher nicht unbedingt zugerechnet werden kann: Menschlichkeit.
Im vergangenen Jahr hat Google das neue Produkt Gemini Live gestartet, das die Kommunikation mit dem KI-ChatBot auf eine neue Ebene heben soll, die einer natürlichen Konversation gleicht. Jetzt kündigt man den Rollout eines verbesserten Sprachmodells an, das die Unterhaltung noch dynamischer und spannender gestalten sowie noch mehr unterschiedliche Eingabeformen ermöglichen soll.