Gemini Live: Google zeigt ein neues Format für den KI-ChatBot – echte Unterhaltungen per Spracheingabe

google 

Google hat das KI-Modell Gemini zuerst als KI-ChatBot gestartet, mit dem die Nutzer per einfachem Frage-Antwort-Modell interagieren. Jeder Frage folgt eine ausführliche Antwort, das ganz klassische Modell. Mit dem baldigen Start von Gemini Live will man ein neues Format etablieren, das die Konversation auf die nächste Ebene bringen soll. Denn Gemini Live ermöglicht eine dauerhafte Konversation in Form eines normalen Gesprächs.


gemini live

Bisher ist es Gemini kaum möglich, aus dem ChatBot-Fenster auszubrechen, denn sowohl als eigenständiges Tool als auch bei der Integration in andere Google-Produkte setzt man auf die gewohnte Konversationansicht. Im Rahmen der Google I/O hat man eine neue Form gezeigt, die zwar immer noch auf Sprache basiert, aber diese in Form von Audio und nicht Text verarbeitet. Noch dazu ist es eine per Gemini Live eine Live-Konversation mit Live-Antworten. Ganz so, als würde man mit einer anderen Person eine Unterhaltung führen.

Die Konversation findet in der gezeigten Version ausnahmslos per Sprache statt, sodass man es eher als Unterhaltung bezeichnen kann. So lange die Oberfläche aktiv ist, können Nutzer ihre Informationen, Fragen oder Aufforderungen in eigener Geschwindigkeit mitteilen und die Gemini-KI wird aufmerksam zuhören. Gemini wird ebenso per Sprachausgabe antworten und diese Antworten, anders als im ChatBot-Modus, möglichst knapp halten. Zur Personalisierung will man mit zehn Stimmen starten, aus denen die Nutzer wählen können.

Wie ihr auf den Screenshots in diesem Artikel sehen könnt, ist die Oberfläche sprachbasiert und soll sich wohl absichtlich wie eine Art Telefongespräch anfühlen. Die Unterhaltung lässt sich sowohl pausieren als auch beenden, wobei der Unterschied zwischen Pause und Beenden wohl der ist, dass Gemini den bisherigen Kontext der Unterhaltung wieder verliert.




gemini live 2

Laut der Ankündigung kann die Unterhaltung im gewohnten Stil und auch Tempo des Nutzers stattfinden, Gemini wird sich daran anpassen. Ihr müsst also keine schnellen Sätze mitteilen oder sehr faktenbasiert sprechen, sondern könnt das digitale KI-Gegenüber wie jeden anderen Telefongespräch-Partner behandeln. Ähnliches hatte man vor mehreren Jahren schon einmal für den Google Assistant angekündigt, aber erst mit der Rechenpower und Künstlichen Intelligenz Gemini dürfte das wohl tatsächlich in der versprochenen Form möglich sein.

Gemini Live soll im Laufe der nächsten Monate für alle zahlenden Abonnenten von Gemini Advanced starten. Ob und wann man so etwas auch für die kostenfreie Variante starten wird oder welche regionalen und sprachlichen Einschränkungen es geben wird, hat man bisher nicht verraten. Ich denke, dass das ein sehr guter Einstieg in die KI-Welt wäre und daher ein Start für alle Nutzer, auch ohne Abo, nur eine Frage der Zeit ist.

» Gemini: Googles KI-ChatBot bekommt ein Gedächtnis – neue Memory-Funktion kommt bald (Teardown)

Letzte Aktualisierung am 2024-11-17 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!




Teile diesen Artikel:

Facebook twitter Pocket Pocket