Gemini Live: Neue Kamera- und Displayfreigabe startet für viele Nutzer – das sind die Möglichkeiten (Videos)

Google hat in der vergangenen Woche mit dem Rollout der Gemini Live Kamera- und Displayfreigabe begonnen, die vielen Nutzern die Möglichkeit gibt, die visuelle Komponente des KI-Modells ausführlich zu verwenden. Erstmals können die vor gut einem Jahr gezeigten bildbasierten KI-Funktionen zur Erleichterung des Alltags genutzt werden – aber wofür eigentlich? In einer Reihe von Videos zeigt man jetzt, was derzeit möglich ist.

Die visuelle Komponente von Gemini Live wird schon sehr bald eine große Rolle bei Smart Glasses spielen und dafür sorgen, dass der bisher eher passive KI-ChatBot zum ständigen Begleiter werden kann. Dabei geht es gar nicht so sehr um die gezielte Auswertung von Bildern und Videos, sondern um eine Live-Freigabe, die stets das aufzeichnet, analysiert und aufbereitet was der Nutzer selbst zu sehen bekommt. Sei es auf dem Display oder im Kamerabild. Es ist die Vorstufe des Smart Glasses-Betriebssystem.
Zur Ankündigung des Rollouts hat Google eine Reihe von Videos veröffentlicht, die die Einsatzmöglichkeiten von Gemini Live mit dieser Art von Freigabe zeigen. Denn statt nach offensichtlichen Dingen zu fragen, um den Testlauf durchzuführen, lässt sich das Tool schon heute praktisch anwenden. Das reicht vom Onlineshopping über die Stilberatung bis zu Einrichtungstipps oder Brainstorming. Schaut euch einmal die folgenden Videos an.
Personalisierte Shopping-Beratung
Mit der Freigabe des Displays könnt ihr einen personalisierten Shoppingtrip mit Gemini in den Onlineshops dieser Welt starten. Dazu müsst ihr einfach nur einen Onlineshop oder ein konkretes Produkt öffnen und schon kann Gemini mit hilfreichen Tipps aufwarten. Das reicht von einer Stilberatung über die Empfehlung passender Produkte bis zum Preisvergleich oder dem Zusammenstellen von Einkaufslisten. Nutzt dazu auch eure Kamera, um eure eigene Garderobe zu präsentieren und zu bewerten, was zu eurem Stil oder der aktuell getragenen Kleidung passt.
Reparaturen und Fehlerbehebung
Es war DIE Demo im vergangenen Jahr und wurde als eines der Haupteinsatzgebiete von Gemini Live präsentiert: Die Aufnahme der Umgebung, die Analyse von einzelnen Objekten, deren Funktionsweise und mehr. Damals hat man das Beispiel eines Plattenspielers gezeigt, der nicht mehr wie gewünscht genutzt werden konnte. In dieser gezeigten Demo hat die Gemini-KI zunächst das Produkt erkannt, dann das exakte Modell erkannt, sicherlich die Anleitung studiert und dadurch den Fehler entdeckt: Nämlich die falsch positionierte Nadel, die mit der Hilfestellung vom Nutzer wieder in die richtige Position gebracht werden konnte. Ein beeindruckendes Zusammenspiel aus visueller Erkennung, Fehlersuche, Informationsaufbereitung und Vermittlung.
Das neue Beispiel ist nicht mehr ganz so beeindruckend, zeigt aber, dass diese Funktionalität grundsätzlich umgesetzt wurde und im Laufe der Zeit sicherlich sehr schnell lernen wird. Im obigen Video könnt ihr sehen, dass der Nutzer Probleme mit seinem Router hat, der korrekt erkannt wird und dann mit dem klassischen Tipp des ausschalten und wieder einschalten bedacht wird. Wäre man vielleicht auch selbst draufgekommen, aber der Weg für eine solche Assistenz ist damit erstmal geebnet.
Man hat das wohl denkbar schlechteste Beispiel genommen, aber dennoch wird der Einsatzbereich ersichtlich: Nutzer sollen Gemini zur Assistenz nutzen, um selbst Dinge zu erledigen. Spannend wäre es so etwas bei der für Laien machbaren Reparatur von Produkten, für die korrekte Verwendung von Geräten und mehr.
Lernen und weiterentwickeln
Lasst ihr Gemini auf euer Smartphone-Display blicken, kann es dieses vollständig und Live analysieren, um die gezeigten Informationen zu verarbeiten und bei Bedarf sowohl aktiv als auch rückblickend zusammenzufassen. Die von Gemini bereitgestellten Funktionen reichen von der Textanalyse bis zur Optimierung einer Bildgestaltung oder des Layouts für eine Webseite. Gemini kann eure Inhalte sowie Verbesserungspotenziale analysieren und euch personalisierte Empfehlungen geben.
In der physischen Welt aufräumen
Vielleicht eine zukünftige Killerfunktion: Gebt ihr Gemini den Blick auf eure Kamera frei und lasst den KI-Bot an einer Roomtour teilnehmen, kann dieser sogar eine Umgestaltung eurer Wohnung oder einzelner Möbel vorschlagen. Im obigen Videobeispiel fragt der Nutzer danach, ob der Sessel an einer anderen Position abgestellt werden könnte, um das Raumpotenzial zu optimieren. Nach einer kurzen Raumanalyse kommt Gemini zum Schluss, dass dieser schon an der optimalen Position steht. In diesem Fall ist das eher eine Bestätigung, aber grundsätzlich könnte da sicherlich noch viel mehr daraus werden. Mit Augmented Reality vielleicht auch eine Umpositionierung mit Vorschaufunktion.
Brainstorming mit allen Medien
Gemini kann mit einer aktiven Displayfreigabe zum Brainstorming zur Entwicklung von neuen Ideen verwendet werden. einfach eure Entwürfe, Ideen, Zeichnungen, inspirierende Diagramme, Collagen oder sonstige Inhalte und Konzepte, sodass Gemini kann euch Ideen liefern, das kreative Schreiben unterstützen oder auch Tipps zum Basteln liefern kann.
Pixel 9a kaufen + Pixel Buds A Kopfhörer gratis: Amazon | Media Markt | Saturn
Letzte Aktualisierung am 2025-04-21 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter