Die Android-App von Gemini wird schon bald ein großes Update erhalten, das sich in diesen Tagen mit immer mehr Details abzeichnet. Wir hatten bereits über erste Verbesserungen berichtet und jetzt zeigt sich ein neues Feature, das den Funktionsumfang potenziell deutlich erweitern kann: Nutzer sollen die Möglichkeit haben, eine ganze Reihe von Mediendateien zur Analyse durch den KI-ChatBot hochzuladen.
Der KI-ChatBot Gemini bzw. dessen KI-Modell wurde multimodal konzipiert, sodass dieser mit Text und Medien gleichermaßen umgehen soll. Bisher ist es für Nutzer der Android-App nur möglich, Eingaben per Text, Sprache oder Upload eines Bildes vorzunehmen, aber das wird schon bald ausgebaut. Wie sich auf folgenden Screenshots zeigt, die im Rahmen eines Teardowns entstanden sind, wird Gemini in Kürze den Upload beliebiger Dateien ermöglichen. Ob sich das nur auf Mediendateien wie Bilder, Videos, Audio und Dokumente beschränkt oder tatsächlich alles hochgeladen werden kann, konnte noch nicht herausgefunden werden.
Die Analyse von Mediendateien gehört zu den großen Stärken von Gemini (hier einige Demos), daher muss man das natürlich auch in der Android-App bieten. Mutmaßlich zuerst für Advanced-Abonnenten, aber in eingeschränkter Form sicherlich auch für alle Nutzer. So sollen sich dann auch PDF-Dokumente zusammenfassen, Audio-Dateien analysieren lassen oder Fragen zu Videos stellen können. Der Clou wäre es natürlich, wenn auch weitere Dateitypen zur Analyse hochgeladen werden könnten – bis hin zu ausführbaren Dateien. Zumindest bietet Google seit vielen Jahren eine umfangreiche Dateianalyse mit VirusTotal und könnte diese Funktionalität sicherlich anzapfen.
Erst gestern hatten wir darüber berichtet, dass Gemini schon bald Medien-Apps steuern kann, Passwörter vorschlagen soll und sich die Android-App als Overlay nutzen lässt.
Letzte Aktualisierung am 2024-10-31 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!