Die Android-App von Gemini erhält ein Update, das eine praktische Funktion im Gepäck hat, die von Desktopnutzern schon seit längerer Zeit verwendet werden kann: Nutzer erhalten die Möglichkeit, eine ganze Reihe von Mediendateien zur Analyse durch den KI-ChatBot in die App hochzuladen.
Der KI-ChatBot Gemini bzw. dessen KI-Modell wurde multimodal konzipiert, sodass dieser mit Text und Medien gleichermaßen umgehen soll. Bisher ist es für Nutzer der Android-App nur möglich, Eingaben per Text, Sprache oder Upload eines Bildes vorzunehmen, aber das wird jetzt recht umfangreich ausgebaut. Denn Nutzer von Gemini Advanced erhalten nach dem Rollout des jüngsten Updates die Möglichkeit, eine große Anzahl unterschiedlicher Dateitypen hochzuladen und vom KI-ChatBot analysieren zu lassen. Auf den folgenden Screenshots ist diese Nutzung zu sehen.
Die Analyse von Mediendateien gehört zu den großen Stärken von Gemini (hier einige Demos), daher muss man das natürlich auch in der Android-App bieten. So sollen bald auch PDF-Dokumente zusammengefasst, Audio-Dateien analysiert oder Fragen zu Videos gestellt werden können. Den Beginn machen nun erst einmal Dokumentformate mit Text- und Bildinhalten. Die folgenden Dateitypen werden unterstützt: TXT, DOC(X), PDF, RTF, DOT(X), HWP(X), CSV, TSV, XLS(X) und Google Docs sowie Google Sheets.
Nutzer können bis zu zehn Dateien auf einmal hochladen und in Kombination von Gemini analysieren lassen. Jede dieser Dateien kann eine Größe von bis zu 100 Megabyte haben. Weitere mediale Dateitypen dürften folgen.
Letzte Aktualisierung am 2024-10-31 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!