KI-Bilderkennung: Gemini & Co haben große Probleme mit analoger Uhr – können Uhrzeit nicht ablesen (Studie)

google 

Moderne KI-Modelle wie Gemini können nicht nur eigene Inhalte generieren, sondern besitzen meist auch eine starke Bilderkennung, die insbesondere bei Googles Modell nach eigenen Angaben zu den großen Stärken gehört. Dennoch zeigt eine interessante Studie jetzt auf, dass die Modelle mit einem Alltagsgegenstand überfordert sein können. Es geht darum, die Uhrzeit von einer analogen Uhr abzulesen.


gemini star logo

Wir haben euch vor einiger Zeit die erschreckend starke Gemini-Bilderkennung demonstriert, die selbst kleinste Details auf Bildern erkennen und mit Informationen verknüpfen kann. Trotz KI basiert das Ganze weitgehend auf einer Objekterkennung, die sowohl bekannte Objekte und Muster als auch Abwandlungen erkennen kann. Dementsprechend wird die Gemini-KI das Bild einer Uhr in den allermeisten Fällen auch als Uhr erkennen. Doch wie sieht es mit der Uhrzeit aus?

Eine aktuelle Studie hat ergeben, dass KIs wie ChatGPT oder auch Googles Gemini große Probleme damit haben, eine analoge Uhr zu lesen. Im Test gibt es keine großen Herausforderungen, denn es wird lediglich das Bild einer Zeigeruhr hochgeladen und die KI danach befragt, wie spät es ist. Angeblich wurden in weniger als 25 Prozent der Testläufe die korrekte Uhrzeit genannt – Verlässlichkeit sieht also anders aus. Die Forscher vermuten, dass das Problem bei den Zeigern liegt, die von der KI gar nicht oder nicht korrekt erkannt werden. Auch römische Zahlen sollen eine Herausforderung sein. Obwohl diese bei Kenntnis einer Uhr (wenn sie richtig ausgerichtet ist) bekanntlich gar nicht benötigt werden würden.

Ich habe das Ganze mit Gemini selbst ausprobiert. In den meisten Fällen hat Gemini die Uhrzeit korrekt erkannt. Unabhängig von Zeigern und Skalen war Gemini stets in der Lage, die richtige Uhrzeit zu nennen. Die einzige Ausnahme war eine wissenschaftliche Uhr mit mehreren Skalen und einem Sekundenzeiger. Gemini interpretierte den Sekundenzeiger als Stunde, aber abseits dessen hat es funktioniert. Auch eine bildlich gekippte Uhr, eine Uhr ohne Skala oder eine gezeichnete Comic-Uhr wurden korrekt erkannt.

Entweder hat Google seit der Studie nachgebessert oder ich war in meinem Testlauf zu gnädig. Versucht es doch einfach einmal selbst: Sucht einfach per Bildersuche nach „Uhr“ und leitete die einzelnen Ergebnisse an Gemini weiter.

» Gemini: Starke Audio Overview-Funktion startet jetzt für alle Nutzer – ChatBot erstellt klärende Podcasts (Video)

» GMail & Gemini: Integration wird überarbeitet – Buttons in der Android-App werden verschoben (Screenshots)

[Futurezone]




Teile diesen Artikel:

Facebook twitter Pocket Pocket