Google hat eine sehr starke Spracherkennung, die über die Jahre mit den Sprachbefehlen der Nutzer in der Websuche und dem Google Assistant trainiert wurde. Die Qualität ist dabei immer wieder gestiegen und hat nun offenbar einen Punkt erreicht, an dem sie, kombiniert mit Künstlicher Intelligenz, den Menschen auch in ganz anderen Situationen helfen kann. Die neue App Live Transcribe kann gesprochen Wörter in Fast-Echtzeit darstellen.
Spracherkennung gibt es schon seit Jahrzehnten, aber erst in den letzten Jahren haben die Technologien große Sprünge gemacht und können Worte sehr genau verstehen. Google trainiert die eigenen Systeme sowohl über die Sprachsteuerung der Websuche oder des Google Assistant, aber auch an anderen Stellen wie etwa bei Google Translate (das gestern einen großen Auftritt hatte) oder auch mit den automatischen Untertiteln von YouTube.
Die neuen App Live Transcribe bringt die Spracherkennung nun auf das nächste Level und steigert sowohl die Geschwindigkeit als auch die Qualität. Die App wandelt jedes gehörte Wort in Textform um und baut daraus ganze Sätze, die dann auf dem Display angezeigt werden. Die Besonderheit dabei ist, dass es nicht nur um die Worterkennung, sondern auch um sinnvolle Sätze geht. Die App setzt Kommas, Punkte für das Satzende und beachtet auch die teilweise für die Verständlichkeit wichtige Groß- und Kleinschreibung.
In obigem Video ist Live Transcribe im Einsatz zu sehen. Wie dort und auch in folgendem Video (weiter unten) deutlich wird, werden die Worte unmittelbar nach der Aussprache angezeigt. Die App nimmt Gespräche vollständig, zeigt diese im Vollbild an und erlaubt ein Scrollen durch das Gespräch, so wie in einem Buch. Hört die Person auf zu sprechen, vibriert das Smartphone und weist darauf hin, dass nun gelesen werden kann.
Die Oberfläche gibt es entweder in Schwarz auf Weiß oder Weiß auf Schwarz, je nach Vorliebe. Ein kleiner blauer Punkt am oberen Displayrand zeigt, ob die Erkennung deutlich genug ist oder das Smartphone näher zur sprechenden Person gehalten werden sollte. Am unteren Rand gibt es dann noch die Möglichkeit, eine Tastatur einzublenden oder die Sprache zu wechseln. Derzeit werden 70 Sprachen unterstützt, davon zwei nahezu simultan, zwischen denen mit einem Button gewechselt werden kann.
Die App befindet sich aktuell in der Beta-Phase und interessierte Nutzer können sich informieren lassen, sobald die App heruntergeladen werden kann. Bessere Nachrichten gibt es für Pixel 3-Nutzer, denn für diese ist die App ab sofort verfügbar und auch schon installiert. Sie kann einfach in den Einstellungen für Barrierefreiheit freigeschaltet werden.
UPDATE 22:30 Das ging schnell, die App ist nach wenigen Stunden nun doch im Play Store aufgetaucht und kann getestet werden.
Siehe auch
» Was Google alles weiß: Hier seht (und hört) ihr alle eure Sprachbefehle an den Google Assistant & Websuche