GoogleWatchBlog

GOOG-411 ist Trainingslager für Googles Spracherkennungssoftware

» Web-Version «


Unter der Telefonnummer 1-800-GOOG-411 betreibt Google seit genau 3 Monaten seinen Auskunftsdienst GOOG-411. Was für den User in erster Linie eine automatisierte Auskunft ist, ist für Google in Wahrheit etwas komplett anderes – nämlich ein riesiger öffentlicher Beta-Test und Trainingsprogramm für die eigene Spracherkennungssoftware.

Google setzt bei seinem Auskunftsdienst nicht mehr wie in der Vergangenheit auf vorhandene Spracherkennungssoftware, sondern hat sich ein eigenes System entwickelt und trainiert dieses jetzt mit Millionen von Stimmen und Anfragen. Durch das nahezu endlose Training verbessert sich das System quasi von selbst immer weiter und wird eines Tages eine 99,9%ige Zuverlässigkeit bieten können – wahrscheinlich auch mit Dialekten.

Mit dieser Masche verfolgt Google weiter die Strategie die User umsonst für sich arbeiten zu lassen. Das gleiche wird schon seit langer Zeit sehr erfolgreich beim Google Image Labeler angewendet und dürfte Google ebenfalls schon jede Menge wertvoller Daten bringen. Interessant an diesem Sprachsystem ist aber, wofür es später verwendet werden soll:

Wenn die Spracherkennung erst einmal einen ausreichenden Wortschatz mit sehr hoher Zuverlässigkeit aufgebaut hat, wird Google diese Software wohl einmal komplett über YouTube jagen und wird Videos erstmals nicht nur anhand der Beschreibung sondern auch anhand des Audio-Inhalts analysieren können. An der Erkennung des visuellen Inhalts wird ja ebenfalls schon gearbeitet.

Eigentlich hätte man ja damit rechnen müssen dass Google auch diese Daten wieder verwendet, aber auf das automatische Training einer Sprachsoftware wäre ich nie gekommen – Genial 😀

[Google Blogoscoped]


Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | Jetzt den GoogleWatchBlog-Newsletter abonnieren