Das Heise-Magazin Technology Review hat ein Interview mit dem Googler Peter Norvig, Chef der Forschungsabteilung, über vergangene Erfolge, aktuelle Forschungsarbeiten und zukünftige Herausforderungen geführt. Dabei ließ Peter unter anderem durchblicken dass Google Video demnächst auch den eigentlichen Inhalt eines Videos durchsuchen wird.
Laut Peter hängen die beiden größten Forschungsbereiche bei Google Research mit dem Thema Sprache zusammen. Das erste Projekt beschäftigt sich mit Spracherkennung und das zweite mit der Analyse der gesprochenen Sätze und deren automatisierte Übersetzung in eine andere Sprache. Zu beiden Themen hat Peter eine Menge zu erzählen:
Videosuchmaschine & Spracherkennung
Wir wollten eine Sprachtechnologie, die als Interface für Telefone und auch zur Indizierung von Audiotext verwendet werden kann. Nach der Betrachtung existierender Ansätze entschieden wir uns, etwas Eigenes zu entwickeln. Wir denken, dass wir mit den Daten und Rechenkapazitäten, die uns zur Verfügung stehen, das Feld nach vorne bringen können.
Auch wenn man es bisher – GOOG-411 mal ausgenommen – nicht bemerkt hat, so hat Google doch auf dem Gebiet der Spracherkennung jede Menge KnowHow gesammelt und kann sich damit rühmen eine der besten Spracherkennungssoftwares zu besitzen. Diese Software soll aber nicht nur für die Websuche eingesetzt werden sondern auch für die Video-Suche, bzw. für die Suche IN den Videos.
Bisher kann Google bzw. YouTube nur aus der Beschreibung, dem Titel, den Tags und eventuell noch den Kommentaren und Verlinkungen Schlüsse ziehen worum es sich bei diesem Video handelt – aber das soll sich mit der Spracherkennung bald ändern. Mithilfe dieser Technik könnte endlich auch der Inhalt des Videos erkannt und durchsuchbar gemacht werden – sofern in diesem Video gesprochen wird.
Bis die Suchmaschine in der Lage ist auch den visuellen Inhalt des Videos soweit zu erkennen dass daraus wichtige Informationen geschlossen werden können, werden sicherlich noch ein paar Jahre vergehen – aber die Spracherkennung könnte eigentlich jederzeit gestartet werden. Ich bin mir auch relativ sicher dass Google bereits damit begonnen hat die Videos nach ihrem Audio-Inhalt zu scannen. Und sobald alle Videos indiziert sind kann das ganze dann an den Start gehen.
Die Leute suchen nicht nach Stellen, in denen dieser oder jener Mann über dieses oder jenes geschichtliche Thema gesprochen hat. Aber all diese Informationen sind vorhanden und mit Spracherkennung wird man auf sie bald zugreifen können.
Websuche
Unter der Haube hat sich bei Googles Websuche in den letzten Jahren so einiges getan – von 99% dieser Änderungen und Verbesserungen hat der gemeine User aber nichts bemerkt, daher wird Google oft vorgeworfen seine Websuche zu vernachlässigen. Das liegt zum einen daran dass sich die Oberfläche bewährt hat und nicht viel daran gedreht werden muss, und zum anderen daran dass die Probleme vor die die Googler gestellt werden mehr als komplex sind:
Wir schauen nicht nur auf die eingetippten Worte. Auch Schreibvarianten und die Länge der Suchanfrage werden überprüft, dann erst wird sie in Teile zerlegt. Vielleicht meinte der Nutzer einige der Worte ja als Suchbegriff, andere wieder nicht.
Das größte Problem aller Suchmaschinen dürfte wohl sein, dass der User einfach zuviel von seiner Suchmaschine abverlangt. Die meisten sind einfach zu faul mehr als 3 Wörter einzutippen um eine fertige Doktorarbeit präsentiert zu bekommen. Für die Suchmaschine ist es hierbei natürlich sehr schwierig – wenn nicht sogar unmöglich – herauszufinden wonach der User eigentlich sucht. Oftmals wäre bei den Suchanfragen sicherlich auch ein Mensch vollkommen überfragt…
Am weitesten von einer Lösung entfernt sind wir aber bei der Eingabe von vollständigen Sätzen in englischer Sprache, die dann auch eine echte Antwort in natürlicher Sprache ergibt.
Die Suchmaschine muss seinen User kennen lernen um ihm die optimalen Ergebnisse liefern zu können. Wenn die Suchmaschine weiß an welchem Thema der User gerade arbeitet, dann könnte der Trefferkreis natürlich stark eingeschränkt werden und das gesuchte Dokument wäre ganz weit oben in den Suchergebnissen. Das Problem dabei ist, dass der User der Suchmaschine diese Informationen garnicht geben möchte – ein Teufelskreis.
Eines der Forschungsvorhaben, die wir prüfen, betrifft Möglichkeiten, den Nutzer stärker einzubeziehen, ihn dazu zu bringen, uns mehr über das zu sagen, was er will. Die Menschen geben beispielsweise „Karte“ bei Google ein und sind dann enttäuscht, wenn nicht gleich die Karte kommt, an die sie dachten. Die Menschen sind viel eher dazu bereit, etwas zu sagen, als etwas zu tippen. Vielleicht hilft ja auch ihnen mehr Vorschläge zu unterbreiten, was sie gemeint haben könnten, aber nicht eingegeben haben.
Daher bleibt der Suchmaschine nichts weiter übrig, als blind zu raten was gemeint sein könnte und den User einfach explizit nach weiteren Details zu fragen. Aber auch bis dahin dass das perfekt funktioniert ist es sicherlich noch ein sehr weiter weg…