Interview mit Google Research-Chef Peter Norvig

Veröffentlicht am 4. August 2007 von Jens

Das Heise-Magazin Technology Review hat ein Interview mit dem Googler Peter Norvig, Chef der Forschungsabteilung, über vergangene Erfolge, aktuelle Forschungsarbeiten und zukünftige Herausforderungen geführt. Dabei ließ Peter unter anderem durchblicken dass Google Video demnächst auch den eigentlichen Inhalt eines Videos durchsuchen wird. Laut Peter hängen die beiden größten Forschungsbereiche bei Google Research mit dem Thema Sprache zusammen. Das erste Projekt beschäftigt sich mit Spracherkennung und das zweite mit der Analyse der gesprochenen Sätze und deren automatisierte Übersetzung in eine andere Sprache. Zu beiden Themen hat Peter eine Menge zu erzählen: Videosuchmaschine & Spracherkennung

Wir wollten eine Sprachtechnologie, die als Interface für Telefone und auch zur Indizierung von Audiotext verwendet werden kann. Nach der Betrachtung existierender Ansätze entschieden wir uns, etwas Eigenes zu entwickeln. Wir denken, dass wir mit den Daten und Rechenkapazitäten, die uns zur Verfügung stehen, das Feld nach vorne bringen können.

Auch wenn man es bisher - GOOG-411 mal ausgenommen - nicht bemerkt hat, so hat Google doch auf dem Gebiet der Spracherkennung jede Menge KnowHow gesammelt und kann sich damit rühmen eine der besten Spracherkennungssoftwares zu besitzen. Diese Software soll aber nicht nur für die Websuche eingesetzt werden sondern auch für die Video-Suche, bzw. für die Suche IN den Videos. Bisher kann Google bzw. YouTube nur aus der Beschreibung, dem Titel, den Tags und eventuell noch den Kommentaren und Verlinkungen Schlüsse ziehen worum es sich bei diesem Video handelt - aber das soll sich mit der Spracherkennung bald ändern. Mithilfe dieser Technik könnte endlich auch der Inhalt des Videos erkannt und durchsuchbar gemacht werden - sofern in diesem Video gesprochen wird. Bis die Suchmaschine in der Lage ist auch den visuellen Inhalt des Videos soweit zu erkennen dass daraus wichtige Informationen geschlossen werden können, werden sicherlich noch ein paar Jahre vergehen - aber die Spracherkennung könnte eigentlich jederzeit gestartet werden. Ich bin mir auch relativ sicher dass Google bereits damit begonnen hat die Videos nach ihrem Audio-Inhalt zu scannen. Und sobald alle Videos indiziert sind kann das ganze dann an den Start gehen.

Die Leute suchen nicht nach Stellen, in denen dieser oder jener Mann über dieses oder jenes geschichtliche Thema gesprochen hat. Aber all diese Informationen sind vorhanden und mit Spracherkennung wird man auf sie bald zugreifen können.

Websuche Unter der Haube hat sich bei Googles Websuche in den letzten Jahren so einiges getan - von 99% dieser Änderungen und Verbesserungen hat der gemeine User aber nichts bemerkt, daher wird Google oft vorgeworfen seine Websuche zu vernachlässigen. Das liegt zum einen daran dass sich die Oberfläche bewährt hat und nicht viel daran gedreht werden muss, und zum anderen daran dass die Probleme vor die die Googler gestellt werden mehr als komplex sind:

Wir schauen nicht nur auf die eingetippten Worte. Auch Schreibvarianten und die Länge der Suchanfrage werden überprüft, dann erst wird sie in Teile zerlegt. Vielleicht meinte der Nutzer einige der Worte ja als Suchbegriff, andere wieder nicht.

Das größte Problem aller Suchmaschinen dürfte wohl sein, dass der User einfach zuviel von seiner Suchmaschine abverlangt. Die meisten sind einfach zu faul mehr als 3 Wörter einzutippen um eine fertige Doktorarbeit präsentiert zu bekommen. Für die Suchmaschine ist es hierbei natürlich sehr schwierig - wenn nicht sogar unmöglich - herauszufinden wonach der User eigentlich sucht. Oftmals wäre bei den Suchanfragen sicherlich auch ein Mensch vollkommen überfragt...

Am weitesten von einer Lösung entfernt sind wir aber bei der Eingabe von vollständigen Sätzen in englischer Sprache, die dann auch eine echte Antwort in natürlicher Sprache ergibt.

Die Suchmaschine muss seinen User kennen lernen um ihm die optimalen Ergebnisse liefern zu können. Wenn die Suchmaschine weiß an welchem Thema der User gerade arbeitet, dann könnte der Trefferkreis natürlich stark eingeschränkt werden und das gesuchte Dokument wäre ganz weit oben in den Suchergebnissen. Das Problem dabei ist, dass der User der Suchmaschine diese Informationen garnicht geben möchte - ein Teufelskreis.

Eines der Forschungsvorhaben, die wir prüfen, betrifft Möglichkeiten, den Nutzer stärker einzubeziehen, ihn dazu zu bringen, uns mehr über das zu sagen, was er will. Die Menschen geben beispielsweise "Karte" bei Google ein und sind dann enttäuscht, wenn nicht gleich die Karte kommt, an die sie dachten. Die Menschen sind viel eher dazu bereit, etwas zu sagen, als etwas zu tippen. Vielleicht hilft ja auch ihnen mehr Vorschläge zu unterbreiten, was sie gemeint haben könnten, aber nicht eingegeben haben.

Daher bleibt der Suchmaschine nichts weiter übrig, als blind zu raten was gemeint sein könnte und den User einfach explizit nach weiteren Details zu fragen. Aber auch bis dahin dass das perfekt funktioniert ist es sicherlich noch ein sehr weiter weg... » Das komplette Interview bei Technology Review

Google arbeitet an Geschlechtserkennung auf Fotos

Veröffentlicht am 21. Mai 2007 von Jens

Die Googler haben sich mal wieder ein großes Ziel gesetzt: Die perfekte Erkennung von Inhalten auf Bildern und Fotos. Während das Image Labeler-Spielchen eher auf menschliche Hilfe setzt, wird zur Zeit an einem Algorithmus gearbeitet der automatisch erkennen soll ob auf dem Foto ein Mann oder eine Frau zu sehen ist. Wofür das später eingesetzt werden soll ist noch relativ unklar. Um Fotos zu analysieren werden diese erst in ein Graustufen-Bild umgewandelt, verkleinert und dann von entsprechender Software analysiert. Laut ersten Aussagen der Googler werden zur Zeit schon Trefferquoten von 80-90% erzielt - was ich aber eher für unwahrscheinlich halte. Ich denke alleine schon die Erkennung ob sich auf dem Foto ein Mensch befindet dürfte nicht ganz so einfach sein. Ich weiß nicht wie weit die Technik auf diesem Gebiet zur Zeit schon ist. Es gab mal eine Webseite, bei der man Fotos hochladen konnte und innerhalb weniger Sekunden war das Gesicht der Person auf diesem Bild mit einem Logo verdeckt - leider habe ich die URL vergessen. Die Erkennung des Gesichts ist also möglich, der Vergleich von Gesichtern auch. Und selbst wenn Google es geschafft hat das Geschlecht zu erkennen, dann bleibt immer noch die Frage nach dem Anwendungsgebiet. Bis zu einer wirklichen Foto-Erkennung, so dass mir der Rechner sagen kann wer und was auf dem Foto zu shen ist, wird es wohl noch Jahrzehnte dauern. Laut internen Aussagen soll die Software vorallem dafür eingesetzt werden, die Bildersuche von pornographischem Content freizuhalten. Ich denke aber dass dieser Grund nur vorgeschoben ist - zumindest mit der reinen Gesichtserkennung könnte es schwer werden ;-) Und ob der Algorithmus die Strand-Fotos im Bikini und Badehose von den Porno-Fotos unterscheiden kann wage ich auch mal leicht zu bezweifeln... [ZDNet-Blog]