Die Straßen dieser Welt verändern sich ständig, und das ist natürlich auch eine Herausforderung für die Google Maps – denn die App bzw. das dahinter liegende Datenmaterial muss Schritt halten und ständig aktualisiert werden. Das geschieht einmal durch die Hilfe der Nutzer und kann zum anderen auch automatisiert erfolgen. Dazu setzt Google auf die Fotos der Streetview-Fahrzeuge, mit denen sich Straßenschilder und Namen von Geschäften vollautomatisch korrigieren lassen.
Auch wenn sie hierzulande längst von den Straßen verbannt sind, gibt es noch viele Teile der Welt in denen die Fahrzeugen von Google Streetview regelmäßig unterwegs sind und frisches Fotomaterial liefern. Aber auch die Datenbank der in der Vergangenheit aufgenommenen Fotos enthält wertvolle Daten die nun von den Algorithmen ausgewertet werden und das Kartenmaterial ergänzen und korrigieren sollen.
Das Team von Google Streetview hat Algorithmen entwickelt, mit denen sich die Beschilderung auf den Fotos vollautomatisch erkennen lässt. Das ist dank OCR, also Texterkennung, in der Theorie zwar keine große Herausforderung, in der Praxis aber eine Mammut-Aufgabe. Auf den Fotos befinden sich natürlich nicht nur Straßenschilder sondern auch Werbeanzeigen, Nummernschilder und viele weitere Dinge die mit einem Straßenschild natürlich nichts zu tun haben. Diese müssen also alle erst einmal herausgefiltert werden.
Ist dann ein Straßenschild extrahiert, nimmt sich der Algorithmus alle verfügbaren Ansichten dieses Schildes und versucht den Text darauf möglichst genau zu erkennen. Dabei werden Abkürzungen wie Av., Str. oder Ln. automatisch erkannt und vervollständigt. Diese Schilder können dann dank der Geodaten der Fahrzeuge einer genauen Straße zugewiesen werden, so dass die Maps über den korrekten Namen verfügen. Herausforderung ist dabei vor allem auch das Ausblenden von Hausnummern und auch Schildern von kreuzenden Straßen.
Aber nicht nur Straßennamen werden auf diese Weise korrigiert oder ergänzt, sondern auch Bezeichnungen von Geschäften. Dabei stand und steht das Team vor der Herausforderung, das korrekte Schild dem korrekten Geschäft zuzuweisen. Werbeanzeigen daneben und darüber müssen ausgeblendet werden, eventuell erwähnte Produkte und Marken ebenfalls. Eine 100%ige Erkennung ist somit natürlich nicht möglich, aber immerhin ein Datenabgleich mit bestehenden Datenbanken.
Wie das ganze funktioniert beschreiben die Entwickler in einem ausführlichen Blogpost von Google Research und verlinken dort auch viele weitere verwendet Technologien. Für Entwickler ganz interessant, wie sich diese Technologien im Laufe der Zeit verbessert haben. Unter anderem hat Google auch für diesen Zweck wieder auf die Hilfe der Community gesetzt und hat erkannte Schilder aus Streetview in Captchas verwendet – so konnte das System perfekt trainiert und mit korrekten Daten gefüttert werden.
Insgesamt verfügt das Streetview-Team mittlerweile über 80 Milliarden Fotos, die allesamt in den vergangenen Jahren analysiert wurden und auch weiterhin ausgewertet werden um möglichst viele Daten herauszuholen.
» Artikel im Google Research Blog