Google Ngram Viewer: Linguistik-Tool erkennt Satzteile & Wortarten
Im letzten Jahr hat Google den Ngram Viewer gestartet, mit dem sich Nutzungsstatistiken von beliebigen Wörtern aus den vergangenen 200 Jahren anzeigen lassen. Die Daten stammen aus den Scans von Google Books und lassen sich seit dem letzten Update sehr umfangreich auswerten und gegenüberstellen.
Nicht nur für Linguisten hat Google mit dem Ngram Viewer eine interessante Möglichkeit geschaffen die Veränderung einzelner Sprachen umfangreich auszuwerten. Ausgangspunkt für die Auswertung ist die Häufigkeit der Verwendung der einzelnen Wörter in gedruckten Büchern der letzten 200 Jahre.
Es lassen sich mehrere Wörter gegenüberstellen, ein beliebiger Zeitraum einstellen und die zu durchsuchende Sprache einstellen. Wie oft ein Wort verwendet worden ist lässt sich anhand der Diagramme leider nicht herausfinden, Google gibt die Ergebnisse lediglich in Prozent an.
Mit dem heutigen Update hat Google dem Tool eine Reihe von Operatoren spendiert, mit dem sich die Verwendung der Wörter einschränken lässt: So können etwa nur Wörter am Satzanfang oder -Ende ausgewertet werden, nur Wörter bei denen es sich um ein Verb oder Adjektiv handelt oder auch die Beeinflussung eines bestimmten Wortes auf ein anderes angezeigt werden. Beeindruckend dabei: Google scheint die gescannten Sätze tatsächlich komplett grammatikalisch einordnen zu können.
Auch der Vergleich von Wörtern in verschiedenen Sprachen und verschiedenen Versionen der Ngram-Datenbank ist möglich, was derzeit alles leider nur per Parameter und nicht über ein UI erreichbar ist. Hat man sich aber einmal einen Überblick über die Parameter verschafft, hat man ein mächtiges Tool vor sich.
» Google Ngrams Viewer
» FAQ: Erklärung aller Parameter
» Ankündigung im Research-Blog
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter
Interessant, aber wenn man dann in den Ergebnissen schaut, sind ne Menge Bücher auf das falsche Jahr datiert.