Tipp: Versteckter Google Mail-Filter zur Spracherkennung
Durch Googles Rechtschreibkorrektur, die unter anderem bei Google Mail und der Google Toolbar zum Einsatz kommt, wissen wir dass Google dazu in der Lage ist die Sprache eines Textes automatisch zu erkennen. Was die meisten aber wohl nicht wussten: Auch diese Information wird nicht nur temporär sondern dauerhaft gespeichert. So lassen sich bei Google Mail Mails auch nach Sprache filtern.
Um eMails nach der Sprache zu filtern müsst ihr nur als Suchparameter language:SPRACHE – die Sprache im englischen Format – eingeben. Der Parameter language:english bspw. zeigt nur die englischsprachigen Mails an. Da auch diese Suche wieder in unter 1 Sekunde ausgeführt wird, gehe ich davon aus dass Google Mail die Sprache direkt speichert und nicht jedesmal neu herausfindet.
Wenn Google Mail seine Filter-Einstellungen jetzt ein wenig erweitern würde, könnte man dieses Feature auch praktisch nutzen: Nichts gegen die russische Sprache, aber bestimmt 20% aller Spam-Mails die ich bekomme sind in russisch gehalten und 100% davon sind von mir nicht erwünscht. Ich spreche kein Wort russisch, also sind diese für mich unbekannt und sollen gleich als Spam markiert werden. Aber leider funktioniert das noch nicht…
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter
aber man kann sie mittels filter gleich löschen lassen…
den string language:xyz bei „Has the words:“ eintragen, dann gehts
Funktioniert bei mir nicht, hatte ich vorhin schonmal versucht. Da hat GMail minutenlang geladen bis ich irgendwann aufgegeben habe…
eigenartig… ich hab schon einen filter für englisch und spanisch erstellt, funktioniert super…
Muss man aber aufpassen, weitergeleitete Mails erkennt es bei mir gern mal als „Englisch“.
So eine Spracherkennung z.B. basierend auf N-Grammen zu schreiben ist ziemlich leicht. Google hat ja zudem auch genug Daten um ein solches Modell zu trainieren. Aber GMail ist bisher der einzige Dienst der so etwas integriert hat und dann wohl auch noch offline vorrauskalkuliert, finde ich nicht schlecht. Auf ähnlichen technischen Grundlagen werden demnächst auch Filter für Labels möglichig, die man gar nicht mehr selbst konfigurieren muss…
jo bei mir gehts mit „language:“ und „is:“ in „Has the words:“ problemlos!