So wie viele andere Tastatur-Apps auch hat Googles Gboard ein integriertes Wörterbuch, mit dem sich der Nutzer das Tippen langer Wörter ersparen kann und das Funktionen wie das Swipen erst möglich macht. Je nach Hersteller sind diese Wörterbücher nur lokal auf dem Gerät gespeichert oder werden über die Cloud synchronisiert. Googles Entwickler haben nun eine Zwischenlösung vorgestellt, bei der die Vorteile aus beiden Welten miteinander kombiniert werden.
Wenn eine Tastatur-App die Synchronisierung mit der Cloud anbietet, dann hat dies in den meisten Fällen den Zwecke, dass das eigene Wörterbuch auf allen Geräten zur Verfügung steht. Einige Hersteller nutzen die Daten auch dazu, die globalen Wörterbücher zu erweitern und eventuelle Fehler auszubessern. Allerdings hat dies den Nachteil, dass die persönlichen Daten in der Cloud abgelegt werden müssen, was vielen Nutzern nicht ganz geheuer ist.
Das Team rund um das Gboard hat nun ein Konzept veröffentlicht, das die Vorteile der beiden Welten miteinander kombiniert und dennoch eine intelligente Tastatur-App ermöglicht. Statt die eingegebenen und zum Wörterbuch hinzugefügten Wörter in die Cloud zu laden, wird aus diesen ein Modell erstellt, dass dann in halbwegs anonymisierter Form mit der globalen Intelligenz aller Nutzer verglichen und mit anderen Nutzern abgeglichen wird.
Federated Learning enables mobile phones to collaboratively learn a shared prediction model while keeping all the training data on device, decoupling the ability to do machine learning from the need to store the data in the cloud.
In diesen Daten werden dann Zusammenhänge gesucht und ein gemeinsames „Shared Model“ erstellt. Dieses soll dann wieder mit den Nutzerdaten abgeglichen und das Wörterbuch des Nutzers erweitert werden.
Your device downloads the current model, improves it by learning from data on your phone, and then summarizes the changes as a small focused update. Only this update to the model is sent to the cloud, using encrypted communication, where it is immediately averaged with other user updates to improve the shared model. All the training data remains on your device, and no individual updates are stored in the cloud.
Durch dieses Modell, das zugegebenermaßen sehr kompliziert klingt und auch nicht wirklich einfach zu beschreibe ist, soll eine intelligente Tastatur-App ermöglicht werden, die nicht zum Datenschutz-Alptraum wird. Der Nutzer kann so mit einem Wörterbuch rechnen, dass sich wie von Geisterhand füllt und bereits Wörter kennt, die niemals eingepflegt worden sind. Aber es soll nicht nur um die Erweiterung des Wörterbuches gehen, sondern auch um die Intelligenz der Tastatur.
Durch diese Modelle soll die Tastatur noch besser erkennen und vorhersagen können, welches Wort wohl als nächstes kommt und dann die richtigen Wörter vorschlagen. Auch dadurch soll das Tippen oder Swipen noch leichter werden, und wer die Tasten nicht genau trifft, kann dennoch mit guten Vorschlägen und Ergebnissen rechnen. Wer mehr Details zu dieser Technik und eine tiefere Beschreibung möchte, findet diese in der Quelle im Google Research Blog.
» Artikel im Google Research Blog