In der vergangenen Woche hat Google die Smart Compose-Funktion von GMail angekündigt, die den Nutzer mit Künstlicher Intelligenz beim Verfassen von E-Mails unterstützen soll. Das ganze funktioniert ähnliche wie eine automatische Vervollständigung, erfordert im Hintergrund aber sehr viel mehr Aufwand. Jetzt gibt Googles AI-Team einen kleinen Einblick in die Anforderungen und die Funktionsweise dieses Features.
Eine automatische Vervollständigung ist heute für viele Nutzer selbstverständlich und wird längst nicht mehr nur von Google angeboten. In den meisten Fällen schlagen diese Funktionen aber nur ein einziges Wort oder eine Wortgruppe vor, können aber längst keine vollständigen Anfragen oder Sätze formulieren. Genau diese Herausforderung hat das GMail-Team angenommen und erfolgreich mit der Smart Compose-Funktion umgesetzt, die derzeit aber nur in englischer Sprache zur Verfügung steht.
Bei der Konzipierung der Funktion haben die Entwickler drei wichtige Ziele gesetzt, ohne deren Erreichen das Feature nicht umgesetzt werden könnte. Alle drei Erfordernisse waren mit den bisherigen Vorhersage-Engines allerdings nicht möglich, so dass man komplett von vorne beginnen und neue Technologien ausprobieren und entwickeln musste. Aber auch der Datenschutz ist bei einem von Nutzern trainierten System ein sehr wichtiges Kriterium.
Folgende Voraussetzungen mussten erfüllt werden
- Geschwindigkeit Die Funktion soll den Nutzer bei der Eingabe unterstützen und ihm Zeit ersparen. Also darf keine Zeit mit Warten auf die Vorschläge verschwendet werden. Aus diesem Grund wurde die maximale Antwortzeit auf 100 Millisekunden gesetzt.
- Skalierbarkeit GMail wird von mehr als 1,4 Milliarden Nutzern verwendet. Das bedeutet, dass man eine enorm starke Plattform benötigt und sich aber auch gleichzeitig individuell auf jeden einzelnen Nutzer einstellen muss.
- Datenschutz Das System wird von über einer Milliarde Nutzer trainiert und jede Eingabe fließt mit in die Verbesserung ein. Dabei muss natürlich sichergestellt werden, dass keine privaten Informationen mit in die Datenbank wandern. Für die Entwickler war es eine Herausforderung, mit einer Datenbank aus Milliarden von Einträgen zu arbeiten, ohne selbst Zugriff darauf zu haben.
Um das zu erreichen, hat das Team eine Reihe von etablierten Technologien ausprobiert, die zwar allesamt eine gute Qualität geliefert haben, aber nicht innerhalb von maximal 100 Millisekunden eine Antwort liefern konnten. Also hatte man eine Kombination aus Bag of Words und RNN ausgewählt. Diese macht nach jeder Eingabe einen neuen Vorschlag, so wie das in obigem Diagramm zu sehen ist.
Da das ganze auf einer CPU noch immer zu langsam gewesen ist, hat man das gesamte System auf einer TPU installiert und kommt dort nun auf Antwortzeiten von durchschnittlich 10 Millisekunden. In den nächsten Schritten spielte dann der Datenschutz eine große Rolle, denn das System wird natürlich ständig von über einer Milliarde Nutzer trainiert und somit immer besser. Gleichzeitig dürfen aber keine privaten Daten in diese Vorhersagen gelangen. Das wurde durch eine Trennung von semantisch wichtigen Informationen vom Rest erreicht.
Viele weitere Details, Erklärungen und Links zu den einzelnen Technologien findet ihr im Google-Blog.
» Weitere Details im Google AI-Blog
Siehe auch
» Smart Compose: GMail kann mit Künstlicher Intelligenz jetzt auch E-Mails automatisch vervollständigen