Google stellt klar: Alle Nutzerdaten und Dokumente werden nur von Algorithmen ausgewertet
Vor wenigen Tagen gab es einen kleinen Bug in Google Docs, der normalerweise nicht weiter erwähnenswert wäre – wenn er nicht eine interessante Fehlermeldung verursacht hätte. Diese gab Grund zur Sorge, dass Google alle Dokumente scannt und auch die Inhalte erfasst – was von einer späteren kurzen Recherche auch teilweise bestätigt wurde. Da das ganze große Kreise zog, hat sich Google nun offiziell in einem Blogpost dazu geäußert – was auch nicht alle Tage vorkommt.
Am Dienstag waren plötzlich eine handvoll Nutzer von Google Docs ausgesperrt und konnte nicht auf ihre Dokumente zugreifen. Das ist ärgerlich, kann bei einer kostenlosen Cloud aber einmal vorkommen und muss eingeplant werden. Wer sich darauf verlässt oder Unternehmensdaten speichert, ist dann eben selbst schuld und könnte die Business-Variante verwenden. Aber darum ging es nicht, denn viel interessanter war die Fehlermeldung, die besagte dass der Inhalt des Dokument die Nutzungsbedingungen verletzt.
Diese Fehlermeldung hatte einige dazu bewogen, sich die Nutzungsbedindungen von Google noch einmal genauer durchzulesen, und diese führten eine interessante Aussage zu Tage. Dass Google viele Nutzerdaten erfasst und Profile aufbaut, um noch bessere und genauere Werbung auszuliefern, ist bekannt – irgendwie muss sich die gesamte Angebotpalette ja auch finanzieren. Doch folgende Aussage war dann doch etwas überraschend.
Erfasst werden Informationen wie Nutzungsdaten, Einstellungen, Gmail-Nachrichten, Google+ Profil, Fotos, Videos, Browserverlauf, Kartensuchen, Dokumente oder andere von Google gehostete Inhalte. Unsere automatisierten Systeme analysieren diese Informationen beim Senden, Empfangen und bei der Speicherung. Diese Erfassung kann alle Inhalte betreffen, die unsere Systeme durchlaufen.
Da das ganze hohe Welle geschlagen hat, und unter anderem auch bei uns im Blog thematisiert wurde, hat sich Google nun offiziell dazu geäußert. In dem Posting geht man vor allem auf die technische Seite des Problems ein, und erklärt dass man den Fehler schnell gefunden und behoben hat. Aber dafür würde man kein Posting im offiziellen Blog verfassen, denn natürlich ging man auch in einem Nebensatz darauf ein, was eigentlich genau gescannt wird, und dass dabei keine Menschen Zugriff auf die Daten bekommen.
Virus and malware scanning is an industry best practice that performs automated comparisons against known samples and indicators; the process does not involve human intervention.
Insbesondere der letzte Teil ist von Belang, denn genau auf diesen haben sich viele Medien gestürzt. Natürlich werden Dokumente nicht manuell von Menschen gesichtet, denn das wäre wohl auch ein nicht zu stemmender Aufwand. Viel wichtiger ist aber, dass wohl auch als potenziell gefährlich eingestufte Dokumente nicht einem Menschen vorgelegt werden – zumindest würde ich das aus der Äußerung so verstehen. Am Ende wird man wohl im Streitfall um einen Zugriff durch den Menschen nicht herum kommen, aber zumindest scheint es dafür keinen automatisierten Prozess zu geben.
Dennoch ist das Kind nun in den Brunnen gefallen, denn dass Google alle Aktivitäten auswertet die den Server durchlaufen, dürfte vielen Nutzern wohl nicht bewusst gewesen sein. Dass sich kein Mensch das durchliest ist klar, aber dennoch macht es das nicht besser, wenn das eigene Profil durch verfasste Dokumente geschärft wird. Bei E-Mails macht das Sinn, da daraus viele persönliche Informationen herausgelesen werden können, die in anderen Diensten verwendet werden – aber das ist bei Docs nicht der Fall.
Ich hatte es im anderen Artikel schon einmal gesagt: Google sollte die erfassten Daten einfach viel tiefer präzisieren und klar stellen, was genau mit diesen Daten passiert und wofür sie ausgewertet werden. Einfach nur zu sagen dass alle Daten „vielleicht“ ausgewertet werden und verwendet werden „könnten“ reicht nicht mehr aus. Vor allem in Zeiten von Künstlichen Intelligenzen muss man sich fragen, ob die Aussage „Kein Mensch sieht die Daten“ noch Schutz genug ist.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter
Das die Nutzungsbedingungen so schwammig formuliert sind, dürfte wohl daran liegen, das sie von Juristen (mit)geschrieben werden, die natürlich keine unnötige Angriffsfläche für Klagen bieten wollen.