Google steckt derzeit sehr viel Energie in die Weiterentwicklung des KI-ChatBot Bard und will diesem jetzt den Zugang zu riesigen Datenmengen ermöglichen. In einer jüngst veröffentlichten neuen Version der Nutzungsbedingungen und Datenschutzbestimmungen sichert man sich das Recht, ALLE öffentlichen Daten zur Auswertung für Bard heranzuziehen. Kritisch daran ist, dass es wohl keine Ausschlussmöglichkeit gibt.
KI-ChatBots wie ChatGPT oder auch Bard werden nicht nur aus speziell aufbereiteten Quellen trainiert, sondern auch mit den öffentlich zugänglichen Daten aus dem Web – das ist seit langer Zeit bekannt. Jetzt will sich Google wohl rein rechtlich in diese Richtung absichern und hat neue Nutzungsbedingungen veröffentlicht. In diesen ist der folgende Auszug zu finden, mit dem man sich selbst die Möglichkeit einräumt, alle Daten aus dem Web zum Training von Bard sowie den Cloud KI-Diensten zu verwenden:
Man spricht davon, dass man öffentlich zugängliche Daten aus anderen Google-Produkten oder auch aus dem Web dazu nutzen kann, um das KI-Modell weiterzuentwickeln bzw. zu trainieren. Erwähnt wird unter anderem der Google Übersetzer, die Cloud-KI oder als Datennutzer auch bard. Selbst Unternehmensinformationen auf Webseiten will man nutzen können, um sie in anderen Google-Diensten anzuzeigen.
Beispielsweise erheben wir Daten, die online oder in anderen öffentlichen Quellen verfügbar sind, um die KI-Modelle von Google zu trainieren sowie Produkte und Funktionen wie Google Übersetzer, Bard und Cloud AI weiterzuentwickeln. Wenn Ihre Unternehmensinformationen auf einer Website erscheinen, können wir sie indexieren und in Google-Diensten anzeigen.
Dass die KI-ChatBots mit Daten aus dem Web gefüttert werden, ist wie bereits erwähnt längst bekannt und lässt sich kaum verhindern. Bei heise gibt man zu bedenken, dass es dennoch einen großen Unterschied dazu gibt, wie Daten für die Websuche und Bard bearbeitet werden. Denn während man in der Websuche Inhalte per robots.txt oder anderen Technologien ausschließen kann, wird diese Möglichkeit bei Bard nicht erwähnt. Man erwähnt es nicht explizit, aber es wäre möglich, dass Bard auch Inhalte verwendet, die man eigentlich nicht indexieren wollte.
Ob diese neuen Bestimmungen jetzt die Voraussetzungen dafür schaffen, Bard endlich im EU-Raum zu starten oder genau das Gegenteil bewirken, lässt sich schwer einordnen. Fraglich ist auch, ob der Vollzugang nur für das Training gilt, oder die eigentlich nicht zu indexierenden Daten auch im Einsatz verwendet werden.
[heise]