Das Internet Archive will Google+ retten: Die Sicherung aller Beiträge & Kommentare hat bereits begonnen
In ziemlich genau zwei Wochen wird das Netzwerk Google+ zum Bedauern vieler Nutzer endgültig und leider unwiderruflich eingestellt. Im Anschluss wird Google alle Beiträge, Profile und viele weitere Daten löschen, die sich in den über sieben Jahren angesammelt haben. Das Internet Archive hat es sich nun kurz vor knapp zur Aufgabe gemacht, alle öffentlichen Beiträge zu retten und diese zu archivieren. Eine kleine Mammutaufgabe.
Das Internet Archive dürfte sehr vielen Nutzern bekannt sein, denn das Projekt archiviert seit vielen Jahren große Teile des Internets und bietet unter anderem die berühmte Wayback Machine an. Auch wenn es zwei völlig verschiedene Welten sind, gibt es da durchaus Überschneidungen mit Google, dessen Kernaufgabe es bekanntlich ebenfalls ist, alle Informationen der Welt zu digitalisieren und dauerhaft zu speichern. Doch bei Google+ sieht man das wohl nicht so eng.
In siebeneinhalb Jahren Google+ haben sich sehr viele Beiträge, Kommentare und interessante Diskussionen angesammelt, die durchaus auch relevant sein können und zu einer Art Internet-Kulturgut gehören. Das gilt genauso für die vielen Communities, die aber mittlerweile längst zerbrochen und verwaist sind und nicht mehr gerettet werden können – es ziehen eben nie alle Nutzer mit. Bei den noch zur Verfügung stehenden Beiträgen und Kommentaren sieht das anders aus.
Das Internet Archive hat bereits vor einigen Tagen damit begonnen, Google+ für die Nachwelt zu erhalten und alle öffentlichen Beiträge herunterzuladen. Auch wenn das Netzwerk seit langem als Geisterstadt verschrien war – was es niemals war (!) – ist das eine gigantische Datenmenge, die erst einmal bewältigt werden will. Vor allem in der Kürze der Zeit. Stand Heute hat das Projekt noch exakt 14 Tage Zeit, denn Google wird wohl keinen Aufschub gewähren, auch wenn es aktuell noch Unklarheiten über den Umfang der gelöschten Daten gibt.
Wie vielleicht zwischen meinen Zeilen bereits angeklungen ist: Das Archiv arbeitet nicht mit Google zusammen und ruft stattdessen alle Daten, Profile und Beiträge einzeln per Spider ab und speichert die aus den HTML-Seiten gewonnen Informationen im eigenen benötigten Format. Fotos und Videos sollen komprimiert gespeichert werden, Kommentare werden sich auf maximal 500 pro Beitrag beschränken. Dabei arbeitet man gegen die Zeit und kann kaum abschätzen, ob die Sicherung bis 2. April abgeschlossen werden kann.
Das Team, das sich mit dem Aufbau dieses Archivs beschäftigt, ist derzeit noch auf der Suche nach Unterstützung, um Google+ tatsächlich vollständig spiegeln können. Dabei können auch spezielle URLs eingereicht werden sowie gleichzeitig Inhalte und URLs entfernt werden – wobei letztes natürlich vorerst einer Prüfung unterzogen wird. In der Ankündigung bei Reddit gibt es dazu viele Details, auch bereits zur späteren Zugänglichkeit dieses Archivs.
Wer sich für das Projekt interessiert, kann auf dieser Seite den Live-Fortschritt sehen und beobachten, welche Daten aktuell gespeichert werden bzw. welchen Umfang sie bereits haben. Das könnte sicher noch sehr interessant sein und Post-Mortem einige Details und Statistiken zu Google+ verraten, die Google zeitlebens des Netzwerks immer zurückgehalten hat. Ob Google über diese Massen-Spiegelung offiziell informiert wurde, geht aus der Ankündigung leider nicht hervor.
Man muss sich aber schon fragen, warum das Archive und Google nicht zusammenarbeiten und sich die Arbeit sehr viel leichter machen. Ich kann mir nicht vorstellen, dass man nicht gefragt hätte. Aber womöglich möchte Google einfach tatsächlich vollständig mit Google+ abschließen, so wie ich früher schon einmal spekuliert hatte.
Wer selbst aktiv werden möchte, kann übrigens immer noch den Google+ Exporter verwenden und die eigenen Daten herunterladen.
Siehe auch
» Google+ Einstellung und die Folgen: Möglicherweise werden viele ältere Google Maps Fotos gelöscht
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter