Seit über einem Jahr warnt Google seine User jetzt vor dem Besucher „gefährlicher“ Webseiten und konnte zumindest deren Suchmaschinentraffic dadurch stark eindämmen. Anfangs hatte Google die dazu benötigten Daten noch von Dritten eingekauft, mittlerweile durchsucht Google das Internet auch selbst nach solchen Webseiten. Und das mit einer gewaltigen Rechner-Power und einem sehr aufwendigen Verfahren…
Um eine Seite die Malware oder ähnliche Schadsoftware verbreitet zu finden, setzt Google natürlich wieder Algorithmen ein – allerdings sind diese in diesem Fall mit gewaltigem Aufwand verbunden:
» Google-Rechner bootet frisches Windows-Image
» 1 einzige URL (!) wird aufgerufen
» PC wird 2 Minuten lang überwacht (Installationen, Registry, Autostart,…)
» Passiert nichts ist die Seite clean, passiert etwas gibt es Malware Warning
» Danach wird das Image runtergefahren, gelöscht, und ein neues Image gebootet
Google startet also Quasi für jede einzelne URL (Was beim GWB allein schon über 42.000 Seiten ausmacht [ohne Suchseiten]) ein neues Betriebssystem. Das mag sehr aufwendig klingen, ist aber die einzige Möglichkeit wirklich 100%ig sicher zu gehen ob eine Seite sicher ist oder nicht.
Smoking Gun hat dafür ein interessantes Rechenbeispiel durchgeführt:
Pro Tag überprüft Google auf diesem Weg ca. 1 Million URLs. Pro URL müssen 2 Minuten Zeit eingerechnet werden (Ohne Bootvorgang), das macht ein Ergebnis von 722 URLs pro PC und Tag. Google bräuchte also nicht weniger als 1389 PCs die den ganzen Tag nur Rauf- und Runter-Booten und eine URL aufrufen. Ist schon beachtlich 😉
Laut Google enthalten übrigens 1% aller Suchergebnisse Links zu Schadsoftware, laut der neuesten hier angeführten Statistik sind es sogar traurige 2,5%…
[Smoking Gun, thx to: Tom]