Google ist bekannt dafür, in vielen Bereichen sehr transparent zu sein und gibt viele Einblicke in die eigenen Entwicklungen und macht dabei auch vor den Rechenzentren nicht halt. Doch trotz aller Transparenz hält man sich normalerweise mit absoluten Zahlen zurück und gibt nur selten Einblicke in die tatsächliche Größe des Unternehmens bzw. auch den gespeicherten Daten. Auf der @Scale-Konferenz hat eine Google-Entwicklerin jetzt sehr interessante Einblicke in die gesamte Software des Unternehmens gegeben und hat dabei unter anderem durchblicken lassen, dass gesamt „Google“ aus 2 Milliarden Codezeilen besteht.
Über den Datenbestand von Google bzw. die Speicherkapazität des Unternehmens gibt es sehr viele Gerüchte, die aber stets nur aus ungefähren Hochrechnungen bestehen und niemals von Google kommentiert werden. Doch über die eigene Codebasis hat man nun geredet und hat einen sehr genauen Einblick in die Größe gegeben. Allerdings ist immer nur von „Google“ die Rede, wobei nie wirklich klar wird ob es sich dabei nur um die Suchmaschine oder auch um alle anderen Angebote handelt.
Insgesamt besteht „Google“ aus über 1 Milliarde Dateien, wobei diese aber nur aus 9 Millionen Source-Dateien bestehen. Insgesamt haben die Googler im Laufe der letzten Jahre 2 Milliarden Zeilen Code geschrieben, wobei es über 35 Millionen Änderungen gegeben hat. Die gesamte Google-Software belegt auf den Servern einen Platz von 86 Terabyte. Und die Googler sind jeden Tag fleißig – denn pro Tag gibt es etwa 45.000 Änderungen an der gesamten Codebasis.
Interessant ist natürlich auch, wie diese gewaltige Codebasis verwaltet wird, und wie sicher gestellt wird dass dabei kein Schindluder getrieben wird: Die meisten Entwickler können tatsächlich auf die gesamte COdebasis zugreifen und diese auch ändern – allerdings ist diese Änderung nur temporär auf ihren Systemen. Erst nach Fertigstellung werden die Änderungen synchronisiert und müssen dann freigegeben werden. Dazu werden diese sowohl von Menschen als auch von Algorithmen geprüft und anschließend weiter geleitet. Jedes Verzeichnis mit Dateien hat dabei eine Reihe von Besitzern, die dieses verwalten und die Änderungen dann endgültig freigeben dürfen.
Die Änderungen werden sowohl vor als auch nach der Freigabe automatisiert und händisch geprüft, um sicher zu stellen dass kein Fehler passiert ist. Durch dieses System ist außerdem auch sicher gestellt, dass kein Nutzer allein eine Änderung vornehmen kann und die Stabilität und Zuverlässigkeit weiterhin gewährleistet ist. Stellt das System einen Fehler fest, werden die Änderungen automatisch wieder zurück genommen und die alte Version wird wieder eingespielt.
Folgendes Video zeigt die gesamte Präsentation und gibt noch weitere interessante Einblicke in die Strukturen von Google und nennt einige weitere Zahlen – wer sich für solche riesigen System interessiert, sollte sich die halbe Stunde Zeit nehmen 😉
[Engadget]