Google führt die humans.txt ein
Jedem Webmaster dürfte wohl die robots.txt bekannt sein. Mit dieser kann man verhindern, dass bestimmte Seiten oder Verzeichnisse des Servers in den Index der Suche aufgenommen werden. Eigentlich alle großen Suchmaschinen halten sich daran. Vor einigen Wochen gab es eine Idee eine humans.txt einzuführen.
Bei Google wurde diese nun umgesetzt. Derzeit hat diese folgenden Inhalt:
Google is built by a large team of engineers, designers, researchers, robots, and others in many different sites across the globe. It is updated continuously, and built with more tools and technologies than we can shake a stick at. If you’d like to help us out, see google.com/jobs.
Auf Deutsch in etwa: Google wird von einem großem Team an Entwicklern, Designern, Forschern, Robotern und anderen in vielen verschiedenen Orten überall auf dem Globus erschaffen. Es wird ständig aktualisiert und mit mehr Tools und Technologien erstellt als wir selbst verwalten können. Wenn du uns helfen willst, schau dir mal google.com/jobs an.
Mit der Humans.txt sollen sich quasi die Betreiber der Webseite vorstellen. Weitere Details zur humans.txt im Allgemeinen gibt es hier. Googles Humans.txt gibt es dort. Wann die Datei von Google genau angelegt wurde, ist unklar, aber sie sendet den HTTP-Header If-Modified-Since:Thu, 05 May 2011 00:48:09 GMT aus. Dies bedeutet, dass sie am 5. Mai zuletzt geändert wurde. Sie ist auf allen Google-Domains vorhanden.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter
Interessanter Artikel. Vor allem, da ich nur erfahren habe, dass es eine humans.txt gibt. Für was sie da ist und was sie macht, steht nicht im Artikel. Dafür muss man schon den externen Links folgen.
steht doch drin:
Ja schon.
Hätte aber ruhig etwas genauer sein können^^
Viel mehr ist das aber nicht.
Habt ihr auf googlewatchblog.de keine humans.txt?
nein.
Gibt ja auch das impressum.xhtml/impressum.html, sowie Mikroformate/FOAF. Sehe also keinen Grund dafür etwas Propritäres zu machen.
Die robots.txt war noch nie mehr für die (Nicht-)Indexierung verantwortlich als es das Nicht-Lesen einer Seite ist. Sowohl fürs Indexieren als auch für mannigfaltige Angaben zum Autor, Publisher usw. gibt es metatags.