Google hat sich seit Oktober 2004 mit
Google Print vorgenommen sämtliche in Buchform verfügbare Informationen zu digitalisieren. Der Amerikanische Buchhändler
Amazon bietet eine ähnliche Funktion zur
Volltextsuche in einigen Büchern an, das Projekt besitzt jedoch eine viel kleinere Dimenson. Doch inzwischen haben sich auch andere der Digitalisierung von Printmedien verschrieben und kämpfen mit harten Bandagen nun auch vor Gericht gegen Google um im Rennen zu bleiben.
Dem geduldigem Papier geht es zeitlich gesehen gleich von 2 Richtungen an den Kragen. Historische Schriften digitalisiert Google Print und die deutsche Wikimedia, während der Börsenverein des Deutschen Buchhandels und Amazon aktuelle Literatur auf einer offenen Plattform online durchsuchbar macht.
Die Projekte unterscheiden sich allerdings stark in Struktur, Ausrichtung, Dimension und vor allem Buget:
Die Google Buchsuche, das weltweit größte derartige Projekt mit einem geschätzten jährlichen Buget von 300 Millionen US-Dollar, besteht eigentlich aus 2 Projekten. Im
Google Library Program, werden Bücher in Bibliotheken eingescannt und im
Publisher Program erhalten Verlage die Möglichkeit ihre Litearatur durchsuchbar zu machen, um so ihre Verkaufsraten zu steigern. Leider sind die Partner im Library Program ausschließlich Bibliotheken im englischsprachigen Raum. Deutschsprachige Bücher kommen vor allem über das Google Publisher Program hinzu.
Die gesamte Datenbank beinhaltet geschätzt schon über eine Million Werke, und wächst täglich um weitere 5000 Stück. 75% davon werden gar nicht mehr gedruckt, so daß Google einen großen Teil der dem Internetsurfer verborgenen Informationen zurück holt.
Alle Rechte bleiben bei den Verlagen, nur 20% des Inhaltes wird öffentlich einsehbar. Doch da im Google Library Program die Verlage nicht vorab gefragt werden, ob die Werke über die Datenbank öffentlich einsehbar sein sollen (die
Opt-Out Methode), hat sich das Unternehmen so schon eine Klage vom
Börsenverein des Deutschen Buchhandels und den Universitätsbibliotheken eingehandelt, die Ende Juni verhandelt wird. In den USA laufen ähnliche Klagen mit dem Argument, dass z.B. im Musikbereich ebenfalls klar gelte, dass Rechte vorher eingeholt und bezahlt werden müssten.
Amazons "Search Inside the Book" hingegen fordert von teilnehmenden Verlagen ab die Rechte an der Literatur abzutreten (die
Opt-In Methode).
Deutsche Bücher sollen mit "Volltext Online" vom
Börsenverein des Deutschen Buchhandels digital verfügbar machen. Doch im Unteschied zu den anderen Projekten sollen die Daten dezentral auf den Servern der Verlage gespeichert bleiben, um so die Kontrolle bei den jeweiligen Urherbern zu belassen.
Wikimedia Deutschland, der Betreiberververein der
deutschen Wikipedia hat sich mit dem
Wikisource Projekt vorgenommen sämtliche frei verfügbare Literatur im Volltext und Anmerkungen zu sammeln und verfügbar zu machen. Zuerst wandern die Seiten eingescannter Literatur in die
Wikimedia Commons Datenbank und fließen dann durch Mitarbeit der Community in die Wikisource ein. So werden manuell auch Handschriften digitalisiert, die mit maschninellen Verfahren nie indexierbar wären.
»
Wikipedia Artikel: Google Print
[
heise.de - Digitalisierungsprojekte,
heise.de - Volltextsuche Online,
ZDNet,
Die-Google-Gesellschaft,
buchmarkt-online,
heise.de - Opt-In Opt-Out,
heise.de - Google Print Europa]