Seit gut 3 Monaten kann man innerhalb des Google News Archive direkt in Zeitungen suchen und sich Original-Scans historischer Ausgaben ansehen. Gestartet ist das ganze mit nur einer handvoll Zeitungen und Ausgaben, aber jetzt wurde das Archiv erstmals deutlich vergrößert: Google hat sich das Archiv von PaperOfRecord gesichert und bietet deren Scans innerhalb der eigenen Engine an.
Insgesamt hat sich Google ein Archiv mit 20 Millionen Scans gesichert, das nicht nur Zeitungen und Magazine enthält, sondern auch einige historische Dokumente - diese werden allerdings vorerst nicht im News Archive aufgenommen. Interessanterweise hat Google bis heute noch keinen Vertrag mit Verlagen um die Original-Daten aus deren Archiven zu bekommen - das scannen ist wohl billiger als sich die zukünftigen Einnahmen mit den Verlagen zu teilen.
» Google News Archive
[SearchEngineWatch, thx to: Max Power]
Schlagwort: google-news-archive-search
Vor ziemlich genau 2 Jahren hat Google sein News Archive gestartet, mit dem sich auch Zeitungsartikel aus der fernen Vergangenheit durchsuchen lassen - teilweise geht das bis zu 200 Jahren zurück. Seitdem ist es sehr ruhig um dieses Archiv geworden, aber jetzt kann es mit einer Funktion aufwarten die richtiges Stöber-Feeling aufkommen lässt: Teilweise sind jetzt Original-Scans der Zeitschriften verfügbar.
Bisher war Googles News Archive im Grunde nur ein Archiv mit Links zu den Original-Artikeln auf der Webseite der jeweiligen Zeitung. Mit dem heutigen Update, wird daraus allerdings ein echtes Archiv: Google hat die originalen Ausgaben von den Verlagen besorgt, diese eingescannt und stellt diese jetzt zur Verfügung - natürlich mit Volltextsuche und vollem Zugriff auf alle Inhalte der kompletten Zeitschrift. Realisiert wird das ganze mit der Engine von Google Book Search bzw. dem PDF-Viewer von Google. Im Grunde ist das ganze eine Verknüpfung von News Archive und Book Search, statt Büchern werden jetzt eben Zeitungen eingescannt. Das macht die ganze Scan-Thematik natürlich noch sehr viel interessanter und gibt jetzt wirklich Zugriff auf Ausgaben an die man als normaler Mensch wohl nicht mehr herangekommen wäre. So lässt sich z.B. die Original-Schlagzeile der Mondlandung inklusive der kompletten Ausgabe der Pittsburgh Post Gazette abrufen und auch eine Original-Anzeige die für den Ford T wirbt befindet sich mittlerweile im Index. Ist wirklich interessant durch die alten Zeitungen quasi zu surfen wie in einem Archiv in der Bibliothek. Leider gibt es noch kein wirkliches Archiv, die Ausgaben sind nur über die Suchfunktion zu erreichen - aber das wird sich hoffentlich demnächst noch ändern. Interessanterweise befindet sich in der Sidebar auch ein Bereich mit dem Titel "Related Articles". Hier scheint man wohl ähnliche Artikel zu der selben Thematik darstellen zu wollen - das surfen durch die Zeitungen wird damit noch interessanter und die Recherche einfacher. Bei meinen Tests gab es allerdings nie einen Eintrag in diesem Bereich - kann die Relevanz daher nicht beurteilen. » Beispielausgabe: The Evening Independent - Apr 6, 1912 » Ankündigung im Google-Blog
Bisher war Googles News Archive im Grunde nur ein Archiv mit Links zu den Original-Artikeln auf der Webseite der jeweiligen Zeitung. Mit dem heutigen Update, wird daraus allerdings ein echtes Archiv: Google hat die originalen Ausgaben von den Verlagen besorgt, diese eingescannt und stellt diese jetzt zur Verfügung - natürlich mit Volltextsuche und vollem Zugriff auf alle Inhalte der kompletten Zeitschrift. Realisiert wird das ganze mit der Engine von Google Book Search bzw. dem PDF-Viewer von Google. Im Grunde ist das ganze eine Verknüpfung von News Archive und Book Search, statt Büchern werden jetzt eben Zeitungen eingescannt. Das macht die ganze Scan-Thematik natürlich noch sehr viel interessanter und gibt jetzt wirklich Zugriff auf Ausgaben an die man als normaler Mensch wohl nicht mehr herangekommen wäre. So lässt sich z.B. die Original-Schlagzeile der Mondlandung inklusive der kompletten Ausgabe der Pittsburgh Post Gazette abrufen und auch eine Original-Anzeige die für den Ford T wirbt befindet sich mittlerweile im Index. Ist wirklich interessant durch die alten Zeitungen quasi zu surfen wie in einem Archiv in der Bibliothek. Leider gibt es noch kein wirkliches Archiv, die Ausgaben sind nur über die Suchfunktion zu erreichen - aber das wird sich hoffentlich demnächst noch ändern. Interessanterweise befindet sich in der Sidebar auch ein Bereich mit dem Titel "Related Articles". Hier scheint man wohl ähnliche Artikel zu der selben Thematik darstellen zu wollen - das surfen durch die Zeitungen wird damit noch interessanter und die Recherche einfacher. Bei meinen Tests gab es allerdings nie einen Eintrag in diesem Bereich - kann die Relevanz daher nicht beurteilen. » Beispielausgabe: The Evening Independent - Apr 6, 1912 » Ankündigung im Google-Blog
+
Googles amerikanische Websuche hat mal wieder eine neue OneBox bekommen: Wenn man nach Begriffen sucht die oft in den Medien genannt werden und zusätzlich noch eine Jahreszahl anhängt, werden Ergebnisse aus dem News Archive angezeigt. Bei der Suche kann auch ein kompletter Zeitraum angegeben werden, der dann nach Meldungen durchsucht wird.
Mit obigem Symbol wird die OneBox unterhalb der Suchergebnisse angezeigt, daneben dann 2-3 News aus dem abgefragten Zeitraum. Neben der einfachen Abfrage Google 2006 funktioniert z.B. auch Google 2004-2006, merkwürdigerweise wird die OneBox nicht immer angezeigt. Nach ein paar Aktualisierungen war die OneBox plötzlich weg, und kurz danach kam sie wieder... Ich denke es wird langsam Zeit das Google sein OneBox-System ein wenig überdenkt, denn mittlerweile wird die Sache wirklich unübersichtlich. Erstens werden sie nicht bei allen Abfragen angezeigt, und zweitens mal überhalb und mal unterhalb der Suchergebnisse. Wonach wird entschieden was den Nutzer wirklich interessiert? Welche Boxen er sehen will, und er welche er gerne ganz oben hätte? Ein eigener Einstellungsbereich in der Websuche ist langsam überfällig... » Beispiel: yahoo 1997-2004 [Google OS]
Googles amerikanische Websuche hat mal wieder eine neue OneBox bekommen: Wenn man nach Begriffen sucht die oft in den Medien genannt werden und zusätzlich noch eine Jahreszahl anhängt, werden Ergebnisse aus dem News Archive angezeigt. Bei der Suche kann auch ein kompletter Zeitraum angegeben werden, der dann nach Meldungen durchsucht wird.
Mit obigem Symbol wird die OneBox unterhalb der Suchergebnisse angezeigt, daneben dann 2-3 News aus dem abgefragten Zeitraum. Neben der einfachen Abfrage Google 2006 funktioniert z.B. auch Google 2004-2006, merkwürdigerweise wird die OneBox nicht immer angezeigt. Nach ein paar Aktualisierungen war die OneBox plötzlich weg, und kurz danach kam sie wieder... Ich denke es wird langsam Zeit das Google sein OneBox-System ein wenig überdenkt, denn mittlerweile wird die Sache wirklich unübersichtlich. Erstens werden sie nicht bei allen Abfragen angezeigt, und zweitens mal überhalb und mal unterhalb der Suchergebnisse. Wonach wird entschieden was den Nutzer wirklich interessiert? Welche Boxen er sehen will, und er welche er gerne ganz oben hätte? Ein eigener Einstellungsbereich in der Websuche ist langsam überfällig... » Beispiel: yahoo 1997-2004 [Google OS]
Nagut, da hätte ich ja auch selbst drauf kommen soll. Als die neue google-archive-Domain aufgetaucht ist habe ich von einem Webseiten-Archiv geträumt. Dabei gab es genau 1 Monat vorher die Meldung, dass Google News von AP lizenziert hat. Zählt man nun 1+1 zusammen kommt ein neues Angebot heraus. Google News Archive Search. Zugegeben, die Startseite des neue Angebots sieht mehr als langweilig aus, und auch die Suchergebnisse bieten wenig spektakuläres und wirken so als wenn die Seiten selbst aus einem alten Google-Archiv stammen würden. Doch was sich dahinter verbirgt ist fast schon sensationell. Alle Zeitungsartikel von den Druckwerken kooperierender Verlage können hier durchsucht und online gelesen werden. Wie weit die Artikel zurück gehen ist dabei garnicht genau abzuschätzen, aber es geht sehr viel weiter als man es anfangs denken würde. So habe ich gestern bei Testsuchen Artikel von 1754 (!!!) geliefert bekommen und konnte sie online lesen - ohne Probleme. DAS ist schon mehr als beeindruckend. Das ganze Portal ist mal wieder in englisch gehalten - dafür ohne Beta - aber es werden auch deutsche Archive durchsucht, zumindest von den Verlagen die vor dem Start mit Google kooperiert haben. Einige Artikel sind kostenpflichtig, vor allem bei amerikanischen Magazinen, aber da Google meistens noch viele andere Quellen angibt kann man dies leicht verschmerzen. Ich denke mir dass viele Verlage jetzt ebenfalls in diesen Index möchten. Schließlich können sie mit den alten Artikeln sowieso nichts verdienen und hätten so wenigstens sehr viel mehr Besucher, falls sie über ein frühes exklusives Ereignis berichten. Und im 18. Jahrhundert gab es bekanntlich nicht soviele Tageszeitungen und Magazine wie heute. Dieses Archiv ist wirklich beeindruckend, denn bisher haben die Google News nur wenige Tage oder Wochen in der Vergangenheit suchen können und wer ältere Meldungen lesen wollte musste schon direkt die Seiten der Zeitungen abklappern. Google, da hast du wieder sehr sehr gute Arbeit geleistet ;-) » Google News Archive Search
Neue Dienste