Felix Klein über Riemann’sche Flächen in Katalogen

23. Januar 2008 um 11:43 6 Kommentare

In einem Posting von letztem Jahr auf ol-tech wies Paul Rubin auf dieses Digitalisat (vollständiger Datensatz bei Archive.org) hin, mit dem die OCR ihre Schwierigkeiten haben dürfte: Abgesehen vom Titelblatt und Inhaltsverzeichnis ist das Vorlesungsskript „Riemann’sche Flächen 1“ (gehalten im Wintersemester 1891/92 in Göttingen) von Felix Klein handschriftlich verfasst! Der entsprechende Katalogeintrag im GBV ist dieser. Das Digitalisat stammt vom „zweiten Abdruck“ (1894), die erste Ausgabe (dieser Datensatz) ist von 1892. Einen unveränderte Nachdruck gab es 1906 (dieser Datensatz). 1986 erschien im Teubner-Verlag eine kommentierte Neuauflage (ISBN 3-211-95829-0), die im GBV-Katalog als Duplikat (hier und hier) verzeichnet ist. Wie aus dem Digitalisat bei Open Library und Internet Archive nicht ganz hervorgeht, gibt es auch den Zweiten Teil mit „Riemann’sche Flächen 2“ (siehe Datensatz) gehalten während des Sommer-Semesters 1892.

Abgesehen vom Inhalt finde das Beispiel schön, da es zwei Probleme und Herausforderungen illustriert. Duplikate und die Schwierigkeit sie automatisch zu erkennen (ein Algorithmus würde wahrscheinlich Teil 1 und Teil 2 zusammenschmeißen) sowie die fehlende semantische Verknüpfungen zwischen Datensätzen. Warum wird bei der Erstausgabe von Teil 1 nicht ein Verweis auf die folgenden Ausgaben, auf das Digitalisat und auf Teil 2 angezeigt? Je mehr ich mich mit dem Thema beschäftige, desto mehr komme ich zur Überzeugung, dass zu solch einer semantischen Tiefenerschließung alle Bibliothekare der Welt nicht ausreichen werden. Ein offener Ansatz wie beim Open Library Projekt, wo Katalogisate wie in Wikipedia von jedem gändert werden können, ist wahrscheinlich die einzige Möglichkeit, mit den Massen an Datensätzen und Verknüpfungsmöglichkeiten fertig zu werden.

P.S: Noch zwei amüsante Fundstücke: es gibt doch einen „Volltext“ und wie sich am Umschlag ablesen lässt wurde das zugrunde liegende Exemplar der Universität Berkeley zuletzt 1987 ausgeliehen worden, bevor es digitalisiert wurde.

Open Library Project: Wikipedia der Kataloge

23. Juli 2007 um 14:35 3 Kommentare

Ein freies Projekt zur Katalogisierung aller jemals erschienenen Publikationen war ja abzusehen, aber dass es so schnell geht, hat mich doch überrascht. Das letzten Montag bekanntgegebene Open Library Project ist eine vom Internet Archive unterstütze Initiative, nach dem Wikipedia-Prinzip einen frei editierbaren Katalog zu schaffen. Die Software ist Open Source, kann also auch lokal installiert werden. Als Suchmaschine wird anscheinen Lucene-Solr verwendet. Einen Überblick gibt es eine Guided Tour und die System-Dokumentation.

Wenn man sich die Beteiligten und weitere Personen auf den Mailinglisten zum Projekt (Ol-lib, Ol-discuss, Ol-tech) ansieht, so sieht das Projekt sehr vielversprechend aus. Geleitet wird das Projekt von Aaron Swartz, und Tim Spaling (LibraryThing) ist dem Projekt auch wohlgesonnen.

Verwandte Projekte zur gemeinsamen Katalogisierung sind LibraryThing sowie Social Bookmarking-Dienste wie CiteULike, Connotea und BibSonomy und von Content-Seite Project Gutenberg sowie das weniger freie Google Books. Als größten Partner oder Konkurrenten – je nachdem aus welcher Richtung betrachtet – sehe ich allerdings WorldCat. Die aus der Wikipedia-Community hervorgebrachten Ansätze finde ich nicht so relevant, wenngleich Wikipedia natürlich eingebunden werden sollte.

Wie schon LibraryThing ist das Open Library Project bislang ausschließlich Englisch und nicht für Mehrsprachigkeit konzipiert (auch bei LibraryThing ist nur Oberfläche mehrsprachig, während die Tagging-Daten und Texte einsprachig sind). Wenn sich das Open Library Project ein Beispiel an Wikipedia nehmen will, sollten sprachabhängige Bestandteile besser in eigene Komponenten ausgelagert werden.

Und was bedeutet das ganze für die Bibliotheken?: In spätestens 5 Jahren werden alle wesentlichen Katalogdaten frei sein, zu einem wesentlichen Teil nicht mehr ausschließlich von Bibliothekaren erstellt werden und verschiedene Anbieter werden Suchfunktionen über diese Daten bereitstellen. Auf diesen Wandel sollte sich das Bibliothekswesen einstellen.