Felix Klein über Riemann’sche Flächen in Katalogen

23. Januar 2008 um 11:43 6 Kommentare

In einem Posting von letztem Jahr auf ol-tech wies Paul Rubin auf dieses Digitalisat (vollständiger Datensatz bei Archive.org) hin, mit dem die OCR ihre Schwierigkeiten haben dürfte: Abgesehen vom Titelblatt und Inhaltsverzeichnis ist das Vorlesungsskript „Riemann’sche Flächen 1“ (gehalten im Wintersemester 1891/92 in Göttingen) von Felix Klein handschriftlich verfasst! Der entsprechende Katalogeintrag im GBV ist dieser. Das Digitalisat stammt vom „zweiten Abdruck“ (1894), die erste Ausgabe (dieser Datensatz) ist von 1892. Einen unveränderte Nachdruck gab es 1906 (dieser Datensatz). 1986 erschien im Teubner-Verlag eine kommentierte Neuauflage (ISBN 3-211-95829-0), die im GBV-Katalog als Duplikat (hier und hier) verzeichnet ist. Wie aus dem Digitalisat bei Open Library und Internet Archive nicht ganz hervorgeht, gibt es auch den Zweiten Teil mit „Riemann’sche Flächen 2“ (siehe Datensatz) gehalten während des Sommer-Semesters 1892.

Abgesehen vom Inhalt finde das Beispiel schön, da es zwei Probleme und Herausforderungen illustriert. Duplikate und die Schwierigkeit sie automatisch zu erkennen (ein Algorithmus würde wahrscheinlich Teil 1 und Teil 2 zusammenschmeißen) sowie die fehlende semantische Verknüpfungen zwischen Datensätzen. Warum wird bei der Erstausgabe von Teil 1 nicht ein Verweis auf die folgenden Ausgaben, auf das Digitalisat und auf Teil 2 angezeigt? Je mehr ich mich mit dem Thema beschäftige, desto mehr komme ich zur Überzeugung, dass zu solch einer semantischen Tiefenerschließung alle Bibliothekare der Welt nicht ausreichen werden. Ein offener Ansatz wie beim Open Library Projekt, wo Katalogisate wie in Wikipedia von jedem gändert werden können, ist wahrscheinlich die einzige Möglichkeit, mit den Massen an Datensätzen und Verknüpfungsmöglichkeiten fertig zu werden.

P.S: Noch zwei amüsante Fundstücke: es gibt doch einen „Volltext“ und wie sich am Umschlag ablesen lässt wurde das zugrunde liegende Exemplar der Universität Berkeley zuletzt 1987 ausgeliehen worden, bevor es digitalisiert wurde.

6 Comments »

RSS feed for comments on this post. TrackBack URI

  1. Ist das, was Sie mit „semantischer Verknüpfung“ meinen, nicht auch etwas, das FRBR leisten würde?

    Comment by jge — 24. Januar 2008 #

  2. Schon richtig, allerdings „leistet“ FRBR nichts sondern bietet ein eine Vorlage, welche Arten von semantische Verknüpfungen man anbringen könnte. Wie ich hier geschrieben habe bringt die ganze FRBR-Theorie jedoch wenig solange nicht mal tatsächliche Daten an Land kommen, die mittels FRBR strukturiert sind.

    Comment by jakob — 24. Januar 2008 #

  3. Hhm, habe mich mit FRBR bisher nur in der Theorie beschäftigt, weil ich keinen Einfluss darauf haben kann, wie bei uns die Daten strukturiert sind, so dass es mir sinnlos zu sein scheint, wie man die Daten besser strukturierte. Danke für den Hinweis auf das Posting. Vielleicht könnten Sie für einen Nicht-IT-Menschen mal überlegen helfen, ob man vorhandene Daten anders nutzen müsste oder ob man andere Daten anlegen müsste. So scheint mir z.B. die FRBR-„Work“-Entität über Einheitssachtitel im Prinzip erfassbar und die geordnete Anzeige von Manifestations und Expressions über die entsprechenden Sortierregeln der Anzeige anhand der definierten Eigenschaften (Sprache, Seitenzahl usw.) auch.

    Comment by jge — 24. Januar 2008 #

  4. Letztendlich müssen neue Daten angelegt werden, alles andere bleibt Gewurschtel. Grundlage aller semantischer Verknüpfungen bilden Identifikatoren, deshalb müssen mehr Identifikatoren definiert und in Datensätze integriert werden. Der Einheitssachtitel könnte eine Grundlage dafür sein, ist aber prinzipiell ungeeignet und wird in der Praxis nicht richtig unterstützt: Wie kann ich beispielsweise so darüber suchen, so dass ich mit Sicherheit genau Null oder genau einen Treffer bekomme? Wo ist die Syntax spezifiziert, kann ich den Titel irgendwie validieren (minimale/maximale Länge, erlaubte Zeichen etc.)? Gibt es eine Normalisierungsvorschrift? Wie wird sichergestellt, dass zwei verschiedene Werke gleichen Titels nicht zusammenfallen? …

    Comment by jakob — 24. Januar 2008 #

  5. Der Wikipedia-Link auf Identifikatoren führt ins Lehre…
    EST: Werke haben immer einen (oder mehrere) Autoren. Also warum soll die Kombination aus Autor + EST nicht eindeutig sein? (Der Autor ist eine Eigenschaft eines Werks :-))

    Comment by jge — 29. Januar 2008 #

  6. Danke, das sollte zum Identifikator gehen. Wenn du weitere Eigenschaften des Werkes zum Einheitssachtitel (EST?) dazupackst – zum Beispiel den Autor, nimmt die Wahrscheinlich von mehrdeutigen Einheitssachtiteln (gleicher Titel, gleiche Autoren, unterschiedliches Werk) ab. Gleichzeitig geht die (jetzt schon fragwürdige) Einheitlichkeit verloren: Welcher Name des Autors? Welche Ansetzung? Welche Reihenfolge der Autoren bzw. welches ist der Hauptautor? Was bei unbekanntem Autor/Titel? Man müsste mal genauer untersuchen, was der Autor auf der einen Seite bringt und auf der anderen Seite Probleme schafft. In jedem Fall heisst das genauere, überprüfbare Vorschriften – gibt es sowas? Bisher glaube ich noch das „Einheitssachtitel“ ein Märchen ist und doch jeder seine eigene Einheit will anstatt sich auf einen verifizierbaren Standard zu einigen.

    Comment by jakob — 29. Januar 2008 #

Sorry, the comment form is closed at this time.