Die Zukunft des Katalogisierens

14. Juli 2008 um 12:45 Keine Kommentare

Meine momentane Begeisterung für OpenStreetMap sollte nicht darüber hinwegtäuschen, dass nach Wikipedia gerade für Bibliotheken der interessanteste und wichtigste Dienst noch immer LibraryThing ist (siehe kurze Einführung für Bibliothekare und zum Ausprobieren bei Lernen 2.0). Ohne je Bibliothekswissenschaft studiert zu haben, entwickelt Tim Spalding innovative Systeme für bibliographische Informationen, bei denen die Bibliothekssysteme jeglicher Hersteller wie von vorvorgestern aussehen (und mit ihnen die Bibliotheken, die sich diese Systeme andrehen lassen, anstatt Dienste wie LibraryThing for Libraries oder VuFind auszuprobieren und genau auf Anne zu hören).

Dabei zeigt LibraryThing nicht nur, wie ein guter Katalog aussehen kann und wie durch Einbindung von Nutzern Mehrwehrt geschaffen wird, sondern nicht weniger als die Zukunft des Katalogisierens! Ich kann jedem, der sich für die Zukunft von Bibliotheken interessiert, nur eindringlich empfehlen, sich den 18-minütigen Mitschnitt des Vortrags von Tim Spalding anzusehen (Teil 1, Teil 2)!

Das nächstes wesentliche Projekt von LibraryThing ist die Open Shelves Classification, die nicht weniger zum Ziel hat als die DDC als Aufstellungssystematik zu ersetzen – das erinnernt mich daran, dass aus Wikipedia-Daten ein Thesaurus erstellt werden kann. Also besser aufpassen (und am Besten mitmachen) anstatt die Augen zu verschließen! [via Patrick]

Erschließung von Videos mit Yovisto

20. Mai 2008 um 13:01 1 Kommentar

Letzten Samstag wurde auf dem Bibcamp 2008 unter Anderem die Videosuchmaschine Yovisto vorgestellt, die an der Uni Jena entstanden ist (siehe Überblick bei infobib und Yovisto-Blog). In Yovisto werden Videos nicht nur mit einfachen Metadaten über den Film erschlossen, sondern mit Tags und Kommentaren innerhalb eines Films. Dazu werden zum einen mittels Texterkennung automatisch Texte im Film erkannt und indexiert – vor allem aus Slideshows bei Vorträgen lassen sich so viele Inhalte ermitteln. Bei der Suche wird angezeigt, welche Wörter an welcher Stellen in einem Film vorkommen und es kann an die entsprechenen Zeitmarke gesprungen werden. Zusätzlich zur automatischen Erschließung können Nutzer zeitbezogen Tags und Kommentare abgeben. Die Benutzeroberfläche ist ziemlich angenehm und leistungsfähig und Yovisto enthält viele weitere experimentelle Funktionen, wie Wiki-Seiten zu einzelnen Filmen, OpenSearch-Schnittstelle, Podcast etc.

Die Erschließung von Videos mit Yovisto eignet sich besonders für Vorlesungsmitschnitte. Diese werden zwar immer mehr gesammelt aber nur wenig durchgehend erschlossen. Was grundsätzlich verbessert werden kann ist die Anbindung an die Bibliothek und den Katalog bzw. an die ganze Uni-Infrastruktur. So sind zwar Beispielsweise in der Digitalen Bibliothek Thüringen Aufzeichnungen von Vorlesungen katalogisiert, aber nicht direkt mit Yovisto verknüpft. Dabei sollte der Trend an Hochschulen eher dahin gehen, die sich auseinander entwickelten Systeme Bibliothek und E-Learning-Plattformen wieder zusammen zu bringen – dazu müssen allerdings alle Beteiligten über ihren Tellerrand hinaus schauen und einige ihrer alten Zöpfe und abschneiden und inkompatible Sonderwege aufgeben. Das Datenformat von Yovisto ist MPEG-7 – anstatt alles von Hand mehrfach zu katalogisieren, können damit sicherlich Daten gemeinsam genutzt werden. Techniken aus Yovisto werden auch im Video-Erschließungssystem REPLAY verwendet, das in Zusammenarbeit mit der ETH-Zürich entsteht.

Aktuelle Projekte und Formate zu Strukturdaten

18. Februar 2008 um 18:04 Keine Kommentare

Mit zunächst ZVDD und nun TextGrid gibt es im deutschen Sprachraum mindestens ein größeres bibliothekarisches DFG-Projekt, dass sich auch der Erschließung von Dokumenten unterhalb der bibliographischen Ebene annimmt. Inzwischen werden im bibliothekarischen Umfeld diese Erschließungsdaten wie zum Beispiel Kapitelgliederung und Paginierung als „Strukturdaten“ bezeichnet (wie es im Englischsprachigen Umfeld aussieht, weiß ich nicht). Standardformate zur Kodierung von Stukturdaten sind der Metadata Encoding and Transmission Standard (METS) und das Format der Text Encoding Initiative (TEI). Der vor kurzem in einer ersten Version veröffentlichte DFG-Viewer basiert auf Strukturdaten im MODS-Format, bislang werden allerdings noch keine Inhaltsverzeichnisses unterstützt. Bislang werden Strukturdaten vor allem im Rahme der Digitalisierung und Archivierung eingesetzt. Ein Beispiel zur Archivierung ist die Dissertation Markup Language (DiML) – als ich als HiWi daran gesessen habe, hat das allerdings noch niemand ein Strukturdatenformat genannt. Ein weiteres Format, das zur Speicherung von Strukturdaten eingesetzt werden kann ist OpenDocument (ODF). Mit der nächsten Version dürfte ODF noch interessanter werden – derzeit sitzt eine Arbeitsgruppe daran, die Einbindung von Metadaten in ODF-Dokumenten auszubauen – wer sich mit Strukturdaten beschäftigt, sollte sich das aktuelle Proposals anschauen – wie man dort sieht, geht alles in Richtung RDF. Wann welches Format vorzuziehen ist bzw. ob und wie ODF beispielsweise TEI verdrängt oder in welchem Kontext die existierenden Formate nebeneinander existieren werden, bleibt abzuwarten.