Digitalisate weiterverarbeiten und anzeigen

20. Mai 2008 um 14:47 4 Kommentare

Nur 48 Stunden nach meinem Vorschlag, den digitalisierten Simplicissimus vom PDF über METS/MODS im DFG-Viewer anzeigen zu lassen, meldete sich Christian Mahnke mit einem entsprechenden Python-Skript bei mir 🙂 Inzwischen hat er sogar einige Verbesserungen vorgenommen, die Konvertierung klappt einwandfrei! Hier ein Beispiel einer erzeugten XML-Datei, im DFG-Viewer sieht das dann so aus. Statt dem DFG-Viewer kann die METS/MODS-Datei übrigens auch in einer anderen Anwendung angesehen werden, zum Beispiel mit dem METS Navigator. Weitere METS Werkzeuge listet die LOC auf.

Ein guter Ansatz ist vielleicht auch, sich mal einige der vielen existierenden Comic Viewer anzuschauen. Während in der Bibliothekswelt nämlich noch an Prototypen und Projekten gewerkelt wird, haben private Sammler längst einfache Lösungen zur Archivierung und Präsentation von Digitalisaten geschaffen. Ich vermute jedoch, dass „Wir wollen existierende OpenSource Comic-Viewer so erweitern, dass sie mit METS/MODS-Daten umgehen können“ nicht gut bei DFG-Gutachtern ankommt – womit diese mal wieder ihre mangelnde Kompetenz unter Beweis stellen würden.

Mit dem Skript von Christian lassen sich prinzipiell Digitalisate als Images aus einem PDF auslesen und in verschiedene Größen skalieren. Die Metadaten müssen jedoch anderswo herkommen. Entweder man holt sich die Daten über HTML oder über eine saubere Schnittstelle wie SRU. Im Idealfall wird sogar MARC21 angeboten, das mit Stylesheets der LOC nach MODS konvertiert werden kann.

Statt Digitalisate alter Zeitschriften können auch neue Scans von Inhaltsverzeichnissen zur Anzeige gebracht werden. So geht’s (die Suche ausgehend von einer ISBN sollte nicht schwieriger sein). Wie wäre es, statt Coverbildern im Katalog Thumbnails von Inhaltsverzeichnissen anzuzeigen? Sauber in Services getrennt könnte das folgendermaßen umgesetzt werden:

  • Webservice A bekommt ISBN/PND/Bibkey/…, ermittelt den Titel und liefert eine Thumbnail sowie einen Link zur Vollanzeige des Inhaltsverzeichnis (beispielsweise per SeeAlso)
  • Webservice B liefert zu einem Titel das PDF und die Metadaten (Beispiel: Katalog mit SRU-Schnittstelle)
  • Webservice C erhält eine PDF-URL und Metadaten in MODS-Daten und erzeugt daraus Bitmaps und METS/MODS und stellt diese bereit
  • Webservice D kann METS/MODS anzeigen (Beispiel: DFG-Viewer)

Viel Spaß beim Umsetzen, Experimentieren und Ideen sammeln!

4 Comments »

RSS feed for comments on this post. TrackBack URI

  1. Die HAAB Weimar geht mit einer individuellen Lösung in puncto Simplicissimus in den nächsten 2 Monaten online. Die Testseite findet Ihr unter test.rockborn.de. Auf dieser Seite sind die Digitalisate in einen Viewer als jpegs einbunden. Der Viewer scheint hierbei aber nur die browserseitige Abwicklung via javascript zu übernehmen.

    Comment by Rumpel — 23. Juni 2008 #

  2. Sehr geehrte Damen und Herren,
    erfreut nehmen wir Ihr Interesse am Simplicissimus zur Kenntnis. Wenig erfreut uns Ihr Aufruf zum Beginn von redundanten Arbeiten. Die digitalisierten Jahrgänge sind bereits unsererseits erschlossen. Die frei zugänglichen Rechercheseiten werden demnächst verlinkt. Schade ist auch, dass es nicht für notwendig gehalten wird, mit unserem leicht ermittelbaren Projekt wenigstens unverbindlich Kontakt aufzunehmen. Dazu ist es aber noch nicht zu spät. Mit der Ermunterung zum weiteren Austausch grüßt
    Johannes Mangei (johannes.mangei@klassik-stiftung.de)

    Comment by Dr. Johannes Mangei — 23. Juni 2008 #

  3. sehr interessanter Beitrag, vielen Dank!

    “Wir wollen existierende OpenSource Comic-Viewer so erweitern, dass sie mit METS/MODS-Daten umgehen können” – in allen gängigen Browsern (IE, FF, Safari) ohne Plugins funktionieren.

    Comment by Joon — 26. August 2009 #

  4. Gerade jJetzt wo Google Books Digitalisate auch im EPUB-Format zum Download anbietet, wäre der Im/Export von EPUB ebenfalls sinnvoll.

    Comment by jakob — 28. August 2009 #

Sorry, the comment form is closed at this time.