Nature als Nationallizenz verfügbar

29. Mai 2008 um 17:14 2 Kommentare

Nature, die neben „Science“ renommierteste wissenschaftliche Fachzeitschrift, ist ab sofort im Rahmen der Nationallizenzen in den Jahrgängen von 1869-2007 für alle „in Deutschland wissenschaftlich Tätige“ kostenfrei verfügbar und kann hier recherchiert werden. Welche weiteren Zeitschriften und Datenbanken ebenfalls als Nationallizenz verfügbar sind, ist unter www.nationallizenzen.de einsehbar. Nach und nach werden auch die gesamten Metadaten gesammelt – siehe dazu die Datenbanken, die bei der VZG aufgelistet werden. Der Zugang sollte in allen Bibliotheken möglich sein, die Nature als Nationallizenz ausgewählt haben. Um auch vom eigenen Arbeitsplatz zugreifen zu können, muss man sich theoretisch per Shibbolethals als Nutzer einer Bibliothek ausweisen. Praktisch funktioniert das aber bislang nur für Einzelnutzer, das heisst Personen, die keine Bibliotheken nutzen oder nur Bibliotheken, die noch kein Shibboleth zur Authentifizierung im Rahmen der DFN-Föderation unterstützen. Hier kann man sich anmelden.

Beim Blättern in den alten Ausgaben ist mir aufgefallen, dass sich der Stil und die Anforderungen an wissenschaftliche Fachartikel mit der Zeit doch schon etwas gewandelt haben. Die kurzen Artikel aus dem 19. Jahrhundert erinnern mich teilweise eher an heutige Weblog-Beiträge! 😉

Digitale Bibliotheken vor 8 Jahren

27. Mai 2008 um 02:52 2 Kommentare

Ich weiß nicht mehr wie genau Google mich auf diese Präsentation gebracht hat und eigentlich ist es ja uncool, auf Folien zu verweisen, die nicht auf Slideshare liegen (archiviert das eigentlich endlich mal jemand); aber irgendwie hat mich schon etwas beeindruckt, wie wenig von dem Grundlagen-Workshop zum Thema „Digitale Bibliotheken“ auf der zweiten CARNet-Konferenz (Zagreb, 2000) bislang veraltet ist. Trotz aller Berechtigung von Initiativen wie „Bibliothek 2.0“ gilt nämlich: die grundlegenden Entwicklungen im Bibliothekswesen sind längerfristig und schon seit mehr als 10 Jahren abzusehen. Die Automatisierung schreitet (auch) in Bibliotheken kontinuierlich immer weiter voran und was nicht digital wird, wird marginal. Zugriff sind nicht mehr auf einen Ort beschränkt, alles ist beliebig kopierbar und auch die Kommunikation findet immer mehr im digitalen Raum statt. Soweit, so vorhersagbar.

Ebenso beeindruckend wie die Kontinuität dieser Entwicklung, ist allerdings, dass bei den Beteiligten in (digitalen) Bibliotheken oft elementarste Grundlagen fehlen. Mein Standardbeispiel ist (immer wieder durch die Praxis bestätigt!) die verbreitete Unkenntnis der grundlegenden Unterschiede zwischen einer einfachen Suchmaschine und einer Metasuchmaschine. Um unabhängig von allen Hypes ein eigenes Gefühl für diese und andere Grundbegriffe zu bekommen (weitere ad-hoc-Beispiele: „Datenformat“, „Harvesting“, „Feed“, „Community“…) muss man sich immer wieder damit beschäftigen. Gut, wenn es also Fortbildungen, wie den Eingangs genannten Workshop gibt. Einen kleinen Beitrag liefert die Reihe Lernen 2.0 zum Selbststudium.

Digitalisate weiterverarbeiten und anzeigen

20. Mai 2008 um 14:47 4 Kommentare

Nur 48 Stunden nach meinem Vorschlag, den digitalisierten Simplicissimus vom PDF über METS/MODS im DFG-Viewer anzeigen zu lassen, meldete sich Christian Mahnke mit einem entsprechenden Python-Skript bei mir 🙂 Inzwischen hat er sogar einige Verbesserungen vorgenommen, die Konvertierung klappt einwandfrei! Hier ein Beispiel einer erzeugten XML-Datei, im DFG-Viewer sieht das dann so aus. Statt dem DFG-Viewer kann die METS/MODS-Datei übrigens auch in einer anderen Anwendung angesehen werden, zum Beispiel mit dem METS Navigator. Weitere METS Werkzeuge listet die LOC auf.

Ein guter Ansatz ist vielleicht auch, sich mal einige der vielen existierenden Comic Viewer anzuschauen. Während in der Bibliothekswelt nämlich noch an Prototypen und Projekten gewerkelt wird, haben private Sammler längst einfache Lösungen zur Archivierung und Präsentation von Digitalisaten geschaffen. Ich vermute jedoch, dass „Wir wollen existierende OpenSource Comic-Viewer so erweitern, dass sie mit METS/MODS-Daten umgehen können“ nicht gut bei DFG-Gutachtern ankommt – womit diese mal wieder ihre mangelnde Kompetenz unter Beweis stellen würden.

Mit dem Skript von Christian lassen sich prinzipiell Digitalisate als Images aus einem PDF auslesen und in verschiedene Größen skalieren. Die Metadaten müssen jedoch anderswo herkommen. Entweder man holt sich die Daten über HTML oder über eine saubere Schnittstelle wie SRU. Im Idealfall wird sogar MARC21 angeboten, das mit Stylesheets der LOC nach MODS konvertiert werden kann.

Statt Digitalisate alter Zeitschriften können auch neue Scans von Inhaltsverzeichnissen zur Anzeige gebracht werden. So geht’s (die Suche ausgehend von einer ISBN sollte nicht schwieriger sein). Wie wäre es, statt Coverbildern im Katalog Thumbnails von Inhaltsverzeichnissen anzuzeigen? Sauber in Services getrennt könnte das folgendermaßen umgesetzt werden:

  • Webservice A bekommt ISBN/PND/Bibkey/…, ermittelt den Titel und liefert eine Thumbnail sowie einen Link zur Vollanzeige des Inhaltsverzeichnis (beispielsweise per SeeAlso)
  • Webservice B liefert zu einem Titel das PDF und die Metadaten (Beispiel: Katalog mit SRU-Schnittstelle)
  • Webservice C erhält eine PDF-URL und Metadaten in MODS-Daten und erzeugt daraus Bitmaps und METS/MODS und stellt diese bereit
  • Webservice D kann METS/MODS anzeigen (Beispiel: DFG-Viewer)

Viel Spaß beim Umsetzen, Experimentieren und Ideen sammeln!

Erschließung von Videos mit Yovisto

20. Mai 2008 um 13:01 1 Kommentar

Letzten Samstag wurde auf dem Bibcamp 2008 unter Anderem die Videosuchmaschine Yovisto vorgestellt, die an der Uni Jena entstanden ist (siehe Ãœberblick bei infobib und Yovisto-Blog). In Yovisto werden Videos nicht nur mit einfachen Metadaten über den Film erschlossen, sondern mit Tags und Kommentaren innerhalb eines Films. Dazu werden zum einen mittels Texterkennung automatisch Texte im Film erkannt und indexiert – vor allem aus Slideshows bei Vorträgen lassen sich so viele Inhalte ermitteln. Bei der Suche wird angezeigt, welche Wörter an welcher Stellen in einem Film vorkommen und es kann an die entsprechenen Zeitmarke gesprungen werden. Zusätzlich zur automatischen Erschließung können Nutzer zeitbezogen Tags und Kommentare abgeben. Die Benutzeroberfläche ist ziemlich angenehm und leistungsfähig und Yovisto enthält viele weitere experimentelle Funktionen, wie Wiki-Seiten zu einzelnen Filmen, OpenSearch-Schnittstelle, Podcast etc.

Die Erschließung von Videos mit Yovisto eignet sich besonders für Vorlesungsmitschnitte. Diese werden zwar immer mehr gesammelt aber nur wenig durchgehend erschlossen. Was grundsätzlich verbessert werden kann ist die Anbindung an die Bibliothek und den Katalog bzw. an die ganze Uni-Infrastruktur. So sind zwar Beispielsweise in der Digitalen Bibliothek Thüringen Aufzeichnungen von Vorlesungen katalogisiert, aber nicht direkt mit Yovisto verknüpft. Dabei sollte der Trend an Hochschulen eher dahin gehen, die sich auseinander entwickelten Systeme Bibliothek und E-Learning-Plattformen wieder zusammen zu bringen – dazu müssen allerdings alle Beteiligten über ihren Tellerrand hinaus schauen und einige ihrer alten Zöpfe und abschneiden und inkompatible Sonderwege aufgeben. Das Datenformat von Yovisto ist MPEG-7 – anstatt alles von Hand mehrfach zu katalogisieren, können damit sicherlich Daten gemeinsam genutzt werden. Techniken aus Yovisto werden auch im Video-Erschließungssystem REPLAY verwendet, das in Zusammenarbeit mit der ETH-Zürich entsteht.

Kleine Ãœbung zur Langzeitarchivierung

12. Mai 2008 um 22:51 4 Kommentare

Die Forderung, sich immer wieder mit neuen Techniken und Verfahren vertraut zu machen, ist zwar gerechtfertigt, aber ohne ohne konkrete Aufgabenstellung nicht so einfach. Selbstlernkurse wie Lernen 2.0 sind da sehr zu begrüßen; am Besten lernt es sich aber an einem konkreten Projekt. Da die Zahl meiner Ideen für Projekte größer ist als meine Geduld und/oder Zeit, werde ich in Zukunft hier im Blog einige davon skizzieren. Ideen sind dazu da, sie zu teilen, also kann sie jeder nutzen (solange er kein Patent darauf anmeldet) – sei es als Thema für eine Studienarbeit, für den nächsten DFG-Antrag, oder als kleine Ãœbung zwischendurch.

Hier nun also eine kleine Ãœbung zur Langzeitarchivierung: Die wunderbare Satire-Zeitschrift „Simplicissimus“ (ZDB-ID 211633-9) ist seit letztem Jahr mit Mitteln der DFG digitalisiert online verfügbar. Die einzelnen Ausgaben können in Form von PDF-Dokumenten mit eingebetteten Bitmaps (keine Volltexte) heruntergeladen und betrachtet werden. PDF ist schonmal in Ordnung, es enthält aber keine ausreichenden Strukturdaten und Metadaten. Das adäquate Format wäre MODS in Kombination mit METS. Inzwischen gibt es mit dem DFG-Viewer (aus einem anderen DFG-Projekt) eine webbasierte Möglichkeit, METS/MODS-Digitalisate im Browser zu betrachten.

Aufgabenstellung: Erstelle aus den PDF-Dateien des digitalisierten Simplicissimus und weiteren relevanten Informationen Digitalisate im METS/MODS-Format und stelle diese so zur Verfügung, dass sie im DFG-Viewer betrachtet werden können.

Hinweise: Mit pdfimages lassen sich ohne Qualitätsverlust Bilder aus PDF-Dokumenten extrahieren. Die Benamung der PDF-Dateien scheint systematisch zu sein, so dass sich daraus automatisch Informationen herausziehen lassen. Die METS/MODS-Daten sind für die unterschiedlichen Ausgaben sehr ähnlich, am Besten ist es also von einem Beispiel auszugehen, dieses zu verallgemeinern und mit einem Skript die Dateien automatisch zu erzeugen.

Zusatzaufgabe: Die vom Projekt bereitgestellten Verzeichnis der Autoren, Beiträge, Themen und erwähnten Personen und Werke ermöglichen eine gute Tiefenerschließung – was ist notwendig, damit von dieser Erschließung auf den einzelnen Beitrag in einer bestimmten Ausgabe verlinkt werden kann?

Fortbildung Weblogs und RSS

9. Mai 2008 um 09:57 3 Kommentare

Gestern habe ich im Zentrum für bibliothekarische Fortbildung in Niedersachsen mal wieder einen Workshop veranstaltet, diesmal ging es speziell um Weblogs und Feeds. Die Vortragsfolien sind bei Slideshare (zum Anschauen im Browser oder zum Herunterladen im OpenOffice-Format). Für die eigene Nachbereitung und alle, die nicht dabei waren, kann ich die Lehrreihe Lernen 2.0 empfehlen – zu Weblogs gibt es dort drei Lektionen: Lektion 1: Weblog erstellen, Lektion 2: Im Weblog schreiben und Lektion 3: RSS entdecken und verstehen. Ich hoffe, die Teilnehmer streuen ihr Wissen auch unter ihren Kollegen, denn leider ist der Umgang mit Weblogs in Bibliotheken noch immer nicht so alltäglich wie es sein sollte. Vor allem in der Führungsebene fehlt manchmal das Grundverständnis für die neuen Mediengattungen, wenn lieber ignoriert oder nachgeplappert statt selber ausprobiert wird.

Zum Thema „Feeds von Fachzeitschriften“ möchte ich noch nachtragen, dass über die Datenbank Online Contents (OLC) theoretisch unter allgemeinen Suchanfragen natürlich auch die neuesten Artikel einer bestimmten Zeitschrift per RSS-Feed abonniert werden können. Dazu ist zunächst die Zeitschrift ausfindig zu machen (in der Datenbank OLC-Journals oder in der OLC-Gesamtdatenbank, z.B. nach ISSN oder ZDB), dann unten Rechts „Alle Aufsätze“ auszuwählen und es erscheint ein Hinweis auf den Feed. Diese 2-3 automatisierbaren Schritte könnte ich mit einem einfachen Service zusammenführen, so dass man über SeeAlso bei gegebener ISSN oder ZDB-ID im Katalog direkt einen passenden Feeds mit den neuesten Artikeln dieser Zeitschrift anbieten könnte. Praktisch scheitert dieses Vorhaben jedoch mal wieder an der Fortschrittsbremse Urheberrecht, denn Online-Contents ist nicht frei zugänglich und somit funktionieren auch die Feeds nur bedingt.

I [edit] Wikipedia campaign for Wikipedia

8. Mai 2008 um 00:04 2 Kommentare

Mike Perez, design student at Texas State University, and his fellow students Mark Decker and Jacob Brubaker have created a wonderful campaign for Wikipedia in their design class. The posters or ads each show a straight view of an everyday person as an expert on a specific subject and a mind map of their thought process. This are the best ads for Wikipedia that I have seen since the Wikipedia promotion images that André created back in 2005 for the German Wikipedia. Just have a look (photos at flickr only because of copyright restrictions) and enjoy if you like Wikipedia as much as I do!

P.S: My other favourites of the Wikipedia search at flickr that I just performed are: this shirt, this manifestation (and this) , this and this and this data visualization, and this meal.

Mehr zu Bibliothekssoftware

7. Mai 2008 um 12:45 Keine Kommentare

Anknüpfend an die US-Umfrage zu Bibliothekssystemen möchte ich auf die unterhaltsame, vonLibrary Mistress ausgegrabene Liste „Bibliothekssoftware 1991“ hinweisen. Vor acht Jahren gab es vom DBI mal eine Umfrage zum „Softwareeinsatz in Bibliotheken“ – das ist aber höchstens noch historisch von Interesse. Michael Lackhoff bietet eine Linksammlung zu Bibliothekssoftware, die allerdings auch nur einen Ausschnitt enthält und nicht ganz aktuell ist – so fehlen beispielsweise die gesamten PICA-Produkte (was auch daran liegt, dass PICA bzw. OCLC, die Produkte nicht richtig vermarkten), neuere Entwicklungen wie VuFind und Evergreen und hoch-relevante Hintergrund-Techniken wie Lucene (mehr zu aktuellen Entwicklungen bei OSS4LIB).

Statt monolithischer Bibliothekssoftware „von der Stange“ sind nämlich die einzelnen Komponenten (Services) und ihre Verzahnung wichtig. Leider ist dagegen noch immer die Vorstellung verbreitet, dass man sich als Bibliothek besser an einen Hersteller wendet, der einem in schön bunter Verpackung, eine Black-Box verkauft. Eine Bibliothek, die sich aber nicht selbst Gedanken darüber macht, welche Daten aus welchen Quellen wie zusammengeführt und in welcher Form bereitgestellt werden, kann eigentlich gleich ihre Mitarbeiter entlassen und auf vollautomatischen Betrieb umstellen – denn in Zukunft wird es sich bei immer mehr Publikationen um elektronische Publikationen handeln, also Daten. Folgende Vorstellung ist leider nicht aus der Luft gegriffen:

Ich dachte wir kaufen Produkt X und die richtigen Daten kommen von Zauberhand hinein, konvertieren sich von alleine und werden auf magische Weise so bereitgestellt, wie es der Nutzer möchte.

Gute Nachrichten zum Tag der Pressefreiheit

3. Mai 2008 um 03:35 Keine Kommentare
Telefonabhöranlage des MfS

Zum Tag der Pressefreiheit hat sogar die USA einen seit 6 Jahren ohne Anklage gefangenen Kameramann freilassen. In Deutschland wird mit dem BKA-Gesetz (Entwurf bei Netzpolitik) darauf hingearbeitet, dass bei uns allen zu Hause besser „investigativ recherchiert“ werden kann. Italien geht in Sachen Informationsfreiheit mit gutem Beispiel voran, indem mal kurz die Einkommensteuer 2005 aller Italiener online gestellt wird. Und im Kleinen gedeiht der Bürgerjournalismus (bitte mehr davon!). Na wenn das kein Tag zum Feiern ist 😉

Freiheit statt Vollbeschäftigung

1. Mai 2008 um 03:49 2 Kommentare

Als Kind habe ich mich immer gewundert, dass am Tag der Arbeit nicht gearbeitet wird – müsste es nicht eher „Tag der Freizeit“ heissen? Inzwischen denke ich dass Paradox lässt sich besser anders auflösen: In Zukunft wird am Tag der Arbeit gearbeitet und dafür ist an den meisten anderen Tagen frei. Dank fortschreitender Automatisierung können nämlich immer mehr Bedürfnisse für immer mehr Menschen mit immer weniger Arbeit befriedigt werden. Ein viel größeres Paradox ist angesichts des andauernden Zuwachses an Produktivität, dass die Mehrheit noch immer den Götzen Lohnarbeit anbetet und von Vollbeschäftigung fabuliert.

Die Initiative Freiheit statt Vollbeschäftigung hat dieses Paradox erkannt und fordert (begleitet von durchdachten Begründungen und Erklärungen) ein Bedingungsloses Grundeinkommen – wer sich jetzt mit einem „das kann doch gar nicht funktioneren!“ abwendet, meint wahrscheinlich auch dass man gegen Hunger und Armut „nun mal nichts machen kann“. Ich weiß nicht, ob ich noch erleben werde, dass irgendwann alle Menschen – ohne Arbeiten zu müssen – mit Nahrung, Kleidung, Wohnung etc. versorgt werden, aber am Tag der Arbeit sollte soviel Utopie schon sein.

Eine andere Welt ist möglich!