Die Rolle der Bibliotheken im Internetzeitalter
21. Juni 2008 um 03:07 1 KommentarDa die „uncoolen“ Potsdamer BibliothekarInnen nun schon die dritten sind, die mich auf den Artikel „Die Rolle der Bibliotheken im Internetzeitalter“ (PDF) von Barbara Lison im Themenheft „Wissen im Web“ von „UNESCO heute“ (Ausgabe 1/2008) hinweisen, muss ich doch meinen Senf dazugeben (zumal ich nach drei Wochen Telekom-Generve endlich wieder Internet habe und somit wieder bloggen kann). Der Artikel bietet eine gute Darstellung des aktuellen aktuellen Standes.
Neben die Sammlung und Erschließung von Inhalten – ob in gedruckter Literatur oder in Netzpublikationen – ist immer stärker die Aufgabe der Vermittlung, der Eröffnung des Zugangs getreten.
Außerdem wird ganz kurz das EU-Projekt Europeana genannt – eine etwas bessere Darstellung gibt Jörn Sieglerschmidt im Interview mit dem SWR. Ein wenig erinnert mich der Artikel an „Bücher und Internet: Das Kaleidoskop der Vergangenheit“ von Johannes Schneider Anfang des Monats in der Süddeutschen Zeitung (siehe Kommentar und mein Hinweis): Mehr oder weniger alles richtig und wichtig aber ziemlich unkonkret, wenig vorausschauend oder innovativ und eigentlich schon vor 5 bis 10 Jahren passend. Schön, dass Bibliotheken allgemein in den Medien präsenter sind, aber für die Darstellung des aktuellen Standes gibt es doch Wikipedia!. Vielleicht ist das UNESCO-Magazin einfach nicht der richtige Ort für neue Entwicklungen; der Artikel zu Wikipedia ist ebenfalls nur sehr allgemein gehalten und das mehrfach im Magazin erwähnte Thema Web 2.0 ist eigentlich inzwischen ein alter Hut.
Was nun tatsächlich die Rolle von Bibliotheken im Internetzeitalter ist und sein wird, beantwortet der Artikel jedenfalls nicht zufriedenstellend. Überhaupt ist der Begriff „Internetzeitalter“ viel zu kurz gegriffen. Es geht nicht um das Zeitalter des Internet, sondern um das Zeitalter der Digitalisierung aller Informationen und damit um die unbegrenzte Kopier-, Modifizier- Annotier-, Verknüpf-, und Verfügbarkeit von Informationen. Und dabei haben Bibliotheken ihre Rolle noch längst nicht gefunden.
Gewinner des Theseus-Wettbewerb ausgezeichnet
20. Juni 2008 um 16:40 Keine KommentareUnter 180 Bewerbungen im Rahmen des Theseus-Talente-Wettbewerbs sind vor drei Tagen die Gewinner ausgezeichnet worden. Ein Vorschlag, die Webseite des Wettbewerbs von unnötigen PDFs zu befreien, fand sich anscheinend nicht unter den Einreichungen – etwas versteckt findet sich zumindest ein „News“-Beitrag, in dem die ersten vier von 14 ausgezeichneten Gewinner kurz mit ihrem Thema genannt sind. Statt langweiligen Informatik-, Technik-, und Wirtschaftsthemen gibt es den erste Preis für einen Beitrag zum Thema „Tagging“ in Verbindung mit „Semantik“. Die Autorin Sonja Kraus studiert auf Lehramt und Magister mit den Nebenfächern Angewandte Sprachwissenschaft und sprachliche Informationsverarbeitung und hat ihren Beitrag mit „Semantstrategien“ betitelt. Was genau das sein soll geht auch aus ihrem Blog nicht so ganz hervor und die Originalarbeit ist auch (noch?) nicht öffentlich verfügbar, so dass es erstmal bei Buzzwords bleibt. Ich hoffe, es ergeht der Arbeit nicht wie dem ersten deutschsprachigen Buch zum Thema Social Tagging („Social Tagging“ von Sascha Carlin, ISBN 3-940317-03-9), auf das ich schon seit einem Dreivierteljahr vergeblich warte. Stattdessen wird nun das erste Buch der Sammelband „Good Tags, Bad Tags“ zur Tagung Social Tagging in der Wissensorganisation, der unter Anderem einen Beitrag von mir zum Semantischen Tagging enthält (weitere Infos zum Sammelband bei Birgit Gaiser). Neben Sonjas Arbeit wurde übrigens noch ein weiterer Text zum Thema Tagging ausgezeichnet und zwar der von Kim Korte (gefunden dank Trackback in Sonjas Blog :-).
Webcomic-Tipp: xkcd
12. Juni 2008 um 21:21 4 KommentareObwohl ich gerne Comic lesen, kann ich Webcomics bisher nicht soviel abgewinnen und schaue mir bis auf Dilbert und Unshelved selten etwas an. Nachdem mich Sven auf diesen Strip hingewiesen hat (übrigens ist Computer Science ebenfalls just applied Mathematics, tja) ist mit xkcd – A webcomic of romance, sarcasm, math, and language ein weiterer dazugekommen. Schön nerdig aber einfach nett, besonders der Schuß romance. Und was der Sternenhimmel mit der Blogosphäre zu tun hat, weiß ich jetzt auch 🙂
KIM-Session zu Metadaten auf dem Bibliothekstag 2008
4. Juni 2008 um 16:38 Keine KommentareDer Vortrag zu „Strukturierten Metadaten in Wikipedia“ auf dem Bibliothekstag 2008 ist gut angenommen worden. Fragen kamen vor allem zu ISBN, PND und Personendaten. Leider konnte ich wahrscheinlich nicht ganz rüberbringen, dass dies nur Beispiele für Metadaten aus Wikipedia sind und dass die Verknüpfung und Weiternutzung von Metadaten insgesamt zunimmt; Wikipedia ist hierbei nur ein wesentlicher Nucleus. Vielleicht hätte zum Verständnis noch der Einführungsvortag von Bernhard Haslhofer zum Semantic Web geholfen, der leider krankheitsbedingt ausfallen musste. Der Vortrag „Metadaten im digitalen Workflow“ von Jens Klump aus Potsdam hat mir gefallen, ich vermute nur, dass er für viele Besucher schwer zu verstehen war – Metadaten sind halt auch ein etwas trockenes Thema, schon verwunderlich, dass die Session mit schätzungsweise 100 Personen so gut besucht war. Bei dem Vortrag von Steffen Lamparter über „Metadaten in Service Registries“ konnte ich zunächst bei einigen grundlegenden Punkte zustimmen (Trend zu immer mehr Produzenten von Inhalten und Metadaten, fortschreitende Automatisierung, immer mehr Dienste etc.), aber als er später zu Ontologien kam, wurde es etwas zu unkonkret und praxisfern. Die Einschätzung liegt vielleicht auch an meiner generell skeptischen Haltung gegenüber Ontologien. Abschließend widmeten sich Tom Baker und Stefanie Rühle der Frage „Kann Zertifizierung der Modellkonformität helfen“ und knüpften damit an den Einführungsvortrag von Mirjam Keßler über das KIM-Projekt an.
Social Cataloging ist Bibliothekswissenschaft at its best
2. Juni 2008 um 21:47 3 KommentareIst eigentlich schon jemandem aufgefallen, dass das Erste Lehrbuch der Bibliothekswissenschaft, nämlich Martin Schrettingers „Handbuch der Bibliothek-Wissenschaft von 1834 mit vollständigem Titel „Handbuch der Bibliothek-Wissenschaft, besonders zum Gebrauche der Nicht-Bibliothekare; welche ihre Privat-Büchersammlung selbst einrichten wollen“ heisst? Social Cataloging ist also nichts anderes als die Fortführung von Bibliothekswissenschaft mit zeitgemäßen Mitteln. Zeitgemäß heisst nichts anderes als digital (entweder digital oder marginal) und damit kommt der Social Software-Aspekt des Social Catalogings ganz automatisch. Denn Digital heisst unbegrenzte kopier- und modifizierbar, das war schon vor 20 Jahren so, auch wenn das bei einigen ewig Gestrigen noch immer nicht angekommen ist: „Der Computer ist eine Maschine zum Kopieren und Verändern von Bits.“ (Wau Holland). Dass ganz normale bibliophile Menschen ihre Literatursammlungen selber erschließen ist nichts bibliothekarisch Irrelevantes oder Unprofessionelles sonder wäre sicher ganz im Sinne Schrettingers. Gestern hätte sich noch niemand vorstellen können, dass in Zukunft Enzyklopädien von Freiwilligen geschrieben werden, morgen werden wir uns darüber wundern, dass Publikationen früher allein von einer Handvoll Bibliothekaren erschlossen wurden. Die kommen nämlich mit dem Katalogisieren jetzt schon nicht hinterher – oder wo bitte sind die fachlich erschlossenen Weblogs, Primärdaten, Vorträge etc.? Mit den dank Social Cataloging freiwerdenden Kräften können dann die Aufgaben angegangen werden, für die nach Ulrich Johannes Schneider in seinem heutigen, ganzseitigen Artikel in der Süddeutschen Zeitung nicht genügend Stellen da sind. In diesem Sinne wünsche ich allen Bibliothekaren und Nicht-Bibliothekaren, ganz gleich welche Sammlung von Publikationen sie einrichten wollen, einen schönen Bibliothekartag 2008!
Nature als Nationallizenz verfügbar
29. Mai 2008 um 17:14 2 KommentareNature, die neben „Science“ renommierteste wissenschaftliche Fachzeitschrift, ist ab sofort im Rahmen der Nationallizenzen in den Jahrgängen von 1869-2007 für alle „in Deutschland wissenschaftlich Tätige“ kostenfrei verfügbar und kann hier recherchiert werden. Welche weiteren Zeitschriften und Datenbanken ebenfalls als Nationallizenz verfügbar sind, ist unter www.nationallizenzen.de einsehbar. Nach und nach werden auch die gesamten Metadaten gesammelt – siehe dazu die Datenbanken, die bei der VZG aufgelistet werden. Der Zugang sollte in allen Bibliotheken möglich sein, die Nature als Nationallizenz ausgewählt haben. Um auch vom eigenen Arbeitsplatz zugreifen zu können, muss man sich theoretisch per Shibbolethals als Nutzer einer Bibliothek ausweisen. Praktisch funktioniert das aber bislang nur für Einzelnutzer, das heisst Personen, die keine Bibliotheken nutzen oder nur Bibliotheken, die noch kein Shibboleth zur Authentifizierung im Rahmen der DFN-Föderation unterstützen. Hier kann man sich anmelden.
Beim Blättern in den alten Ausgaben ist mir aufgefallen, dass sich der Stil und die Anforderungen an wissenschaftliche Fachartikel mit der Zeit doch schon etwas gewandelt haben. Die kurzen Artikel aus dem 19. Jahrhundert erinnern mich teilweise eher an heutige Weblog-Beiträge! 😉
Digitale Bibliotheken vor 8 Jahren
27. Mai 2008 um 02:52 2 KommentareIch weiß nicht mehr wie genau Google mich auf diese Präsentation gebracht hat und eigentlich ist es ja uncool, auf Folien zu verweisen, die nicht auf Slideshare liegen (archiviert das eigentlich endlich mal jemand); aber irgendwie hat mich schon etwas beeindruckt, wie wenig von dem Grundlagen-Workshop zum Thema „Digitale Bibliotheken“ auf der zweiten CARNet-Konferenz (Zagreb, 2000) bislang veraltet ist. Trotz aller Berechtigung von Initiativen wie „Bibliothek 2.0“ gilt nämlich: die grundlegenden Entwicklungen im Bibliothekswesen sind längerfristig und schon seit mehr als 10 Jahren abzusehen. Die Automatisierung schreitet (auch) in Bibliotheken kontinuierlich immer weiter voran und was nicht digital wird, wird marginal. Zugriff sind nicht mehr auf einen Ort beschränkt, alles ist beliebig kopierbar und auch die Kommunikation findet immer mehr im digitalen Raum statt. Soweit, so vorhersagbar.
Ebenso beeindruckend wie die Kontinuität dieser Entwicklung, ist allerdings, dass bei den Beteiligten in (digitalen) Bibliotheken oft elementarste Grundlagen fehlen. Mein Standardbeispiel ist (immer wieder durch die Praxis bestätigt!) die verbreitete Unkenntnis der grundlegenden Unterschiede zwischen einer einfachen Suchmaschine und einer Metasuchmaschine. Um unabhängig von allen Hypes ein eigenes Gefühl für diese und andere Grundbegriffe zu bekommen (weitere ad-hoc-Beispiele: „Datenformat“, „Harvesting“, „Feed“, „Community“…) muss man sich immer wieder damit beschäftigen. Gut, wenn es also Fortbildungen, wie den Eingangs genannten Workshop gibt. Einen kleinen Beitrag liefert die Reihe Lernen 2.0 zum Selbststudium.
Digitalisate weiterverarbeiten und anzeigen
20. Mai 2008 um 14:47 4 KommentareNur 48 Stunden nach meinem Vorschlag, den digitalisierten Simplicissimus vom PDF über METS/MODS im DFG-Viewer anzeigen zu lassen, meldete sich Christian Mahnke mit einem entsprechenden Python-Skript bei mir 🙂 Inzwischen hat er sogar einige Verbesserungen vorgenommen, die Konvertierung klappt einwandfrei! Hier ein Beispiel einer erzeugten XML-Datei, im DFG-Viewer sieht das dann so aus. Statt dem DFG-Viewer kann die METS/MODS-Datei übrigens auch in einer anderen Anwendung angesehen werden, zum Beispiel mit dem METS Navigator. Weitere METS Werkzeuge listet die LOC auf.
Ein guter Ansatz ist vielleicht auch, sich mal einige der vielen existierenden Comic Viewer anzuschauen. Während in der Bibliothekswelt nämlich noch an Prototypen und Projekten gewerkelt wird, haben private Sammler längst einfache Lösungen zur Archivierung und Präsentation von Digitalisaten geschaffen. Ich vermute jedoch, dass „Wir wollen existierende OpenSource Comic-Viewer so erweitern, dass sie mit METS/MODS-Daten umgehen können“ nicht gut bei DFG-Gutachtern ankommt – womit diese mal wieder ihre mangelnde Kompetenz unter Beweis stellen würden.
Mit dem Skript von Christian lassen sich prinzipiell Digitalisate als Images aus einem PDF auslesen und in verschiedene Größen skalieren. Die Metadaten müssen jedoch anderswo herkommen. Entweder man holt sich die Daten über HTML oder über eine saubere Schnittstelle wie SRU. Im Idealfall wird sogar MARC21 angeboten, das mit Stylesheets der LOC nach MODS konvertiert werden kann.
Statt Digitalisate alter Zeitschriften können auch neue Scans von Inhaltsverzeichnissen zur Anzeige gebracht werden. So geht’s (die Suche ausgehend von einer ISBN sollte nicht schwieriger sein). Wie wäre es, statt Coverbildern im Katalog Thumbnails von Inhaltsverzeichnissen anzuzeigen? Sauber in Services getrennt könnte das folgendermaßen umgesetzt werden:
- Webservice A bekommt ISBN/PND/Bibkey/…, ermittelt den Titel und liefert eine Thumbnail sowie einen Link zur Vollanzeige des Inhaltsverzeichnis (beispielsweise per SeeAlso)
- Webservice B liefert zu einem Titel das PDF und die Metadaten (Beispiel: Katalog mit SRU-Schnittstelle)
- Webservice C erhält eine PDF-URL und Metadaten in MODS-Daten und erzeugt daraus Bitmaps und METS/MODS und stellt diese bereit
- Webservice D kann METS/MODS anzeigen (Beispiel: DFG-Viewer)
Viel Spaß beim Umsetzen, Experimentieren und Ideen sammeln!
Erschließung von Videos mit Yovisto
20. Mai 2008 um 13:01 1 KommentarLetzten Samstag wurde auf dem Bibcamp 2008 unter Anderem die Videosuchmaschine Yovisto vorgestellt, die an der Uni Jena entstanden ist (siehe Überblick bei infobib und Yovisto-Blog). In Yovisto werden Videos nicht nur mit einfachen Metadaten über den Film erschlossen, sondern mit Tags und Kommentaren innerhalb eines Films. Dazu werden zum einen mittels Texterkennung automatisch Texte im Film erkannt und indexiert – vor allem aus Slideshows bei Vorträgen lassen sich so viele Inhalte ermitteln. Bei der Suche wird angezeigt, welche Wörter an welcher Stellen in einem Film vorkommen und es kann an die entsprechenen Zeitmarke gesprungen werden. Zusätzlich zur automatischen Erschließung können Nutzer zeitbezogen Tags und Kommentare abgeben. Die Benutzeroberfläche ist ziemlich angenehm und leistungsfähig und Yovisto enthält viele weitere experimentelle Funktionen, wie Wiki-Seiten zu einzelnen Filmen, OpenSearch-Schnittstelle, Podcast etc.
Die Erschließung von Videos mit Yovisto eignet sich besonders für Vorlesungsmitschnitte. Diese werden zwar immer mehr gesammelt aber nur wenig durchgehend erschlossen. Was grundsätzlich verbessert werden kann ist die Anbindung an die Bibliothek und den Katalog bzw. an die ganze Uni-Infrastruktur. So sind zwar Beispielsweise in der Digitalen Bibliothek Thüringen Aufzeichnungen von Vorlesungen katalogisiert, aber nicht direkt mit Yovisto verknüpft. Dabei sollte der Trend an Hochschulen eher dahin gehen, die sich auseinander entwickelten Systeme Bibliothek und E-Learning-Plattformen wieder zusammen zu bringen – dazu müssen allerdings alle Beteiligten über ihren Tellerrand hinaus schauen und einige ihrer alten Zöpfe und abschneiden und inkompatible Sonderwege aufgeben. Das Datenformat von Yovisto ist MPEG-7 – anstatt alles von Hand mehrfach zu katalogisieren, können damit sicherlich Daten gemeinsam genutzt werden. Techniken aus Yovisto werden auch im Video-Erschließungssystem REPLAY verwendet, das in Zusammenarbeit mit der ETH-Zürich entsteht.
Kleine Übung zur Langzeitarchivierung
12. Mai 2008 um 22:51 4 KommentareDie Forderung, sich immer wieder mit neuen Techniken und Verfahren vertraut zu machen, ist zwar gerechtfertigt, aber ohne ohne konkrete Aufgabenstellung nicht so einfach. Selbstlernkurse wie Lernen 2.0 sind da sehr zu begrüßen; am Besten lernt es sich aber an einem konkreten Projekt. Da die Zahl meiner Ideen für Projekte größer ist als meine Geduld und/oder Zeit, werde ich in Zukunft hier im Blog einige davon skizzieren. Ideen sind dazu da, sie zu teilen, also kann sie jeder nutzen (solange er kein Patent darauf anmeldet) – sei es als Thema für eine Studienarbeit, für den nächsten DFG-Antrag, oder als kleine Übung zwischendurch.
Hier nun also eine kleine Übung zur Langzeitarchivierung: Die wunderbare Satire-Zeitschrift „Simplicissimus“ (ZDB-ID 211633-9) ist seit letztem Jahr mit Mitteln der DFG digitalisiert online verfügbar. Die einzelnen Ausgaben können in Form von PDF-Dokumenten mit eingebetteten Bitmaps (keine Volltexte) heruntergeladen und betrachtet werden. PDF ist schonmal in Ordnung, es enthält aber keine ausreichenden Strukturdaten und Metadaten. Das adäquate Format wäre MODS in Kombination mit METS. Inzwischen gibt es mit dem DFG-Viewer (aus einem anderen DFG-Projekt) eine webbasierte Möglichkeit, METS/MODS-Digitalisate im Browser zu betrachten.
Aufgabenstellung: Erstelle aus den PDF-Dateien des digitalisierten Simplicissimus und weiteren relevanten Informationen Digitalisate im METS/MODS-Format und stelle diese so zur Verfügung, dass sie im DFG-Viewer betrachtet werden können.
Hinweise: Mit pdfimages lassen sich ohne Qualitätsverlust Bilder aus PDF-Dokumenten extrahieren. Die Benamung der PDF-Dateien scheint systematisch zu sein, so dass sich daraus automatisch Informationen herausziehen lassen. Die METS/MODS-Daten sind für die unterschiedlichen Ausgaben sehr ähnlich, am Besten ist es also von einem Beispiel auszugehen, dieses zu verallgemeinern und mit einem Skript die Dateien automatisch zu erzeugen.
Zusatzaufgabe: Die vom Projekt bereitgestellten Verzeichnis der Autoren, Beiträge, Themen und erwähnten Personen und Werke ermöglichen eine gute Tiefenerschließung – was ist notwendig, damit von dieser Erschließung auf den einzelnen Beitrag in einer bestimmten Ausgabe verlinkt werden kann?
Neueste Kommentare