Weblogs Sammeln, Erschließen, Verfügbar machen und Archivieren

19. Oktober 2007 um 03:03 2 Kommentare

Ich ärgere mich ja schon seit längerer Zeit, dass praktisch keine Bibliotheken Weblogs sammeln und archivieren, obwohl diese Mediengattung bereits jetzt teilweise die Funktion von Fachzeitschriften übernimmt. Inzwischen kann ich unter den Kollegen zwar ein steigendes Interesse an Blogs feststellen (der nächste Workshop war nach kurzer Zeit ausgebucht), aber so richtig ist bei der Mehrheit noch nicht angekommen, dass hier eine mit der Einführung des Buchdrucks oder Erfindung von Zeitschriften vergleichbare Evolution im Gange ist. Ansonsten sollten doch viel mehr Bibliotheken damit beginnen Weblogs zu Sammeln, Erschließen, Verfügbar zu machen und zu Archivieren.

Anstatt erstmal darüber zu diskutieren, in welche MAB-Spezialfelder die Daten kommen und als was für eine Mediengatung Weblogs gelten, müsste nur mal einer der existierenden Open Source-Feedreader aufgebohrt werden, so dass er im großen Maßstab auf einem oder mehreren Servern läuft und wenigstens jene Feeds sammelt, die irgend ein Bibliothekar mal als sammlungswürdig eigestuft hat. Alles was wohlgeformtes XML und mit einem Mindestsatz an obligatorischen Elementen (Autor [Zeichenkette], Titel [Zeichenkette], Datum [ISO 8061], Inhalt [Zeichenkette]) ausgestattet ist, dürfte doch wenigstens so archivierbar sein, dass sich der wesentliche Teil rekonstruieren lässt – Besonderheiten wie HTML-Inhalte, Kategorien und Kommentare können ja später noch dazu kommen, wenn die Infrastruktur (Harvester zum Sammeln, Speicher zum Archivieren, Index zum Erschließen und eine Lesemöglichkeit zum Verfügbar machen) steht.

Für die Millionen von Blogartikeln, die bislang verloren sind (abgesehen von den nicht für die Archivierung zur Verfügung stehenden Blogsuchmaschinen wie Bloglines, Technorati, Google Blogsearch, Blogdigger etc.) gibt es zumindest teilweise Hoffnung:

Im September wurde RFC 5005: Feed Paging and Archiving definiert eine (auch in RSS mögliche) Erweiterung des ATOM-Formats, bei der vom Feed der letzten Einträge auf die vorhergehenden Einträge und/oder ein Archiv verwiesen wird. Im Prinzip ist das schon länger möglich und hier an einem Beispiel beschrieben, aber jetzt wurde es nochmal etwas genauer spezifiziert. Damit ist ATOM eine echte Alternative zum OAI-PMH, das zwar der Bibliothekswelt etwas näher steht, aber leider auch noch etwas stiefmütterlich behandelt wird.

Wie auch immer: Bislang werden Blogs nicht systematisch und dauerhaft für die Nachwelt gesammelt und falls Bibliotheken überhaupt eine Zukunft haben, sind sie die einzigen Einrichtungen die dafür wirklich in Frage kommen. Dazu sollte in den nächsten Jahren aber die „Erwerbung“ eines Blogs für den Bibliotheksbestand ebenso vertraut werden wie die Anschaffung eines Buches oder einer Zeitschrift. Meinetwegen können dazu auch DFG-Anträge zur „Sammlung und Archivierung des in Form von Weblogs vorliegenden kulturellen Erbes“ gestellt werden, obgleich ich diesem Projektwesen eher skeptisch gegenüber bin: Die Beständige Weiterentwicklung von Anwendungen als Open Source bringt mehr und es wird auch weniger häufig das Rad neu erfunden.

P.S.: Auf der Informationsseite der DNB zur Sammlung von Netzpublikationen findet sich zu Weblogs noch nichts – es liegt also an jeder einzelnen Bibliothek, sich mal Gedanken über die Sammlung von für Sie relevanten Weblogs zu machen.

Semantic Web aus Bibliothekssicht

14. Oktober 2007 um 23:00 2 Kommentare

Ben weist im IB-Weblog auf einen Beitrag von Allen Cho hin, der Web 3.0-Librarian-Weblog von hin, der mit Dean Giustini den Artikel The Semantic Web as a Large, Searchable Catalogue: A Librarian’s Perspective verfasst hat. Abgesehen davon, dass sie aus meiner Sicht mit einigem Durcheinander und Fehlurteilen ahnen lassen, dass über das Semantic Web ebenso viel Übertreibungen und Unsinn verbreitet werden wird, wie über Web 2.0, enthält der Artikel trotz Übertreibungen eine richtige Kernaussagen: Dokumentarische Erschließung und Semantic Web haben viele Gemeinsamkeiten. Oder wie die Autoren schreiben:

The Resource Description Framework (RDF), a method of connecting URIs in a meaningful way, is the key to making the Semantic Web possible. Making connections among and between documents and ideas is something librarians do for a living.

Nur: wieviele Bibliothekare haben sich wenigstens mal mit RDF auseinandergesetzt und zumindest die wichtigsten Eigenschaften (URIs, Unicode, Triples) verstanden? Wenn man daran denkt, welch Schattendasein FRBR nach über einem Dutzend Jahren noch immer fristet und wie noch immer eher diskutiert statt ausprobiert wird, kann man schon stark daran zweifeln, ob an der folgenden Prognose etwas dran ist:

Many of the same techniques of bibliographic control apply to the possibilities of the Semantic Web. It was the computer scientists and computer engineers who had created Web 1.0 and 2.0, but it will ultimately be individuals from library science and information science who will play a prominent role in the evolution of organizing the messiness into a coherent whole for users.

Zumindest mit „individuals from library science and information science“ haben Sie recht.

Neues von LibraryThing

1. Oktober 2007 um 23:52 Keine Kommentare

Wenn ich angemessen über all die interessanten Neuerungen bei LibraryThing berichten würde, käme ich zu gar nichts mehr, so schnell entwickelt sich die Community für Literaturfreunde. Zur Einführung habe ich vor einigen Wochen einen kurzen Artikel für das Mitteilungsblatt der Bibliotheken in Niedersachsen und Sachsen-Anhalt (mb) geschrieben (Heft 137/August 2007, leider noch nicht online).

Zu den wesentlichen Neuerungen bei LibraryThing gehören weitere Mitarbeiter (unter anderem Teilzeitmitarbeiter Giovanni, der mit seiner anderen Hälfte bei justbooks in Düsseldorf arbeitet und auch ab und zu blogt), die Verwendung von Solr (basierend auf Apache Lucene) als Suchmaschine , ein Google Book Search Search-Bookmarklet, um Google gemeinsam Identifier zu entlocken, und nun auch ein eigenes Wiki für LibraryThing.

Im WikiThing kann unter anderem eingesehen werden was die Mitarbeiter so jeden Tag treiben. Für mich interessant sind die Hinweise zur Einbindung von LibraryThing for Libraries in andere Bibliothekssysteme. Aha, Horizon Information Portal 3.x nutzt also auch XSLT zur Darstellung – ich warte ja noch, dass das für PICA freigegeben wird. Ich habe mal angefangen, die Einbindung von Katalogen in LibraryThing etwas weiter zu beschreiben.

Comics in Unterricht und Bibliotheken

25. September 2007 um 23:54 Keine Kommentare

Letzten Freitag war ich auf der Veranstaltung „Jenseits von Asterix. Über das Subgenre des Geschichtscomics“ zum Anlass des 35. Geburtstag des Göttinger Buchladen Rote Straße: Der in Didaktik der Geschichte über Comics im Geschichtsunterricht promovierende René Mounajed stellte ebenso unterhaltsam wie kenntnisreich Geschichtscomics vor und teilte diese in (soweit ich ihn verstanden habe) rein fiktive Werke (Asterix, Hägar, Sigurd …), Romane mit historischem Hintergrund (Murena, Die Entdeckung…) und dokumentarische Comics wie Maus. Leider hatte ich wegen einer anderen Verabredung nicht viel Zeit für ein anschließendes Gespräch, dafür habe ich am nächsten Tag endlich mal wieder Geld für Comics ausgegeben.

Kontrovers diskutiert wurde vor kurzem in Großbrittanien Hergés „Tim im Kongo“, da dort Neger verspottet werden, was natürlich nicht PC ist – erinnert mich daran, dass vor einiger Zeit Tom Sawyer wegen Rassismus aus einigen amerikanischen Schulbibliotheken verbannt wurde (aber dafür fehlt mir grade eine Quelleangabe).

Der Vorschlag, solch nicht mehr sachgemäßen Comics aus der Kinder- in die Forschunsabteilung umzustellen ist richtig, aber wo gibt es schon in deutschen Bibliotheken eine Forschungsabteilung mit Comics? Ich beschäftige mich schon seit einiger Zeit mit dem Thema Comics und Bibliotheken und Comicforschung und muss sagen, dass sich deutsche Bibliotheken da nicht gerade mit Ruhm bekleckern. Die beste deutschsprachige Zeitschrift (Reddition) ist beispielsweise nur in Frankfurt abonniert. Zum Glück ist die 2005 gegründete Fachzeitschrift ImageTexT Open Access. Ah, und The Comics Journal gibt es inzwischen in Kassel und Hannover, also direkt bei mir vor der Tür – in den letzten drei Jahren hat sich also doch schon etwas getan.

Und noch etwas ist mir neulich zum Thema Comics und Bibliotheken aufgefallen: es gibt in mehreren Ländern kommerzielle Comic-Bibliotheken, vergleichbar mit Videotheken.

P.S: Und zum Schluss noch der Hinweis von Michaele Seadle auf PhD Comics.

Open Source Bibliothekssysteme

19. September 2007 um 16:51 3 Kommentare

Bereits im Mai berichtete ein Entwickler bei LibLime von der Einbindung von xISBN, thingISBN und oISBN (noch so ein Dienst und zwar vom Open Source Bibliothekssystem Evergreen) in den Katalog der Nelsonville Public Library, der mit (ebenfalls OpenSource) Koha betrieben wird. Die seit 2005 aktive Firma LibLime bezeichnet sich übrigens als „Leader in Open Source for Libraries“ und reiht sich damit neben Indexdata und Talis in die Reihe der „Bibliothekssoftwareanbieter 2.0“ ein, die als Davids den Goliaths SirsiDynix (Unicorn, Horizon), Endeavor (Voyager), Innovative Interfaces (Millennium), Ex Libris (Aleph) und OCLC (PICA/Sisis) möglicherweise demnächst das Fürchten lehren. Als Distributor ist LibLime in etwa sowas wie Redhat, Suse oder Ubuntu für Linux ist. VUFind haben sie anscheinend noch nicht im Angebot und dass die deutschen Lösungen OpenBib (auch Open Source) oder XOpac (kein Open Source aber mit OpenSource gebaut) den Sprung über den großen Teich schaffen, bezweifle ich – was anscheinend bisher fehlt ist ein Anbieter, der auch in Deutschland als Distributor Open Source Bibliothekssysteme zur Verfügung stellt und den lokalen Bedürfnissen anpasst (nein, ich habe nicht vor, mich selbständig zu machen ;-).

P.S: Auf der PACINET 2008 (cool, da möchte ich auch mal teilnehmen!) gab Chris Hammond Thrasher von den Fiji-Inseln einen Vortrag zu Koha and Greenstone: open source library software in the Pacific. Meineswissens ist Koha ein richtiges integriertes Bibliothekssystem (ILS) während Greenstone als Digital Library Management System für digitale Sammlungen gedacht ist.

P.P.S: Und noch ein Beitrag was Open Source und Bibliotheken gemeinsam haben.

Der OPAC als Widget

18. September 2007 um 14:22 7 Kommentare
British Library bei iGoogle

Die British Library bietet seit kurzem ein „Gadget für iGoogle“ an, mit dem iGoogle-Nutzer die Suche im Katalog in ihrer persönlichen Startseite einbinden können. Anstatt die Suchergebnisse direkt in iGoogle anzuzeigen (was mit etwas mehr Aufwand ebenfalls möglich wäre), wird lediglich in den Katalog verlinkt – also wirklich simpelst, wenn man vernünftig in den Katalog verlinken kann. Die Implementierung besteht aus einer einfachen XML-Datei, bei Google gibt es eine ausführliche Anleitung für Entwickler. Ich habe mal ein entsprechendes Widget für den GBV-Verbundkatalog erstellt. Da ich das Widget noch nicht offiziell bei Google registriert habe, ist zum Einbinden in iGoogle rechts „Gadget hinzufügen“ auszuwählen, dann neben dem Suchschlitz „Per URL hinzufügen“ und schließlich die URL http://ws.gbv.de/widgets/iGoogle/simple-search-gso.xml eingeben.

GSO-iGoogle-Widget

Bei Bedarf kann ich das Ganze auch ausbauen und weitere Widgets für andere Kataloge erstellen – der Impuls muss allerdings deutlich von Bibliotheken kommen, die das Prinzip dann auch ihren Nutzern erklären können. Mit Technik allein lässt sich kein Katalog 2.0 gestalten!

Neben iGoogle gibt es unter anderem mit Pageflakes und Netvibes weitere Dienste um eigene Webseiten aus vorgefertigten Bausteinen zusammenzubasteln (siehe dieser Überblick oder dieser Artikel). Im Mai gab es schon bei Ning eine Diskussion zum Thema Is your OPAC an add-on or widget? aber wahrscheinlich dauert es noch etwas, bis das Widget-Prinzip ins Bewusstsein der Betreiber dringt. Als Till vor 18 Monaten schon mal testweise eine iGoogle-Einbindung für ViFas erstellt hatte, haben wir uns in der VZG noch gefragt, was dieser Spielkram denn soll und das ganze nicht weiterverfolgt. 😉

Mehr zu Schnittstellen von Bibliothekssystemen

14. September 2007 um 11:47 5 Kommentare

Angeregt durch eine Frage zu SNLP auf Inetbib habe ich anknüpfend an meine vorhergehenden Überlegungen etwas weiter im Netz nach Schnittstellen zu Bibliothekssystemen recherchiert. Leider steht der Grad deren Dokumentation im umgekehrten Verhältnis zu ihrer Vielfalt. Die von Marshall Breeding publizierte Übersicht von Bibliothekssystemen ist auch nicht gerade vollständig, so hat er anscheinend von PICA noch nicht gehört. Deshalb erheben folgende Funde auch keinen Anspruch auf Vollständigkeit:

Zunächst einmal sind als Suchprotokolle das altehrwüdige Z39.50 und dessen Nachfolger SRU/SRW zu nennen. Zum asynchronen Abholen von Metadaten gibt es OAI-PMH. OAI wurde im Rahmen der Open Access- Bewegung für Preprint-Server eingesetzt und wird noch immer vor allem für Dokumentenserver eingesetzt. Etwas zwischen Schnittstelle und Format ist OpenURL angesiedelt, das für Linkresolver entwickelt wurde und inzwischen mit COinS auch zur Übertragung von Metadaten verwendet wird.

Was weitere Schnittstellen angeht sieht es leider etwas dürftig aus was die freie Verfügbarkeit betrifft. Die SirsiDynix-Werbeseite auf der statt auf Dokumentation auf Fortbildungen verwiesen wird, finde ich da symptomatisch: Es gibt zwar überall etwas aber jedes System hat seine eigene Schnittstelle, auf die sowieso nicht von Außen zugegriffen werden kann. Dazu gehört auch das Simple Library Network Protocol (SLNP), welches als interne API für Bibliothekssysteme der Sisis Informationssysteme GmbH entwickelt wurde und inzwischen auch von anderen Systemen wie Aleph, Bibliotheca unterstützt wird, um die Fernleihe zu koordinieren. Das alles spielt sich aber rein intern ab und hat mit Web 2.0 und Bibliotheks-Mashups noch nichts zu tun.

Auch im Open-Source-Bereich sieht es nicht besser aus. Für Koha ist bislang nur eine API geplant und die OpenSRF benannte API des ebenfalls freien Evergreen ist in seiner Unübersichtlichkeit und Komplexität auch eher für interne Zwecke gedacht. Die Talis API (siehe Dokumentation) sieht ganz gut durchdacht aus und wäre wahrscheinlich für viele Anwendungen brauchbar, aber ich kenne kein Bibliothekssystem, das sie unterstützt – dass so im luftleeren Raum dauerhaft verlässliche Schnittstellen entstehen, bezweifle ich. Etwas besser sieht die Open Library WebServices aus, die Oliver Flimm zur Anbindung von SISIS-Systemen an OpenBib entwickelt hat.

Worauf ich jedoch warte sind weitere Schnittstellen, die ohne großen Aufwand als Webservices auch von Außen benutzt können. Beispielsweise wäre nicht nur für Anbieter wie Bücherwecker eine API hilfreich, mit der Nutzer ihre Ausleihen samt Rückgabedatum abfragen können. Glücklicherweise hat – wie dem Vortrag von Norbert Weinberger auf der GBV Verbundkonferenz zu entnehmen ist – auch OCLC die Zeichen der Zeit erkannt und will in Zukunft mit einem „WorldCat Grid“ mehr in Richtung Serviceorientierte Architektur gehen. Ich bin gespannt, was sich da alles ergibt.

Falls keine API existiert oder diese nicht ausreichend dokumentiert ist, muss man wohl erstmal direkt auf die interne Datenbank des Bibliothekssystems zugreifen und selber etwas stricken. Das ist in der Regel aber nur dem Anbieter möglich und stellt keine nachhaltige Lösung dar. Bei Horizon soll das ganz gut gehen, hab ich mir sagen lassen. Möglicherweise kann auch noch mehr aus den Katalogdaten rausgeholt werden, die über Z39.50 oder SRU erhältlich sind. Bei PICA-Systemen steht der Ausleihstatus eines Mediums (ausleihbar, ausgeliehen, Präsenzbestand…) zum Beispiel anscheinend in Feld 201@, so sicher bin ich mir da aber nicht.

Für weitere Recherchen zum Thema habe ich im GBV Wiki habe ich vor einigen Wochen etwas mehr zu Webservices zusammengesammelt.

Katalog 2.0-Projekt Beluga mit eigenem Blog

13. September 2007 um 17:50 Keine Kommentare

Auf der 11. GBV-Verbundkonferenz wurde unter anderem das Hamburger Projekt Beluga vorgestellt. Aktuelles gibt es im Beluga-Blog, wo Anne Christensen verschiedene Katalog 2.0-Projekte vorstellt. Wie sie selbst in netbib schreibt polarisiert das Label “Katalog 2.0″ jedoch und hält zu sehr von einer Diskussion um das Wesentliche ab. Ich würde es folgendermaßen auf den Punkt bringen:

Es geht nicht darum, einen „Katalog 2.0“ zu schaffen, sondern bestehenden Kataloge der fortschreitenden Entwicklung anzupassen und diese mitzugehen und zu gestalten. Wie Markus Krajewski ebenso unterhaltsam wie lehrreich in seinem Buch „Zettelwirtschaft“ (ISBN 3-931659-29-1) darstellt, war auch der Weg zum Zettelkatalog mühsam. Ebenso ist mit der Einführung des OPAC das Bibliothekarische Abendland nicht untergegangen. Katalog 2.0 ist auch nichts, was von heute auf morgen eingeführt wird oder das es bei irgendeiner Firma fertig zu kaufen gibt. Wie der Katalog in 20 Jahren aussehen wird, kann niemand vorhersagen, aber dass er sich ändert halte ich für unzweifelhaft. Die Aufgabe eines Bibliothekars besteht nun darin, sich darüber Gedanken zu machen, was geändert werden kann und soll und diese Änderungen umzusetzen. Wer ganz vorne bei der Diskussion dabei sein möchte, sollte sich die seit letztem Jahr bestehende Mailingliste Next Generation Catalogs for Libraries (NGC4Lib) zu Gemüte führen.

Feedback aus der Blogosphäre zur Beluga-Ankündigung gibt es unter anderem bei Text & Blog, Wortgefecht und Blognation [en] – mehr gibt es über einen Suchfeed.

Data Sharing Summit und OpenID in Bibliotheken

6. September 2007 um 00:44 2 Kommentare

Mein Beitrag zur Geschlossenheit von Web 2.0-Diensten von letzter Woche war vielleicht etwas zu pessimistisch. Einem Beitrag von Dare Obasanjo auf den ich durch einen Beitrag von Lambert Heller gestoßen bin, entnehme ich den Hinweis auf den das Data Sharing Summit. Auf der am kommenden Wochenende im kalifornischen Richmond stattfindenden Veranstaltung soll es um die Interoperabilität von Sozialen Softwarediensten gehen (siehe Themensammlung).

Wie Dare Obasanjo schreibt ist es zwar technisch (mit OpenID) machbar aber aufgrund ihrer konkurrierenden Geschäftsmodelle unwahrscheinlich, dass sich jemand mit einem Facebook-Account bei MySpace anmelden und die jeweils beim anderen Dienst gesammelten Kontakte nutzen kann. Wie D’Arcus bemerkt würde die Verknüpfung von Benutzerprofilen auch für bibliographische Dienste wie Zotero, CiteULike, RefBase und Bibsonomy sehr interessant und dort eher möglich sein.

Da frag ich mich doch, welche Bibliothek bereits OpenID für ihre Benutzeraccounts unterstützt oder die Unterstützung plant. Dass man gleich den Benutzernamen und Passwort bei einem anderen Dienst eingeben muss, kann ja nicht der Weisheit letzter Schluss sein. Diese Lösung nutzt übrigens der überaus hilfreiche Bücherwecker, der ebenso wie ZACK aus einer Abschlussarbeit entstanden ist. Ich hoffe, dass sich mal eine Bibliothekseinrichtung der Sache annimmt und dabei hilft, daraus einen stabilen Webservice für alle Bibliotheken zu erstellen anstatt dass eine Erinnerungsfunktion mehr schlecht als recht in jeder einzelnen Bibibliothessoftware nachprogrammiert werden muss.

Im Bibliotheksbereich gewinnt zum Glück Shibboleth an Bedeutung, aber davon kann ich mich leider trotzdem noch nicht mit meinem Wikipedia- oder LibraryThing-Account bei der nächsten Stadtbücherei anmelden (übrigens kommt Single Sign on für die Wikimedia-Projekte ganz bestimmt … irgendwann ;-).

Little more about The European Library (TEL)

24. August 2007 um 00:17 1 Kommentar

Patrick, who is enjoying the Winter in South Africa, went down well with his presentation (but I cannot find the slides?). In his blog he pointed out before IFLA that you can find more about The European Library (TEL) in Fleur Stigter’s blog. There is also a blog about the European Digital Library (EDL, very confusing) and a customized search engine for the projects. But I still have not found out what TEL and EDL are really about. To me as a library 2.0 developer one of the most interesting features of TEL is its SRU-interface which showed me that data quality needs to be the next hype. By the way TEL is hiring. If I could clone myself, I would apply here. In the context of Theseus there will surely also be some interesting jobs. Skilled library (2.0) developers where are you? Not every organization can do a hunt on you and reward 1.000$ like LibraryThing just did!