How to encode the availability of documents

23. Oktober 2009 um 12:50 2 Kommentare

Since almost a year I work on a simple encoding format and API to just get the current (!) availability status of documents in libraries. Together with Reh Uwe (hebis network) and Anne Christensen (beluga project) we created the Document Availability Information API (DAIA) which is defined as data model with encoding in XML and JSON (whichever you prefer).

This week I finished and published a reference implementation of the DAIA protocol as open source Perl-module at CPAN. The implementation includes a simple DAIA validator and converter. A public installation of this validator is also available. The next tasks include implementing server and client components for several ILS software. Every library has its own special rules and schemas – Jonathan Rochkind already wrote about the problems to implement DAIA because of ILS complexity. We cannot erase this complexity by magic (unless we refactor and clean the ILS), but at least we can try to map it to a common data model – which DAIA provides.

Core components of the DAIA data model

With the DAIA Perl package you can concentrate on writing wrappers from your library systems to DAIA and easily consume and evaluate DAIA-encoded information. Why should everyone write its own routines to grab for instance the HTML OPAC output and parse availability status? One mapping to DAIA should fit most needs, so others can build upon. DAIA can not only be helpful to connect different library systems, but also to create mashups and services like „Show me on a map, where a given book is currently hold and available“ or „Send me a tweet if a given books in my library is available again“ – If you have more cool ideas for client applications, just let me know!

In the context of ILS Discovery Interface Task Force and their official recommendation DAIA implements the GetAvailability method (section 6.3.1). There are numerous APIs for several tasks in library systems (SRU/SRW, Z39.50, OpenSearch, OAI-PMH, Atom, unAPI etc.) but there was no open, usable standard way just to query whether a copy of given publication – for instance book – is available in a library, in which department, whether you can loan it or only use it in the library, whether you can directly get it online, or how long it will probably take until it is available again (yes, I looked at alternatives like Z39.50, ISO 20775, NCIP, SLNP etc. but they were hardly defined, documented, implemented and usable freely on the Web). I hope that DAIA is easy enough so non-librarians can make use of it if libraries provide an API to their system with DAIA. Extensions to DAIA can be discussed for instance in Code4Lib Wiki but I’d prefer to start with this basic, predefined services:

  • presentation: an item can be used inside the institution (in their rooms, in their intranet etc.).
  • loan: an item can be used outside of the institution (by lending or online access).
  • interloan: an tem can be used mediated by another institution. That means you do not have to interact with the institution that was queried for this item. This include interlibrary loan as well as public online ressources that are not hosted or made available by the queried institution.
  • openaccess: an item can be used imediately without any restrictions by the institution, you don’t even have to give it back. This applies for Open Access publications and free copies.

Ãœbersicht Social-Cataloging-Plattformen

12. Oktober 2009 um 22:39 4 Kommentare

Anknüpfend an die inzwischen schon etwas veraltete Übersicht webbasierter Literaturverwaltung und an die provokante Frage, ob und wie Bibliotheken das Katalogisieren lieber den Nutzern überlassen sollten, habe ich zusammen mit Silvia Czerwinski folgende Übersicht von Social-Cataloging-Plattformen zusammengestellt. Ausgenommen sind an dieser Stelle Dienste zur gemeinsamen (wissenschaftlichen) Literaturverwaltung wie Mendeley, CiteULike, Connotea und BibSonomy sowie webbasierte OpenSource-Software wie WIKINDX und Aigaion.

Die größten Social-Cataloging Plattformen für Bücher sind LibraryThing und GoodReads gefolgt von ähnlichen Dienste wie aNobii (benannt nach dem Bücherwurm Anobium Punctatum) und Shelfari. Im Open Library Project wird ebenfalls gemeinsam katalogisiert, wobei automatische Massenimports den Großteil ausmachen. Daneben gibt es Buch-Communities wie weRead (vor allem verbreitet in Sozialen Netzwerken wie Facebook, Orkut, MySpace etc.), bookJetty und BookCrossing sowie aus dem deutschsprachigen Raum Quillp und Lovelybooks. Bei diesen Communities handelt es sich jedoch nicht um vollständige Katalogisierungsplattformen, da hier nur persönliche Listen, Bewertungen und Kommentare zu bereits vorhandenen Büchern angelegt werden können. Dafür bietet Quillp die Möglichkeit, eigene Manuskripte hochzuladen und von anderen Lesern bewerten zu lassen. Die Verknüpfung mit Bibliotheken ist vor allem bei LibraryThing und bei bookJetty ausgeprägt.

Die Inhalte des größten und einflussreichsten Filmkatalogs, der Internet Movie Database (IMDb), werden ebenfalls von den Benutzern gesammelt. ImDb ist im Besitz von Amazon.com, das auch Shelfari und über Abebooks eine 40%ige Beteiligung an Librarything hält. Weitere Film-Communities ohne Katalogisierungsmöglichkeit sind u.a. Flixster und Criticker.

Zur gemeinschaftlichen Katalogisierung von Audio-Publikationen (vor allem Musik) gibt es Discogs, MusicBrainz, MusicMoz und freeDB. Im Gegensatz zu reinen Musik-Communities wie Last.fm und Rate Your Music steht nicht die Bewertung, Kommentierung und Gruppierung von Musik im Mittelpunkt, sondern die Erschließung von Künstlern, Gruppen, Stücken, Veröffentlichungen und Herausgebern. Eine Zusammenarbeit mit Institutionen wie dem Deutschen Musikarchiv oder der GEMA findet – abgesehen von der gegenseitigen Verwendung als Quelle – bislang nicht statt.

Herausragend in der Tiefenerschließung sind Social-Cataloging-Plattformen für Spezialbereiche, wie zur Katalogisierung von Comics (Grand Comic-Book Database), Computerspielen (MobyGames) oder Animes und Mangas (MyAnimeList). Hier zeigt sich, dass engagierte Nutzer in Masse einfach unschlagbar sind: ebenso wie Wikipedia dank Tausender von Freiwilligen umfangreicher und detaillierter als jede herkömmliche Enzyklopädie werden konnte, können spezialisierte Social-Cataloging-Plattformen wie LibraryThing, IMdB und die Grand Comic-Book Database ihren Sammlungsgegenstand umfangreicher und tiefer erschließen als es eine überschaubare Zahl von Bibliothekare oder Dokumentare je schaffen – allerdings nur unter der Vorraussetzung, dass eine kritische Masse und eine leistungsfähige und einfach zu bedienende Katalogisierungsoftware vorhanden sind.

LibraryThing doppelt so populär wie WorldCat

4. Oktober 2009 um 01:50 5 Kommentare

Als Mitte dieses Jahrzehnts Wikipedia immer populärer wurde, verfolgten die Wikipedianer das exponentielle Wachstum gespannt anhand der Zugriffsstatistiken der am häufigsten aufgerufenen Webseiten. Inzwischen liegt die freie, kollaborative Enzyklopädie laut Alexa.com nach Google, Facebook, Yahoo, YouTube und Windows Live auf Platz 6: 10% aller Internetnutzer eines Tages rufen mindestens einmal Wikipedia auf und verbringen dort durchschnittlich 5 Minuten. Einen ähnliche Analyse hat sich Tim Spalding für seine kollaborative Bibliographie und Literaturplattform LibraryThing angesehen und herausgefunden, dass LibraryThing fast doppelt so viel Traffic wie WorldCat hat. Die Zahlen stammen von compete.com; bei Alexa sehen die Zugriffszahlen ebenso aus – und LibraryThing wächst deutlich schneller als WorldCat. Genaugenommen könnten die Zahlen von LibraryThing noch etwas höher sein, da Aufrufe von anderen Domains als librarything.com, beispielsweise librarything.de nicht direkt mitgezählt werden. Was bedeutet das für Bibliotheken?

LibraryThing vs. WorldCat

LibraryThing vs. WorldCat (% der Internetnutzer eines Tages)

Als ich Wikipedia vor dreieinhalb Jahren auf dem Bibliothekartag vorstellte [PDF], war die Seite noch auf Platz 18 und wurde damit schon vermutlich mehr besucht als alle Bibliothekswebseiten zusammen – LibraryThing war damals gerade ein halbes Jahr alt. Der Vergleich von Wikipedia mit Bibliothekswebseiten war natürlich unangemessen und sollte nur verdeutlichen, warum sich Bibliotheken mit Wikipedia auseinandersetzen sollten. Wikipedia ist inzwischen auch für Bibliothekare eine ernstzunehmende Institution (wobei die Zusammenarbeit mit der Deutschen Nationalbibliothek im obrigkeitshörigen Bibliothekswesen wahrscheinlich mehr wiegt als alle Nutzerinteressen) – wie sieht es mit LibraryThing aus?

Während groß und breit diskutiert wird, ob und wie deutsche Bibliothekskataloge in WorldCat eingebunden werden können, warte ich mitlerweile seit Jahren darauf, dass Bibliotheken ernsthaftes Interesse and LibraryThing zeigen und als Partner wahrnehmen. Liegt es daran, dass die Mitarbeiter von LibraryThing noch genügend Zeit und Spaß dafür haben, das Benutzerinterface in Piratensprache zu übersetzen? Oder dass Belletristik den Hauptbestand in LibraryThing ausmacht? Oder dass die Suchfunktion von LibraryThing das einzige ist das fast noch schlechter ist als in herkömmlichen OPACs? (Hintergrund: LibraryThing setzt mehr auf Browsing statt daneben die Suche auszubauen und herkömmliche OPACs verwenden Boolesches Retrieval statt Vektorraum-Suche).

Ich denke, dass Bibliotheken zum einen institutionell träger sind als ein kleines Startup, dass nicht dauernd Fördergelder für befristete Stellen beantragen muss, aber zum anderen auch träger in der Wahrnehmung der stattfindenden Digitalen Revolution. Statt zu schauen, was Wikipedia und LibraryThing erfolgreich macht und wo mit ihnen kooperiert werden kann, wird neidisch auf andere Bibliotheken geguckt und einem verblassendem Bild der Bibliothek als Wissenshort nachgehangen. Dabei wird in Zukunft weder die Katalogisierung noch der eigene Bestand die Relevanz einer Bibliothek ausmachen. Katalogisieren können sowieso besser die Nutzer (wenn man ihnen die richtigen Werkzeuge in die Hand gibt) und der „eigene“ Bestand erübrigt sich durch Digitalisierung und bessere Lesegeräte. Was bleibt ist die Fokusierung auf den Nutzer – und das haben sowohl Wikipedia als auch LibraryThing von Anfang an verinnerlicht .