Die Citation Style Language (CSL) als Metadatenformat

29. April 2010 um 16:39 6 Kommentare

Auf der Code4Lib Mailingliste hat Tim Spalding vor einigen Tagen die Idee aufgeworfen, die angekündigten Twitter Annotations zur Übertragung von bibliographischen Daten zu verwenden. Die Beteiligten waren alle der Meinung, das bibliotheksspezifische Formate wie MARC und MODS unpassend sind; BibTeX scheidet ebenfalls aus.

Nach der Überlegung, dass Identifikation und Beschreibung zwei klar abzugrenzende Aufgaben von bibliographischen Daten sind, habe ich mir mal genauer die Citation Style Language (CSL) angeschaut. CSL wird unter Anderem in den Literaturverwaltungsprogrammen Zotero und Mendeley benutzt, um Literaturangaben in unzähligen Zitationsstilen ausgeben zu können. Die Grundidee von CSL ist, Zitationsstile als CSL-Styles zu definieren, mit denen dann ein CSL-Prozessor aus bibliographischen Datensätzen schön formatierte Literaturangaben und Bibliographien erstellt. Der am weitesten fortgeschrittene CSL-Prozessor ist citeproc-js. Er ist in JavaScript geschrieben und wurde als Modul aus dem Programmcode von Zotero herausgelöst, so dass er auch unabhängig verwendet werden kann (allerdings bislang noch nicht mit allen JavaScript-Interpretern).

Die Idee ist nun, das CSL-Eingabeformat als Metadatenformat für bibliographische Daten in Twitter-Annotationen zu verwenden. Im Code4lib-Wiki habe ich mal zusammengefasst, was ich zur Spezifikation des CSL-Eingangsformat gefunden habe. Das Metadatenformat ist ziemlich einfach aufgebaut und soll sich dem Entwickler Frank Bennett nach in einer kommenden Zotero-Version auch einfacher aus dem Programm exportieren lassen.

Zur Vermeidung des Umwegs über Zotero fehlen nur Exportmöglichkeiten von CSL-Eingangsdaten aus Bibliothekskatalogen. Deren Titel könnten dann automatisch mit CSL in hunderten von Zitierstilen exportiert werden. In Beluga wird dazu übrigens bislang refbase verwendet, das ebenso wie der CSL-Prozessor citeproc-js als Open Source verfügbar ist. Für die Wikimedia-Projekte bietet sich das Format ebenso an – so könnten die Leser auswählen, welchen Zitationsstil sie bevorzugen und Literaturangaben aus Wikipedia-Artikeln direkt in ihre Literaturverwaltung übernehmen.

BibRecord: Wikipedia als Literaturdatenbank

28. August 2009 um 22:48 2 Kommentare

Während die Wikimania 2009 ohne mich zu Ende geht (Videomitschnitte hier) habe ich heute mal wieder etwas mehr in Wikipedia getan und das bereits Ende 2008 erwähnte Projekt einer zentralen Wikimedia-Literaturdatenbank weiterverfolgt. Das Konzept sieht vor, einen Katalog aller Publikationen zu erstellen, die in Wikipedia-Artikeln zitiert werden. Wie bei Bildern, Videos und Audiodateien, die zentral in Wikimedia Commons verwaltet werden, sollen Literaturangaben mit einem einfachen Verweis in beliebige Artikel eingebunden werden (siehe BibRecord-Dokumentation).

Die Referenzierung der Publikationen geschieht über Identifikatoren wie ISBN, DOI, URN, Google-Books-ID, OCLC-ID und (falls die deutschen Bibliotheksverbände endlich die Relevanz von Identifikatoren wahrnehmen und entsprechend agieren) EKI. Für Titel ohne ID könnte zudem ein Bibkey-Verfahren verwendet werden. Um in Wikipedia eine bereits beschriebene Publikation zu referenzieren, genügt eine Vorlageneinbindung nach folgendem Muster:

{{BibISBN|0801857899}} (bei bekannter ISBN) oder
{{BibDOI|10.1038/35057062}} (bei bekannter DOI)

Der Zitierstil kann per format-Parameter angepasst werden (später sollte ggf. die Citation Style Language unterstützt werden). In der ISBN-Suche von Wikipedia werden bekannte Publikationen automatisch angezeigt. Die Zahl der unterstützen Datenfelder ist bislang noch etwas begrenzt und die Literaturangaben werden noch nicht in einer eigenen Datenbank, sondern in Form von Wikipedia-Seiten gespeichert (siehe ISBN/…, DOI/…). Dies geschieht mit Hilfe von Vorlage:BibRecord. Alles weitere (Import aus anderen bibliographischen Datenbanken, Werkverknüpfungen, Katalogsuche etc.) kommt getreu der Web-2.0-Philosophie des „Perpetual Beta“ – nicht zu verwechseln mit „Relaunch“ – später.

Zwei Artikel zu Hochschulbibliografien und zur WorldCat Policy im Bibliotheksdienst

22. März 2009 um 18:45 1 Kommentar

In der März-Ausgabe des Bibliotheksdienst (Jahrgang 43/2009) ist ein Artikel zu Hochschulbibliografien erschienen, den ich zusammen mit Franziska Scherer an der Fachhochschule Hannover geschrieben haben: „Hochschulbibliografien an deutschen Hochschulen. Eine vergleichende Bestandsaufnahme„. Bei E-LIS habe ich eine Postprint-Version veröffentlicht, dort ist zusätzlich noch die Hochschulbibliografie der TU Darmstadt aufgeführt.

In der selben Ausgabe findet sich der Artikel „OCLC, WorldCat und die Metadaten-Kontroverse“ von Adrian Pohl (auch als Online-Version verfügbar). Adrian, der übrigens seit kurzem einen eigenen Blog betreibt, fasst darin übersichtlich die Kontroverse zur „Policy for Use and Transfer of WorldCat Records“ zusammen, so dass man sich nun auch auf Deutsch darüber gut einen Ãœberblick verschaffen kann. Ich bin ja persönlich der Meinung, dass bibliographische Daten wie beispielsweise WorldCat frei sein sollten, die passenden Lizenzen gibt es bald oder jetzt schon. Wenn allerdings, wie Adrian ausführt, OCLC ein Drittel seiner Einnahmen durch Lizensierung der Daten und WorldCat-Dienste macht, kann ich auch verstehen, dass sie sich nicht gleich hinter freie bibliographische Daten stellen. Schade für OCLC.

Ãœbersicht webbasierter Literaturverwaltung

9. April 2008 um 15:28 8 Kommentare

P.S.: Unter http://literaturverwaltung.wordpress.com gibt es inzwischen ein von Bibliothekaren betriebenes Portal zum Theme Literaturverwaltungsprogramme.

Einen Ãœberblick über „Webbasierte Literaturverwaltung“ gab Thomas Stöber von der UB Augsburg in seinem Vortrag zusammen mit Astrid Teichert auf der INETBIB 2008. Das Thema ist eigentlich nicht neu, aber nicht jeder hat die Zeit und Muße, sich selber mit RefWorks, citeulike, Connotea und BibSonomy im Vergleich zu EndNote und Citavi zu beschäftigen – außerdem sollte man das Firefox-Plugin Zotero kennen.

Auf der einen Seite stehen die traditionellen, „geschlossenen“ Systemen (EndNote, Citavi), bei denen ein Nutzer für sich alleine bibliographische Daten sammelt und verwaltet. „Halboffene“ Systeme (EndNote Web, RefWorks) bieten als Webanwendungen zusätzlich die Möglichkeit, Daten für andere Nutzer freizugeben. Bei „Offenen“ Systeme ist der Nutzerkreis prinzipiell offen und alle bibliographischen Daten werden miteinander geteilt.

Die offenen Literaturverwaltungs-Systeme bieten neue Kooperationsmöglichkeiten im Bereich Forschung und Lehre, Stöber zitierte Lambert Hellers Hinweis auf die Möglichkeit „Informeller Gemeinschaftsbibliographien„. Dabei lassen sich aus seiner Sicht drei wesentliche Anwendungszenarien unterscheiden:

(1) Freigabe des eigenen Datenpools mit Lesezugriff, z.B. Literaturlisten für Lehrveranstaltungen, Bibliographien, eigene Schriftenverzeichnisse etc. (RefWorks…)

(2) Geschlossene Arbeitsgruppen arbeiten gemeinsam an Bibliographien (EndNote Web, BibSonomy…)

(3) Gemeinsamer, offener Datenpool (BibSonomy…)

Für die weitere Entwicklung stellen sich angesichts der rasanten Entwicklungen im Bereich webbasierter Literaturverwaltung folgende Fragen:

(1) Ist die offene, gemeinschaftliche Arbeiten an Bibliographien ein realistisches Modell für eine offene Wissenschaft? Laura Cohen spricht schon begeistert von „Social Scholarship (wobei meiner Meinung nach dabei eher Blogs von Bedeutung sind, siehe blogs as scholarship von Georgia Harper und als Beispiel Research Blogging). Viele Wissenschaftler möchten jedoch vermutlich nur ungern ihre Literaturlisten offenlegen (was meiner Meinung nach nicht unbedingt für die Qualität ihrer Forschung spricht).

(2) Sind OpenSource-Anwendung aktuell und zukünftig eine echte Alternative zu kommerziellen Systemen? Thomas Stöber konnte diese Frage nicht bejahen – ich denke vor allem bei der Usability hat OpenSource regelmäßig Probleme.

(3) Wie entwickeln sich Bibliographie-Verwaltungssysteme weiter? Zur Zeit ist eine Konvergenz der Funktionen zu beobachten, so dass sich die verschiedenen Systeme im Kern immer weniger unterscheiden.

In der anschließenden Fragerunde meldeten sich vor Allem die „üblichen Verdächtigen“ (Till Kinstler, Lambert Heller, Patrick Danowski) zu Wort – ich war zu sehr mit der Formulierung dieses Beitrags beschäftigt und kann der Einführung nichts wesentliches hinzufügen. Mir fehlte nur etwas Zotero. Herr Stöber wies darauf hin, dass sich das Programm in erstaunlich kurzer Zeit zu einer vollwertigen Literaturverwaltung entwickelt hat. Dem in der Diskussion gebrachten Hinweis auf die Notwendigkeit von Werbung und Benutzerschulungen kann ich mich nur anschließen.

P.S.: Eine tabellarische Übersicht von Programmen zur Literaturverwaltung gibt beim Max Planck Institut für Biochemie.