BibSonomy und Kataloge verknüpfen mit dem Bibkey

25. April 2008 um 15:46 2 Kommentare

Anknüpfend an einen Workshop zum Thema „Social Tagging in Bibliotheken“ und an Gespräche auf der INETBIB 2008 gab es Ãœberlegungen, Bibliothekskataloge mit der webbasierten Literaturverwaltung BibSonomy zu verknüpfen (siehe auch die Diplomarbeit von Annett Kerschis auf die Patrick hingewiesen hat).

Zum einen sollen Nutzer Einträge aus dem Katalog direkt in BibSonomy abspeichern können (wie bereits der KUG und HEIDI anbieten) – der einfachste Weg dazu ist ein BibTeX-Export. Zum anderen soll per Webservice BibSonomy abgefragt werden, ob und mit welchen Tags dort bereits ein Titel von Nutzern gespeichert wurde. Ein grundsätzliches Problem dabei ist jedoch, erst einmal den Titel zu identifizieren, nach dem gesucht werden soll. Die dahinter liegende Aufgabenstellung ist ein klassisches (nicht nur) Bibliothekswissenschaftliches Forschungsfeld: Duplikaterkennung in bibliographischen Datenbanken. BibSonomy ist dabei auf eine ähnliche Lösung gekommen, wie sie teilweise in Katalogen angewandt wird: Aus verschiedenen Feldern (Titel, Autor, Jahr…) wird durch Normalisierung und mittels einer Hashfunktion eine Zeichenkette als Identifikator („Hashkey“) gebildet. Dubletten sollen dabei möglichst auf den gleiche Hashkey abgebildet werden. Der übergreifende Hashkey von BibSonomy heisst dort „Interhash“.

Ich bin momentan dabei, diesen Hashkey zu spezifizieren (Unter dem Namen „Bibkey Level 1“) und zu implementieren – der Bibkey kann hier ausprobiert werden. In diesem Beispiel wird der Titel über die ISBN aus den GBV-Verbundkatalog geholt und aus den Daten der Bibkey gebildet (serverseitig, Link „Go to record in GSO“). Mit dem Bibkey wird dann über eine weitere API von BibSonomy (die ich als „SeeAlso“-verpackt habe) abgefragt ob den Titel schon jemand in seiner Sammlung hat (clientseitig, Link „Available in BibSonomy“).

Wie alle Heuristiken funktionier der Bibkey in seiner jetzigen Form nicht in jedem Fall. In diesem Beispiel wird bei BibSonomy nichts gefunden, weil die meisten Nutzer „Albert-László Barabási“ Nicht richtig buchstabieren können. Auch verschiedene Auflagen kommen aufgrund unterschiedlicher Jahreszahl nicht zusammen. Es ist also noch genügend Forschungs- und Entwicklungsbedarf. Auch für den Einsatz von FRBR wird über Hashkeys nachgedacht, wie dieser Vortrag von Rosemie Callewaert auf der ELAG2008 zeigt.

Weitere Literatur zum Thema „Hashkeyverfahren zur Duplikaterkennung in bibliographischen Daten“ sammle ich dank hilfreicher Hinweise mit dem Tag „bibkey“ – falls jemand seine Bachelor/Master-Arbeit dazu machen möchte, helfe ich gerne! 🙂

Mashups zusammenklicken mit Mashup-Editoren

25. September 2007 um 01:17 Keine Kommentare

Wie heise vermeldet (und viele andere, darunter Talis in einer Semantic-Web-Linkliste) gibt es mit Intels Mashup Maker nach Google Mashup Editor schon den zweiten großen (noch-)Vaporware-Mashup-Editor. Weitere dieser webbasierten, graphischen Benutzeroberflächen, mit denen sich verschiedene Datenquellen verknüpfen und relativ einfach Skripte zur automatischen Verarbeitung und Anreicherung von Daten erstellen lassen, sind Yahoo Pipes, Microsoft Popfly, QEDWiki und Piggy Bank – je weiter man die Definition fasst, desto mehr Tools zur Datenextraktion und Informationsintegration gibt es. Mit dem Trend, immer mehr Daten überhaupt irgendwie strukturiert (Microformats, unAPI etc.) oder sogar in einer gemeinsamen virtuellen Datenbank (Semantic Web) anzubieten, dürfte das Gemische noch mehr zunehmen – nach dem ersten großen Rausch sollte dann allerdings hoffentlich auch klar werden, dass Themen wie Informationsqualität und Data Lineage (=woher stammen die Daten eigentlich?), Datenvisualisierung und Interface-Design ebenfalls wichtig sind und dass Daten ohne (sozialen) Kontext erstmal keinen Mehrwehrt dastellen, egal wie toll sie gemischt werden.

In jedem Fall interessant zu sehen, dass nicht mehr nur Informatiker Daten hin- und herschieben können. Die Bibliothekare sind nicht die Einzige Zunft, deren praktische Tätigkeit mehr und mehr von Laien beherrscht wird, während der theoretische Hintergrund erstaunlich unbekannt bleibt 😉

P.S.: Bei all den verschiedenen Mashup-Diensten muss natürlich irgendwann wieder vereinheitlicht werden: Netvibes hat mit der Universal Widget API (UWA) eine JavaScript-API vorlgelegt, mit deren Hilfe Anwendungen auch bei iGoogle, Apple Dashboard u.A. eingesetzt werden können. Fehlt nur noch ein universeller Mashup-Editor, der UWA ausspuckt. Kommen jetzt nach dem Browserkrieg die Mashup-Kriege? [via heise]