GBV verlinkt auf Wikipedia mit SeeAlso-Linkserver

14. November 2007 um 17:17 8 Kommentare

Da es anscheinend bisher niemand in der Biblioblogosphere gemerkt hat und da ich es gerade auf dem Sun-Summit in Frankfurt vorgestellt habe, möchte ich hiermit auf einen neuen Webservice des GBV hinweisen: Mit SeeAlso werden seit Ende letzter Woche dynamisch im GBV-Katalog Links auf Wikipedia-Artikel eingeblendet, in deren Literaturangaben ISBN-Nummern enthalten sind: hier ein Beispiel. Das ganze läuft zunächst als Beta-Test und daher noch etwas langsam – dafür können die Linkserver hier ausprobiert werden; unter Anderem gibt es auch Links auf LibraryThing und VD17. Ideen für weitere Linkserver nach dem SeeAlso–Prinzip sind herzlich willkommen. Sobald die Server-Software als Open Source publiziert wird, können auch andere Einrichtungen eigene Linkserver anbieten. Die Einbindung in eigene Anwendung (vor allem Kataloge) funktioniert schon jetzt – happy mashuping!

Karten im Netz

7. November 2007 um 18:11 6 Kommentare

Google Maps kennt inzwischen jeder, aber was gibt es darüber hinaus und wie stellen Bibliotheken ihre Karten im Netz dar? Die folgende Ausarbeitung von Tatjana Frolow zeigt, dass hier noch viel Entwicklungspotential besteht. Weitere Quellen zum Thema gibt es in der Literaturliste.

Die Entwicklung des Internets und der allgemeine Fortschritt der Informations- und Kommunikationstechnologie treiben die Nachfrage nach geokodierten Daten an und machen die neuen Karten zu einem Werbemedium der Zukunft. Beispiele für Karten in Netzen sind Map24, Google Maps , Yahoo Maps , ViaMichelin und viele andere. Ähnlich bei allen Anbietern ist die Oberfläche, die eine Adresssuche, einen Routenplaner die elektronische Karte selbst und ggf. standardbezogene Informationen (Hotels usw.) zur Verfügung stellt. Die Landkarten werden meistens in den drei Ansichten der reinen Straßenkarte, der Satellitenansicht und der Hybridansicht, einer Komination aus reiner Straßenkarte und Satellitenansicht, präsentiert. Trotz vieler Gemeinsamkeiten gibt es jedoch auch Unterschiede nicht nur in den Funktionen, sondern vor allem auch in der Qualität. So bietet ViaMichelin z.B. nur die Ansicht einer reinen Straßenkarte , Yahoo Maps lässt bei der Satellitenansicht nicht nah genug ranzoomen und Map24 beschreibt die Route in ganzen Sätzen, andere Anbieter nur stichwortartig. Eine besondere Funktion bei Google Maps ermöglicht es die Route mit der Maus per Drag and Drop zu verändern. Automatisch ändert sich dadurch auch der Beschreibungstext zur Route samt Kilometerzahl und Fahrtdauer. Eine Änderung der Route ist bei der Konkurrenz nur via Eingabemaske möglich. Google Maps und Map24 sind sowohl von der Schnelligkeit, als auch von der Grafik qualitativ am besten. Beide basieren auf Vektorgrafiken, (Computerbilder aus Kreisen, Linien und Polygonen), und liefern somit realistischere Ergebnisse als bei der Pixelgrafik. Das zu übertragende Datenvolumen ist geringer, das Laden der Karten schneller und das Zoomen flüssiger.

Neu im Kartenbusiness ist das Interaktive Mapping, dass jedem Nutzer ermöglicht seine eigene Karte zu entwerfen, eigene Informationen einzusetzen, zu speichern und anderen zur Verfügung stellen. Karteninformationen können also mit eigenen Informationen verknüpft werden. Einen Boom erlebte diese Bewegung mit Google Maps: In den USA gibt es bereits die unterschiedlichsten Google Maps-Mashups, wie z.B. den Ride Finder, mit dem Taxis und Shuttles in Echtzeit lokalisiert werden können und man mit einem Klick auf das Taxisymbol die Nummer des Transportunternehmens erhält. Ein weiteres Beispiel sind die Housing Maps. Dabei gibt man in die Suchmaske den gewünschten Ort und den Betrag ein, den man für die monatliche Miete aufbringen möchte und findet freie Wohnungen und Häuser aus dem Immobilenkatalog Craigslist.

Trotz der Landkartenbewegung im Internet sollte nicht vergessen werden, dass auch Bibliotheken Karten besitzen, die sich über Bibliothekskataloge, Verbundkataloge, wie z.B. GBV oder im Katalog der Deutschen Nationalbibliothek recherchieren und bestellen lassen. Zwar liegen diese vorwiegend nur im Papierformat vor, jedoch bieten Bibliotheken im Vergleich zu Google Maps und Co. neben geographischen auch historische und thematische Karten jeglicher Art an, wie z.B. Artenschutzkarten u. ä. Die Staats- und Unibibliothek Göttingen sammelt im Rahmen des Sondersammelgebietplans der DFG thematische, geographische, geologische und meteorologische Karten und ist damit gute Anlaufstelle bei der Kartenrecherche. Mittlerweile haben auch die Biblioteheken die Nachfrage der Benutzer erkannt schnell und unkompliziert auf Medien zugreifen zu können. Das Göttinger Digitalisierungszentrum z.B. digitalisiert analoge Medien und macht sie im Internet verfügbar. Allerdings befinden sich in der digitalen Bibliothek zur Zeit nur 13 Landkarten. Auch die Staats- und Unibibliothek Bremen stellt online eine elektronische Bibliothek bereit, aber auch hier ist die Anzahl der Karten eher gering.

Abschließend lässt sich sagen, dass der Trend eindeutig in Richtung 3D/Virtual Reality-Karten und Mashups geht und dass Bibliotheken meiner persönlichen Einschätzung nach intensiver mitziehen müssen, um weiterhin als wichtiger Informationsdienstleister zu funktionieren.

P.S: Ein schönes Mashup zur Suche nach historischen Bildern ist HistoGrafica [via Nando]

Zeitreihen dynamisch visualisieren mit Timeplot

4. November 2007 um 20:21 Keine Kommentare

Im Rahmen des SIMILE-Projekts gibt es nach Timeline mit Timeplot ein weiteres schönes neues Werkzeug zur Datenvisualisierung.

Im Gegensatz zu ManyEyes und Swivel ist etwas mehr Handarbeit angesagt, um mit JavaScript dynamisch, webbasiert Zeitreihen anzeigen zu können, dafür ist Timeplot flexibler und kann auf eigenen Webseiten eingebunden werden. Die zu visualisierenden Daten können unter Anderem als kommaseparierte Zeitreihen oder Zeitpunkte im Timeline XML event format vorliegen (für welches ich leider keine gute Dokumentation aber dieses Tool gefunden habe). Mit diesem Dienst können Ereignisse im hCalender- oder vCalender-Format ins Timeline-Format konvertiert werden. Google experimentiert ebenfalls mit Zeitreihen als Antwort auf Suchanfragen aber so wie ich Google kenne, kann man die Suchergebnisse wahrscheinlich nicht weiterverwenden.

Wer ganze Mashups zur Visualisierung mit JavaScript zusammenbasteln möchte, sollte sich das ebenfalls bei SIMILE entstandene Exhibit ansehen.

Mashups zusammenklicken mit Mashup-Editoren

25. September 2007 um 01:17 Keine Kommentare

Wie heise vermeldet (und viele andere, darunter Talis in einer Semantic-Web-Linkliste) gibt es mit Intels Mashup Maker nach Google Mashup Editor schon den zweiten großen (noch-)Vaporware-Mashup-Editor. Weitere dieser webbasierten, graphischen Benutzeroberflächen, mit denen sich verschiedene Datenquellen verknüpfen und relativ einfach Skripte zur automatischen Verarbeitung und Anreicherung von Daten erstellen lassen, sind Yahoo Pipes, Microsoft Popfly, QEDWiki und Piggy Bank – je weiter man die Definition fasst, desto mehr Tools zur Datenextraktion und Informationsintegration gibt es. Mit dem Trend, immer mehr Daten überhaupt irgendwie strukturiert (Microformats, unAPI etc.) oder sogar in einer gemeinsamen virtuellen Datenbank (Semantic Web) anzubieten, dürfte das Gemische noch mehr zunehmen – nach dem ersten großen Rausch sollte dann allerdings hoffentlich auch klar werden, dass Themen wie Informationsqualität und Data Lineage (=woher stammen die Daten eigentlich?), Datenvisualisierung und Interface-Design ebenfalls wichtig sind und dass Daten ohne (sozialen) Kontext erstmal keinen Mehrwehrt dastellen, egal wie toll sie gemischt werden.

In jedem Fall interessant zu sehen, dass nicht mehr nur Informatiker Daten hin- und herschieben können. Die Bibliothekare sind nicht die Einzige Zunft, deren praktische Tätigkeit mehr und mehr von Laien beherrscht wird, während der theoretische Hintergrund erstaunlich unbekannt bleibt 😉

P.S.: Bei all den verschiedenen Mashup-Diensten muss natürlich irgendwann wieder vereinheitlicht werden: Netvibes hat mit der Universal Widget API (UWA) eine JavaScript-API vorlgelegt, mit deren Hilfe Anwendungen auch bei iGoogle, Apple Dashboard u.A. eingesetzt werden können. Fehlt nur noch ein universeller Mashup-Editor, der UWA ausspuckt. Kommen jetzt nach dem Browserkrieg die Mashup-Kriege? [via heise]

GBV-Verbunddaten weiterverarbeiten mit SRU-Schnittstelle und Perl

20. August 2007 um 14:58 2 Kommentare

Ende Juli habe ich im Rahmen meiner Arbeit bei der VZG mit PICA::Record eine Perl-API zur Verarbeitung von PICA+-Daten veröffentlicht. PICA+ ist das interne Katalogformat von PICA-Bibliothekssystemen, die neben dem GBV und den Verbünden HeBIS und SWB auch bei der Deutschen Nationalbibliothek und für Zentralsysteme in den Niederlanden, Australien, Frankreich und England eingesetzt werden. Inzwischen ist PICA übrigens eine vollständige OCLC-Tochterfirma. Mehr zum PICA+ Format findet sich in den jeweiligen Katalogisierungsrichtlinien, zum Beispiel beim GBV und in dieser kurzen Einführung.

PICA::Record ist sozusagen ein Pendant zu Mike Rylanders CPAN-Modul MARC::Record, das bereits seit einigen Jahren bei MARC-Anwendern genutzt und in der Mailingliste perl4lib diskutiert wird. Feedback in Form von Anwendungen, Ideen, Bugreports etc. ist sehr willkommen – zum Beispiel öffentlich bei der Dokumentation im GBV-Wiki. Neben der Erzeugung von Datensätzen in PICA+, um diese in Katalogsysteme einzuspielen, eignet sich PICA::Record auch für die umgekehrte Richtung. Dazu ist ein einfacher SRU-Client implementiert; die entsprechende SRU-Schnittstelle bietet der GBV seit einiger Zeit inoffiziell und nun auch öffentlich an. Für Bibliotheks-Mashups ist die SRU-Schnittstelle ein Baustein und die Perl-API ein mögliches Bindemittel. Natürlich kann der Webservice auch mit anderen Methoden als mit Perl abgefragt werden.

Beispiele und Anleitungen gibt es unter Anderem in der API-Dokumentation, im Quelltext oder hier.

Bibliotheks-Mashups mit Hürden auf dem Vormarsch

13. Juli 2007 um 18:06 8 Kommentare

Wie von Patrick und im BibSonomy Blog berichtet wurde, bietet der Kölner UniversitätsGesamtkatalog (KUG) seit kurzem den Export von Datensätzen in das Kasseler Social-Cataloging-System Bibsonomy an. Als gemeinsames Datenformat fungiert BibTeX, das neben Dublin Core trotz einiger Probleme im Gegensatz zu Spezialformaten wie MARC und MAB De-facto-Standard für solche Anwendungen ist.

Prinzipiell kann jede Bibliothek, die BibTeX exportieren kann, den gleichen Service anbieten. Die Übergabe an BibSonomy funktioniert über eine einfache REST-API, die anscheinend in Kürze veröffentlicht werden soll. Die URL-Syntax is

http://www.bibsonomy.org/BibtexHandler?requTask=upload&encoding=ISO-8859-1&selection=…BibTeX-Datensatz…

Welche Zeichenkodierungen neben ISO-8859-1 noch möglich sind, weiß ich nicht; bislang werden auch sinnlose Werte anstandslos akzeptiert. Problematisch könnte es auch bei umfangreichen Datensätzen werden. Prinzipiell legt der HTTP-Standard zwar keine Längenbegrenzung für URLs fest, aber verlassen würde ich mich darauf nicht. Natürlich gibt es auch bei der Konvertierung noch einige Bugs, siehe zum Beispiel dieser Datensatz, bei dem die Keywords ziemlich durcheinander geworfen werden.

Dazu muss gesagt werden dass ein fehlerfreier BibTeX-Export komplizierter ist als angenommen. Der KUG wird mit der Software OpenBib betrieben, die – so sollte es sein – Open Source ist. Nach kurzer Recherche im Quelltext zeigt sich die Funktion normset2bibtex als Kernbestandteil der Konvertierung nach BibTeX. Mir ist neulich auch schon ein PICA+ nach BibTeX-Script über den Weg gelaufen, aber wenn jede Bibliothek und jeder Hersteller ihr eigenes kleines Skript schreiben, können bei der Konvertierung qualitativ keine großen Sprünge gemacht werden. Ein guter Kandidat für eine dauerhafte Lösung sind vielleicht die Bibutils bibliography conversion utilities, die als Intermediate-Format das Metadata Object Description Schema (MODS) verwenden und ebenso wie OpenBib unter der GPL zur Verfügung stehen. By the way: Warum werden von DFG & Co eigentlich laufend Anträge ohne technischen Sachverstand gefördert, bei denen am Ende nur unfreies Gewurstel rauskommt, anstatt konsequent auf Open Source zu setzen, damit am Ende alle etwas davon haben?

Und noch eine positive Überraschung brachte das Stöbern im Quellcode und der Dokumentation: Der OpenBib-Entwickler Oliver Flimm hat bereits 2005 mit den Open Library WebServices eine SOAP-Schnittstelle für Sisis-Systeme implementiert (siehe Dokumentation und Quellcode), die anscheinend direkt auf die SQL-Datenbank zugreift. Bisher hatte ich von Sisis-Systemen eher den Eindruck, dass sie mit Schnittstellen nicht so freizügig sind. Zwar gibt es beispielsweise schon seit längerer Zeit das Simple Library Network Protocol (SLNP), aber eine offene API-Dokumentation und freie Implementierungen von auf diese API zugreifenden Clients habe ich bisher nicht finden können.

Mit den Open Library WebServices können Benutzerdaten (Ausleihen, Vorbestellungen etc.) und über die interne Datenbank-ID eines Katalogdatensatzes der Medienstatus (Signatur, Exemplar, Standort, Status, Rueckgabe) sowie die vollständigen Titeldaten abgerufen werden. Um welches „nativen Kategorienschema“ es sich bei den Titeldaten handelt, kann ich leider aus Unkenntnis von Sisis-LBS-Systemen nicht sagen, vielleicht MAB2, aber dann sollte besser MABXML geliefert werden und die Konvertierungsroutine nach BibTeX wie oben angedeutet als eigenständiges MAB2-nach-BibTeX-Modul.

Jedenfalls ein großes Lob an Oliver Flimm für die Entwicklung von OpenBib. Ich hoffe, dass die Weiterentwicklung mehr in Richtung einer Serviceorientierten Architektur geht, indem einzelne Funktionen sauber getrennt und als Webservice gekapselt werden. So können Funktionen wie der BibTeX-Export und die Weiterreichung nach BibSonomy als Bausteine auch in anderen Katalogprojekten zum Einsatz kommen können, beispielsweise bei X-OPAC und E-LIB Bremen. Auch dort steckt eine Menge intelligenter Eigenentwicklung, aber noch werkelt jeder vor sich hin. Bei den Schnittstellen sollte deshalb, wie ich vor kurzem in INETBIB betonte, streng auf offene Standards gesetzt werden anstatt eigene Bastellösungen zu verwenden, dann klappt’s auch mit den Mashups.