Bibliotheks-Mashups mit Hürden auf dem Vormarsch

13. Juli 2007 um 18:06 8 Kommentare

Wie von Patrick und im BibSonomy Blog berichtet wurde, bietet der Kölner UniversitätsGesamtkatalog (KUG) seit kurzem den Export von Datensätzen in das Kasseler Social-Cataloging-System Bibsonomy an. Als gemeinsames Datenformat fungiert BibTeX, das neben Dublin Core trotz einiger Probleme im Gegensatz zu Spezialformaten wie MARC und MAB De-facto-Standard für solche Anwendungen ist.

Prinzipiell kann jede Bibliothek, die BibTeX exportieren kann, den gleichen Service anbieten. Die Übergabe an BibSonomy funktioniert über eine einfache REST-API, die anscheinend in Kürze veröffentlicht werden soll. Die URL-Syntax is

http://www.bibsonomy.org/BibtexHandler?requTask=upload&encoding=ISO-8859-1&selection=…BibTeX-Datensatz…

Welche Zeichenkodierungen neben ISO-8859-1 noch möglich sind, weiß ich nicht; bislang werden auch sinnlose Werte anstandslos akzeptiert. Problematisch könnte es auch bei umfangreichen Datensätzen werden. Prinzipiell legt der HTTP-Standard zwar keine Längenbegrenzung für URLs fest, aber verlassen würde ich mich darauf nicht. Natürlich gibt es auch bei der Konvertierung noch einige Bugs, siehe zum Beispiel dieser Datensatz, bei dem die Keywords ziemlich durcheinander geworfen werden.

Dazu muss gesagt werden dass ein fehlerfreier BibTeX-Export komplizierter ist als angenommen. Der KUG wird mit der Software OpenBib betrieben, die – so sollte es sein – Open Source ist. Nach kurzer Recherche im Quelltext zeigt sich die Funktion normset2bibtex als Kernbestandteil der Konvertierung nach BibTeX. Mir ist neulich auch schon ein PICA+ nach BibTeX-Script über den Weg gelaufen, aber wenn jede Bibliothek und jeder Hersteller ihr eigenes kleines Skript schreiben, können bei der Konvertierung qualitativ keine großen Sprünge gemacht werden. Ein guter Kandidat für eine dauerhafte Lösung sind vielleicht die Bibutils bibliography conversion utilities, die als Intermediate-Format das Metadata Object Description Schema (MODS) verwenden und ebenso wie OpenBib unter der GPL zur Verfügung stehen. By the way: Warum werden von DFG & Co eigentlich laufend Anträge ohne technischen Sachverstand gefördert, bei denen am Ende nur unfreies Gewurstel rauskommt, anstatt konsequent auf Open Source zu setzen, damit am Ende alle etwas davon haben?

Und noch eine positive Überraschung brachte das Stöbern im Quellcode und der Dokumentation: Der OpenBib-Entwickler Oliver Flimm hat bereits 2005 mit den Open Library WebServices eine SOAP-Schnittstelle für Sisis-Systeme implementiert (siehe Dokumentation und Quellcode), die anscheinend direkt auf die SQL-Datenbank zugreift. Bisher hatte ich von Sisis-Systemen eher den Eindruck, dass sie mit Schnittstellen nicht so freizügig sind. Zwar gibt es beispielsweise schon seit längerer Zeit das Simple Library Network Protocol (SLNP), aber eine offene API-Dokumentation und freie Implementierungen von auf diese API zugreifenden Clients habe ich bisher nicht finden können.

Mit den Open Library WebServices können Benutzerdaten (Ausleihen, Vorbestellungen etc.) und über die interne Datenbank-ID eines Katalogdatensatzes der Medienstatus (Signatur, Exemplar, Standort, Status, Rueckgabe) sowie die vollständigen Titeldaten abgerufen werden. Um welches „nativen Kategorienschema“ es sich bei den Titeldaten handelt, kann ich leider aus Unkenntnis von Sisis-LBS-Systemen nicht sagen, vielleicht MAB2, aber dann sollte besser MABXML geliefert werden und die Konvertierungsroutine nach BibTeX wie oben angedeutet als eigenständiges MAB2-nach-BibTeX-Modul.

Jedenfalls ein großes Lob an Oliver Flimm für die Entwicklung von OpenBib. Ich hoffe, dass die Weiterentwicklung mehr in Richtung einer Serviceorientierten Architektur geht, indem einzelne Funktionen sauber getrennt und als Webservice gekapselt werden. So können Funktionen wie der BibTeX-Export und die Weiterreichung nach BibSonomy als Bausteine auch in anderen Katalogprojekten zum Einsatz kommen können, beispielsweise bei X-OPAC und E-LIB Bremen. Auch dort steckt eine Menge intelligenter Eigenentwicklung, aber noch werkelt jeder vor sich hin. Bei den Schnittstellen sollte deshalb, wie ich vor kurzem in INETBIB betonte, streng auf offene Standards gesetzt werden anstatt eigene Bastellösungen zu verwenden, dann klappt’s auch mit den Mashups.

Tagging, Umfrage, Buch, Vortrag

12. Juli 2007 um 00:22 4 Kommentare

Drei kleine Hinweise zum Thema Tagging:

1. Tobias Kowatsch führt für seine Abschlussarbeit eine Web-Experiment-Umfrage zum Thema Tagging durch. Die Auswahl fand ich teilweise etwas komisch aber ich bin ja nur Versuchsperson, also nehmt euch die 13 Minuten und probiert es selber aus!

2. Sascha Carlin hat ein Buch über Social Tagging geschrieben, das vermutlich auf seiner Diplomarbeit basiert. Ich bin gespannt und werde es nach Erscheinen mal genauer unter die Lupe nehmen.

3. Auf der GBV Verbundkonferenz im September werde ich unter anderem über Social Tagging und Bibliotheken und die konkreten Planungen zur Tagging-Unterstützung im GBV referieren.

Die Tagesschow

11. Juli 2007 um 17:26 1 Kommentar

In Deutschlandradio kam gestern ein Feature über die Tagesschau. Leider ist die Sendung nicht als Podcast verfügbar, dafür gibt es das Manuskript (das allerdings die Wirkung der O-Töne nicht ersetzen kann). Nachdem der Autor Walter van Rossum schon 2004 mit Sabine Christiansen abrechnete, hat er sich nun die medienheilige Institution Tagesschau vorgenommen. Er kommt zum Ergebnis, dass die Nachrichtensendung einseitig berichtet und zur Volksverblödung beiträgt. Im Oktober erscheint dazu ein Buch bei Kiepenheuer und Witsch. Vielleicht ist eine der Ursachen für die Unzulänglichkeit der Tagesschau einfach, dass sie keine Hyperlinks und Quellennachweise enthält?

Mehr Unsicherheit mit dem neuen Reisepass

9. Juli 2007 um 16:14 Keine Kommentare

Heute habe ich beim Einwohnermeldeamt meinen neuen Reisepass mit biometrischen Daten abgeholt (siehe auch die Werbeseite zum ePass). Wer ebenfalls etwas dagegen hat, dass auch noch Fingerabdrücke gespeichert werden, sollte sich bis Oktober beeilen, denn obwohl praktisch alle bisherigen Terrorakte ohne gefälschten Pass durchgeführt wurden und auch mit biometrischen Pässen nicht verhindert worden wären, wird weiter aufgerüstet.

Einen Hinweis auf den im Pass enthaltenen RFID-Chip und die damit verbundenen Sicherheitsprobleme gibt es bei der Ausgabe nicht. Eigentlich sollte jedem Reisepass gleich eine Schutzhülle gegen unbefugtes Auslesen beigelegt werden. Bereits letztes Jahr wurde gezeigt, dass sich vom ePass Kopien anfertigen lassen, die von elektronischen Lesegeräten nicht vom Original unterscheidbar sind. Einen schönen Vortrag zum Auslesen und Simulieren von RFID-Chips gab es übrigens auf dem 23C3.

Angesichts dass, vorangetrieben von dem Verfassungsfeind Wolfgang Schäuble, die nach 1945 eingeführte Trennung von Geheimdienste, Polizei und Militär immer weiter aufgeweicht wird und Techniken eingeführt werden, von denen die Stasi nur träumen konnte, muss einem schon unheimlich werden. Da hilft auch die Ich-habe-doch-nichts-zu-verbergen-Ausrede im Biedermann’schen Sinne nichts: Wenn Kopien eines Reisepasses zu oft an den falschen Orten auftauchen, drohen dem damit Verdächtigen Passinhaber bald schnell nicht nur Handy- und Internetverbot sondern, wie Schäuble vorschlägt, gar die „gezielte Tötung“. Wer einmal – warum auch immer (falscher Name, falscher Urlaubsort, zufällig neben der falschen Person gesessen etc.) – auf deiner der vielen Listen von Terrorverdächtigen gelandet ist, hat halt Pech gehabt – nach der neuen Anti-Terror-Doktrin sind wir doch schließlich alle potentielle Terroristen.

Justizministerium verkauft Urheberrechtsnovelle dummdreist als Erfolg

6. Juli 2007 um 14:35 3 Kommentare

Bei Lektüre der Pressemitteilung des Bundesjustizministeriums zur (inzwischen wievielten?) Novelle des Urheberrechts vom 5. Juli 2007 kann es einem angesichts der Dreistigkeit der PR-Abteilung schon den Atem verschlagen. Unter „Schranken für Wissenschaft und Forschung“ steht dort:

Die Novelle erlaubt es öffentlichen Bibliotheken, Museen und Archiven erstmalig, ihre Bestände an elektronischen Leseplätzen zu zeigen. Damit behalten diese Einrichtungen Anschluss an die neuen Medien. Die Medienkompetenz der Bevölkerung wird gestärkt. Neu ist auch, dass Bibliotheken auf gesetzlicher Basis Kopien von urheberrechtlich geschützten Werken auf Bestellung anfertigen und versenden dürfen, z.B. per E-Mail. Das dient dem Wissenschaftsstandort Deutschland.

Fakt ist, dass öffentlichen Bibliotheken, Museen und Archiven schon seit Jahren ihre Bestände sowohl an elektronischen Leseplätzen als auch über das Web zeigen und über Subito per E-Mail verschicken. Bei Werken, die nicht Open Access sind, ist dazu in der Regel ein Benutzeraccount und eine Gebühr erforderlich und die Verlage werden dafür durch Lizenzgebühren und Pauschalabgaben bezahlt. Dies wird durch die Urheberrechtsnovelle nun verhindert.

Der Versand per E-Mail ist nur erlaubt, wenn „der Verlag nicht ein offensichtliches eigenes Online-Angebot zu angemessenen Bedingungen bereithält“, also statt einem einfachen, einheitlichen Zugang versucht jeder Verlag in einem eigenen Angebot, einzelne Kopien von digitalen Objekten zu verkaufen. Darüber Hinaus ist „die Anzahl der Vervielfältigungen eines bestimmten Werkes, die an Leseplätzen gleichzeitig gezeigt werden dürfen, grundsätzlich an die Anzahl der Exemplare im Bestand der Einrichtung geknüpft“, also muss der Leser in die Bibliothek laufen, und dort warten, das eine einzelne Kopie eines digitalen Objektes „frei“ wird.

Offensichtlich ist das Justizministerium noch immer nicht im digitalen Zeitalter angekommen. Nochmal für die die ewig Gestrigen in Ministerien, Presse und Verlagen:

Es ist eine inhärente Eigenschaft digitaler Objekte, dass sie sich verlustfrei in beliebiger Anzahl kopieren lassen!

Wenn ihr euch darauf nicht einstellt, sondern versucht, veraltete Geschäftsmodelle aus dem letzten Jahrtausend auf juristischem Wege aufrecht zu erhalten, ergeht es euch ebenso wie den Dinosauriern. [Hinweis via Till]

Wikimedia-Wahlen bei Foundation und Verein

5. Juli 2007 um 00:42 1 Kommentar

Seit der Mitgliederversammlung am Sonntag bin ich nicht mehr Vorstandsmitglied des Vereins Wikimedia Deutschland – im letztem Augenblick habe ich angesichts genügend engagierter und fähiger Kandidaten, Diskussionen zur Umstrukturierung der Vereinsarbeit und nicht zuletzt wegen der eigenen Überlastung meine Kandidatur zurückgezogen und überlasse die Verantwortung nach drei Jahren nun Anderen. Allerdings werde ich weiterhin für Wikimedia und Freies Wissen aktiv sein, nur eben als „einfaches Vereinsmitglied“.

Auf internationaler Ebene finden bei der Wikimedia-Foundation zur Zeit ebenfalls Wahlen statt. Wie ich gerade im Wikipedia-Kurier geschrieben habe, dominieren dabei die Nutzer der Englischsprachigen Wikipedia. Ich befürchte, dass die Mehrheit der Wähler rein nach dem Bekanntheitsgrad anstatt nach der Befähigung wählt und selten sind die, die am lautesten schreien, auch am besten geeignet.

Das Auswertungsskript zur Erstellung einer kleinen Statistik der teilnehmenden Wähler ließe sich mit Zeit und Muße noch so erweitern, dass per Diagramm sichtbar ist, aus welchen Wikimedia-Wikis über den Wahlzeitraum am meisten Stimmen kommen.

Warum Mikroformate noch nicht so toll sind

3. Juli 2007 um 01:54 3 Kommentare

Christian hat neulich seine Links zum Thema Mikroformate/Microformats zusammengefasst und merkte an, dass auf infobib das hcard-Mikroformat für Personendaten verwendet wird. Ich mag Microformats ja auch aber so ganz ausgereift scheint mit das doch noch nicht zu sein:

Web2.0-Junkies mögen ihre Freude an technischen Spezifikationen haben, aber normale Menschen interessiert sowas wie „Format“ doch zu Recht nicht die Bohne (ich darf mich hoffentlich je nachdem zu beiden Personengruppen zählen). Wenn sich schon jemand die Mühe macht, in einheitlicher Form eine maschinenlesbare „Visitenkarte“ auf seine Webseite zu bringen, dann erwarte ich sie mit einem einfachen Klick in meiner Adressverwaltung übertragen zu können. Dazu sind aber bislang folgende Hürden zu nehmen:

  • Die Überwindung, sich mit Mikroformaten zu beschäftigen, während es eigentlich einfach nur „funktionieren“ soll.
  • Die Wahl von Firefox als Webrowser und ein Microformats-Plugin wie zum Beispiel Operator, das die Mikroformate aus einer Webseite auslesen kann.
  • Das Herumkonfigurieren am Plugin (in Operator sollte „display icon in status bar“ in den Plugin-Einstellungen aktiviert werden).
  • Eine Anwendung, die mit dem entsprechenden Mikroformat (hier vCard) etwas anfangen kann.
  • Die Erkenntnis, dass bisher sowieso nur wenige Webseiten Mikroformate anbieten.

Mir war es beim vorletzten Punkt zu viel: Thunderbird kann vCard zwar beigebracht werden, aber nicht direkt aus dem Browser heraus, also muss ich die Adressdaten mit dem Operator-Plugin erst als vCard-Datei speichern und dann die Datei in Thunderbird importieren.

Bei Software-Monokulturen wie Apple oder KDE mag der Austausch von Daten über Programme hinweg ja einwandfrei funktionieren, aber dafür werden eigentlich keine Mikroformate benötigt. Bis verschiedenste Informationen problemlos aus dem Netz in andere Anwendungen übernommen werden können, dauert es sicherlich noch etwas, zumal selbst die Web 1.0-Grundlage Mime-type (auch Content-Type in HTTP) oft nicht richtig verwendet wird.

Wochenende.

2. Juli 2007 um 04:28 2 Kommentare

Donnerstag. Mit der Bahn nach Oberhaching zu OCLC PICA Deutschland. Gerade so zum letzten Vortrag angekommen. Dafür früh genug zum Sommerfest. Als „Junger Wilder“ zum Vorzeigen hergehalten. Abends fast so lange ausgehalten wie die letzten 5 Kölner. Freitag. Die Sonne blendet. Weiter nach Langen bei Frankfurt. Kurz Gepäck abgeladen, eingekauft und zum Haus der Jugend. Dort bei den Vorbereitungen zu Wikimedia Workshoptag und Mitgliederversammlung im Wege rumgestanden. Anschließend mit den ersten Wikipedianern trinken gehen. Nicht genug Bargeld dabei. Übernachtung in Langen. Samstag. Umentschieden – Übernachtung morgen doch in Frankfurt. Viele nette Leute. Das ist Community. Ausstellungsbesuch. Workshops. Mit Wikimedianern aus Polen, Frankreich, Niederlande, Schweiz gequatsch. Wieder mal über uns selber und das Projekt gestaunt. Abends grillen. Sehr motivierend, aber etwas kaputt. Sonntag. Protokolle vergessen. Nicht-gesperrte Brücke über den Main gesucht. Kurzer Abstecher in die Geschäftsstelle, Mittagessen, Mitgliederversammlung. Festgestellt, dass der Verein eben doch auch Verein. Aber nicht Irgendeiner! Über Anträge zur Geschäftsordnung gewundert. Sichere Kandidatur als Vorstandsmitglied in letztem Moment zurückgezogen. Müssen auch mal andere ran. Interessantes Gefühl. Nach der Sitzung noch nett zusammengesessen. Tolle Leute. Doch erst den letzten Zug genommen. Sonntagnacht. Im Zug Mexikaner getroffen. Hätte eben aussteigen müssen. Flieger geht um 7:30. Letzter Zug. Schaffner kann kein Englisch. Übersetzt. Vom Schaffner zwei Getränkegutscheine bekommen. Keine Chance. Überlegt. Mexikaner muss nach Lissabon. Bis Göttingen mitgenommen. Mit Taxi zur Autobahnraststätte. Taxifahrer verfährt sich auf Autobahn. AB-Tankstelle um Mitternacht. Niemand fährt nach Berlin. Nette Hamburger können auch nicht helfen. Nach einer Stunde aufgegeben. Zu mir nach Hause. Im Netz nach Billigflügen gesucht. Mexikaner muss in 30 Stunden in Lissabon sein. Freundin kommt. Endlich Flug und Bahnfahrt zum Flughafen gefunden. Könnte morgen mittag für 130 Euro in Lissabon sein. Sind doch 160 Euros. Buchung geht nicht. Billigflieger mag kein Firefox unter Linux. Windows-Rechner gesucht. Hat kein Netz. Erster Zug schon weg. Gibt noch zweiten Zug. Buchung geht endlich auf Windows-Rechner. Mexikaner Onlineticket Bahn und Flug in die Hand gedrückt und ins Taxi gesetzt. Montag. Zu viel Adrenalin, um zu schlafen.