Freie Bibliotheksdaten mit Wikipedia und OpenStreetmap

3. Dezember 2009 um 01:29 7 Kommentare

Seit über 5 Jahren versuche ich fachkundige Menschen aus dem Bibliotheks- und Dokumentationswesen (bzw. mit Interesse an Bibliotheken und Dokumentation) zur Mitarbeit an Wikipedia zu begeistern. Das Portal Bibliothek, Information, Dokumentation fasst Wikipedia-Artikel aus diesem Themenbereich zusammen; gleichwohl ist die Zahl der aktiven Wikipedia-Autoren mit Bibliothekshintergrund überschaubar oder die Autoren schreiben lieber in anderen Bereichen. In den letzten Wochen und Tagen ist nun wieder etwas Schwung in den bibliothekarischen Bereich der Wikipedia gekommen:

Peter Kostädt im Magisterstudiengang Library and Information Science (MALIS) die Arbeitsaufgabe gestellt, einen Wikipedia-Artikel zu verfassen. Inzwischen sind die ersten Beiträge bei Wikipedia eingestellt und können dort ergänzt und umgearbeitet werden. Bislang sind dies unter anderem Artikel zur Open Library, zur E-LIB Bremen und zu DigiAuskunft. Natürlich ist jeder dazu eingeladen, die Artikel (wie alle anderen Inhalte in Wikipedia) zu ergänzen oder anderweitig zu verbessern. Mit etwas Vorbereitung können auch neue Artikel angelegt werden; so fehlen z.B. So fehlen beispielsweise Artikel zu so grundlegenden Begriffen wie Büchereifachstelle, Fachreferent, Lektoratskooperation und Universitätsverlag.

Zu einzelnen Bibliotheken gibt es in Wikipedia derzeit 580 Artikel (653-64), die in eine facettierte Systematik aus 64 Kategorien eingeordnet sind. Zur Angabe der Grunddaten in strukturierter Form habe ich die Infobox Bibliothek aktualisiert, so dass sie zum Beispiel über DBpedia ins Semantic Web übernommen werden können – so entsteht in Wikipedia ein freier Bibliotheksführer. Wie die Übersicht zeigt, gibt es noch viele Lücken und einige Artikel sind für meinen Geschmack zu affirmativ geschrieben – aber nicht kritisieren sondern selber besser machen! Als Richtlinie gibt es inzwischen auch spezifische Hinweise für Artikel über Bibliotheken.

Nicht nur in Wikipedia werden Bibliotheken gesammelt; auch bei dem vergleichbaren freien Kartenprojekt OpenStreetmap (OSM) sind innerhalb Deutschlands schon 1546 Bibliotheken und weltweit 18415 Bibliotheken verzeichnet. Allerdings sind nur etwa 5% auch explizit einzelnen Gebäuden zugeordnet während die Mehrzahl nur als Punktkoordinate erfasst ist. Zur Verknüpfung von OpenStreetmap, Wikipedia und dem ISIL/Sigelverzeichnis habe ich angeregt, die international gültige ISIL als Identifier in OpenStreetmap einzutragen. Details dazu im OSM-Wiki. Bislang sind etwa 40 Bibliotheken in OSM mit ISIL ausgezeichnet. Die Mitarbeit in OSM (z.B. um fehlende Bibliotheken einzutragen und mit ihrer ISIL zu taggen) steht ebenso wie bei Wikipedia jedem frei und die Ergebisse kommen allen zugute.

Neben Wikipedia, OSM und dem Sigelverzeichnis gibt es noch eine Reihe weiterer Verzeichnisse von Bibliotheksdaten (ich hatte im März darüber geschrieben). In libwebcat sind beispielsweise derzeit 112 Deutsche Bibliotheken vertreten. Zu den (bislang?) nicht frei zugänglichen Quellen zählen BibDir und das VdB-Jahrbuch. Weshalb hier mal wieder zahlreiche Systeme parallel gepflegt und sinnlos bibliothekarische Ressourcen verschwendet werden, lässt sich wahrscheinlich nur historisch oder politisch begründen. Die Bibliotheksdaten in Wikipedia und OpenStreetmap können jedenfalls dank der freien Lizensierung (CC-BY-SA wenn nicht sowieso Public Domain) problemlos weiterverwendet und kombiniert werden.

P.S.: Ein weiteres Verzeichnis von Bibliotheksdaten enthält das „internationale Linkportal“ Bib-Link. Die Linksammlung ist jedoch nicht als gesamte Datenbank downloadbar und wäre besser in einer Social-Cataloging-Plattform aufgehoben.

How to encode the availability of documents

23. Oktober 2009 um 12:50 2 Kommentare

Since almost a year I work on a simple encoding format and API to just get the current (!) availability status of documents in libraries. Together with Reh Uwe (hebis network) and Anne Christensen (beluga project) we created the Document Availability Information API (DAIA) which is defined as data model with encoding in XML and JSON (whichever you prefer).

This week I finished and published a reference implementation of the DAIA protocol as open source Perl-module at CPAN. The implementation includes a simple DAIA validator and converter. A public installation of this validator is also available. The next tasks include implementing server and client components for several ILS software. Every library has its own special rules and schemas – Jonathan Rochkind already wrote about the problems to implement DAIA because of ILS complexity. We cannot erase this complexity by magic (unless we refactor and clean the ILS), but at least we can try to map it to a common data model – which DAIA provides.

Core components of the DAIA data model

With the DAIA Perl package you can concentrate on writing wrappers from your library systems to DAIA and easily consume and evaluate DAIA-encoded information. Why should everyone write its own routines to grab for instance the HTML OPAC output and parse availability status? One mapping to DAIA should fit most needs, so others can build upon. DAIA can not only be helpful to connect different library systems, but also to create mashups and services like „Show me on a map, where a given book is currently hold and available“ or „Send me a tweet if a given books in my library is available again“ – If you have more cool ideas for client applications, just let me know!

In the context of ILS Discovery Interface Task Force and their official recommendation DAIA implements the GetAvailability method (section 6.3.1). There are numerous APIs for several tasks in library systems (SRU/SRW, Z39.50, OpenSearch, OAI-PMH, Atom, unAPI etc.) but there was no open, usable standard way just to query whether a copy of given publication – for instance book – is available in a library, in which department, whether you can loan it or only use it in the library, whether you can directly get it online, or how long it will probably take until it is available again (yes, I looked at alternatives like Z39.50, ISO 20775, NCIP, SLNP etc. but they were hardly defined, documented, implemented and usable freely on the Web). I hope that DAIA is easy enough so non-librarians can make use of it if libraries provide an API to their system with DAIA. Extensions to DAIA can be discussed for instance in Code4Lib Wiki but I’d prefer to start with this basic, predefined services:

  • presentation: an item can be used inside the institution (in their rooms, in their intranet etc.).
  • loan: an item can be used outside of the institution (by lending or online access).
  • interloan: an tem can be used mediated by another institution. That means you do not have to interact with the institution that was queried for this item. This include interlibrary loan as well as public online ressources that are not hosted or made available by the queried institution.
  • openaccess: an item can be used imediately without any restrictions by the institution, you don’t even have to give it back. This applies for Open Access publications and free copies.

Übersicht Social-Cataloging-Plattformen

12. Oktober 2009 um 22:39 4 Kommentare

Anknüpfend an die inzwischen schon etwas veraltete Übersicht webbasierter Literaturverwaltung und an die provokante Frage, ob und wie Bibliotheken das Katalogisieren lieber den Nutzern überlassen sollten, habe ich zusammen mit Silvia Czerwinski folgende Übersicht von Social-Cataloging-Plattformen zusammengestellt. Ausgenommen sind an dieser Stelle Dienste zur gemeinsamen (wissenschaftlichen) Literaturverwaltung wie Mendeley, CiteULike, Connotea und BibSonomy sowie webbasierte OpenSource-Software wie WIKINDX und Aigaion.

Die größten Social-Cataloging Plattformen für Bücher sind LibraryThing und GoodReads gefolgt von ähnlichen Dienste wie aNobii (benannt nach dem Bücherwurm Anobium Punctatum) und Shelfari. Im Open Library Project wird ebenfalls gemeinsam katalogisiert, wobei automatische Massenimports den Großteil ausmachen. Daneben gibt es Buch-Communities wie weRead (vor allem verbreitet in Sozialen Netzwerken wie Facebook, Orkut, MySpace etc.), bookJetty und BookCrossing sowie aus dem deutschsprachigen Raum Quillp und Lovelybooks. Bei diesen Communities handelt es sich jedoch nicht um vollständige Katalogisierungsplattformen, da hier nur persönliche Listen, Bewertungen und Kommentare zu bereits vorhandenen Büchern angelegt werden können. Dafür bietet Quillp die Möglichkeit, eigene Manuskripte hochzuladen und von anderen Lesern bewerten zu lassen. Die Verknüpfung mit Bibliotheken ist vor allem bei LibraryThing und bei bookJetty ausgeprägt.

Die Inhalte des größten und einflussreichsten Filmkatalogs, der Internet Movie Database (IMDb), werden ebenfalls von den Benutzern gesammelt. ImDb ist im Besitz von Amazon.com, das auch Shelfari und über Abebooks eine 40%ige Beteiligung an Librarything hält. Weitere Film-Communities ohne Katalogisierungsmöglichkeit sind u.a. Flixster und Criticker.

Zur gemeinschaftlichen Katalogisierung von Audio-Publikationen (vor allem Musik) gibt es Discogs, MusicBrainz, MusicMoz und freeDB. Im Gegensatz zu reinen Musik-Communities wie Last.fm und Rate Your Music steht nicht die Bewertung, Kommentierung und Gruppierung von Musik im Mittelpunkt, sondern die Erschließung von Künstlern, Gruppen, Stücken, Veröffentlichungen und Herausgebern. Eine Zusammenarbeit mit Institutionen wie dem Deutschen Musikarchiv oder der GEMA findet – abgesehen von der gegenseitigen Verwendung als Quelle – bislang nicht statt.

Herausragend in der Tiefenerschließung sind Social-Cataloging-Plattformen für Spezialbereiche, wie zur Katalogisierung von Comics (Grand Comic-Book Database), Computerspielen (MobyGames) oder Animes und Mangas (MyAnimeList). Hier zeigt sich, dass engagierte Nutzer in Masse einfach unschlagbar sind: ebenso wie Wikipedia dank Tausender von Freiwilligen umfangreicher und detaillierter als jede herkömmliche Enzyklopädie werden konnte, können spezialisierte Social-Cataloging-Plattformen wie LibraryThing, IMdB und die Grand Comic-Book Database ihren Sammlungsgegenstand umfangreicher und tiefer erschließen als es eine überschaubare Zahl von Bibliothekare oder Dokumentare je schaffen – allerdings nur unter der Vorraussetzung, dass eine kritische Masse und eine leistungsfähige und einfach zu bedienende Katalogisierungsoftware vorhanden sind.

LibraryThing doppelt so populär wie WorldCat

4. Oktober 2009 um 01:50 5 Kommentare

Als Mitte dieses Jahrzehnts Wikipedia immer populärer wurde, verfolgten die Wikipedianer das exponentielle Wachstum gespannt anhand der Zugriffsstatistiken der am häufigsten aufgerufenen Webseiten. Inzwischen liegt die freie, kollaborative Enzyklopädie laut Alexa.com nach Google, Facebook, Yahoo, YouTube und Windows Live auf Platz 6: 10% aller Internetnutzer eines Tages rufen mindestens einmal Wikipedia auf und verbringen dort durchschnittlich 5 Minuten. Einen ähnliche Analyse hat sich Tim Spalding für seine kollaborative Bibliographie und Literaturplattform LibraryThing angesehen und herausgefunden, dass LibraryThing fast doppelt so viel Traffic wie WorldCat hat. Die Zahlen stammen von compete.com; bei Alexa sehen die Zugriffszahlen ebenso aus – und LibraryThing wächst deutlich schneller als WorldCat. Genaugenommen könnten die Zahlen von LibraryThing noch etwas höher sein, da Aufrufe von anderen Domains als librarything.com, beispielsweise librarything.de nicht direkt mitgezählt werden. Was bedeutet das für Bibliotheken?

LibraryThing vs. WorldCat

LibraryThing vs. WorldCat (% der Internetnutzer eines Tages)

Als ich Wikipedia vor dreieinhalb Jahren auf dem Bibliothekartag vorstellte [PDF], war die Seite noch auf Platz 18 und wurde damit schon vermutlich mehr besucht als alle Bibliothekswebseiten zusammen – LibraryThing war damals gerade ein halbes Jahr alt. Der Vergleich von Wikipedia mit Bibliothekswebseiten war natürlich unangemessen und sollte nur verdeutlichen, warum sich Bibliotheken mit Wikipedia auseinandersetzen sollten. Wikipedia ist inzwischen auch für Bibliothekare eine ernstzunehmende Institution (wobei die Zusammenarbeit mit der Deutschen Nationalbibliothek im obrigkeitshörigen Bibliothekswesen wahrscheinlich mehr wiegt als alle Nutzerinteressen) – wie sieht es mit LibraryThing aus?

Während groß und breit diskutiert wird, ob und wie deutsche Bibliothekskataloge in WorldCat eingebunden werden können, warte ich mitlerweile seit Jahren darauf, dass Bibliotheken ernsthaftes Interesse and LibraryThing zeigen und als Partner wahrnehmen. Liegt es daran, dass die Mitarbeiter von LibraryThing noch genügend Zeit und Spaß dafür haben, das Benutzerinterface in Piratensprache zu übersetzen? Oder dass Belletristik den Hauptbestand in LibraryThing ausmacht? Oder dass die Suchfunktion von LibraryThing das einzige ist das fast noch schlechter ist als in herkömmlichen OPACs? (Hintergrund: LibraryThing setzt mehr auf Browsing statt daneben die Suche auszubauen und herkömmliche OPACs verwenden Boolesches Retrieval statt Vektorraum-Suche).

Ich denke, dass Bibliotheken zum einen institutionell träger sind als ein kleines Startup, dass nicht dauernd Fördergelder für befristete Stellen beantragen muss, aber zum anderen auch träger in der Wahrnehmung der stattfindenden Digitalen Revolution. Statt zu schauen, was Wikipedia und LibraryThing erfolgreich macht und wo mit ihnen kooperiert werden kann, wird neidisch auf andere Bibliotheken geguckt und einem verblassendem Bild der Bibliothek als Wissenshort nachgehangen. Dabei wird in Zukunft weder die Katalogisierung noch der eigene Bestand die Relevanz einer Bibliothek ausmachen. Katalogisieren können sowieso besser die Nutzer (wenn man ihnen die richtigen Werkzeuge in die Hand gibt) und der „eigene“ Bestand erübrigt sich durch Digitalisierung und bessere Lesegeräte. Was bleibt ist die Fokusierung auf den Nutzer – und das haben sowohl Wikipedia als auch LibraryThing von Anfang an verinnerlicht .

BibRecord: Wikipedia als Literaturdatenbank

28. August 2009 um 22:48 2 Kommentare

Während die Wikimania 2009 ohne mich zu Ende geht (Videomitschnitte hier) habe ich heute mal wieder etwas mehr in Wikipedia getan und das bereits Ende 2008 erwähnte Projekt einer zentralen Wikimedia-Literaturdatenbank weiterverfolgt. Das Konzept sieht vor, einen Katalog aller Publikationen zu erstellen, die in Wikipedia-Artikeln zitiert werden. Wie bei Bildern, Videos und Audiodateien, die zentral in Wikimedia Commons verwaltet werden, sollen Literaturangaben mit einem einfachen Verweis in beliebige Artikel eingebunden werden (siehe BibRecord-Dokumentation).

Die Referenzierung der Publikationen geschieht über Identifikatoren wie ISBN, DOI, URN, Google-Books-ID, OCLC-ID und (falls die deutschen Bibliotheksverbände endlich die Relevanz von Identifikatoren wahrnehmen und entsprechend agieren) EKI. Für Titel ohne ID könnte zudem ein Bibkey-Verfahren verwendet werden. Um in Wikipedia eine bereits beschriebene Publikation zu referenzieren, genügt eine Vorlageneinbindung nach folgendem Muster:

{{BibISBN|0801857899}} (bei bekannter ISBN) oder
{{BibDOI|10.1038/35057062}} (bei bekannter DOI)

Der Zitierstil kann per format-Parameter angepasst werden (später sollte ggf. die Citation Style Language unterstützt werden). In der ISBN-Suche von Wikipedia werden bekannte Publikationen automatisch angezeigt. Die Zahl der unterstützen Datenfelder ist bislang noch etwas begrenzt und die Literaturangaben werden noch nicht in einer eigenen Datenbank, sondern in Form von Wikipedia-Seiten gespeichert (siehe ISBN/…, DOI/…). Dies geschieht mit Hilfe von Vorlage:BibRecord. Alles weitere (Import aus anderen bibliographischen Datenbanken, Werkverknüpfungen, Katalogsuche etc.) kommt getreu der Web-2.0-Philosophie des „Perpetual Beta“ – nicht zu verwechseln mit „Relaunch“ – später.

Class or Property? Objectification in RDF and data modeling

14. August 2009 um 00:23 14 Kommentare

A short twitter statement, in which Ross Singer asked about encoding MARC relator codes in RDF, reminded me of a basic data modeling question that I am thinking about for a while: When should you model something as class and when should you model it as property? Is there a need to distinguish at all? The question is not limited to RDF but fundamental in data/information modeling. In Entity-relationship modeling (Chen 1976) the question is whether to use an entity or a relation. Let me give an example by two subject-predicat-object statements in RDF Notation3:

:Work dc:creator :Agent
:Agent rdf:type :Creator

The first statement says that a specific agent (:Agent) has created (dc:creator) a specific work (:Work). The second statement says that :Agent is a creator (:Creator). In the first dc:creator is a property while in the second :Creator is a class. You could define that the one implies the other, but you still need two different concepts because classes and properties are disjoint (at least in OWL – I am not sure about plain RDF). In Notation3 the implications may be written as:

@forAll X1, X2. { X1 dc:creator X2 } => { X2 a _:Creator }.
@forAll Y1. { Y1 a _:Creator } => { @forSome Y2. Y2 dc:creator Y1 }.

If you define two URIs for class and property of the same concept (the concept of a creator and creating something) then the two things are tightly bound together: Everyone who ever created something is a creator, and to be a creator you must have created something. This logic rule sounds rather rude if you apply it to other concepts like to lie and to be a liar or to sing and to be a singer. Think about it!

Beside the lack of fuzzy logic on the Semantic Web I miss an easy way to do „reification“ (there is another concept called „reification“ in RDF but I have never seen it in the wild) or „objectification“: You cannot easily convert between classes and properties. In a closed ontology this is less a problem because you can just decide whether to use a class or a property. But the Semantic Web is about sharing and combining data! What if Ontology A has defined a „Singer“ class and Ontology B defined a „sings“ property which refer to the same real-world concept?

Other data modeling languages (more or less) support objectification. Terry Halpin, the creator and evangelist of Object-Role Modeling (ORM) wrote a detailed paper about objectification in ORM whithout missing to mention the underlying philosophical questions. My (doubtful)
philosophic intuition makes me think that properties are more problematic then classes because the latter can easily be modeled as sets. I think the need for objectification and to bring together classes and properties with similar meaning will increase, the more „semantic“ data we work with. In many natural languages you can use a verb or adjective as noun by nominalization. The meaning may slightly change but it is still very useful for communication. Maybe we should more rely on natural language instead of dreaming of defining without ambiguity?

Zwei Jahre PICA::Record

20. Juli 2009 um 17:06 3 Kommentare

Heute vor zwei Jahren habe ich die erste öffentliche Version von PICA::Record auf CPAN hochgeladen. Das Comprehensive Perl Archive Network (CPAN) ist ein umfassendes Repository von Open-Source-Modulen für die Programmiersprache Perl. Mit Perl habe ich erst relativ spät angefangen, die die Sprache nicht sauber definiert und für ihre mögliche Unleserlichkeit bekannt ist. Andererseits trifft zu, was Larry Wall, der Autor von Perl 1999 sagte:

The very fact that it’s possible to write messy programs in Perl is also what makes it possible to write programs that are cleaner in Perl than they could ever be in a language that attempts to enforce cleanliness.

Die Tatsache, dass Programme (und damit ist hier der Quellcode gemeint) als „schön“ bezeichnet werden können zeigt, dass Programmieren auch als eine Kunst angesehen werden kann – und die Bühne für Perl ist dabei CPAN 🙂 Übrigens habe ich bislang noch keine schöne kommerzielle Bibliothekssoftware gesehen – aber Bibliotheken geht es beim Erwerb von Software ja auch weniger darum, dass sie etwas schönes und sinnvolles mit der Software anfangen können, sondern darum dass sie die Verantwortung an einen Softwarehersteller abschieben können.

Das Modul PICA::Record hat wahrscheinlich nur einen ziemlich begrenzten Anwenderkreis, da das PICA+ Datenformat sogar bei vielen Bibliothekaren eher unbekannt ist. Inzwischen ist wahrscheinlich PICA::Record mit allen Beschreibungen, Tests und Beispielen selbst die umfangreichste Dokumentation zu PICA+. Seit dem Bibliothekstag 2009 gibt es auch eine Kurzbeschreibung als Faltblatt auf Deutsch („Verarbeiten von PICA+ Daten mit PICA::Record„). Die aktuelle Version enthält als neuestes die Möglichkeit, PICA-Daten in einer SQL-Datenbank (bislang: SQLite) zu speichern (PICA::SQLiteSTore) und über ein Wiki (PICA+Wiki) darauf zuzugreifen. Für kommende Versionen ist der Ausbau dieses „CMS-Light“, einer Erweiterung der SOAP-API zum Lesen und Schreiben von Datensätzen sowie eine bessere Unterstützung von Lokaldaten geplant.

Sicher gibt es schönere Programmiersprachen als Perl, aber wenn schon mehr Personen im Bibliotheksumfeld programmieren (oder zumindest skripten) lernen – was unbedingt notwendig ist – könnte Perl die richtige Wahl sein, da sich mit PICA::Record bereits nach kurzer Zeit praxistaugliche Ergebnisse erzielen lassen. Zum deutschsprachigen Austausch zwischen Entwicklern im Bibliotheksbereich gibt es übrigens die Mailingliste bibcode.

Deutschsprachige BID/LIS-Wikis – eine Bestandsaufnahme

18. Juli 2009 um 13:48 1 Kommentar

Angeregt durch eine Diskussion über Fachcommunities auf dem BibCamp 2009 habe ich recherchiert, welche deutschsprachigen Wikis es für den Informations- und Dokumentationsbereich in Deutschland, Österreich und der Schweiz gibt.

Ein Wiki ist zwar nicht das Gleiche wie eine Community, aber es kann sowohl ein hilfreiches Werkzeug für eine Community sein als auch der Keim, um den sich eine Community bildet. Weitere Werkzeuge und Sammelpunkte von (Online-)Communities sind unter Anderem Foren, Mailinglisten und allgemeine Soziale Netzwerke á la StudiVZ, Facebook und MySpace. Die dafür eingesetzte Software wird allgemein auch als Soziale Software bezeichnet. Ein allgemeiner Irrtum in Bezug auf Online-Communities ist, dass sie sich allein mit der richtige Software schaffen ließen – dabei entstehen Communities meiner Erfahrung eher dadurch, dass sich Personen mit einem gemeinsamen Interesse finden, miteinander kommunizieren und zusammentun. Bei Wikipedia ist das gemeinsame Interesse zum Beispiel die Idee, eine Enzyklopädie zu erstellen, während bei Last.fm ganz klar die Musik im Zentrum steht. Nicht für alle Interessen und Communities sind Wikis das beste Mittel – Wikis lassen sich allerdings sehr flexibel einsetzen. Eine gute Einführung in Wikis bieten die Lektion 11 und Lektion 12 des Online-Kurs „13 Dinge„. Ausführlichere Erfahrungsberichte gibt es unter Anderem in der aktuellen Ausgabe (4/2009) der Information – Wissenschaft & Praxis (IwP) mit dem Schwerpunkt Soziale Software und Wikis. Die IfW ist leider weder Open Access noch vernüftig z.B. in DBLP erschlossen, so dass ich hier auf nichts verlinken kann: #fail

Aber zurück zu den deutschsprachigen Wikis aus dem und für den Bereich Bibliothek, Information, Dokumentation (BID) bzw. Library and Information Science (LIS): Das internationale LIS-Wiki enthält eine Linksammlung anderer Wikis in Deutsch. Eine ähnliche Übersicht enthält das MuseumsWiki unter Wikis für Bibliotheken. Geschlossene Wikis, die nicht zur Mitarbeit einladen – wie zum Beispiel das Wiki der Universitätsbibliothek Rostock, habe ich hier ausgenommen, zumal viele davon als Unternehmenswikis nicht öffentlich zugänglich sind. Mit dem ErwerbungsWiki und dem GBV-Wiki gibt es zwei Grenzfälle: das Erwerbungswiki der Expertengruppe Erwerbung und Bestandsentwicklung im Deutschen Bibliotheksverband erlaubt zwar die freie Anmeldung, aber die Hauptseiten können nur von einer Redaktion bearbeitet werden. Im Wiki des Gemeinsamen Bibliotheksverbund (GBV) werden Benutzeraccounts nur auf Anfrage erteilt (z.B. bei mir unter jakob.voss öt gbv.de); grundsätzlich kann sich aber jedoch, der einmal dabei ist, an allen Inhalten beteiligen. Ebenfalls einen eher eingeschränkten Nutzerkreis hat das Wiki des Arbeitskreis fuer Information Stuttgart (AKI-Wiki). Es bleiben fünf allgemeine, offen zugängliche, deutschsprachige BID/LIS-Wikis:

Das Netbib-Wiki sammelt Informationen rund um die Themen des netbib Weblogs.

Das Buecherei-Wiki sammelt Informationen für die Arbeit in öffentlichen Bibliotheken.

Das B.I.T. Wiki ist ein Projekt der Fachzeitschrift B.I.T. online und von Informationsmanagement-Studierenden an der Hochschule der Medien in Stuttgart (HdM).

Das InfoWissWiki wird von der (inzwischen auslaufenden) Fachrichtung Informationswissenschaft an der Uni Saarbrücken betrieben.

Schließlich beinhaltet auch die deutschsprachige Wikipedia eine Vielzahl von Artikeln aus dem Bereich Bibliothek, Information, Dokumentation.

Das Netbib-Wiki und das Buecherei-Wiki werden mit der Software CoMaWiki und die anderen drei Wikis mit MediaWiki betrieben. Obgleich beide Wiki-Engines Usability-Probleme haben, halte ich MediaWiki für die beste Wahl für allgemeine, offene Wikis: die Software wird auch in Wikipedia eingesetzt und der technische Umgang mit Wikipedia sollte zumindest rudimentär zur Grundkenntnis eines jeden Informationsspezialisten gehören (wer noch nie etwas in Wikipedia geändert hat, suche sich bei Gelegenheit einen Artikel mit Fehler oder Lücke und nehme eine kleine Korrektur vor oder hinterlasse eine Nachricht auf der Diskussionsseite des Artikels. Vom Neuanlegen von Artikeln ohne vorherige Einarbeitung muss ich aufgrund des rauhen Umgangstons dagegen leider eher abraten).

Zum Betrieb eines Wikis gehört die regelmäßige Aktualisierung der MediaWiki-Installation, damit die in Wikipedia möglichen Bearbeitungsfunktionen zur Verfügung stehen. Ebenso ist eine inhaltliche Administration notwendig, um neuen Benutzern unter die Arme zu greifen, Spam zu entfernen und im Wiki aufzuräumen – denn die Tendenz zur Vermüllung ist allen Wikis inhärent. Es sollte deshalb überlegt werden, bei welchen LIS/BID-Wikis eine dauerhafte Administration gewährleistet werden kann. Denkbar wäre zum Beispiel der Betrieb durch einen Bibliotheksverband; da sich deutsche Bibliotheksverbände in der Vergangenheit jedoch weder durch technische Kompetenz und Innovationsfreudigkeit noch durch politisches Verantwortungsbewußtsein sondern eher durch Schnarchnasigkeit hervorgetan haben, vertraue ich lieber einer NGO wie der Wikimedia Foundation.

Neben der Administration ist ein weiterer Punkt, der bei offenen Wikis häufig vernachachlässigt wird, die inhaltliche Ausrichtung: Oft wird davon gesprochen, wie bei Wikipedia „eine Enzyklopädie“ oder „ein Nachschlagewerk“ zu erstellen, was ebenso oft Quatsch ist. Die Wiki-basierte Erstellung von enzyklopädischen Artikeln macht außerhalb der Wikipedia nur dann Sinn, wenn es sich um Themen handelt, die für Wikipedia zu speziell sind oder den Charakter einer Enzyklopädie sprengen (siehe Was Wikipedia nicht ist). Beispiele für Fachwikis sind unter Anderem das Genderwiki und diverse Stadt- und Regionalwikis. Im BIT-Wiki gibt es unter Anderem ein Herstellerverzeichnis, im NetbibWiki diverse Linksammlungen und im GBV-Wiki technische Beschreibungen. Leider werde in Wikis jedoch oft auch allgemeine Definitions-Artikel angelegt, die besser in Wikipedia aufgehoben werden (z.B. vor einigen Tagen Eugene Garfield im InfoWissWiki). Ich vermute als einen Grund, dass die Autoren sich nicht den Wikipedia-Gepflogenheiten unterwerfen wollen; das ist einerseits verständlich, da die Einarbeitung in Wikipedia-Qualitätsrichtlinien Zeit erfordert und der Umgang mit der Wikipedia-Community nicht unproblematisch ist. Andererseits bietet die Arbeit im selbstverwalteten Refugium eine bequeme Ausrede, sich keinen Qualitätsstandards zu unterwerfen und andere Themenbereiche, Sichtweisen und Quellen nicht zur Kenntnis nehmen zu müssen. Wie beim Schreiben für eine Fachzeitschrift muss sich, wer in Wikipedia mitarbeiten möchte, mit speziellen Richtlinien und Empfehlungen vertraut machen und mit den anderen Beteiligten koordinieren – was im Endeffekt aber zu besseren Artikeln führt.

Die deutschsprachige BID/LIS-Wiki führen in ihrer Verstreutheit dagegen eher ein Schattendasein: Anstatt sich wenigstens auf ein allgemeines, offenes Fachwiki zu einigen werkelt jeder vor sich hin. Zwischen all den Artikelleichen, die irgendwann angelegt und dann nie wieder angefasst wurden, gibt es einige sehr hilfreiche Informationssammlungen, aber wenig Struktur – dafür dass sich Informations- und Bibliotheksspezialisten mit der Erschließung von Informationen auskennen sollten, ist das eigentlich ziemlich peinlich.

Vielleicht bin ich mal wieder etwas zu naiv was die sozialen Abgrenzungs- und Widerstandsprozesse betrifft, aber es sollte doch möglich sein, zumindests die allgemeinen, offenene, deutschsprachigen BID/LIS-Wiki (mindestens Netbib-Wiki, InfoWissWiki und BIT-Wiki) zusammenzuführen, um gemeinsam die kritische Masse für eine dauerhafte Community zu erreichen. Einzelne Projekte und Bereiche wie das sehr zu empfehlende Zukunftswerkstatt-Wiki, das Buecherei-Wiki und ein bislang nur angedachtes FaMI-Wiki können dabei ebenfalls integriert werden, während allgemeine Definitionsartikel sich besser auf ein Minimum beschränken und dann auf Wikipedia weiterverweisen.

1800 Polizisten schützen eine Wiese

21. Juni 2009 um 00:55 5 Kommentare

Mit der rhetorischen Frage „have you ever squatted an airport?“ wurde gestern in Berlin dazu aufgerufen, das Gelände des ehemaligen Flughafen Tempelhof zu besetzen. Mit der noch andauernden Aktion soll die sofortige Öffnung der Fläche bewirkt und gegen die Privatisierung des städtischen Raums demonstriert werden (siehe Hintergründe). Von den Aktivisten, die im Vorfeld unter Anderem Anleitungen zur Zaunüberwindung veröffentlicht hatten, wurde deutlich gesagt:

„Das Ziel der Aktion ist das Gelände und nicht die Polizei. Das Mittel der Aktion wird der zivile Ungehorsam sein. Konfrontationen wird clever aus dem Weg gegangen werden. Wir verfolgen das Konzept der ausgestreckten Hand.“

Die Kommentare von den Beteiligten lesen sich nicht so als die Hand angenommen worden. sebaso twitterte: „wir brauchen dringen staatsbürgerkunde für die Polizei in Berlin. Selten so viel gepöbel und grundlose Gewalt erlebt.“. Inzwischen gibt es einige Demo-Fotos bei flickr. Am meisten Aufsehen erregte das Bild eines Zivil(sic!)polizisten, der mit seiner Waffe auf Demonstranten zielt. Das 4km2 große Gelände (544 Fußballfelder) war im Vorfeld aufwändig befestigt und gesichert worden. Hans-Christian Ströbele brachte es auf den Punkt: „1800 Polizisten aus 5 Bundesländern schützen eine Wiese, das ist ein Stück aus Absurdistan.“

Bei so viel Polizeieinsatz ist es auch nicht mehr verwunderlich, warum beispielsweise nicht genügend Polizisten zur Bekämpfung von Kindesmissbrauch zur Verfügung stehen, so dass stattdessen Zensur eingeführt, um die Misstände unter den Teppich zu kehren – hier ein erklärender Cartoon und der Zensursula-Song.

Die aufwändige Polizeiaktion in Berlin erinnert auch an die Räumung des Topf & Söhne-Gelände Anfang April in Erfurt mit schwerem Polizeigerät und Spezialeinsatzkräften. Die Kosten des dortigen Einsatz überschritten den Kaufpreis des Geländes des ehemaligen KZ-Ofen-Herstellers um ein Vielfaches. Während die Besetzer auf dem Gelände freie Kulturprojekte organisierten und Geschichte aufarbeiteten, wurden die Gebäude nach der Räumung sofort abgerissen und alle Spuren beseitigt. Nun soll dort nun ein normales Gewerbe- und Wohngebiet gebaut werden – für die die es sich leisten können.

Wir begeben uns also lieber auf eine Stufe mit den Regimes in Simbabwe, Iran und China und verdrängen, was wir nicht sehen wollen, statt etwas gegen das Grundübel selber zu unternehmen. Denn das höchste Gut in diesem Land ist – nicht Kinder, nicht Gesundheit, nicht Bildung, Umwelt oder Menschenleben – sondern: das Eigentum. Es mag zwar viele Menschen (sogar Politiker) geben, die das anders sehen, aber die belügen sich nur selber, weil sie es nicht wahrhaben wollen (wie z.B. die FDP, die „keine gerechte Gesellschaft“ anstrebt) oder können (wie z.B. gutmeinend aber doof die Grünen). Sie (oder besser: wir) alle tragen dazu bei, dass das Eigentum vor allen anderen Werten steht. Die Berliner Polizisten schützen nicht nur eine Wiese sondern ein ganzes Gedankenkonstrukt – eine „fixe Idee“, die sich in unseren Köpfen so festgebrannt hat, dass wir es uns nicht andere vorstellen können: nicht diejenigen, die eine Sache benötigt oder nutzen können, sollen darüber verfügen können, sondern allein diejenige, denen es „gehört“

Ich behaupte nicht, dass Proudhons Feststellung „Eigentum ist Diebstahl“ für sich eine allglücklichmachende und einfach umzusetzende Alternative ist. Aber erstens muss man nicht gleich die Patentlösung in der Tasche haben, um auf Misstände hinweisen zu dürfen, und zweiten gibt es durchaus Alternativen. Diese herauszufinden und auszuprobieren sollte sich jedoch jeder selber Gedanken machen anstatt einfache Lösungen zu verlangen. Es reicht also nicht nur aus, die Piratenpartei zu wählen und den freien Zugang zu Informationen fördern, sondern man muss auch mal einen Flughafen besetzen 🙂

Empfehlungsdienste für Bibliotheken und Informationseinrichtungen

24. Mai 2009 um 11:32 Keine Kommentare

Im Handbuch „Erfolgreiches Management von Bibliotheken und Informationseinrichtungen“ (hrsg. von Hans-Christoph Hobohm und Konrad Umlauf im Verlag Dashöfer seit 2002) ist vor einiger Zeit das Kapitel über Empfehlungsdienste (recommender/recommendation systems) von mir erschienen, das ich nun in einer angepassten Version auf E-LIS online gestellt habe. Erklärt werden die grundlegenden Formen von Empfehlungsdiensten (explizit, inhaltsbasiert, regel- und wissensbasiert, verhaltensbasiert), ihre Entwicklung in Komponenten (Datengrundlage, Verfahren, Dienst, Anwendung) sowie eine Reihe von Beispielen. Mit „Empfehlungssysteme: Grundlagen, Konzepte und Systeme“ von André Klahold (InterRed GmbH) gibt es inzwischen auch ein deutschsprachiges Handbuch zum Thema. Eine verständliche Erklärung des collaborative filtering (einer Form von Empfehlungsdiensten) gibt der „elektrische Reporter“.

Die redaktionelle Betreuung beim Dashöfer-Verlag wusste ich beim Verfassen des Artikels sehr zu schätzen; die Form der Veröffentlichung als Loseblattsammlung – einer grobschlächtigen Vorform des Wikis – ist jedoch ziemlich unpraktisch. Hätten Hobohm und Umlauf nur einige Jahre gewartet, wären Sie wahrscheinlich selber darauf gekommen, dass solche Nachschlagewerke – zumal wenn sie regelmäßig aktualisiert werden sollen – nur noch in elektronischer Form sinnvoll sind. Das muss ja nicht bedeuten, dass es keine druckbare Version gibt und dass jeder frei ändern kann, was er möchte. Erstens ist es jedoch ziemlich mühsam, unnötig Word-Dokumente hin-und-herzuschicken, umzulayouten, auszudrucken, zu verteilen und einsortieren zu lassen, nur damit sie später herausgesucht und kopiert werden können. Und zweitens glaube ich, dass der Artikel über Empfehlungsdienste in Form eines Wikipedia-Artikels insgesamt für mehr Leser von Nutzen wäre.

Nun ja, der Wandel des Publikationswesens dauert wohl doch etwas länger als erwartet. Schade nur, dass Bibliotheks- und Informationseinrichtungen hierbei nicht unbedingt weitsichtig voran- sondern bestenfalls mitgehen. In Zukunft möchte ich zur betreuten Erstellung von regelmäßig aktualisierten Werken jedenfalls nur noch Wikis oder ähnliche Publikationssysteme nutzen (Google Docs ist schon mal ein Anfang). Aber vielleicht bin ich auch einfach etwas zu ungeduldig. 🙂