Ein Jahr Jakoblog

13. April 2008 um 12:43 7 Kommentare

Seit einem Jahr gibt es nun dieses Weblog. Das sind: 212 213 Beiträge in 365 366 Tagen, 351 Kommentare (davon etwa ein Drittel eigene und knapp die Hälfte Trackback/Pingback). Die Beiträge sind im Mittel zwei Kilobyte lang, die Verteilung sieht lognormal aus (Powerlaw). Der Zugriffsstatistik mit StatPress nach zu urteilen gibt es zur Zeit fast 150 Besucher pro Tag und zwischen 400 und 500 Seitenaufrufe (ohne Crawler etc.). Die meisten Besucher kommen per Google auf einige Artikel, die bei entsprechenden Suchanfragen hoch gerankt werden – populär sind vor allem MBTI (im Moment Google Platz 12) und ASIN (Platz 7). Besonders erfreut es, dass ich anscheinend beim Googeln nach Jakob knapp vor Jakob Maria Mierscheid lande, der immerhin zu den kompetentesten Abgeordneten des Bundestags gehört!

Eine inhaltliche Rückschau der 213 Beiträge gibt es vielleicht ein andermal. Die am Häufigsten vergebenen Tags („Bibliothek“: 69, „Wikipedia“: 29, „Web 2.0“: 23) drücken es eigentlich schon aus, danach folgen „Tagging“ und „Semantic Web“ sowie „Politik“ und „Freie Inhalte“. Für das kommende Jahr habe ich mir vorgenommen, weniger im Blog und dafür mehr an der Dissertation zu schreiben. 😉

Inetbib 2008, first German „2.0“ library conference

10. April 2008 um 16:06 2 Kommentare

Participating at the Inetbib 2008 conference in Würzburg I am pleased to see that web 2.0 usage among German librarians finally has reached the critical mass. I’d guess that we are more or less 18 month behind the situation of the vital US „library 2.0“ scene. With Inetbib 2008 we finally have a larger general library conference with open wifi and participants blogging (technorati, google blogsearch), twittering, flickring and social-networking the event (or just reading email if the speaker bores ;-). I hope that soon no more library colleauge will think that „all this internet services“ are a waste of time but usefull tools to better recognize developements, ideas, and events – even outside the German biblio-blogosphere (for instance here). The next event will be BibCamp, a Library 2.0 BarCamp at March May 16th/17th in in Potsdam and Berlin.

Aggregation von Metadaten aus Social Software-Diensten mit Aloe

3. April 2008 um 18:33 1 Kommentar

Im Vortrag „Sagt wer? Metadaten im Web“ auf der re:publica 08 sprach Martin Memmel darüber, „wie Daten von Experten, Maschinen und Endusern kombiniert“ werden können. Dabei stellte er das Projekt Aloe vor (link), in dem am DFKI Metadaten aus verschiedenen Quellen kombiniert und annotiert werden können. Alle Funktionen sind auch als Webservice verfügbar. Interessant sah die im Vortrag vorgestellte Tagging-Funktion aus, die Tag-Vorschläge aus mehreren Tagging-Diensten zusammenführt. Mehr dazu in den Vortragsfolien bei Slideshare.

Wirklich interessant werden solche aggregierenden Dienste meiner Meinung nach erst, sobald sich offene Standardformate zum Austausch von Kommentaren, Bewertungen, Tags etc. und anderen Metadaten durchsetzen. Bisher nicht bekannt in diesem Kontext war mir APML. Ein kritischer Punkt, der am Ende heftig diskutiert wurde, sind die Rechte an Metadaten und was juristisch und moralisch möglich und vertretbar ist. Ist es beispielsweise legitim, aus verschiedenen Social Networking-Plattformen soziale Graphen zusammenzuführen und weiterzugeben? Welche Rechte an Metadaten kann es überhaupt geben und welche lassen sich überhaupt durchsetzen? In jedem Fall spannend, wie es mit der Zusammenführung von Daten aus verschiedenen Diensten weitergeht.

Morgen nimmt Martin Memmel auch noch am Panel Social Media in der Wissenschaft teil, wo die „Möglichkeiten und Grenzen einer Wissenschaft 2.0“ diskutiert werden.

Bibliotheken in LibraryThing mit LibraryThing Local

12. März 2008 um 16:38 Keine Kommentare

LibraryThing ist vor allem für Öffentliche Bibliotheken wunderbar geeignet – ich hoffe, dass bald mal eine größere Stadtbücherei einsteigt, bislang ist ja Nordenham einsamer Vorreiter. Bisher hat noch niemand die Einbindung in den OPAC mit LibraryThing for Libraries umgesetzt. Schade, dass AbeBooks (zu 40% Anteilseigner an LibraryThing) laut Ausstellerverzeichnis nicht auf der Leipziger Buchmesse ist – ein direkter Ansprechpartner würden deutschen Bibliotheken sicher helfen.

Das neueste Feature (und Anlass dieses Beitrags) ist „LibraryThing Local“: dort lassen sich nette kleine Buchhandlungen, Bibliotheken, literarische Veranstaltungen und sonstige Orte mit Bezug zu Büchern und Lesen eintragen [via netbib]. Aus Berlin hat die Möglichkeit zum Beispiel Marius entdeckt, der darauf hinweist, dass in der Stadtteilbibliothek Berlin-Buch eine Lesung stattfindet. Jetzt müssten diese Daten noch irgendwie mit anderen Veranstaltungsdiensten wie wevent Venteria verknüpft werden.

Die ungeheure Kraft der Communities und warum ich LibraryThing für Bibliotheken ebenso relevant halte wie Wikipedia zeigt vielleicht folgende Aussage aus dem LibraryThing-Weblog:

This morning, three days after its official launch, LibraryThing Local passed 9,000 venues. (UPDATE: 10,000 13,000 15,000 16,000.)

In this time some 700 members have entered more libraries, bookstores, fairs and other venues than our closest competitor in this space assembled in ten months of work, drawing mostly on chain bookstores and publicists.

Kurze Einführung zu LibraryThing für Bibliothekare

9. Februar 2008 um 16:34 5 Kommentare

In Heft 137 des Mitteilungsblatt der Bibliotheken in Niedersachsen und Sachsen-Anhalt erschien letztes Jahr ein zweiseitiger Artikel zu LibraryThing. Obwohl bei LibraryThing schneller neue, spannende Features hinzukommen, als ich sie ausprobieren kann (inzwischen sogar Reihenwerke!), ist das grundlegende Prinzip unverändert: LibraryThing stellt Datenbank, Schnittstellen und Benutzeroberfläche bereit (von der sich herkömmliche OPACs übrigens gleich mehrere dicke Scheiben abschneiden können!) und die Benutzer erstellen, sammeln, verbessern, diskutieren, rezensieren etc. Bücher. Der Vergleich, dass LibraryThing für Bibliotheken das sei was Wikipedia für Enzyklopädieverlage, hinkt zwar an verschiedenen Stellen – so ganz von der Hand zu weisen ist es aber auch nicht. Deshalb sollte frau/man sich selber ein Bild davon machen.

Für die Einführung mit dem Titel „LibraryThing – Web 2.0 für Literaturfreunde und Bibliotheken“ recht ein Blatt beidseitig A4. Also auszudrucken, der/dem Kolleg(i/e)n hinlegen und mithelfen, dass das Deutsche Bibliothekswesen nicht den Anschluß verliert. Die OpenOffice-Datei ist auch verfügbar und Public Domain, d.h. es ist in diesem Fall völlig in Ordnung, meinen Namen rauszunehmen, im Text herumzustreichen und etwas anderes daraus zu machen!

Zeitreihen dynamisch visualisieren mit Timeplot

4. November 2007 um 20:21 Keine Kommentare

Im Rahmen des SIMILE-Projekts gibt es nach Timeline mit Timeplot ein weiteres schönes neues Werkzeug zur Datenvisualisierung.

Im Gegensatz zu ManyEyes und Swivel ist etwas mehr Handarbeit angesagt, um mit JavaScript dynamisch, webbasiert Zeitreihen anzeigen zu können, dafür ist Timeplot flexibler und kann auf eigenen Webseiten eingebunden werden. Die zu visualisierenden Daten können unter Anderem als kommaseparierte Zeitreihen oder Zeitpunkte im Timeline XML event format vorliegen (für welches ich leider keine gute Dokumentation aber dieses Tool gefunden habe). Mit diesem Dienst können Ereignisse im hCalender- oder vCalender-Format ins Timeline-Format konvertiert werden. Google experimentiert ebenfalls mit Zeitreihen als Antwort auf Suchanfragen aber so wie ich Google kenne, kann man die Suchergebnisse wahrscheinlich nicht weiterverwenden.

Wer ganze Mashups zur Visualisierung mit JavaScript zusammenbasteln möchte, sollte sich das ebenfalls bei SIMILE entstandene Exhibit ansehen.

Weblogs Sammeln, Erschließen, Verfügbar machen und Archivieren

19. Oktober 2007 um 03:03 2 Kommentare

Ich ärgere mich ja schon seit längerer Zeit, dass praktisch keine Bibliotheken Weblogs sammeln und archivieren, obwohl diese Mediengattung bereits jetzt teilweise die Funktion von Fachzeitschriften übernimmt. Inzwischen kann ich unter den Kollegen zwar ein steigendes Interesse an Blogs feststellen (der nächste Workshop war nach kurzer Zeit ausgebucht), aber so richtig ist bei der Mehrheit noch nicht angekommen, dass hier eine mit der Einführung des Buchdrucks oder Erfindung von Zeitschriften vergleichbare Evolution im Gange ist. Ansonsten sollten doch viel mehr Bibliotheken damit beginnen Weblogs zu Sammeln, Erschließen, Verfügbar zu machen und zu Archivieren.

Anstatt erstmal darüber zu diskutieren, in welche MAB-Spezialfelder die Daten kommen und als was für eine Mediengatung Weblogs gelten, müsste nur mal einer der existierenden Open Source-Feedreader aufgebohrt werden, so dass er im großen Maßstab auf einem oder mehreren Servern läuft und wenigstens jene Feeds sammelt, die irgend ein Bibliothekar mal als sammlungswürdig eigestuft hat. Alles was wohlgeformtes XML und mit einem Mindestsatz an obligatorischen Elementen (Autor [Zeichenkette], Titel [Zeichenkette], Datum [ISO 8061], Inhalt [Zeichenkette]) ausgestattet ist, dürfte doch wenigstens so archivierbar sein, dass sich der wesentliche Teil rekonstruieren lässt – Besonderheiten wie HTML-Inhalte, Kategorien und Kommentare können ja später noch dazu kommen, wenn die Infrastruktur (Harvester zum Sammeln, Speicher zum Archivieren, Index zum Erschließen und eine Lesemöglichkeit zum Verfügbar machen) steht.

Für die Millionen von Blogartikeln, die bislang verloren sind (abgesehen von den nicht für die Archivierung zur Verfügung stehenden Blogsuchmaschinen wie Bloglines, Technorati, Google Blogsearch, Blogdigger etc.) gibt es zumindest teilweise Hoffnung:

Im September wurde RFC 5005: Feed Paging and Archiving definiert eine (auch in RSS mögliche) Erweiterung des ATOM-Formats, bei der vom Feed der letzten Einträge auf die vorhergehenden Einträge und/oder ein Archiv verwiesen wird. Im Prinzip ist das schon länger möglich und hier an einem Beispiel beschrieben, aber jetzt wurde es nochmal etwas genauer spezifiziert. Damit ist ATOM eine echte Alternative zum OAI-PMH, das zwar der Bibliothekswelt etwas näher steht, aber leider auch noch etwas stiefmütterlich behandelt wird.

Wie auch immer: Bislang werden Blogs nicht systematisch und dauerhaft für die Nachwelt gesammelt und falls Bibliotheken überhaupt eine Zukunft haben, sind sie die einzigen Einrichtungen die dafür wirklich in Frage kommen. Dazu sollte in den nächsten Jahren aber die „Erwerbung“ eines Blogs für den Bibliotheksbestand ebenso vertraut werden wie die Anschaffung eines Buches oder einer Zeitschrift. Meinetwegen können dazu auch DFG-Anträge zur „Sammlung und Archivierung des in Form von Weblogs vorliegenden kulturellen Erbes“ gestellt werden, obgleich ich diesem Projektwesen eher skeptisch gegenüber bin: Die Beständige Weiterentwicklung von Anwendungen als Open Source bringt mehr und es wird auch weniger häufig das Rad neu erfunden.

P.S.: Auf der Informationsseite der DNB zur Sammlung von Netzpublikationen findet sich zu Weblogs noch nichts – es liegt also an jeder einzelnen Bibliothek, sich mal Gedanken über die Sammlung von für Sie relevanten Weblogs zu machen.

Semantic Web aus Bibliothekssicht

14. Oktober 2007 um 23:00 2 Kommentare

Ben weist im IB-Weblog auf einen Beitrag von Allen Cho hin, der Web 3.0-Librarian-Weblog von hin, der mit Dean Giustini den Artikel The Semantic Web as a Large, Searchable Catalogue: A Librarian’s Perspective verfasst hat. Abgesehen davon, dass sie aus meiner Sicht mit einigem Durcheinander und Fehlurteilen ahnen lassen, dass über das Semantic Web ebenso viel Übertreibungen und Unsinn verbreitet werden wird, wie über Web 2.0, enthält der Artikel trotz Übertreibungen eine richtige Kernaussagen: Dokumentarische Erschließung und Semantic Web haben viele Gemeinsamkeiten. Oder wie die Autoren schreiben:

The Resource Description Framework (RDF), a method of connecting URIs in a meaningful way, is the key to making the Semantic Web possible. Making connections among and between documents and ideas is something librarians do for a living.

Nur: wieviele Bibliothekare haben sich wenigstens mal mit RDF auseinandergesetzt und zumindest die wichtigsten Eigenschaften (URIs, Unicode, Triples) verstanden? Wenn man daran denkt, welch Schattendasein FRBR nach über einem Dutzend Jahren noch immer fristet und wie noch immer eher diskutiert statt ausprobiert wird, kann man schon stark daran zweifeln, ob an der folgenden Prognose etwas dran ist:

Many of the same techniques of bibliographic control apply to the possibilities of the Semantic Web. It was the computer scientists and computer engineers who had created Web 1.0 and 2.0, but it will ultimately be individuals from library science and information science who will play a prominent role in the evolution of organizing the messiness into a coherent whole for users.

Zumindest mit „individuals from library science and information science“ haben Sie recht.

Neues von LibraryThing

1. Oktober 2007 um 23:52 Keine Kommentare

Wenn ich angemessen über all die interessanten Neuerungen bei LibraryThing berichten würde, käme ich zu gar nichts mehr, so schnell entwickelt sich die Community für Literaturfreunde. Zur Einführung habe ich vor einigen Wochen einen kurzen Artikel für das Mitteilungsblatt der Bibliotheken in Niedersachsen und Sachsen-Anhalt (mb) geschrieben (Heft 137/August 2007, leider noch nicht online).

Zu den wesentlichen Neuerungen bei LibraryThing gehören weitere Mitarbeiter (unter anderem Teilzeitmitarbeiter Giovanni, der mit seiner anderen Hälfte bei justbooks in Düsseldorf arbeitet und auch ab und zu blogt), die Verwendung von Solr (basierend auf Apache Lucene) als Suchmaschine , ein Google Book Search Search-Bookmarklet, um Google gemeinsam Identifier zu entlocken, und nun auch ein eigenes Wiki für LibraryThing.

Im WikiThing kann unter anderem eingesehen werden was die Mitarbeiter so jeden Tag treiben. Für mich interessant sind die Hinweise zur Einbindung von LibraryThing for Libraries in andere Bibliothekssysteme. Aha, Horizon Information Portal 3.x nutzt also auch XSLT zur Darstellung – ich warte ja noch, dass das für PICA freigegeben wird. Ich habe mal angefangen, die Einbindung von Katalogen in LibraryThing etwas weiter zu beschreiben.

Ich kann 2.0 nicht mehr hören

21. September 2007 um 17:43 Keine Kommentare

Mag sein, dass ich etwas gereizt bin, dass ich dauernd Web 2.0, Dies 2.0 und Das 2.0 lesen muss – das Faß zum Ãœberlaufen brachte heute morgen in der Zeitung eine Rezension des Buches Manieren 2.0. Ich kann 2.0 nicht mehr hören ! Die einzig passende Verwendung ist zur Zeit Stasi 2.0 für den aufgrund von Sicherheitswahn stattfindenden Umbau des Rechtsstaates.

Das Web 2.0 wurde schon Ende 2005 totgesagt und selbst Tim O’Reilly hatte schon 2006 genug davon – inzwischen ist jeder Bezug, wie zum Beispiel diese schwachsinnige Prognose nur noch reinster Bullshit (übrigens sehr zu empfehlen die Abhandlung von Harry Frankfurt!). Wie wäre es, statt weiter dummes Zeug zu erzählen oder den nächsten Hype abzuwarten, mal Klartext zu reden, also beispielsweise statt „Web 2.0“ einfach „Die aktuellen Entwicklungen im Internet“? Aber da müsste man ja genaur sagen, welche Entwicklungen gemeint sind, während mit „2.0“ ein „irgendwas neues, verstehe ich selber nicht, aber ich tue mal so als ob ich Ahnung habe“ kaschiert werden kann.