2007 Juli « Jakoblog — Das Weblog von Jakob VoÃŸ

Blog
About

LibrayThing makes subject indexing not suck

30. Juli 2007 um 02:19 Keine Kommentare

I just mentioned it in my previous post – LibraryThing released a new tagging feature called „Tagmash„. Here a quick review for those of you who don’t read German and because I am not the only one who is so excited about Tagmash:

From a library and information science point of view the feature is little more then saved searches for boolean retrieval in a collaborative subject indexing system. But this „little more“ makes the difference: It’s the interface, stupid! You can create elaborated queries with OR, AND, and NOT in library catalouges and information retrieval systems since decades but most users don’t even know about it – it’s just too complicated and last but not least: it’s not fun!

Tim knows how to make OPACs not suck. It’s refreshing to see the the inventions of information retrieval beeing ~~reinvented~~ implemented in a way that is usable for everyone. David Weinberger got the heard of it in a comment to his posting about Tagmash:

So it is really a matter of positioning and perception. The Google url for a search on france and wwii is: http://www.google.com/search?source=ig&hl=en&q=france+wwii
LibraryThing’s url for the tagmash is http://www.librarything.com/tag/france,wwii So, it’s more human readable. More important, the tagmash page tries to assemble resources related the tagmash.

That’s the point: Assembling resources. A retrievel system where you have to type in a query in some special language to only get a list of hits (or a stupid „nothing found“ message) is just out of date. Other ways to present catalouge content in libraries are rare and experimental but they exist – we need more of them!

The query language (I suppose Tim would not call it such) of LibraryThing is going to evolve as well as the retrieval system, for instance to support weighted boolean retrieval, but the most important part will remain the user interface.

P.S: What I miss in LibraryThing tagging is RSS-Feeds for the books in Tagmashes (so you can create alerting services) and support of SKOS for the Semantic Web (which is not Tim’s job and will take some time).

Tags: Bibliothek, LibraryThing, Tagging Keine Kommentare

Nochmal Tagging und dann los

29. Juli 2007 um 23:55 1 Kommentar

Bevor ich morgen nach Taiwan fliege (mit Zwischenlandung in Hongkong aber hoffentlich nicht so wie auf diesem Video), hier noch zwei Neuigkeiten zum Thema Tagging:

Auf der Dublin-Core Konferenz 2007 (DC-2007) in Singapur wird es eine von Liddy Nevile organisierte Session zum Thema Tagging geben. Angesichts eines fehlenden Permalinks fÃ¼r die Session, der Nicht-Nennung und Verlinkung der URL des im Abstract genannten Social Tagging wiki und des Tagesordnungspunktes „Election of leaders“ kann ich mir allerdings eine Spitze Bemerkung nur mÃ¼hsam noch verkneifen.

Noch interessanter ist die neueste Entwicklungen der Tagging-Funktion in LibraryThing. Unter der Bezeichnung „Tagmash“ sind nun (soweit ich es auf den ersten Blick verstanden habe) gespeicherte Anfragen mit erweitertem Booleschem Retrieval Ã¼ber Tags mÃ¶glich. Die Innovation liegt wie allgemein beim Tagging weniger in der FunktionalitÃ¤t als in der Umsetzung. Vom Standpunkt der Informationswissenschaft mag es keinen Unterschied machen, ob jemand seine Suchanfrage in einer speziellen Anfragesprache eingeben muss oder die Anfrage einfach zusammenklicken kann, aber in der Praxis liegen Welten dazwischen. Ãœbrigens unterstÃ¼tzt LibraryThing ebenfalls bereits MÃ¶glichkeiten fÃ¼r hierarchische Tags (hier ein Beispiel) und terminologische Kontrolle. Die Reaktionen auf Tagmash finden sich am besten Google Blogsearch oder Bloglines (Technorati ist bei mir durch die ZumÃ¼llung ihrer Suchergebnisse mit Videos und Fotos erstmal unten durch).

Noch ein Hinweis in eigener Sache: Die kommenden Postings werden wahrscheinlich etwas kÃ¼rzer ausfallen oder ich schreibe gleich in unserem Urlaubsblog.

Tags: DC2007, Dublin Core, LibraryThing, Tagging, Taiwan 1 Kommentar

Mehrere AdressbÃ¼cher in Thunderbird

29. Juli 2007 um 21:01 1 Kommentar

Obwohl es anscheinend schon mal ging, kann ich in Thunderbird (Version 2.0.0.5 fÃ¼r Linux) keine neues Adressbuch Ã¼ber Datei>Neu>Adressbuch anlegen. Wem ein „PersÃ¶nliches Adressbuch“ und „Gesammelte Adressen“ nicht genug sind, der kann aber weitere AdressbÃ¼cher anlegen, indem er Ã¼ber Extras>Exportieren ein vorhandenes Adressbuch exportiert, die Exportdatei danach umbenennt und anschlieÃŸend Ã¼ber Export>Importieren das Adressbuch importiert. Ãœber den Export kann ein Adressbuch auch in eine Tabellenkalkulation oder andere Datenbanken importiert werden – gerade bei grÃ¶ÃŸeren Datenmengen (mein Adressbuch umfasst mitlerweile Ã¼ber 500 EintrÃ¤ge) ist die Bearbeitung und Weiterverarbeitung dort besser mÃ¶glich. Was mir trotz des zwingend notwendigen Plugins MoreColsForAddressBook noch fehlt ist die MÃ¶glichkeit, Kontakte mit einem Bild zu versehen und Links auf Profile bei verschiedenen anderen Diensten zu setzen, so wie die „Also on “ Connections bei LibraryThing. FOAF-Support wÃ¤re auch nicht schlecht.

Tags: Adressverwaltung, Thunderbird 1 Kommentar

Vortrag zum Tagging

27. Juli 2007 um 11:35 Keine Kommentare

Die Unterlagen zum Vortrag Towards integration between collaborative tagging and professional indexing von Traugott Koch am 26.6.2007 im Berliner Bibliothekswissenschaftlichen Kolloquium sind nun Online. Ich finde die analytische Zusammenstellung des Themas sehr bereichernd und hilfreich fÃ¼r weitere Studien – und dass die Forschung noch sehr am Anfang steht, hat Traugott gut dargestellt.

Tags: Tagging Keine Kommentare

Von ISBD zum Web 2.0 mit Mikroformaten

26. Juli 2007 um 14:18 15 Kommentare

Den folgenden Beitrag habe ich bereits in Ã¤hnlicher Form in INETBIB gepostet. Um ihn in die BlogosphÃ¤re einzubinden, poste ich ihn hier nochmal als Blogeintrag.

Um sich nicht im Sommerloch langweilen zu mÃ¼ssen, habe ich hier eine kleine Aufgabe fÃ¼r ISBD-Experten, Bibliothekare und andere Zukunftsinteressierte: Es geht um nicht weniger als die die Entwicklung eines bibliothekarischen Datenformates. Da der Beitrag etwas lÃ¤nger ist, hier eine

Zusammenfassung

1. Im Web sind mehr und mehr Daten direkt und in standardisierten Formaten zur Weiterverarbeitung verfÃ¼gbar
2. Durchsetzen wird sich am Ende das, was im Browser ohne Plugin unterstÃ¼tzt wird
3. So wie es aussieht, werden dies Mikroformate sein
4. FÃ¼r Bibliographsche Daten fehlt bislang ein Mikroformat
5. Wenn sich Bibliothekare nicht mit ihrem Sachverstand an der Entwicklung eines solchen Formates beteiligen, tun es andere – und das nicht unbedingt nach bibliothekarischen Gesichtspunkten.

Worum geht es?
Beitrag Von ISBD zum Web 2.0 mit Mikroformaten weiterlesen…

Tags: Bibliothek, ISBD, Microformats, Semantic Web, Standards, Web 2.0 15 Kommentare

FÃ¶rderpreis fÃ¼r Suchmaschinen

26. Juli 2007 um 11:40 Keine Kommentare

Der GemeinnÃ¼tzige Verein zur FÃ¶rderung der Suchmaschinen-Technologie und
des freien Wissenszugangs (SuMa e.V.) schreibt mit dem SuMa Awards 2008 einen FÃ¶rderpreise fÃ¼r Suchmaschinen aus. FÃ¼r seine BemÃ¼hungen Alternativen zu Google aufzuzeigen und umzusetzen musste Herr Sander-Beuermann schon einige HÃ¤me einstecken – jetzt kÃ¶nnen die Kritiker also beweisen, dass sie es besser kÃ¶nnen.

Nach den bisherigen Informationen beschrÃ¤nkt sich der Wettbewerb nicht nur auf technische Realisierungen – auch wirtschaftliche und kÃ¼nstlerische Auseinandersetzungen sind gefragt. Mich wÃ¼rde beispielsweise interessieren, was an Semantic Web und Suchagenten wirklich dran ist und wie personalisierte Suchdienste das Suchverhalten verÃ¤ndern – werden wir ohne Internet bald an digitalem Alzheimer leiden? Am Wettbewerb kann also jeder vom Studenten bis zur Forschungsgruppen teilnehmen.

Unter SuMa-Lab.de zeigt der Verein einige existierende Projekte, daneben ist sicherlich A9 einen Blick wert. Eine Suchmaschine muss auch nicht von Grund auf neu programmiert werden, sondern kann mit etablierten Techniken (OpenSearch, SRU, OAI, RSS etc.) vielleicht sogar einfach zusammengeklickt werden – ob kleine LÃ¶sungen wie Planet Biblioblog den Hauptpreis bekommen, weiÃŸ ich nicht aber mit vielen solcher kleinen LÃ¶sungen („Webservices“) ist sicherlich mehr zu erreichen als mit dem Versuch eines dicken Google-Clons. Vergleichbare Wettbewerbe (allerdings mehr technik-zentriert) gab es Ã¼brigens schon bei Talis (Mashing Up The Library competition) und bei OCLC (OCLC Research Software Contest).

Tags: Suchmaschine, Webservices, Wettbewerb Keine Kommentare

Open Library Project: Wikipedia der Kataloge

23. Juli 2007 um 14:35 3 Kommentare

Ein freies Projekt zur Katalogisierung aller jemals erschienenen Publikationen war ja abzusehen, aber dass es so schnell geht, hat mich doch Ã¼berrascht. Das letzten Montag bekanntgegebene Open Library Project ist eine vom Internet Archive unterstÃ¼tze Initiative, nach dem Wikipedia-Prinzip einen frei editierbaren Katalog zu schaffen. Die Software ist Open Source, kann also auch lokal installiert werden. Als Suchmaschine wird anscheinen Lucene-Solr verwendet. Einen Ãœberblick gibt es eine Guided Tour und die System-Dokumentation.

Wenn man sich die Beteiligten und weitere Personen auf den Mailinglisten zum Projekt (Ol-lib, Ol-discuss, Ol-tech) ansieht, so sieht das Projekt sehr vielversprechend aus. Geleitet wird das Projekt von Aaron Swartz, und Tim Spaling (LibraryThing) ist dem Projekt auch wohlgesonnen.

Verwandte Projekte zur gemeinsamen Katalogisierung sind LibraryThing sowie Social Bookmarking-Dienste wie CiteULike, Connotea und BibSonomy und von Content-Seite Project Gutenberg sowie das weniger freie Google Books. Als grÃ¶ÃŸten Partner oder Konkurrenten – je nachdem aus welcher Richtung betrachtet – sehe ich allerdings WorldCat. Die aus der Wikipedia-Community hervorgebrachten AnsÃ¤tze finde ich nicht so relevant, wenngleich Wikipedia natÃ¼rlich eingebunden werden sollte.

Wie schon LibraryThing ist das Open Library Project bislang ausschlieÃŸlich Englisch und nicht fÃ¼r Mehrsprachigkeit konzipiert (auch bei LibraryThing ist nur OberflÃ¤che mehrsprachig, wÃ¤hrend die Tagging-Daten und Texte einsprachig sind). Wenn sich das Open Library Project ein Beispiel an Wikipedia nehmen will, sollten sprachabhÃ¤ngige Bestandteile besser in eigene Komponenten ausgelagert werden.

Und was bedeutet das ganze fÃ¼r die Bibliotheken?: In spÃ¤testens 5 Jahren werden alle wesentlichen Katalogdaten frei sein, zu einem wesentlichen Teil nicht mehr ausschlieÃŸlich von Bibliothekaren erstellt werden und verschiedene Anbieter werden Suchfunktionen Ã¼ber diese Daten bereitstellen. Auf diesen Wandel sollte sich das Bibliothekswesen einstellen.

Tags: Bibliothek, Open Library 3 Kommentare

Entwicklungen an der Nationalbibliothek von Australien

23. Juli 2007 um 10:10 Keine Kommentare

National Library of Australia IT Architecture Project Report

Die Nationalbibliothek von Australien (NLA) hat vor einiger Zeit einen sehr ansehnlichen Lucene-basierten Katalog-Prototypen verÃ¶ffentlicht. Dass die NLA zukunftsweisende Entwicklungen betreibt, zeigt auch die geospatial search (deren Eingabemaske allerdings nicht sehr komfortabel ist) und den im MÃ¤rz diesen Jahres verÃ¶ffentlichten National Library of Australia IT Architecture Project Report auf den ich hiermit hinweisen mÃ¶chte. Den folgenden Absatz aus dem Report kÃ¶nnte ich direkt unterschreiben:

The benefits of having a native level of support for standard protocols in the architecture cannot be overestimated. A standards-based service-oriented approach for core services such as Contribute, Alert, Harvest and Request will allow protocols such as SRU Update, RSS, OAI-PMH and OpenURL to be supported across all applications. It will also ensure that these protocols are part of the Library’s way of thinking when training new staff or prototyping new requirements; and that gaps in standards are identified and addressed through a testbed approach, as part of the development process.

Ãœbrigens setzt die NLA wie der GBV auch als Zentralsystem das CBS von OCLC PICA ein.

Tags: Australien, Bibliothek, Standards Keine Kommentare

Streit um Theseus: wohin mit 120 Millionen?

20. Juli 2007 um 15:36 2 Kommentare

Wie am 19.7 mittgeilt wurde ist das EU-Suchmaschinen-GroÃŸprojekt Theseus bewilligt worden. Der GemeinnÃ¼tzige Verein zur FÃ¶rderung der Suchmaschinen-Technologie und des freien Wissenszugangs e.V. (SuMa-eV) regt sich darÃ¼ber auf (siehe Pressemitteilung), allerdings dummerweise aus den falschen GrÃ¼nden.

Es ist nÃ¤mlich viel eher beklagenswert, dass ohne verbindliche Vorgaben 120 Millionen Euro der GroÃŸindustrie (Empolis GmbH, der SAP AG, der Siemens AG und der Deutsche Thompson oHG) in den Rachen geworfen werden, die dafÃ¼r bunte Luftblasen („Web 3.0“) erzeugt und groÃŸe Versprechungen Ã la Transrapid und Mautsystem gemacht werden. Die Panikmache des Suma e.V. kann ich allerdings nicht ganz nachvollziehen. Dass auf „Semantische Technologien“ statt auf eine Google-Kopie gesetzt wird, ist nÃ¤mlich der richtige Weg – nur muss dieses Buzzword in der Praxis auch richtig ausgefÃ¼llt werden, was ich bei der vorliegenden Ausgangslage stark bezweifle.

Die 120 Millionen wÃ¤ren viel besser angelegt, wenn damit zu einem Teil bereits bestehende OpenSource-Initiativen im Suchmaschinen- und Semantic-Web-Bereich unterstÃ¼tzt werden und mit dem Rest digitalisiert und annotiert wird (sei es in Wikipedia, LibraryThing & Co oder durch Bibliotheken und Digitalisierungseinrichtungen). Eine interessante Anwendung der „semantischen Technologien“ wÃ¤re es Ã¼brigens mal all die beteiligten Projektpartner, Firmen und Personen mit ihren GeschÃ¤ftsbeteiligungen und Verstrickungen transparent zu erschlieÃŸen, um zu erfahren, wer hier wem in die Tasche wirtschaftet.

Nachtrag: in der Englischsprachigen BlogosphÃ¤re gibt es bereits Ã¼ber ein Dutzend BeitrÃ¤ge zu Theseus. Besonders gefallen hat mir Galileo of the internet, der auch noch die besondere EuropÃ¤ische Komponente dieser Geldverschwendung darlegt:

But nothing symbolises the divide between old Europe and the New World. Whereas Google is a testament to the power of free enterprise, set up by Larry Page and Sergey Brin, then PhD students at Stanford University, the European version is a multi-million project, heavily subsidised by the German and French governments, and developed by some of the largest corporate giants in Europe.

Tags: Bibliothek, EU, Suchmaschine, Theseus 2 Kommentare

Zotero, COins und technische Kompetenz in Bibliotheken

19. Juli 2007 um 23:22 2 Kommentare

Das Firefox-Literaturverwaltungs-Plugin Zotero wurde schon vor einigen Monaten in verschiedenen Bibliotheks-Weblogs genannt und unter Anderem auf e-teaching.org vorgestellt; da es Firefox 2.0 voraussetzt, habe ich es mir aber erst jetzt ein wenig nÃ¤her angesehen.

Zotero erkennt auf vielen Webseiten bibliographische Angaben, so dass sie mit einem Mausklick in die eigene Literatursammlung Ã¼bernommen werden kÃ¶nnen. Darunter sind auch Bibliothekskataloge, allerdings bislang noch keine aus Deutschland. Das ist allerdings auch nicht verwunderlich, denn wer sollte die Anbindung an Zotero auch umsetzen wenn nicht die so genannten „Web 2.0“-Experten mit bibliothekarischem Umfeld?

Soweit ich es verstanden habe, genÃ¼gt fÃ¼r Zotero, bei der Titelanzeige in die HTML-Seite OpenURL-Daten mittels COins (ContextObjects in Spans) einzufÃ¼gen. COins sind nicht nur fÃ¼r Zotero von Bedeutung sondern wird bereits jetzt als allgemeines Mikroformat fÃ¼r bibliographische Daten eingesetzt (die Microformats-Community werkelt derweil dennoch an einem eigenen Standard herum).

Da COins auf OpenURL basiert, dÃ¼rfte es bei Katalogen, die bereits OpenURL als Source fÃ¼r Linkresolver unterstÃ¼tzen, einfach sein, auch COins anzubieten. Dies ist nebenbei bemerkt auch ein Beispiel dafÃ¼r, wie wichtig es ist, dass Bibliotheken die technische Kompetenz zur Entwicklung ihrer OPACs selbst benÃ¶tigen anstatt die Katalogsoftware bei einem Hersteller einzukaufen ohne selber daran herumzuskripten. Denn obwohl die Einbindung von COins technisch nicht aufwendig ist, hat ein herkÃ¶mmlicher kommerzieller Hersteller in der Praxis dazu weder die MÃ¶glichkeit (auÃŸer er hat direkten Zugang zum Katalogserver) noch den Anreiz (auÃŸer er bekommt einen expliziten, bezahlten Auftrag). Die Bibliothek selber kann aber ohne die technischen FÃ¤higkeiten, weder mal eben etwas wie COins selber in die eigenen Katalogsoftware integrieren, noch seinem Softwarehersteller frÃ¼h und konkret genug sagen, was dieser genau umsetzen soll – und bekommen dann deshalb irgend etwas unzureichendes als „Web 2.0“ verkauft.

P.S.: Wie infobib mitteilt ist seit kurzem die Institutsbibliothek der SaarlÃ¤nder Informationswissenschaft schon soweit – ist ja auch kein Produkt von der Stange.

Tags: Bibliothek, Microformats, Zotero 2 Kommentare

Nächste Seite »

Jakoblog — Das Weblog von Jakob VoÃŸ