SuMa-eV Kongress 2008

30. September 2008 um 22:53 Keine Kommentare

Letzten Donnerstag fand in Berlin die 5. Tagung des SuMa-eV statt, Carl Meyer hat einen pointierten Bericht geschrieben. Preisträger des SuMa Award in der Sparte Musik war die Altpunker-Band „Die Betakteten“ mit dem „Lied vom Datenkraken„. Noch besser als das Lied ist fast die Aufführung in der Vertretung des Landes Niedersachsen beim Bund (sic!) – das hätte sich Sänger Micro zu seiner Zeit bei den Abstürzenden Brieftauben wohl eher nicht gedacht. Am 10. Oktober geht die Tour dann weiter zur Fachtagung für Datenschutzbeauftragte.

In die Pleite mit ungeplanten Medien-Mashups

29. September 2008 um 19:59 3 Kommentare

Eine interessante Verkettung von Internetbasierten Medien hat am 8. September zu einem Verlust von mindestens 20 Millionen Dollar in 5 Minuten geführt. Für Banken sind das zwar im Moment sprichwörtliche „Peanuts“ (die ich gerne annehme), aber die Geschichte ist so bemerkenswert, dass ich die Details nachrecherchiert und hier zusammengefasst habe. Weitere Informationen gibt es unter Anderem im Artikel von James Erik Abels.

Am 10.12.2002 veröffentlichte die Zeitung Chicago Tribute einen Artikel über den damaligen Konkurs der Flugline United Airlines. Der Artikel erschien auch im Online-Portal South Florida Sun Sentinel, das zum Tribune gehört. Inzwischen ist United Airlines wieder – mehr schlecht als recht – im Geschäft und der Artikel war im Sentinel über das Archiv abrufbar – im Google Cache kann man sich noch ein Bild davon machen. Wegen des Sturms am Wochenende suchten anscheinend mehr Sentinel-Nutzer nach „United Airlines“ und stießen auf den Artikel, der – es war sonst wohl nix los – auf der Seite unter „Popular stories / most viewed“ auftauchte. Die dort verlinkten, durch die „Wisdom-of-the-Crowds“ ausgewählten Artikel werden nicht nur wiederum häufiger angeklickt sondern auch von Newsaggregatoren wie Google News eingesammelt. Die Agentur Income Securities Advisors Inc. bekommt den Artikel vom Newsaggregator über einen Suchalert und anstatt nochmal nachzurecherchieren schickt der betreffende Mitarbeiter eine Mitteilung an seine Kunden und an Bloomberg Terminal, das Informationsportal für Börsenhändler (die genaue Tickermeldung konnte ich nicht mehr ausfindig machen). Daraufhin werden UA-Aktien verkauft (durch Menschen oder Softwareprogramme, die den Ticker auswerten); als der Kurs fällt, verkaufen automatisch weitere Softwareprogramme und der Kurs stürzt bei einem Verkaufsvolumen von mehr als 20 Millionen $ von 12.45$ auf 3$ – bis der Handel ausgesetzt wird. Corey Rosenbloom hat in seinem Artikel eine Grafik ders Kursverlaufs.

Hm, das erinnert mich an Joseph Weizenbaums bereits 1976 erschienenes Buch „Die Macht der Computer und die Ohnmacht der Vernunft“. Irgendwo waren zwar noch Menschen beteiligt, aber die von ihnen geschaffenen Systeme (Online-Archive, Aggregatoren, Empfehlungs- und Alerting-Dienste, Börsenprogramme und – last-but-not-least – der alte „Schlawiner Kapitalismus“) beherrschen weitgehend das Geschehen. Ich habe die Geschichte in meiner Lehrveranstaltung verwendet, um verschiedene Informationsdienste zu illustrieren und auf die Bedeutung von Metadaten und Informationskompetenz hinzuweisen.

Eine eigene Darstellung der Geschehnisse von Sentitel vom 9.9. gibt es hier und ein passendes Video zur Bankenkrise gibt es von Extra 3.

Deutschsprachiges Buch zum Thema Social-Tagging

24. September 2008 um 17:53 1 Kommentar

Das erste deutschsprachige Buch zum Thema Social-Tagging ist diese Woche im Waxmann Verlag erschienen: Birgit Gaiser, Thorsten Hampel, Stefanie Panke (Hrsg.): Good Tags – Bad Tags. Social Tagging in der Wissensorganisation. 240 Seiten, 29,90 EUR, ISBN 978-3-8309-2039-7. Das im Anschluss an den Workshop „Social Tagging in der Wissensorganisation“ (siehe PDF) am Institut für Wissensmedien am 21. und 22. Februar 2008 entstandene Sammelwerk kann auch als PDF heruntergeladen werden. Hier das Inhaltsverzeichnis (auch als PDF):

Einleitung

  • Thomas Vander Wal: Welcome to the Matrix! (S. 7-9)
  • Birgit Gaiser, Thorsten Hampel, Stefanie Panke: Vorwort (S. 11-14)
  • Matthias Müller-Prove: Modell und Anwendungsperspektive des Social Tagging (S. 15-22)

Teil 1: Theoretische Ansätze und empirische Untersuchungen

  • Stefanie Panke, Birgit Gaiser: „With my head up in the clouds“ – Social Tagging aus Nutzersicht (S. 23-36)
  • Christoph Held, Ulrike Cress: Social Tagging aus kognitionspsychologischer Sicht (S. 37-50)
  • Michael Derntl, Thorsten Hampel, Renate Motschnig, Tomáš Pitner: Social Tagging und Inclusive Universal Access (S. 51-62)

Teil 2: Einsatz von Tagging in Hochschulen und Bibliotheken

  • Christian Hänger: Good tags or bad tags? Tagging im Kontext der bibliothekarischen Sacherschließung (S. 63-72)
  • Mandy Schiefner: Social Tagging in der universitären Lehre (S. 73-84)
  • Michael Blank, Thomas Bopp, Thorsten Hampel, Jonas Schulte: Social Tagging = Soziale Suche? (S. 85-98)
  • Andreas Harrer, Steffen Lohmann: Potenziale von Tagging als partizipative Methode für Lehrportale und E-Learning-Kurse (S. 97-106)
  • Harald Sack, Jörg Waitelonis: Zeitbezogene kollaborative Annotation zur Verbesserung der inhaltsbasierten Videosuche (S. 107-118)

Teil 3: Kommerzielle Anwendungen von Tagging

  • Karl Tschetschonig, Roland Ladengruber, Thorsten Hampel, Jonas Schulte: Kollaborative Tagging-Systeme im Electronic Commerce (S. 119-130)
  • Tilman Küchler, Jan M. Pawlowski, Volker Zimmermann: Social Tagging and Open Content: A Concept for the Future of E-Learning and Knowledge Management? (S. 131-140)
  • Stephan Schillerwein: Der ‚Business Case‘ für die Nutzung von Social Tagging in Intranets und internen Informationssystemen (S. 141-152)

Teil 4: Tagging im Semantic Web

  • Benjamin Birkenhake: Semantic Weblog. Erfahrungen vom Bloggen mit Tags und Ontologien (S. 153-162)
  • Simone Braun, Andreas Schmidt, Andreas Walter, Valentin Zacharias: Von Tags zu semantischen Beziehungen: kollaborative Ontologiereifung (S. 163-174)
  • Jakob Voß: Vom Social Tagging zum Semantic Tagging (S. 175-186)
  • Georg Güntner, Rolf Sint, Rupert Westenthaler: Ein Ansatz zur Unterstützung traditioneller Klassifikation durch Social Tagging (S. 187-200)
  • Viktoria Pammer, Tobias Ley, Stefanie Lindstaedt: tagr: Unterstützung in kollaborativen Tagging-Umgebungen durch Semantische und Assoziative Netzwerke (S. 201-210)
  • Matthias Quasthoff, Harald Sack, Christoph Meinel: Nutzerfreundliche Internet-Sicherheit durch tag-basierte Zugriffskontrolle (S. 211-222)

Das bisher einzige Buch zum Thema war Tagging: people-powered metadata for the social web von Gene Smith (2008, ISBN 0-321-52917-0).

Dublin Core conference 2008 started

23. September 2008 um 12:20 4 Kommentare

Yesterday the Dublin Core Conference 2008 (DC 2008) started in Berlin. The first day I spent with several Dublin Core Tutorials and with running after my bag, which I had forgotten in the train. Luckily the train ended in Berlin so I only had to get to the other part of the town to recover it! The rest of the day I visited the DC-Tutorials by Pete Johnston and Marcia Zeng (slides are online as PDF). The tutorials were right but somehow lost a bit between theory and practise (see Paul’s comment) – I cannot tell details but there must be a way to better explain and summarize Dublin Core in short. The problem may be in a fuzzy definition of Dublin Core. To my taste there are far to many „cans“, „shoulds“, and „mays“ instead of formal „musts“. I would also stress more the importance of publicating stable URIs for everything and using syntax schemas.

What really annoys me on DC is the low committement of the Dublin Core Community to RDF. RDF is not propagated as fbase but only as one possible way to encode Dublin Core. The same way you could have argued in the early 1990s that HTTP/HTML is just one framework to build on. That’s right, and of course RDF is not the final answer to metadata issues – but it’s the state-of-the-art to encode structured data on the web. I wonder when the Dublin Core Community lost tight connection with the W3C/RDF community (which on her part was spoiled by the XML community). In official talks you don’t hear this hidden stories of the antipathies and self-interests in standardization.

The first keynote that I heard at day 2 was given by Jennifer Trant about results of steve.museum – one of the best projects that analyzes tagging in real world environments. Data, software and publications are available to build upon. The second talk – „Encoding Application Profiles in a Computational Model of the Crosswalk“ by Carol Jean Godby (PDF-slides) – was interesting as well. In our library service center we deal a lot with translations (aka mappings, crosswalks etc.) between metadata formats, so the crosswalk web service by OCLC and its description language may be of large use – if it is proberly documented and supported. After this talk Maria Elisabete Catarino reported with „Relating Folksonomies with Dublin Core“ (PDF-slides) from a study on the purposes and usage of social tagging and whether/how tags could be encoded by DC terms.

At Friday we will hold a first Seminar on User Generated Matadata with OpenStreetmap, Wikipedia, BibSonomy and The Open Library – looking forward to it!

P.S: Pete Johnston’s slides on DC basic concepts are now also available at slideshare [via his blog]

Insight into the Digital Library Reference Model

18. September 2008 um 18:31 2 Kommentare

On the first post-ECDL-conference day I participated in the Third Workshop on Foundation of Digital Libraries (DLFoundations 2008) that was organized by the DELOS Network of Excellence on Digital Libraries. One major work of DELOS is the DELOS Digital Library Reference Model (DLRM). The DLRM is an abstract model to describe digital libraries; it can be compared to the CIDOC Conceptual Reference Model (CIDOC-CRM) and the Functional Requirements for Bibliographic Records (FRBR) – and it shares some of their problems: a lack of availability and (resulting) a lack of implementations.

The DLRM is „defined“ in a 213-page PDF-file – this is just not usable! Have a look at W3C or IETF how nowadays standards are defined. As DLRM is a conceptual model, you must also provide a RDF representation or it is just inavailable for serious applications on the web. And of course the silly copyright statement should be removed in favor of a CC-license. That’s the formal part. Summarizing the content of DLRM there are 218 concepts and 52 relations – which is far too much to start with. But: there are some really useful ideas behind DLRM.

The reference model includes a division of „digital library“ into three levels of conceptualization (see image): first the visible digital library (the collection that users work with), second the digital library system (the software application that is installed and configured to run a digital library), and third the digital library management system (the software system that supports the production and administration of digital libraries). This division can be helpful to understand and talk about digital libraries – although I am not sure whether the division between digital library systems and digital library management systems is a such a good one.

Beside general talks about the Digital Library Reference Model the workshop provided some experience from practise by Wolfram Hostmann (DRIVER project) and by Georg Eckes (Deutsches Filminstitut) – never underestimate good real world examples! The most refreshing talk was given by Joan Lippincott (Coalition of Networked Information). She pointed out that much more then traditional repositories can be viewed as digital libraries. Especially user-generated content can constitute a digital library. A useful model for digital libraries should also fit for collections at Flickr, YouTube, Wikis, Weblogs etc. and user can mash up resources to create new digital library services, for instance the species search engine iSpecies. She is sooo right! In addition Joan mentioned initiatives to broaden the use of authority files and identity management. Another direct hit! If digital libraries only focus on interoperability with other „official“ digital libraries they will not remain. Libraries are only one little player in the digital knowledge environment and their infrastructure is not defined only by them.

I enjoyed the workshop, I really like the digital library community and I am happy to be part of it. But some parts still seem to live in an ivory tower. If the digital library reference model does not quickly get adopted to real applications (both repositories like those build with DSpace, Fedora, EPrints etc. and open systems like YouTube, Wikipedia, Slideshare…), it is nothing but an interesting idea. The digital revolution is taking place anyway, so let’s better be part of it!

P.S: The slides will soon be available at the Workshop’s website.

Some ECDL highlights

17. September 2008 um 22:01 1 Kommentar

The main ECDL 2008 program ended today and I will try to quickly summarize some highlights that I catched from the poster session. I participated with a poster on Dynamic Catalogue Enrichment with SeeAlso Link Servers (self-archived at E-LIS, abstract also as DOI 10.1007/978-3-540-87599-4_62).

First I talked with Magnus Pfeffer und Kai Eckert (University Mannheim, see photo). Kai developed a tool called Semtinel to visualize thesauri and classifications, and their usage for indexing a particular collection. He also published a paper (Semtinel: Interactive Supervision of Automatic Indexing, see PDF) at the JCDL’08 and gave a presentation at the Bibliothestag 2008. Displaying a hierarchical knowledge organization system and its usage in a treemap seems to be a simple idea, but it looks like nobody has done it before. If Semtinel becomes OpenSource and reads SKOS, this will be a useful tool for every „ontology engineer“ (that’s what „thesaurus managers“ are called now, as Dagobert Soergel remarked in his tutorial).

Unfortunately I missed the demo Using Terminology Web Services for the Archaeological Domain about an SKOS terminology webservice developed at the university of Glamorgan. Reminds me at the German terminology registry Museumsvokabular.de. I also liked the demo of DIGMAP, a set of services to enrich maps in libraries with geographical information and to mash them up with Google Maps. The best ECDL demo award was choosen democratically by all participants. It went to the Preservation Planning Tool Plato and to the search engine Summa.

I had some time to glimpse the nice „little“ city of Ã…rhus (2nd largest of Denmark with 300.000) and I liked it a lot. The ECDL 2009 will take place at Corfu which is a bit warmer (last year I visited it for the MTSR 2007) – see you next year at ECDL or another digital library related conference!

…und noch ein 2.0-Katalog

16. September 2008 um 16:26 Keine Kommentare

Auf der ECDL wurde heute im Vortrag „Enhancing Library Services with Web 2.0 functionalities“ mit OPACIAL ein weiterer „2.0“-Katalog vorgestellt. Der Proceedings-Artikel enthält eine Ãœbersicht von so genannten 2.0-Features (Tags, Drilldown, ein Index über alle Bestände, Empfehlungsdienste etc.) und anderen 2.0-Katalogprojekten (Penntags, SOPAC, BookSpace, VuFind, AFI-OPAC 2.0, Scriblio, Aquabrowser, Primo…). Die an der Panteion-Universität Athen entwickelte OPAC-Software ist als OpenSource verfügbar und die Entwicklung wird wie bei Beluga durch Nutzerstudien begleitet – wie es sich gehört. 🙂

So sehr ich Experimentieren und Eigenentwicklungen befürworte, sehe ich doch ein wenig die Gefahr, dass zu oft das Rad neu erfunden und aneinander vorbei entwickelt wird. Vor allem ist es notwendig für die verschiedenen Zusatzdienste eine gemeinsame Infrastruktur und Standards zu finden: statt mehrere große Baustellen, die alle den ultimativen Katalog entwickeln wollen, besser viele kleine Komponenten, die sich flexibel zusammenstellen lassen. Leider ist nicht alles Serviceorientierte Architektur wo SOA draufsteht und was sich als Standard durchsetzt, lässt sich erst im Nachhinein sagen (für den Suchmaschinenindex wird beispielsweise gerade Lucene zum De-Facto-Standard). Außerdem reicht es nicht, alles in den großen „2.0-Topf“ zu schmeißen und kräftig herumzurühren – man muss sich schon genauer damit auseinandersetzen, aus welchen verschiedenen Komponenten und Diensten ein Katalog bestehen kann und soll.

Momentan ist vermutlich die sinnvollste Strategie zur Entwicklung eines „Katalog 2.0“ für die eigene Bibliothek, sich an der Entwicklung von VuFind zu beteiligen – aber man sollte natürlich auch nicht nur auf ein Pferd setzen. In jedem Fall ist es spannend zu sehen, wohin sich der Katalog in Zukunft entwickeln wird.

So called „best“ ECDL paper ignores tagging

15. September 2008 um 13:39 4 Kommentare

The first normal talk at the ECDL2008 was about „Improving Placeholders in Digital Documents“ by George Buchanan and Jennifer Pearson. Placeholders (also known as bookmarks) in physical form are common and easy to use: you just put a peace of paper (or similar flat thing) inside a book, and optionally add notes on it. Bookmarks in the digital world are known but have low usability. A bookmark in a browser is just a plain link without additional information (color, notes, etc.), it only points to a webpage instead of specific parts of the content and it does not show up if you open the object that had been bookmarked. Moreover there is other content you may want to bookmark, for instance PDF files.

Buchanan and Pearson identified current uses of placeholders by user studies (interviews with a dozen of researchers) and created a demo interface for bookmarking PDFs. The talk was nice but I really wonder why it was selected as best paper. Especially the lack of referencing Social Tagging (Brewster Kahle brought it up in a question after the talk) would have been a clear reason for rejection if I was the reviewer! Social Tagging and Social Bookmarking has limitations – but it is much more than normal digital bookmarks and there are several tools to support tagging the files on your own hard disk. You should better try enhance tagging tools so tagging becomes more like annotating documents with placeholders instead of asking people to use artificial bookmarking tools. I hope the next talks will be better in scientific and practical relevance. Maybe the fact that Buchanan also got the best paper award last year (while beeing in the ECDL programm commitee) has influenced the decision? One more argument for open review.

Anyway: as long as there are no good interfaces to easily read and annotate documents, people will prefer paper notes for good reason. Give people a working e-paper-device with high resolution, long-lasting battery, touchscreen and the possibility to share documents without technical barriers like DRM and we can create a collaborative workspace for bookmarking and annotating documents; or as I already called it 2005 in the article „Mehr als Marginalien – das E-Book als gemeinsamer Zettelkasten“ in the German library science e-journal „LIBREAS“: a common file-card box.

Veranstaltungen 2008/2009

9. September 2008 um 15:52 1 Kommentar

Morgen und übermorgen findet in Berlin die jährliche Verbundkonferenz des GBV statt (siehe voriger Blogbeitrag). Ob es wohl an der Stabi WLAN geben wird? Anschließend fahre ich weiter zur European Conference on Digital Libraries (ECDL), unter Anderem um dort mit einem Poster „SeeAlso“ vorzustellen (die PDFs werden grade bei E-LIS hochgeladen). Danach geht es wieder zurück nach Berlin, wo vom 22.-26. die Dublin Core Conference stattfindet. Wikimedia Deutschland veranstaltet im Rahmen der DC2008 am Freitag nachmittag einen Workshop zu User Generated Metadata zu dem herzlich eingeladen wird! Ab Oktober wird es dann hoffentlich etwas ruhiger – abgesehen von der Frankfurter Buchmesse (15.-19.10.) in dessen Rahmen die DGI-Online-Tagung stattfindet. Wer mehr als die (hoffentlich) bekannte Bibliotheks-und-Informations-Soße kosten möchte, findet weitere themenverwandte Veranstaltungen wie zum Beispiel den Workshop Lernen-Wissen-Adaption (LWA 2008) am 6.-8.10. in Würzburg.

Nächstes Jahr gibt es dann den Bibliothekstag 2009 in Erfurt (2.6.-5.6.). Bis zum 19. Oktober können Abstracts für Vorträge eingereicht werden. Etwas früher, wissenschaftlicher und internationaler ist die Bielefeld Conference vom 3. bis 5. Februar 2009 und sicherlich kommt im Laufe des Jahres noch die eine oder andere interessante Bibliotheks-Veranstaltung hinzu.

Vier Jahre Wikipedia-Portal Bibliothek, Information, Dokumentation

9. September 2008 um 00:45 2 Kommentare

Das Wikipedia-Portal „Bibliothek, Information, Dokumentation“ wurde vor etwa vier Jahren ins Leben gerufen und mit einer Pressemitteilung der Fachöffentlichkeit bekannt gemacht, um Artikel aus dem Themenbereich der Bibliotheks- und Informationswissenschaft in der deutschsprachigen Wikipedia zu fördern und zu strukturieren. Nach einer Ãœberarbeitung des Portals vor zwei Jahren war nun wieder einmal Zeit aufzuräumen und zu renovieren.

Das bisherige Layout (siehe Screenshot rechts) war etwas überfrachtet. Die zugehörige Redaktion BID ist momentan eher sporadisch aktiv – aber das kann sich ja jederzeit wieder ändern, denn jeder kann sich an Wikipedia beteiligen! Inzwischen sind eine Menge von Artikeln hinzugekommen, so dass – bis auf wenige Ausnahmen – zu den wesentlichen Begriffen aus dem BID-Bereich grundlegende Artikel existieren. Die Qualität ist jedoch sehr unterschiedlich – was um so bedauerlicher ist, da inzwischen Wikipedia als Standard-Nachschlagewerk genutzt von wird. Wenn ihr euch also in Zukunft gerade mit einem Thema beschäftigt – sei es für eine Hausarbeit, einen Artikel, Vortrag oder die eigene Fortbildung – schaut auch mal, ob es einen entsprechenden Wikipedia-Artikel gibt und ob dort grobe Fehler oder Lücken vorkommen. Zumindest einen Kommentar oder eine Frage auf der Diskussionsseite des Artikels kann jeder (auch ohne Anmeldung) hinterlassen. Und wer sich etwas mehr Zeit nimmt, um Artikel direkt zu verbessern, lernt selber am Meisten.