TPDL 2011 Doctoral Consortium – part 2

25. September 2011 um 12:42 Keine Kommentare

The TPDL 2011 Doctoral Consortium, which I already blogged about in part 1, continued with 15 minutes of delay: Christopher Gibson also talked about eBooks – I wonder why his talk was not combined with Luca Colombo’s work in eBook reading experiences. Gibson’s specific topic is eBook lending services in UK public libraries. To quote the research questions from his paper:

Q1. How have public libraries addressed ebook service provision in the UK?
Q2. What challenges and opportunities exist in incorporating ebook lending into other reader services?
Q3. Is it feasible to lend ebook reading devices from public libraries?
Q4. How can the effectiveness of ebook lending services be measured?
Q5. How do library users view the provision of ebook lending services?
Q6. How can effective ebook lending services be developed?

To me an interesting aspect of his methodology was the use of targeted FOI (freedom of information) requests to gather data about eBook lending services. I cannot image this in this Germany where „Informationsfreiheit“ is still in its infancy. One result from another survery done by Gibson: most eBooks are not included in library catalogs. I think this failure is found in German libraries too. In summary the PhD project looked very profound with some real practical values for libraries. On the other hand, the theoretical contribution, for instance the question what „lending“ can mean in a digital library work, was only added in the discussion afterwards.

The next presenting PhD student was Adam Sofronjievic. I am sorry that I could not fully concentrate on his talk about a New Paradigm of Library Collaboration although it seemed very interesting. My talk is next 🙂

TPDL 2011 Doctoral Consortium

25. September 2011 um 11:21 2 Kommentare

Today the International Conference on Theory and Practice of Digital Libraries 2011 started with tutorials and a Doctoral Consortium that I participate with a talk. The seven talks and discussions on ongoing PhD topics were rather diverse and interesting. I tried to briefly summarize at least some of them.

Luco Colombo started with his work on developing and evaluating eBook reading experience for children. Reading „traditional“ books has been extensively investigated – this is not true for eBooks. Especially children are little involved in eBook studies. Colombo explained how the eBook reading experience is different because it directly involves searching, browsing, sharing, and recommending, among other arguments. A good reading experience results in a „flow state“ where the reading gets positively lost in a book. Colombo’s method is a cooperative inquiry. It is not clear whether and by what eBooks are more engaging to children (age 9-11 in this study) than traditional books – maybe this PhD will show. The following discussion was dominated by the participating mentors Jose Borbinha, Milena Dobreva, Stefan Gradmann and Giuseppina Vullo.

In the second talk Krassimira Ivanova presented her dissertation on (content-based) image retrieval utilizing color models. Image retrieval on art images is difficult because it includes very different aspects (artistic styles, depicted objects etc.). Even aspects of color (contrasts, intensity, diversity, harmony etc.) are manifold – maybe this is why philosophy of color has a long history. Nevertheless Ivanova developed several machine learning methods for this color aspects that can be used for image retrieval. I am not sure whether the resulting APICAS system („Art Painting Image Colour Aesthetics and Semantics“) has been evaluated with a user study. Similar to the first talk, the focus could be improved by more narrowing down and making clear the specific contribution. Finally we had some real discussion, but little time.

Modeling is difficult

21. September 2011 um 00:33 3 Kommentare

Yesterday Pete Johnston wrote a detailed blog article about difficulties of „the right“ modeling with SKOS, and FOAF in general, and about the proposed RDF property foaf:focus in particular. As Dan Brickley wrote in a recent mail „foaf:focus describes a link from a skos:Concept to ‚the thing itself‘. Not every SKOS concept (in a thesauri of classification scheme) will have such a direct „thing“, but many do, especially concepts for people and places.“

Several statements in this discussion made me laugh and smile. Don’t get me wrong – I honor Pete, Dan, and the whole Semantic Web community, but there is a regular lack of philosophy and information science. There is no such thing as ‚the thing itself‘ and all SKOS concepts are equal. Even the distinction between an RDF ‚resource‘ and an SKOS ‚concept‘ is artificial. The problem origins not from wrong modeling, which could be solved by the right RDF properties, but from different paradigms and cultures. There will always be different ways to describe the same ideas with RDF, because neither RDF nor any other technology will ever fully catch our ideas. These technologies are not about things but only about data. As William Kent wrote in Data Reality (1978): „The map is not the territory“ (by the way, last year Chris Rusbridge has quoted Kent in the context of linked data). As Erik Wilde and Robert J. Glushko wrote in a great article (2008):

RDF has succeeded beyond the wildest expectations as a convenient format for encoding information in an open and easily computable fashion. But it is just a format, and the difficult work of analysis and modeling information has not and will never go away.

Ok, they referred not to „RDF“ but to „XML“, so the quotation is wrong. But the statement is right for both data structuring methods. No matter if you put your data in XML, in RDF, or carve it in stone – there will never be a final model, because there’s more than one way to describe something.

Wozu mobile Bibliothekskataloge?

18. September 2011 um 14:17 7 Kommentare

Oliver Flimm hat letzte Woche eine mobile Katalogoberfläche vorgestellt, die er auf Basis von jQuery Mobile und OpenBib umgesetzt hat. Der Quellcode ist frei verfügbar.

Wie er in seinem Blogartikel darstellt, sind „mobile Kataloge […] keine Hexerei und koennen mit
vergleichsweise wenig Aufwand erstellt werden.“ Warum sind mobile Kataloge in Bibliotheken trotzdem noch kein Standard? Die Aussage, dass „mobile OPACs kaum genutzt werden“, lasse ich jedenfalls nicht als Begründung gelten – eher lässt sich daran ablesen, dass mobile Kataloge nicht nutzergemäß umgesetzt werden. So ist es beispielsweise notwendig, dass Mobilgeräte automatisch beim Aufruf der Bibliothekswebseite auf den mobilen Katalog hingewiesen werden. Ohne entsprechende Öffentlichkeitsarbeit dauert es auch lange bis sich der Katalog herumgesprochen hat und ohne einfach benutzbaren, tatsächlichen Mehrwehrt ist keine Akzeptanz zu erwarten. Einige positiven Beispiele finden sich in der M-Libraries Liste des Library Success Wiki.

Ich vermute, dass gerade ein mobiler Katalog nicht primär für die Recherche genutzt wird, sondern um mal schnell zu überprüfen, ob und wo ein Buch vorhanden und verfügbar ist und um es ggf. vorzumerken oder zu bestellen. Es geht also um die Funktionalität. Dazu gehört:

  • eine fehlertollerante Suche mit gutem Ranking
  • die Anzeige der aktueller Verfügbarkeit (mit genauem Rückgabedatum) und Standort (mit Koordinate und Lageplan statt kryptischem Bibliothekskürzel)
  • der Zugriff auf das eigene Nutzerkonto

Dies alles sind Funktionen, die Kataloge schon seit mehr als zehn Jahren bieten sollten. In der Praxis sind sie jedoch oft über verschiedene Systeme verteilt und können mangels Schnittstellen kaum integriert werden.

Möglicherweise spricht in 5-10 Jahren auch niemand mehr von mobilen Webseiten, weil erwartet wird, dass alle Webseiten auf verschiedenen Endgeräten benutzbar sind. Ich sehe mobile Katalogoberflächen deshalb vor allem als Chance, bestehende Bibliothekssysteme zu verbessern, unabhängig davon, wie sie dann präsentiert werden.

Wikimedia-Projekt Bibliographisch archivalische Datenbank

10. September 2011 um 10:51 1 Kommentar

In Nürnberg findet dieses Wochenende mit der WikiConvention 2011 eine Wikimedia/Wikipedia-Tagung statt – in mehr als 80 Workshops diskutieren die über 160 Teilnehmer über vielfältige Möglichkeiten und Probleme im Wikimedia-Universum. Heute morgen habe ich an der Veranstaltung von Olaf Simons zu einer geplanten
Bibliographisch archivalischen Datenbank teilgenommen. Das von Wikimedia Deutschland geförderte Projekt lässt sich in den größeren Rahmen der Idee von „WikiData“ einordnen.

Die Kernidee der „bibliographisch-archivalischen Datenbank“ scheint für Kenner des Bibliotheksbereiches etwas naiv, soll doch nichts weniger als ein „Internationaler Katalog und Recherechewerkzeug für alle Bücher aus einem begrenzten Erscheinungszeitraum“ erstellt werden. Andererseits tut ein wenig unkoventionelle Naivität ganz gut, um die traditionellen, geschlossenen Katalogstrukturen zu überwinden. Mit der Datenbank sollen bibliographische Daten als Forschungsdaten verwendet werden können, beispielsweise um sie nach nach Erscheinungsorten, -jahren und beteiligten Personen zu durchforsten, Inhalte zu annotieren und zu korrigieren, und neue Verbindungen und Visualisierungen herzustellen. Die bestehenden Kataloge wie VD16, VD17, VD18 oder im Englischsprachigen Raum ESTC können dazu eher als Steinbruch und Datengrundlage dienen – ohne kollaborative Funktionen und einfachen Datenexport bleiben solche Projekte jedoch zwangsläufig unter ihren Möglichkeiten.

Wie Olaf Simons berichtete, gab es bei ersten Gesprächen zwischen der Bodleian Library und Wikimedia-Vertretern einige Aha-Effekte. Dort – wie auch an einigen anderen Bibliotheken – gibt es zwar schon Bestrebungen, Nicht-Bibliothekare an bibliographischen Datenbanken zu beteiligen, vor allem durch Forscher für historische Bestände. Vergleicht man die Ansätze mit Lösungen aus dem Wikimedia-Universum, scheinen jedoch oft Räder neu erfunden zu werden. Gleichzeitig sind auch die Verfahren in Wikipedia historisch gewachsen und nicht immer auf andere Kontexte anwendbar. Etwas überrascht hat mich Simons Bericht darüber, wie unsicher bisherige Forschungsprojekte zu historischen Publikationsdaten sind: Bestand und Weiternutzung der Forschungsdaten an Bibliotheken sind nach Ablauf der Projektphase in der Regel nicht möglich, was für die Bibliotheken aus meiner Sicht ein Armutszeugnis ist. Nicht nur aus diesem Grund ist es wahrscheinlich sinnvoller, die bibliographischen Datenbanken nicht primär an einer Bibliothekseinrichtung sondern bei Wikimedia, vergleichbar mit Wikisource. Im Gegensatz zu Wikisource sollte es jedoch nicht verschiedene Sprachversionen sondern gleich eine internationale Datenbank geben.

Im Verlauf des Workshop stelle Mathias Schindler einige bereits verwendete Mapping-Tools vor, mit denen Wikipedianer und andere Freiwillige schon mehrere Hunderttausend Verknüpfungen zwischen Personen, Bildern und Publikationen gefunden haben, zum Beispiel im Rahmen der Kooperation mit dem Bundesarchiv. Selbstverständlich konnten wir im kurzen WikiCon-Workshop kein fertiges Konzept für eine kollaborative, bibliographisch-archivalische Datenbank vorlegen. Sicher ist jedoch, dass wir früher oder später bibliographische Systeme haben werden, die wenig mit den geschlossenen Katalogsystemen von Bibliotheken zu tun haben. Um diese Vision voranzutreiben, sollen in dem von Olaf Simons geleiteten Projekt möglichst alle interessierten Personengruppen (Fachwissenschaftler, Wikimedia-Community, Open-Data Community, Techniker und Bibliothekare) zusammengebracht werden. Feedback ist ausdrücklich erwünscht!

Mit dem Handy Bibliotheksbücher lokalisieren dank NFC

31. August 2011 um 23:35 1 Kommentar

Geht man die Liste der Mobilgeräte mit NFC (Near Field Communication) bei Wikipedia durch, so finden sich immer mehr Handys, die diese drahtlose Übertragungstechnik unterstützen. Das Google Nexus unterstützt bereits NFC, das BlackBerry Bold 9900 ist vor einigen Tagen in den USA mit NFC herausgekommen und auf der IFA 2011 stellt Samsung im September das Samsung Galaxy S2 LTE ebenfalls mit NFC vor. Nokia hat auch schon Erfahrung mit der Technik, nur ob Apple mit dem iPhone 5 auch auf NFC setzt oder Bluetooth 4.0 favorisiert, ist noch unklar.

Für Android-Handys (Android 2.3) gibt es schon verschiedene Apps, mit denen sich per NFC und dem Handy RFID-Chips auslesen lassen. Aus Ermangelung eines entsprechenden Gerätes habe ich aber noch keine davon ausprobiert. Prinzipiell ließe sich jedenfalls eine kleine App entwickeln, über die mit dem Handy die Bibliothek eines beliebigen Buches mit RFID-Chip ermittelt werden kann. Wie mit ISO 28560 vereinbart, steht im Chip die ISIL als weltweit einheitlicher Bibliotheksidentifier. Je nach Fähigkeit des NFC-Gerätes und der Reichweite der RFID-Chips (angeblich mindestens 35cm), liesse sich so übrigens auch ermitteln, aus welchen Bibliotheken die Person neben einem gerade Bücher ausgeliehen hat. Zum Datenschutz findet sich von Bibliotheksseite zum Thema RFID leider meist wenig. Der Arbeitskreis kritischer BibliothekarInnen (Akribie) hat einiges gesammelt. Dass in wenigen Jahren jeder mit einem [automatisierbaren!] RFID-Leser in seiner Tasche herumläuft, war bei der Einführung von RFID in Bibliotheken den meisten wahrscheinlich nicht bewusst.

Zum weitergehenden Hacken von NFC-Verbindungen und RFID-Tags bietet sich übrigens dieses Gerät an. Ob sich das bargeldlose Bezahlen mit dem Handy per NFC durchsetzen wird (das ist nämlich der Grund warum es immer mehr Handys unterstützen), bleibt deshalb abzuwarten. Ich vermute aber, dass wieder einmal die Bequemlichkeit siegen wird und dafür hinterher nach mehr Überwachung geschriehen wird 🙁

P.S.: Das nächste, was dann in Handys eingebaut wird sind Video-Beamer (hat Samsung als Prototyp bereits 2009 vorgestellt). Das Scannen von Büchern ist ja eigentlich schon mit herkömmlichen Handy-Kameras möglich. Handgeführte 3D-Laserscanner sind ebenfalls bereits auf dem Markt, das kann auch gleich dazu. Nach Fukushima gibt es vielleicht auch einen Markt für Geigerzähler in Handys. Nur bei medizinischen Diagnose-Sensoren bin ich noch skeptisch.

Darum mag ich Wikimedia: Closed Access

26. Juli 2011 um 21:37 7 Kommentare

Vor knapp zwei Wochen war ich auf der Suche nach einer einfachen, ansprechenden und deutlichen Methode, um GBV-Datenbanken als frei zugänglich oder als zugangsbeschränkt zu kennzeichnen. So sind beispielsweise die Bibliothekskataloge und der Verbundkatalog frei zugänglich (also Open Access), während einige Fachdatenbanken wie zum Beispiel Online-Contents nur innerhalb der Hochschulnetze aufrufbar sind (also Closed Access). Die Public Library of Science (PLoS) hatte mal ein Logo entworfen, um auf Open-Access-Publikationen hinzuweisen:

Open Access logo PLoS white

Ich habe noch einen Button hinzugefügt: Open Access

Für Closed Access gab es bislang kein Logo. Solange Closed Access die Regel und Open Access die Ausnahme ist, mag das verständlich sein. Inzwischen ist es aber an der Zeit, nicht frei zugängliche Publikationen gezielt zu kennzeichnen und so an den Pranger zu stellen. Ich habe deshalb zwei Varianten für ein Closed-Access-Logo entworfen, in Wikimedia Commons hochgeladen und auf einer eigenen Seite verschiedene Logos und Buttons gesammelt:

Closed Access logo white Closed Access logo alternative

Und heute habe ich dann die Icons plötzlich in einem Artikel über aktuelle Wikipedia-Forschung zufällig entdeckt. Ein anderer Wikipedia-Autor hatte die Icons gefunden, für praktisch befunden, und in seine Arbeit eingebaut. Das ist möglich dank Freier Inhalte, die über Open Access hinausgehen.

Oc 80x15 blue

Freie Inhalte sind nämlich nicht nur frei zugänglich, sondern bleiben auch frei, da sie weiterverbreitet und sogar verändert werden dürfen. Dabei müssen je nach Lizenz nur die Urheber und die Lizenz genannt sowie abgeleitete Werke unter die selbe Lizenz gestellt werden (Prinzip „Share-Alike“). hier noch einige weitere Icons und Banner, die auch freie Lizenzen abdecken.

People are Knowledge

24. Juli 2011 um 22:35 Keine Kommentare

Ich könnte mich über die Löschung eines vor 6 Jahren in Wikipedia eingestellten Artikels ärgern. Oder über die Querelen in Wikimedia-Deutschland e.V. Stattdessen freue ich mich darüber, dass Wikipedia grundsätzlich funktioniert: zahlreiche wissenshungrige Engagierte recherchieren, formulieren und korrigieren gegen die allgemeine Unwissenheit und Dummheit. Dabei stellen sie im Besten Fall sich und ihre Arbeit immer wieder selber in Frage, um ihrem Gegenstand „Wissen“ besser gerecht zu werden. Ein aktuelles Beispiel ist die Auseinandersetzung mit dem Prinzip der Quellenangaben und Belege. Für viele Kulturkreise lässt es sich nicht so einfach anwenden, da keine schriftlichen Quellen nach westlichem Bewertungsmaßstab existieren. Aber es gibt überall Menschen, die ihr Wissen weitergeben. Wie lässt sich dieses Wissen in Wikipedia erschließen? Die Wikimedia Foundation hat dazu ein Forschungsprojekt zusammen mit dem indischen Centre for Internet and Society unterstützt, dessen Ergebnisse nun in Form eines 45-minütigen Filmes vorliegen.

Ein Film für Wikipedianer, Bibliothekare, Kulturwissenschaftler und alle anderen, die sich für Wissen und Wissenssammlung interessieren.

Der Film steht unter CC-BY-SA zur Verfügung, kann also weiterverbreitet und angepasst werden (z.B. durch Erstellen einer Synchronisation, die bei Interesse sicher von Wikimedia Deutschland finanziell unterstützt werden könnte). Im Wikimedia-Kurier gibt es eine kurze Zusammenfassung und auf der Wikimania 2011 in Haifa wird es zum Forschungsprojekt eine Session geben. Dass ich dieses Jahr in Haifa nicht dabei bin, ärgert mich dann allerdings schon etwas.

Affen als Urheber

17. Juli 2011 um 14:32 4 Kommentare

Dass Affen keine Urhebrrechte haben muss nicht heißen, dass sie nicht als Urheber auftreten können. Nur sind ihnen Konstrukte wie „Copyright“, „geistiges Eigentum“, „immaterielle Monopolrechte“, die die Verbreitung ihrer Werke einschränken, egal. Vielleicht sollte mensch sich hier mal ein Vorbild nehmen? Hier eine unvollständige Liste von Affen als Urhebern:

Brassau
Peter aka Pierre Brassau

Chimpanzee congo painting
Ein Gemälde von Congo

Howler monkey
Brüllaffen, acapella

Chomsky
Nim Chimpsky, Linguist


Unbekannter Affe, Wikipedia-Autor

Daneben gibt es mehrere Affen, die als Schauspieler, Artisten u.Ä. auftraten. Nicht aufgenommen in diese Liste sind die Monkees, da sie nur gecastet waren.

Affen haben keine Urheberrechte

17. Juli 2011 um 12:43 2 Kommentare

Urheberrecht und rechtskonforme Bildernutzung sind normalerweise trockene und komplizierte Themen. Selbst bei eigentlich freien Bilder, wie sie in Wikimedia Commons gesammelt werden, ist es trotz der hervorragenden Arbeit von Creative Commons manchmal nicht einfach herauszufinden, wie genau denn nun ein Bild genutzt werden darf. Zumindest gibt es zu meinem Erstaunen bislang keine Schnittstelle, über die sich die Nutzungsbedingungen eines Bildes automatisch ermitteln ließen. Bei freien Bilder gibt es folgende Möglichkeiten:

Entweder das Bild ist gemeinfrei, d.h. jeder kann damit (zumindest vom Standpunkt des Urheberrechts aus) machen was er möchte. Oder der Urheber hat das Bild unter eine freie Lizenz gestellt, unter deren Bedingungen es verwendet werden kann. Je nach Art der freien Lizenz sind folgende Nutzungsbedingungen möglich:

  • Der Urheber muss genannt werden
  • Die Lizenz muss angegeben werden
  • Es muss auf die Quelle verwiesen werden
  • Eigene Bearbeitungen des Bildes müssen unter die gleiche Lizenz gestellt werden (ShareAlike)

Wie allerdings im Detail auf Quellen, Urheber und Lizenzen verwiesen werden muss, lässt sich schwer automatisch ermitteln. Seit September 2010 gibt es zumindest in Wikimedia Commons die Funktion „Use this file“, die das Herausfinden erleichtert. Ich habe mal angefangen den JavaScript-Code dieser Funktion nach PHP zu portieren, um die automatische Einbindung von Bildern aus Commons zu erleichtern.

Damit ein Bild lizensiert werden kann, muss es erst einmal rechtsgültiger Urheber existieren und das Bild muss eine rudimentäre Schöpfungshöhe aufweisen. Einfache Digitalisate von bereits gemeinfreien Werken sind beispielsweise nicht urheberrechtlich geschützt. Dirk Franke hat nun in in seinem Blog auf einen anderen Fall hingewiesen, in die Tücken des Urheber- und Bilderrechts unterhaltsam werden:

Chimpanzee congo painting Macaca nigra self-portrait
Affengemälde: Urheberrechtsfrei Affenfoto: Urheberrechtsfrei

Vor drei Jahren hat ein Affe im indonesischen Tangkoko-Nationalpark eine Reihe von Fotos von sich selbst gemacht. Die Aufnahmen entstanden nach Aussagen des Fotografen David Slater, der die Kamera auf einem Stativ montiert hatte, nicht absichtlich. Damit gibt es weder Urheber noch Schöpfungshöhe, d.h. die Bilder fallen nicht unter das Urheberrecht. Das ist für profesionelle Fotografen und Journalisten allerdings so undenkbar wie für einen Tea-Party-Anhänger die Vorstellung von den menschlichen Ursachen der Erderwärmung. Dabei ist das Urheberrecht kein Gottgegebenes Menschenrecht, sondern ein künstliches Monopolrecht, das Rechteinhabern unter bestimmten Bedingungen zugestanden wird. Über die Bedingungen lässt sich streiten, aber zumindest haben bislang Affen kein Urheberrecht. David Slater bekommt trotz der unabsichtlichen Fotos genügend Publicity, Rechtsexperten haben etwas zum diskutieren und der Betrachter freut sich. Nur der Affen hat nichts von dem ganzen Theater – er braucht auch keine Urheberrechte sondern ungestörten Lebensraum, sonst ist er bald ausgestorben.

P.S.: In Wikimedia Commons gibt es übrigens bereits nicht nur Bilder von Affen, sondern auch von einem Hund und von einem Puma. Die malenden Elefanten aus dem Elefanten-Camp bei Chiang Mai fehlen leider noch.

P.P.S: Schon gewusst, dass es im Unicode-Standard fünf verschiedene Affen gibt?: 🐒 🐵 🙈 🙉 🙊