TPDL 2011 Doctoral Consortium – part 3

25. September 2011 um 17:36 Keine Kommentare

See also part 1 and part 2 of conference-blogging and #TPDL2011 on twitter.

My talk about general patterns in data was recieved well and I got some helpful input. I will write about it later. Steffen Hennicke, another PhD student of my supervisor Stefan Gradman, then talked about his work on modeling Archival Finding Aids, which are possibly expressed in EAD. The structure of EAD is often not suitable to answer user needs. For this reason Hennicke analyses EAD data and reference questions, to develope better structures that users can follow to find what they look for in archives. This is done in CIDOC-CRM as a high-level ontology and the main result will be an expanded EAD model in RDF. To me the problem of „semantic gaps“ is interesting, and I think about using some of Hennicke data as example to explain data patterns in my work.

The last talk by Rita Strebe was about aesthetical user experience of websites. One aim of her work is to measure the significance of aesthetical perception. In particular her hypothesis to be evaluated by experiments are:

H1: On a high level, the viscerally perceived visual aesthetics of websites effects
approach behaviour.
H2: On a low level, the viscerally perceived visual aesthetics of websites effects
avoidance behaviour.

Methods and preliminary results look valid, but the relation to digital libraries seems low and so was the expertise of Strebe’s motivation and methods among the participants. I suppose her work better fits to Human-Computer Interaction.

After the official part of the program Vladimir Viro briefly presented his music search engine peachnote.com, that is based on scanned muscial scores. If I was working in or with musical libraries, I would not hesitate to contact Viro! I also though about a search for free musical scores in Wikimedia framework. The Doctoral Consortium ended with a general discussion about dissertation, science, libraries, users, and everything, as it should be 🙂

TPDL 2011 Doctoral Consortium – part 2

25. September 2011 um 12:42 Keine Kommentare

The TPDL 2011 Doctoral Consortium, which I already blogged about in part 1, continued with 15 minutes of delay: Christopher Gibson also talked about eBooks – I wonder why his talk was not combined with Luca Colombo’s work in eBook reading experiences. Gibson’s specific topic is eBook lending services in UK public libraries. To quote the research questions from his paper:

Q1. How have public libraries addressed ebook service provision in the UK?
Q2. What challenges and opportunities exist in incorporating ebook lending into other reader services?
Q3. Is it feasible to lend ebook reading devices from public libraries?
Q4. How can the effectiveness of ebook lending services be measured?
Q5. How do library users view the provision of ebook lending services?
Q6. How can effective ebook lending services be developed?

To me an interesting aspect of his methodology was the use of targeted FOI (freedom of information) requests to gather data about eBook lending services. I cannot image this in this Germany where „Informationsfreiheit“ is still in its infancy. One result from another survery done by Gibson: most eBooks are not included in library catalogs. I think this failure is found in German libraries too. In summary the PhD project looked very profound with some real practical values for libraries. On the other hand, the theoretical contribution, for instance the question what „lending“ can mean in a digital library work, was only added in the discussion afterwards.

The next presenting PhD student was Adam Sofronjievic. I am sorry that I could not fully concentrate on his talk about a New Paradigm of Library Collaboration although it seemed very interesting. My talk is next 🙂

TPDL 2011 Doctoral Consortium

25. September 2011 um 11:21 2 Kommentare

Today the International Conference on Theory and Practice of Digital Libraries 2011 started with tutorials and a Doctoral Consortium that I participate with a talk. The seven talks and discussions on ongoing PhD topics were rather diverse and interesting. I tried to briefly summarize at least some of them.

Luco Colombo started with his work on developing and evaluating eBook reading experience for children. Reading „traditional“ books has been extensively investigated – this is not true for eBooks. Especially children are little involved in eBook studies. Colombo explained how the eBook reading experience is different because it directly involves searching, browsing, sharing, and recommending, among other arguments. A good reading experience results in a „flow state“ where the reading gets positively lost in a book. Colombo’s method is a cooperative inquiry. It is not clear whether and by what eBooks are more engaging to children (age 9-11 in this study) than traditional books – maybe this PhD will show. The following discussion was dominated by the participating mentors Jose Borbinha, Milena Dobreva, Stefan Gradmann and Giuseppina Vullo.

In the second talk Krassimira Ivanova presented her dissertation on (content-based) image retrieval utilizing color models. Image retrieval on art images is difficult because it includes very different aspects (artistic styles, depicted objects etc.). Even aspects of color (contrasts, intensity, diversity, harmony etc.) are manifold – maybe this is why philosophy of color has a long history. Nevertheless Ivanova developed several machine learning methods for this color aspects that can be used for image retrieval. I am not sure whether the resulting APICAS system („Art Painting Image Colour Aesthetics and Semantics“) has been evaluated with a user study. Similar to the first talk, the focus could be improved by more narrowing down and making clear the specific contribution. Finally we had some real discussion, but little time.

Modeling is difficult

21. September 2011 um 00:33 3 Kommentare

Yesterday Pete Johnston wrote a detailed blog article about difficulties of „the right“ modeling with SKOS, and FOAF in general, and about the proposed RDF property foaf:focus in particular. As Dan Brickley wrote in a recent mail „foaf:focus describes a link from a skos:Concept to ‚the thing itself‘. Not every SKOS concept (in a thesauri of classification scheme) will have such a direct „thing“, but many do, especially concepts for people and places.“

Several statements in this discussion made me laugh and smile. Don’t get me wrong – I honor Pete, Dan, and the whole Semantic Web community, but there is a regular lack of philosophy and information science. There is no such thing as ‚the thing itself‘ and all SKOS concepts are equal. Even the distinction between an RDF ‚resource‘ and an SKOS ‚concept‘ is artificial. The problem origins not from wrong modeling, which could be solved by the right RDF properties, but from different paradigms and cultures. There will always be different ways to describe the same ideas with RDF, because neither RDF nor any other technology will ever fully catch our ideas. These technologies are not about things but only about data. As William Kent wrote in Data Reality (1978): „The map is not the territory“ (by the way, last year Chris Rusbridge has quoted Kent in the context of linked data). As Erik Wilde and Robert J. Glushko wrote in a great article (2008):

RDF has succeeded beyond the wildest expectations as a convenient format for encoding information in an open and easily computable fashion. But it is just a format, and the difficult work of analysis and modeling information has not and will never go away.

Ok, they referred not to „RDF“ but to „XML“, so the quotation is wrong. But the statement is right for both data structuring methods. No matter if you put your data in XML, in RDF, or carve it in stone – there will never be a final model, because there’s more than one way to describe something.

Wozu mobile Bibliothekskataloge?

18. September 2011 um 14:17 7 Kommentare

Oliver Flimm hat letzte Woche eine mobile Katalogoberfläche vorgestellt, die er auf Basis von jQuery Mobile und OpenBib umgesetzt hat. Der Quellcode ist frei verfügbar.

Wie er in seinem Blogartikel darstellt, sind „mobile Kataloge […] keine Hexerei und koennen mit
vergleichsweise wenig Aufwand erstellt werden.“ Warum sind mobile Kataloge in Bibliotheken trotzdem noch kein Standard? Die Aussage, dass „mobile OPACs kaum genutzt werden“, lasse ich jedenfalls nicht als Begründung gelten – eher lässt sich daran ablesen, dass mobile Kataloge nicht nutzergemäß umgesetzt werden. So ist es beispielsweise notwendig, dass Mobilgeräte automatisch beim Aufruf der Bibliothekswebseite auf den mobilen Katalog hingewiesen werden. Ohne entsprechende Öffentlichkeitsarbeit dauert es auch lange bis sich der Katalog herumgesprochen hat und ohne einfach benutzbaren, tatsächlichen Mehrwehrt ist keine Akzeptanz zu erwarten. Einige positiven Beispiele finden sich in der M-Libraries Liste des Library Success Wiki.

Ich vermute, dass gerade ein mobiler Katalog nicht primär für die Recherche genutzt wird, sondern um mal schnell zu überprüfen, ob und wo ein Buch vorhanden und verfügbar ist und um es ggf. vorzumerken oder zu bestellen. Es geht also um die Funktionalität. Dazu gehört:

  • eine fehlertollerante Suche mit gutem Ranking
  • die Anzeige der aktueller Verfügbarkeit (mit genauem Rückgabedatum) und Standort (mit Koordinate und Lageplan statt kryptischem Bibliothekskürzel)
  • der Zugriff auf das eigene Nutzerkonto

Dies alles sind Funktionen, die Kataloge schon seit mehr als zehn Jahren bieten sollten. In der Praxis sind sie jedoch oft über verschiedene Systeme verteilt und können mangels Schnittstellen kaum integriert werden.

Möglicherweise spricht in 5-10 Jahren auch niemand mehr von mobilen Webseiten, weil erwartet wird, dass alle Webseiten auf verschiedenen Endgeräten benutzbar sind. Ich sehe mobile Katalogoberflächen deshalb vor allem als Chance, bestehende Bibliothekssysteme zu verbessern, unabhängig davon, wie sie dann präsentiert werden.

Wikimedia-Projekt Bibliographisch archivalische Datenbank

10. September 2011 um 10:51 1 Kommentar

In Nürnberg findet dieses Wochenende mit der WikiConvention 2011 eine Wikimedia/Wikipedia-Tagung statt – in mehr als 80 Workshops diskutieren die über 160 Teilnehmer über vielfältige Möglichkeiten und Probleme im Wikimedia-Universum. Heute morgen habe ich an der Veranstaltung von Olaf Simons zu einer geplanten
Bibliographisch archivalischen Datenbank teilgenommen. Das von Wikimedia Deutschland geförderte Projekt lässt sich in den größeren Rahmen der Idee von „WikiData“ einordnen.

Die Kernidee der „bibliographisch-archivalischen Datenbank“ scheint für Kenner des Bibliotheksbereiches etwas naiv, soll doch nichts weniger als ein „Internationaler Katalog und Recherechewerkzeug für alle Bücher aus einem begrenzten Erscheinungszeitraum“ erstellt werden. Andererseits tut ein wenig unkoventionelle Naivität ganz gut, um die traditionellen, geschlossenen Katalogstrukturen zu überwinden. Mit der Datenbank sollen bibliographische Daten als Forschungsdaten verwendet werden können, beispielsweise um sie nach nach Erscheinungsorten, -jahren und beteiligten Personen zu durchforsten, Inhalte zu annotieren und zu korrigieren, und neue Verbindungen und Visualisierungen herzustellen. Die bestehenden Kataloge wie VD16, VD17, VD18 oder im Englischsprachigen Raum ESTC können dazu eher als Steinbruch und Datengrundlage dienen – ohne kollaborative Funktionen und einfachen Datenexport bleiben solche Projekte jedoch zwangsläufig unter ihren Möglichkeiten.

Wie Olaf Simons berichtete, gab es bei ersten Gesprächen zwischen der Bodleian Library und Wikimedia-Vertretern einige Aha-Effekte. Dort – wie auch an einigen anderen Bibliotheken – gibt es zwar schon Bestrebungen, Nicht-Bibliothekare an bibliographischen Datenbanken zu beteiligen, vor allem durch Forscher für historische Bestände. Vergleicht man die Ansätze mit Lösungen aus dem Wikimedia-Universum, scheinen jedoch oft Räder neu erfunden zu werden. Gleichzeitig sind auch die Verfahren in Wikipedia historisch gewachsen und nicht immer auf andere Kontexte anwendbar. Etwas überrascht hat mich Simons Bericht darüber, wie unsicher bisherige Forschungsprojekte zu historischen Publikationsdaten sind: Bestand und Weiternutzung der Forschungsdaten an Bibliotheken sind nach Ablauf der Projektphase in der Regel nicht möglich, was für die Bibliotheken aus meiner Sicht ein Armutszeugnis ist. Nicht nur aus diesem Grund ist es wahrscheinlich sinnvoller, die bibliographischen Datenbanken nicht primär an einer Bibliothekseinrichtung sondern bei Wikimedia, vergleichbar mit Wikisource. Im Gegensatz zu Wikisource sollte es jedoch nicht verschiedene Sprachversionen sondern gleich eine internationale Datenbank geben.

Im Verlauf des Workshop stelle Mathias Schindler einige bereits verwendete Mapping-Tools vor, mit denen Wikipedianer und andere Freiwillige schon mehrere Hunderttausend Verknüpfungen zwischen Personen, Bildern und Publikationen gefunden haben, zum Beispiel im Rahmen der Kooperation mit dem Bundesarchiv. Selbstverständlich konnten wir im kurzen WikiCon-Workshop kein fertiges Konzept für eine kollaborative, bibliographisch-archivalische Datenbank vorlegen. Sicher ist jedoch, dass wir früher oder später bibliographische Systeme haben werden, die wenig mit den geschlossenen Katalogsystemen von Bibliotheken zu tun haben. Um diese Vision voranzutreiben, sollen in dem von Olaf Simons geleiteten Projekt möglichst alle interessierten Personengruppen (Fachwissenschaftler, Wikimedia-Community, Open-Data Community, Techniker und Bibliothekare) zusammengebracht werden. Feedback ist ausdrücklich erwünscht!