Europeana-Daten teilweise als Linked Data

21. Juni 2011 um 13:09 1 Kommentar

Wie auf public-lld angekündigt, bietet Europeana seit gestern einige Daten, die von verschiedenen europäischen Kultureinrichtungen aggregiert werden, als Linked Open Data an. Der Testzugang mit Beschreibung ist unter data.europeana.eu, während im Europeana-Blog noch nichts dazu steht. Und so kommt man an die Daten: Es gibt sowohl zeinen großen Datenbankdump (etwa 1GB gepackt, 185 Millione Tripel) als auch kleinere Teile zum Herunterladen. Um die URIs einzelner Datensätze herauszubekommen, ist noch etwas Handarbeit notwendig:

  1. Suche im Europeana-Portal
  2. Einschränken des Suchergebnis auf „Free Access“
  3. Auswahl eines Datensatz
  4. Entfernen der HTTP-Query-Parameter und der Dateiendung .html von der URL, z.B. http://europeana.eu/portal/record/09428/DB8CA8BB4FABF5AE7F1B93FD6672D30A6B94B343
  5. Ersetze http://europeana.eu/portal/record/ durch http://data.europeana.eu/item/, also zum Beispiel http://data.europeana.eu/item/09428/DB8CA8BB4FABF5AE7F1B93FD6672D30A6B94B343

Dummerweise ist damit noch nicht sicher gestellt, dass über diese URI auch RDF-Daten abgerufen werden können, da bislang nur einige Institutionen am Europeana-LOD-Pilot teilnehmen. Auch bei anderen Beispielen aus meiner Suche bekomme ich eher eine Fehlermeldung. Die in der Dokumentation angegebenen Beispiele funktionieren aber. Also gibt es erstmal keine Verknüpfung zum Normdatensatz von Livia Drusilla. Beim Ausprobieren ist mir aufgefallen, dass die Europeana-Server etwas lahm sind und dass es mir unmöglich war, sinnvoll etwas zu finden, da die meisten Objekte als „Image“ gekennzeichnet sind, statt als „Gemälde“, „Statue“, „Münze“ etc. Für praktische Linked-Data-Anwendungen wäre es hilfreich, die Suche auf Objekte einzuschränken zu können, deren Daten als Linked Data verfügbar sind.

Alles in Allem ist der Pilot ein guter Schritt in die richtige Richtung, aber noch etwas wackelig. Da es sich explizit um einen Beta-Test handelt, sollte man jedoch nicht allzu kritisch sein, sondern erstmal mit den Daten herumspielen oder abwarten was noch kommt.

First impressions from the Europeana meeting

23. Juni 2008 um 12:02 Keine Kommentare

Today and tomorrow I participate in a Europeana/EDLnet conference in Den Haag. Europeana is a large EU-funded project to create a „European Digital Library“. Frankly speaking I cannot give a simple definition of Europeana because in the first instance it is just a buzzword. You can ask whether library portals have a future at all, and Europeana has many ingredients that may help to make it fail: a large ambitious plan, a tight schedule, and many different participants with different languages, cultures and needs. The current Europeana Outline Function Specification partly reads like a magic wishlist. Instead of following one simple, good idea from bottom-up, it looks like the attempt to follow many ideas in a bottom-up way.

But if you see Europeana less as a monolithical project but as a network of participants (libraries, museums, and archives) that try to agree on standards to improve interoperability, the attempt seems more promising. In his introductionary speech Jill Cousins (director of Europeana) stressed the importance of APIs and ways to export information from Europeana so other institutions can build their websites and mashups with services and content from Europeana. I hope that open content respositories like Wikimedia Commons and Wikisource can act as both as source and as target of exchange with the European Digital Library. What I also found interesting is that Google and Wikipedia are seen as the default role models or at least important examples of portals to compare with. The talks I have seen so far give me the impression that the view on possibilities and roles for libraries, museums, and archives are more realistic than I thought. One of their strength is that they hold the content and are responsible for it – in contrast to user generated collections like YoutTube, Slideshare, and (partly) Wikipedia. But in general cultural institutions are only one player among others on the web – so they also need to develop further and „let the data flow“. If the Europeana project helps in this development, it is a good project, no matter if you call it a „European Digital Library“ or not.

The next short talks were about CIDOC-CRM and about OAI-ORE – both complex techniques that you cannot easily describe in short time (unless you are a really good Wikipedia author ;-), but at the least my imagination of them has been improved.