Links Sammeln und Verteilen mit BEACON

12. Juni 2012 um 12:45 9 Kommentare

Seit ich Ende letzten Jahres auf der Semantic Web in Bibliotheken (SWIB11) einen Vortrag zur Linkaggregation mit BEACON gehalten haben (hier der Mitschnitt) hat sich einiges getan.

Das BEACON-Format wurde ursprünglich Anfang 2010 von Mathias Schindler als ad-hoc Lösung vorgeschlagen, um über Identifier der Gemeinsame Normdatei (GND) zwischen Wikipedia-Artikeln und passenden Webseiten in Personenlexika und Bibliothekskatalogen zu verlinken. Beispielsweise findet sich Literatur zu Tina Modotti im Katalog der Bayerischen Staatsbibliothek (BSB) unter folgender URL:

http://opacplus.bsb-muenchen.de/search?pnd=11858295X

Die URI des GND-Eintrags von Modotti ist:

http://d-nb.info/gnd/11858295X

Sofern die Links einheitlich aufgebaut sind, reicht für die Verknüpfung in einer BEACON-Datei die GND-Nummer 11858295X aus. Zusätzlich kann beispielsweise die Anzahl der Treffer im BSB-Katalog (momentan acht) angegeben werden. Hier ein Beispiel für eine BEACON-Datei:

#FORMAT: BEACON
#PREFIX: http://d-nb.info/gnd/
#TARGET: http://opacplus.bsb-muenchen.de/search?pnd={ID}
#DESCRIPTION: Links auf Literatur zu Personen im Katalog der BSB
#MESSAGE: {annotation} Einträge im BSB-Katalog

11858295X|8

Diese einfache Form der Weitergabe von Links hat sich inzwischen durchgesetzt und es sind zahlreiche BEACON-Dateien verfügbar. Wie bei ad-hoc Standards üblich, haben sich allerdings unterschiedliche Interpretationen und Erweiterungen von BEACON entwickelt. Wir sind deshalb dabei, BEACON endgültig exakt zu spezifizieren, um es schließlich als Internet-Standard (RFC) zu verabschieden. Die Entwicklung kann auf github verfolgt werden, wobei der aktuelle Stand hier (HTML) bzw. hier (TXT) einsehbar ist.

Im wesentlichen muss zum Verständnis von BEACON zwischen zwei Ebenen unterschieden werden: Ein BEACON Link Dump ist eine Menge von einheitlich aufgebautem Links, die ggf. mit einigen Metadaten angereichert ist. In welchem Format die Links gespeichert werden, ist davon unabhängig. Jeder Link besteht aus genau vier Teilen:

  • Einer Quelle (link source), beispielsweise der URL
    http://d-nb.info/gnd/11858295X
  • Einem Ziel (link target), beispielsweise der URL
    http://opacplus.bsb-muenchen.de/search?pnd=11858295X
  • Einem Beziehungstyp (link relation type), beispielsweise der URI
    http://www.w3.org/2000/01/rdf-schema#seeAlso
  • Einer Anmerkung (link annotation), beispielsweise der Zeichenkette
    8 Einträge im BSB-Katalog.

Der Beziehungstyp ist für alle Links in einem BEACON Link Dump gleich. Quelle, Ziel und Anmerkung können bei der Speicherung abgekürzt werden. Die Form zur Speicherung und Weitergabe (Serialisierung) ist die Zweite Ebene von BEACON. Neben dem ursprünglichen BEACON-Text-Format gibt es ein einfaches BEACON-XML-Format. Das oben angegebene Beispiel könnte in BEACON-XML folgendermaßen ausgedrückt werden:

<?xml version="1.0" encoding="UTF-8"?>
<beacon xmlns="http://purl.org/net/beacon"
       prefix="http://d-nb.info/gnd/"
       target="http://opacplus.bsb-muenchen.de/search?pnd="
  description="Links auf Literatur zu Personen im Katalog der BSB"
      message="{annotation} Einträge im BSB-Katalog">
   <link source="11858295X" annotation="8" />
</beacon>

Daneben können Links aus BEACON auch nach RDF übersetzt werden, was für die Anwendung als Linked Open Data von Bedeutung ist. Der Link in RDF/Turtle-Syntax (hier ohne Anmerkung) wäre bswp.:

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
<http://d-nb.info/gnd/11858295X>
rdfs:seeAlso 
<http://opacplus.bsb-muenchen.de/search?pnd=11858295X> .

Zum Ausdrücken der Anmerkung eines Links ist das Meta-Feld „qualifier“ vorgeschlagen, so dass sich BEACON Dumps auch vollständig in RDF übertragen lassen. In jedem Fall ist BEACON nicht auf GND-Nummern beschränkt und Quelle und Ziel müssen nicht zwangsläufig eine gemeinsame ID verwenden. So stellt beispielsweise lobid.org ein Mapping zwischen Lobid-URIs und Wikipedia-Artikeln bereit. Die dabei verwendete Form von BEACON weicht noch etwas vom endgültigen BEACON-Standard ab. Auch aus diesem Grund benötigen wir zum Aktuellen Entwurf des BEACON-Spezifkation noch Feedback und Korrekturleser.

9 Comments »

RSS feed for comments on this post. TrackBack URI

  1. sollte der Link unter „noch Feedback“ zu https://github.com/gbv/beaconspec zeigen? Er zeigt momentan zum „Aktuelen Entwurf“.

    Comment by dr0i — 13. Juni 2012 #

  2. ich meine natürlich zur issue Seite https://github.com/gbv/beaconspec/issues

    Comment by dr0i — 13. Juni 2012 #

  3. […] zu BEACON. Jakob erklärt, was und […]

    Pingback by Infobib » RFC zu BEACON — 13. Juni 2012 #

  4. […] gab es noch etwas Technik: Jakob Voss erläuterte in seinem Jakoblog das BEACON-Format und wünscht sich Feedback zur Spezifikation des endgültigen […]

    Pingback by Gelesen in Biblioblogs (24.KW’12) – Vertretung Lesewolke | Bibliothekarisch.de — 18. Juni 2012 #

  5. ich hoffe das Mapping zwischen Lobid-URIs und DBpedia-Artikeln ist jetzt ok…

    Comment by dr0i — 18. Juni 2012 #

  6. @dr0id: Im moment ist die Datei nicht vorhanden, Als ich neulich reingeschaut habe war die Mailadresse (#CONTACT), syntaktisch noch nicht korrekt.

    Comment by jakob — 22. Juni 2012 #

  7. Die Mailadresse ist absichtlich inkorrekt um SPAM zu vermeiden. Ich hab ein Issue dazu eröffnet um das zu diskutieren.

    Comment by dr0i — 25. Juni 2012 #

  8. Quelle und Ziel sind in Deinem Beispiel identisch. Das ist ja wohl ein Fehler, oder?

    Comment by AndreasP — 31. Oktober 2012 #

  9. @AndreasP: Ups, danke für den Hinweis, ist korrigiert!

    Comment by jakob — 1. November 2012 #

Sorry, the comment form is closed at this time.