Was ist Semantisches Tagging?

26. Februar 2008 um 14:19 11 Kommentare

In Anschluß an den sehr fruchtbaren Workshop Social Tagging in der Wissensorganisation (Program und weitere Berichte von Mandy Schiefner, bei Joachim Wedekind und Johannes Moskaliuk) schreibe ich grade an einem Artikel über “Semantic Tagging”. Im Zusammenhang mit Social Tagging wurde das Thema Semantic Web zwar immer wieder genannt und die Beiträge dazu im letzten Panel waren alle interessant; wie den nun konkret beide Welten zusammenkommen sollen, blieb aber abgesehen vom Vortrag von Rolf Sint und Georg Güntner von Salzburg Research) über das Terminologie-Modul im Projekt LIVE etwas vage – vielleicht liegt das auch an meiner Technik-zentrierten Sicht, auf Implementierungen und Spezifikationen.

So wie ich das LIVE-Projekt verstanden habe, sollen bei der Olympiade 2008 sportliche Ereignisse “live” verschlagwortet werden, wobei freie Tags zeitnah mit Hilfe eines Thesaurus-Editors in die “Ontologie” eingearbeitet werden; das ganze basiert auf SKOS und ist damit weitgehend Semantic-Web-kompatibel – und ein Beispiel für Semantic Tagging. Mit Social Tagging hat das Projekt allerdings nur noch wenig zu tun. Falls sich dennoch normale Nutzer am Tagging der PR-Olympiade beteiligen dürfen, hier mal ein Vorschlag für die Tag-Cloud:

2008 Bronze Doping Gold Menschrechtsverletzung Propaganda Peking Silber Sponsor

Aber zurück zum Semantischen Tagging: Die Bezeichnung ist eigentlich schon aus der Linguistik besetzt; dort wird unter Semantic Tagging die Erkennung und Auszeichnung von Namen und syntaktischen Strukturen in einem Text verstanden. Ein sehr einfaches Beispiel aus dem Web sind semantische HTML-Tags wie em, strong und cite; eine andere Form semantischen Taggings im Web, die eher in Richtung Auszeichnung von Daten geht, sind Mikroformate. Von dort lässt sich zwar wieder der Bogen zum Semantic Web spannen, aber eigentlich ist semantisches Tagging im Linguistischen Sinne etwas anderes: Gegeben ist ein Text, in dem einzelnen Bestandteile wie Subjekt, Objekt, Nebensatz, Personennamen etc. als solche markiert werden. Beim Social Tagging werden dagegen freie Tags an einen gesamten Text (oder ein anderes Objekt) angehängt, um seinen gesamten Inhalt zu beschreiben. Irgendwo sollte sich deshalb zwischen Semantischem Tagging innerhalb eines Textes und Semantischem Tagging als (Social) Tagging mit expliziter Semantik eine Grenze ziehen lassen.

Dachte ich. Bis ich entdeckt habe, was die Nachrichtenagentur Reuters Ende Januar online gebracht hat: Mit der kostenlosen Web-API “Calais” lassen sich Texte analysieren, indem Reuters Namen, Orte, Zahlen und andere Angaben extrahiert (siehe API-Dokumentation) und mit RDF auszeichnet. [via Taxonomy Watch] Ob die gefundenen Entitäten auch gleich mit URIs versehen werden oder ob nur ausgezeichnet wird, dass es sich beispielsweise um einen Firmennamen handelt, habe ich noch nicht rausgefunden – in jedem Fall dürften die extrahierten Terme gute Vorschläge für semantisches Tagging abgeben. Zum Ausprobieren kann dieses Formular verwendet werden.

Ach herrje – Ich weiß manchmal nicht, ob ich begeistert sein soll, in welch spannender Weise sich das Web zur Zeit weiterentwickelt oder ob ich daran verzweifeln sollte, wie komplex und schnell das alles geht. Inzwischen ist “Semantic Web” ja schon so hype, dass es schwierig wird, die Spreu vom Weizen zu trennen.

11 Kommentare »

RSS Feed für Kommentare zu diesem Artikel. TrackBack URI

  1. Ist das semantische Web jetzt Web 3.0?

    Kommentar by Dani — 26. Februar 2008 #

  2. Danke für die Differenzierung. Ich teile Deine Meinung: Nicht überall wo Semantic drauf steht, ist auch Semantic drin, siehe Agiles E-Learning in semantischen Wissensnetzen.

    Kommentar by Johannes Moskaliuk — 27. Februar 2008 #

  3. @Dani: Ja, wer unbedingt ein neues “Buzzword” braucht, der könnte das Semantic Web auch als Web 3.0 bezeichnen. Ich habe allerdings auch schon die Verwendung des Begriff Web 3.0 für das dreidimensionale Internet also z.B. Second Life gehört.

    Kommentar by Johannes Moskaliuk — 27. Februar 2008 #

  4. Schon seit ein-zwei Jahren hat eine semantic-web nahe Fraktion die Kombination “Social Semantic” bzw. umgekehrt lanciert, z.B. “Semantic Social Software”. Das taten z.B. Kollegen von DERI Ireland (vgl. NKOS workshop at ECDL 2006), oder jetzt Leute im Umkreis der I-Semantics 2008 Conference, die einen solchen Themenschwerpunkt anbietet, mit Salzburg Research und DERI prominent beteiligt.
    In der akademischen Konkurrenz zaehlen fuer viele fruehe Vorankuendigungen und die bewusste Erfindung neuer buzzwords, um ihre Reviere abzustecken, mehr als terminologische Genauigkeit und wissenschaftliche Wuerdigung frueherer Errungenschaften.

    Kommentar by Traugott Koch — 28. Februar 2008 #

  5. Als Koautor des Beitrags im Zusammenhang mit LIVE ein kurzer Kommentar: Ja, der LIVE-Ansatz ist kein Social Tagging Ansatz (wohl aber ein semantischer Tagging Ansatz). Der im Social Tagging Workshop vorgestellte Beitrag beschäftigte sich jedoch schon mit Social Tagging: Es ging vielmehr um eine Kombination von Social und Semantic Tagging.
    Übrigens: Information zu LIVE findet sich auf http://www.ist-live.org.

    Kommentar by Georg Güntner — 29. Februar 2008 #

  6. Man könnte es auch “Verbesserung der terminologischen Kontrolle durch Feedback-Mechanismen während der Verschlagwortung und ausgewählte Übernahme von durch Nutzer vergebenen Schlagwörtern als Deskriptor-Kandidaten” nennen – aber “Social und Semantic Tagging” ist kürzer und klingt halt auch besser ;-) Das was ich von eurem Prototypen gesehen habe hat mir schon gefallen, aber so lange es nicht frei verfügbar ist, ist das irrelevant – ich empfehle eure Arbeit möglichst bald als Open Source freizugeben, auf bestehenden Standards zu setzen (SKOS und SPARQL wurden schon genannt) und die Schnittstellen gut zu dokumentieren, damit es weitergenutzt werden kann.

    Kommentar by jakob — 29. Februar 2008 #

  7. Hallo,

    ich würde meinen, dass Semantic Tagging eher auf die Semantik für Maschinen abzielt. Und zwar in der Weise, dass der ausgezeichnete Text für Maschinen eindeutig zuordenbar bzw. unterscheidbar und damit interoperabel wird. Das kann in einer Weise geschehen, die die Bedeutung für Menschen nicht unbedingt vorhält (ausgedrückt durch eine URI, hinter der kein Konzept beschrieben ist oder eine Katalogisierungskategorie).
    Da das alles jedoch sehr kryptisch daher kommen kann, wurden solche Dinge wie Mikroformate entwickelt (erst für Menschen, dann für Maschinen).
    Die Soziale Komponente (social tagging) kommt ja erst hinzu, wenn es darum geht einen Mehrwert in einer Community zu schaffen. Dies kann sowohl mit semantischer Anotation (microformats z.B. hcalendar wird publiziert, damit sich jeder den Termin in den Kalender speichern kann) oder nicht (maschinen)semantischer Annotation (Tags bei delicious).
    Es bilden sich hier meiner Meinung Überlappungen, die eine Unterscheidung von Semantic und Social Tagging nur je nach Blickwinkel zulassen.

    Weiterhin finde ich es schon spannend, wie Begrifflichkeiten wie “Web 3.0″ scheinbar dazu verwandt werden die eigene Arbeit in den Vordergrund zu stellen oder Produkte zu verkaufen.
    Die Idee des Semantic Web oder der semantischen Beziehungen von Webinhalten gibt es schon seit Einführung des WWW. Daran, dass jeder “Web 3.0″ anders interpretiert, zeigt zwar, dass hier eine Menge neue Sachen passieren, aber dass der Versionssprung sich einfach nicht deutlich abzeichnet, um ihn wirklich zu bestimmen. Ich würde sagen, dass wir auf der halben Treppe zum Web 3.0 sind (was auch immer darunter zu verstehen ist). Und wahrscheinlich gehen Web 2.0, Semantic Web und Web 3D in diese Richtung. Bis zur nächsten Webversion braucht es aber wohl noch ein bisschen.

    Kommentar by Carsten — 10. März 2008 #

  8. [...] zur Tagung Social Tagging in der Wissensorganisation, der unter Anderem einen Beitrag von mir zum Semantischen Tagging enthält (weitere Infos zum Sammelband bei Birgit Gaiser). Neben Sonjas Arbeit wurde [...]

    Pingback by Gewinner des Theseus-Wettbewerb ausgezeichnet « Jakoblog — Das Weblog von Jakob Voß — 20. Juni 2008 #

  9. [...] Tagging-Vokabular über mehrere Anwendungen – das wäre dann ein einfacher Fall von Semantischem Tagging … und wahrscheinlich erst etwas für 2009 Tags: BibSonomy, LibraryThing, Mashup, [...]

    Pingback by Kombination von Weblog, Kalender und Literaturverzeichnis? « Jakoblog — Das Weblog von Jakob Voß — 6. August 2008 #

  10. [...] Was ist semantisches Tagging? [...]

    Pingback by Tools der Woche: Faviki « Zukunftswerkstatt 2009 — 14. Januar 2009 #

  11. Offensichtlich kann OpenCalais aber nur Englisch, Französisch und Spanisch – kein Deutsch

    Kommentar by zyko — 27. November 2014 #

Entschuldige, das Kommentarformular ist zurzeit geschlossen.

Powered by WordPress with Theme based on Pool theme and Silk Icons.
Entries and comments feeds. Valid XHTML and CSS. ^Top^