Was ist ein Publikationstyp?

7. April 2011 um 20:29 7 Kommentare

Im Rahmen der Weiterentwicklung von DAIA kam wiederholt der Wunsch auf, Exemplare als Netzpublikation zu kennzeichnen, so dass klar ist, dass man direkt über einen Link auf den Titel kommt. Uwe Reh wies in der Diskussion darauf hin, dass nach dem neuen Katalogisierungsstandard RDA eine „Manifestation“ (das entspricht etwa einer bestimmten Auflage oder Version einer Publikation) eine eindeutige Materialart haben muss (hier eine RDA-Ãœbersicht zur Manifestation [PDF]). Aber ist die Materialart das Gleiche wie ein Publikationstyp?

Das Konzept des Publikationstyps hat mich schon öfter etwas genervt wenn ich von irgend einer Anwendung oder einem Datenformat gezwungen wurde, für eine Publikation einen „Typ“ auszuwählen. In BibTeX gibt es beispielsweise 14 verschiedene Typen von „article“ über „proceedings“ bis „misc“. Daneben gibt es zahlreiche andere Listen von Typen. Also was ist das eigentlich, ein Publikationstyp?

In Wikipedia gibt es dazu bislang keinen Artikel, nur verschiedene Artikel zu einzelnen Literaturgattungen, Formen von wissenschaftlichen Arbeiten, oder allgemein Formen von Publikationen. Ãœber DBPedia ließen sich diese Listen auch zur Angabe von Publikationstypen verwenden. Das Glossar Informationskompetenz definiert Publikationstyp als „Form einer schriftlichen Veröffentlichung, von Zweck, Umfang und Inhalt bestimmt. In Katalogen und Datenbanken ist der Publikationstyp meist ein mögliches Suchkriterium, mit dem die Treffermenge bei einer Literatursuche formal eingeschränkt werden kann.“ Der Eintrag im Lexikon der Bibliotheks und Informationswissenschaft (LBI) erscheint gerade erst mit Band 9. Konrad Umlauf definiert Publikationstyp dort als “ Klasse von Publikationen mit mindestens einem gleichen Merkmal“ und weist angesichts überschneidender Begriffe wie „Dokumenttyp“, „Materialart“, „Editionsform“ und „Medientyp“ darauf hin, dass es „keinen einheitlichen Begriff von Publikationstyp“ gibt.

Wenn es jedoch keine einheitliche Definition von Publikationstyp gibt, ist der Zwang, dass eine Publikation genau einen Typ haben muss, um so unsinniger. Warum kann eine Publikation zum Beispiel nicht gleichzeitig Buch, Onlinepublikation und Dissertation sein? Oder gleichzeitig Mikroform, Onlinepublikation und Klaviernoten (die Links gehen auf die Klassifikationen von Publikationen aus RDA)? Sicher schließen sich einige der Typen aus, aber eben nicht alle. Sinnvoller wäre da eine Facettenklassifikation von Publikationstypen. Darauf werden sich die verschiedenen Anwender jedoch wahrscheinlich nie einigen werden. Stattdessen gibt es zahlreiche unabhängige Klassifikationen:

Und viele,viele weitere…

Vielleicht sollten wir einfach aufhören von Publikationstypen zu reden und uns stattdessen auf charakteristische Eigenschaften (Höhe, Breite, Umfang, Zielpublikum etc.) beschränken?

Ontologien und Ontologiesprachen definiert – ganz ohne „Semantik“

14. März 2011 um 18:21 5 Kommentare

Die Artikel „Ontologie“ und „Ontologiesprache“ gehören neben dem Eintrag „Metadaten“ zu den umfangreichsten Artikeln, die ich für das Lexikon der Bibliotheks- und Informationswissenschaft (LBI) übernommen habe. Da die Artikel bis Donnerstag fertig sein müssen, hier die aktuelle Vorabversion. Die mit „↗“ gekennzeichnet Links ergeben sich aus der Auswahl anderer Einträge im LBI:

Ontologie:
Strukturierte Sammlung von beliebigen ↗Kategorien, Relationstypen und Regeln zur Beschreibung von Objekten. Der Begriff O. ist an die gleichnamige philosophische Disziplin der „Lehre vom Sein“ angelehnt. Anfang der 1990er wurde der Begriffsumfang ausgehend von der ↗künstlichen Intelligenz in der Informatik auf beliebige Systeme zur ↗Wissensrepräsentation ausgeweitet. Trotz starker thematischer Ãœberschneidungen wird er meist ohne systematischen Rückgriff auf verwandte Konzepte der ↗Datenmodellierung und der dokumentarischen ↗Wissensorganisation und ↗Informationspraxis angewandt, vor allem im Bereich des ↗Semantic Web.

Die Bestandteilen einer O. lassen sich in ↗Klassen (↗Allgemeinbegriff), Instanzen (↗Individualbegriff) und Eigenschaften als Relationstypen (↗Klassem, ↗Facette) unterscheiden. Hinzu kommen Regeln in Form von ↗Integritätsbedingungen und Ableitungsregeln (Inferenz). Alle Bestandteile sollten durch ↗Definitionen und ↗Scope notes erklärt sein.

Die Möglichkeiten der Strukturierung einer O. hängen von der ↗Ontologiesprache ab, in der die O. ausgedrückt ist. Die Bandbreite der Ausdrucksfähigkeit reicht von einfachen ↗Terminologien und ↗Kontrollierte Vokabularen über ↗Taxonomie und ↗Thesauri mit festen Relationstypen bis zu Systemen mit freien Relationstypen wie ↗Semantischen Netzen, ↗Topic Maps, und ↗Datenmodellen. Im engeren Sinne grenzen sich O. von der letztgenannten Gruppe durch eine freie Wahl von Regeln ab. Zudem müssen bei einer O. Klassen, Individuen und Relationstypen nicht unbedingt disjunkt sein, so dass sich sehr komplexe Zusammenhänge detailliert beschreiben lassen. In der Praxis wird von diesen Erweiterungen, wie z.B. Aussagen über Aussagen, jedoch nur begrenzt Gebrauch gemacht, da sie die allgemeine Nutzbarkeit einer O. einschränken.

Eine weitere übliche Unterteilung von O.typen besteht in O. mit begrenztem Gegenstandsbereich und übegreifenden O. die allgemeinere Begriffe beschreiben. Hauptanwendungsgebiete von O. ist der ↗Datenaustausch zur automatischen Informationsintegration. Im Gegensatz zu herkömmlichen Datenmodellen (z.B. einem ↗Kategorienkatalog) wird mit O. die Nutzung von hoch formalisierten Modellen unabhängig von einzelnen Anwendung angestrebt. Dafür können O. z.B. mit ↗RDF aufeinander bezogen und miteinander kombiniert werden. Die Nutzung gemeinsamer O. und O.bestandteile soll das automatische Zusammenführen und Auswerten von ↗Informationen aus unterschiedlichen ↗Quellen ermöglichen. Beispiele für solche Ontologien sind das CIDOC ↗Conceptual Reference Model und ↗OAI-ORE. Da viele Informationen nur unstrukturiert vorliegen, werden Ontologien zunehmend mit Verfahren der ↗Computerlinguistik kombiniert.

siehe auch: ↗Modellierung, Deduktionssystem

Ontologiesprache:
Formales System zur Beschreibung von ↗Ontologien. Populäre Beispiele im Bereich des ↗Semantik Web sind RDF Schema (RDFS), die ↗Web Ontology Language (OWL) und deren Vorläufer ↗DAML+OIL für Ontologien über ↗RDF-Daten. In anderen Bereichen können je nach Ontologiebegriff und ihrer Anwendung Schemasprachen wie ↗XML Schema und die ↗Data Definition Language sowie konzeptuelle Modellierungssprachen wie die das ↗Entity-Relationship-Datenmodell (ERM), die ↗Unified Modeling Language (UML) und ↗Object Role Modelling (ORM). Hinzu kommen ergänzende Regelsprachen wie Common Logic und das Rule Interchange Format (RIF). Beschreibungssprachen für ↗Kontrollierte Vokabulare wie das ↗Simple Knowledge Organisation System (SKOS) werden seltener zu den O. gezählt. Zur Beschreibung von O. werden gelegentlich spezielle (Meta-)O. wie Meta-Object Facility (MOF) eingesetzt.

Die konkreten Fähigkeiten einer O. bestimmen, wie in einer Ontologie Konzepte, Relationen und Regeln definiert und in Beziehung gesetzt werden können. Angestrebt wird i.d.R. ein hoher Grad an Formalisierung und Ausdrucksstärke bei gleichzeitig beherrschbarer Komplexität. Dafür basieren O. auf mathematischen Logiksprachen wie der ↗Beschreibungslogik. Da mit steigender Ausdrucksstärke die praktische und theoretische Berechenbarkeit einer O. abnimmt, gibt es für viele O. in abgestuften Varianten, vor allem im Bereich der möglichen ↗Integritätsbedingungen und Inferenzregeln. Grundsätzlich stoßen O. beim Umgang mit ungenauen Angaben (↗Fuzzy-Logik) und Strukturen höherer Ordnung (z.B. Regeln über Regeln) an ihre Grenzen.

Prinzipiell lassen sich auch ↗Programmiersprachen als O. nutzen. Der Vorteil von O. besteht jedoch darin, dass Ontologien damit prinzipiell übersichtlicher und weniger an konkrete Technologien gebunden sind, so dass sie sich besser miteinander vergleichen und kombinieren lassen. Im Besten Fall dienen O. ebenso wie Beispiele und Dokumentation dazu durch ↗Modellierung, die Kluft zwischen dem oft implizitem ↗Wissen über Sachverhalte und ihrer Abbildung in einem ↗Informationssystem zu überbrücken.

siehe auch: ↗Deduktionssystem

Nach meiner Definition hat Ontologie nichts mit „Semantik“ zu tun, zumindest wäre der Bezug zur Klärung wenig hilfreich. In der deutschsprachigen Wikipedia hatte ich es 2003 so eingetragen, inzwischen ist der Artikel dort etwas unverständlich und der Englischsprachige ziemlich einseitig. Aber das lässt sich ja ändern. Meine Texte stehen frei unter CC-BY-SA.

Begriffssysteme, Ontologien und ihr gemeinschaftlicher Aufbau mit Wikis

27. Mai 2007 um 13:06 2 Kommentare

Vor inzwischen gut 4 Jahren habe ich mich im Rahmen einer Studienarbeit im Diplomstudiengang Informatik mit verschiedenen Arten von Begriffssystemen beschäftigt. Ausgangspunkt war der mangelnde Austausch zwischen Informationswissenschaft und Informatik im Bereich der Wissensorganisation: Während die Informatiker plötzlich alles „Ontologie“ nannten und mit der unreflektierten Neuerfindung des Rades Forschungsgelder einkassierten, hinkten die Informationswissenschaftler der technischen Entwicklung um Jahre hinte (syptomatisch unter Anderem daran erkennbar, dass viele Thesauri bislang nur auf Papier erhältlich sind).

Die Situation bessert sich inzischen, wenn auch nur langsam. So ist beispielsweise beim Thema Tagging (früher: Indizierung/Indexierung) momentan Ähnliches zu beobachten, weshalb ich mit den Versuch einer umfassenderen Typologie von Indexierungssystemen gewagt habe. Im Tagungsband der letzten DGI-Online-Tagung ist nun ein feiner Artikel von Katrin Weller aus dem Ontoverse-Projekt zum „Kooperativen Ontologieaufbau“ erschienen, der sich in Bezug auf die Begriffsverwirrung in der Ontologieforschung und der Notwendigkeit einer Zusammenarbeit zwischen den Disziplinen meiner damaligen Beurteilung anschließt.

Der Artikel ist ebenso wegen Wellers Ausführungen zum gemeinschaftlichen Ontologieaufbau und der dafür angedachten Verwendung von Wikis zu empfehlen. Im Forschungsprojekt Ontoverse soll eine Wiki-Plattform zur gemeinschaftlichen Erstellung und Pflege von Ontologien entwickelt werden, die „inter-ontologische“ (Aufarbeitung von Wissen innerhalb eines abgegrenzten Themenbereiches) und „intra-ontologische“ (Interoperabilität zwischen verschiedenen Ontologien) Aspekte in Beziehung setzt und „die Konsensbildung und den Diskurs im Rahmen des Ontologieaufbaus unterstützt“. Zwar fehlen im Artikel etwas konkretere Beispiele und einige bereits existierende Ansätze wie beispielsweise Semantic MediaWiki oder bisherige Versuche, einfache Thesauri und Klassifikationen mit Wikis zu verwalten, bleiben unerwähnt, aber es handelt sich ja auch nur um eine erste Einführung.

Ich bin gespannt auf die Ergebnisse des Ontoverse-Projekts und hoffe, dass es nicht bei rein akademischen Prototypen bleibt, wie in der Informatik leider allzu oft üblich – bis jetzt ist ja auf der Homepage des Projekts wenig konkretes zu erfahren und der Aufruf zu einem Workshop 2006 ist ja auch nicht mehr ganz aktuell.