Ontologien und Ontologiesprachen definiert – ganz ohne „Semantik“

14. März 2011 um 18:21 5 Kommentare

Die Artikel „Ontologie“ und „Ontologiesprache“ gehören neben dem Eintrag „Metadaten“ zu den umfangreichsten Artikeln, die ich für das Lexikon der Bibliotheks- und Informationswissenschaft (LBI) übernommen habe. Da die Artikel bis Donnerstag fertig sein müssen, hier die aktuelle Vorabversion. Die mit „↗“ gekennzeichnet Links ergeben sich aus der Auswahl anderer Einträge im LBI:

Ontologie:
Strukturierte Sammlung von beliebigen ↗Kategorien, Relationstypen und Regeln zur Beschreibung von Objekten. Der Begriff O. ist an die gleichnamige philosophische Disziplin der „Lehre vom Sein“ angelehnt. Anfang der 1990er wurde der Begriffsumfang ausgehend von der ↗künstlichen Intelligenz in der Informatik auf beliebige Systeme zur ↗Wissensrepräsentation ausgeweitet. Trotz starker thematischer Ãœberschneidungen wird er meist ohne systematischen Rückgriff auf verwandte Konzepte der ↗Datenmodellierung und der dokumentarischen ↗Wissensorganisation und ↗Informationspraxis angewandt, vor allem im Bereich des ↗Semantic Web.

Die Bestandteilen einer O. lassen sich in ↗Klassen (↗Allgemeinbegriff), Instanzen (↗Individualbegriff) und Eigenschaften als Relationstypen (↗Klassem, ↗Facette) unterscheiden. Hinzu kommen Regeln in Form von ↗Integritätsbedingungen und Ableitungsregeln (Inferenz). Alle Bestandteile sollten durch ↗Definitionen und ↗Scope notes erklärt sein.

Die Möglichkeiten der Strukturierung einer O. hängen von der ↗Ontologiesprache ab, in der die O. ausgedrückt ist. Die Bandbreite der Ausdrucksfähigkeit reicht von einfachen ↗Terminologien und ↗Kontrollierte Vokabularen über ↗Taxonomie und ↗Thesauri mit festen Relationstypen bis zu Systemen mit freien Relationstypen wie ↗Semantischen Netzen, ↗Topic Maps, und ↗Datenmodellen. Im engeren Sinne grenzen sich O. von der letztgenannten Gruppe durch eine freie Wahl von Regeln ab. Zudem müssen bei einer O. Klassen, Individuen und Relationstypen nicht unbedingt disjunkt sein, so dass sich sehr komplexe Zusammenhänge detailliert beschreiben lassen. In der Praxis wird von diesen Erweiterungen, wie z.B. Aussagen über Aussagen, jedoch nur begrenzt Gebrauch gemacht, da sie die allgemeine Nutzbarkeit einer O. einschränken.

Eine weitere übliche Unterteilung von O.typen besteht in O. mit begrenztem Gegenstandsbereich und übegreifenden O. die allgemeinere Begriffe beschreiben. Hauptanwendungsgebiete von O. ist der ↗Datenaustausch zur automatischen Informationsintegration. Im Gegensatz zu herkömmlichen Datenmodellen (z.B. einem ↗Kategorienkatalog) wird mit O. die Nutzung von hoch formalisierten Modellen unabhängig von einzelnen Anwendung angestrebt. Dafür können O. z.B. mit ↗RDF aufeinander bezogen und miteinander kombiniert werden. Die Nutzung gemeinsamer O. und O.bestandteile soll das automatische Zusammenführen und Auswerten von ↗Informationen aus unterschiedlichen ↗Quellen ermöglichen. Beispiele für solche Ontologien sind das CIDOC ↗Conceptual Reference Model und ↗OAI-ORE. Da viele Informationen nur unstrukturiert vorliegen, werden Ontologien zunehmend mit Verfahren der ↗Computerlinguistik kombiniert.

siehe auch: ↗Modellierung, Deduktionssystem

Ontologiesprache:
Formales System zur Beschreibung von ↗Ontologien. Populäre Beispiele im Bereich des ↗Semantik Web sind RDF Schema (RDFS), die ↗Web Ontology Language (OWL) und deren Vorläufer ↗DAML+OIL für Ontologien über ↗RDF-Daten. In anderen Bereichen können je nach Ontologiebegriff und ihrer Anwendung Schemasprachen wie ↗XML Schema und die ↗Data Definition Language sowie konzeptuelle Modellierungssprachen wie die das ↗Entity-Relationship-Datenmodell (ERM), die ↗Unified Modeling Language (UML) und ↗Object Role Modelling (ORM). Hinzu kommen ergänzende Regelsprachen wie Common Logic und das Rule Interchange Format (RIF). Beschreibungssprachen für ↗Kontrollierte Vokabulare wie das ↗Simple Knowledge Organisation System (SKOS) werden seltener zu den O. gezählt. Zur Beschreibung von O. werden gelegentlich spezielle (Meta-)O. wie Meta-Object Facility (MOF) eingesetzt.

Die konkreten Fähigkeiten einer O. bestimmen, wie in einer Ontologie Konzepte, Relationen und Regeln definiert und in Beziehung gesetzt werden können. Angestrebt wird i.d.R. ein hoher Grad an Formalisierung und Ausdrucksstärke bei gleichzeitig beherrschbarer Komplexität. Dafür basieren O. auf mathematischen Logiksprachen wie der ↗Beschreibungslogik. Da mit steigender Ausdrucksstärke die praktische und theoretische Berechenbarkeit einer O. abnimmt, gibt es für viele O. in abgestuften Varianten, vor allem im Bereich der möglichen ↗Integritätsbedingungen und Inferenzregeln. Grundsätzlich stoßen O. beim Umgang mit ungenauen Angaben (↗Fuzzy-Logik) und Strukturen höherer Ordnung (z.B. Regeln über Regeln) an ihre Grenzen.

Prinzipiell lassen sich auch ↗Programmiersprachen als O. nutzen. Der Vorteil von O. besteht jedoch darin, dass Ontologien damit prinzipiell übersichtlicher und weniger an konkrete Technologien gebunden sind, so dass sie sich besser miteinander vergleichen und kombinieren lassen. Im Besten Fall dienen O. ebenso wie Beispiele und Dokumentation dazu durch ↗Modellierung, die Kluft zwischen dem oft implizitem ↗Wissen über Sachverhalte und ihrer Abbildung in einem ↗Informationssystem zu überbrücken.

siehe auch: ↗Deduktionssystem

Nach meiner Definition hat Ontologie nichts mit „Semantik“ zu tun, zumindest wäre der Bezug zur Klärung wenig hilfreich. In der deutschsprachigen Wikipedia hatte ich es 2003 so eingetragen, inzwischen ist der Artikel dort etwas unverständlich und der Englischsprachige ziemlich einseitig. Aber das lässt sich ja ändern. Meine Texte stehen frei unter CC-BY-SA.

5 Comments »

RSS feed for comments on this post. TrackBack URI

  1. Mir fehlt noch ein bisschen der Aspekt „shared“ (-> Konsensbildung auf der einen und -> mitgeteilt auf der anderen Seite).

    Und … ist eine nicht formale Ontologie eigentlich immer noch eine Ontologie oder vielleicht schon wieder etwas anderes?

    Comment by Matthias — 14. März 2011 #

  2. Stimmt, die Frage wie Ontologie (gemeinsam) erstellt werden, kommt bislang zu kurz. Nicht-formale Anteile hat praktisch jede Ontologie, zumindest in Form der Labels und natürlichsprachlichen Beschreibungen, ohne die eine Ontologie ziemlich unverständlich wäre. Ob sowas zur Ontologie dazugehört, ist imho Ansichtssache.

    Comment by jakob — 14. März 2011 #

  3. Hallo Jakob,
    ich bin mir nicht ganz sicher, wie der Begriff „Integritätsbedingungen“ in den beiden Artikelentwürfen gemeint ist. Denn Datentyp- oder sonstige Constraints in dem Sinne sieht z. B. OWL bzw. RDFS meines Wissens nicht vor, lediglich Angaben zu „domain“ und „range“, die aber ausschließlich für Inferenzen herangezogen werden.
    Falls mit „Integritätsbedingungen“ Beschreibungen von Klassen-Restrictions gemeint sind, sollte dies ggf. anders formuliert werden.

    Beste Grüße, Max

    Comment by Max Richter — 15. März 2011 #

  4. Hallo Max! Bei RDF-Ontologien mit Open-World-Assumption dienen die meisten Bedingungen tatsächlich dazu, auf zusätzliche Triple (z.B. rdf:type) zu schließen. Integritätsbedingungen werden meist anderweitig ausgedrückt z.B. in der SKOS-Spezifikation oder mit einer zusätzlichen Regelsprache. Aber Ontologien sind ja nicht auf RDF beschränkt. Ich habe nochmal gegooglelt und bin auf diesen interessanten Artikel zu Integritätsbedingungen für OWL gestoßen.

    Comment by jakob — 15. März 2011 #

  5. […] wird, beschreibt die Extensible Markup Language (XML). Wie bei den anderen Artikeln (vgl. Ontologie und Ontologiesprache sowie Metadaten) besteht die Kunst darin, sich auf das wesentliche zu Beschränken und sinnvoll mit […]

    Pingback by Was ist XML? « Jakoblog — Das Weblog von Jakob Voß — 15. April 2012 #

Sorry, the comment form is closed at this time.