Metadaten – Versuch einer Kurzdefiniton

26. Februar 2011 um 17:21 14 Kommentare

Obgleich ich dem Lexikon der Bibliotheks- und Informationswissenschaft (LBI) von Anfang an mit gemischten Gefühlen gegenüber stand – das Vorhaben eines gedruckten Lexikons ist anachronistisch und verspielt eine Chancen, die deutschsprachige Bibliotheks- und Informationswissenschaft als auf der Höhe der Zeit darzustellen – habe ich als Enzyklopädist inzwischen einige Artikel übernommen. Ich muss zugeben, dass die Beschränkungen des LBI auch einen gewissen Reiz haben. Vor allem ist die Länge der Artikel vorgegeben, so dass es darauf ankommt, einen Begriff in seiner Gänze auf das Wesentliche zu reduzieren. Der Begriff „Metadaten“, für den nächste Woche Abgabefrist ist, fällt mit bis zu 4.000 Zeichen in die umfangreichste Kategorie. Ich habe mit der Geschichte des Begriffs begonnen und versucht, das Wesentliche in diesem Umfang zusammenzufassen. Da sich die Bedeutung eines Begriffs erst aus seinen Relationen zu anderen Begriffen ergibt, habe ich auf möglichst viele andere, verwandte Einträgen des LBI verwiesen. Im Laufe der Diskussion vorgenommene Änderungen sind orange markiert.

Bei Google Books Ngram kann man schön den Anstieg der Verwendung des Begriffs nachvollziehen: Der deutlich zu erkennende Knick 1995 ist auf die Dublin Core Initiative zurückzuführen. Nun aber die Definition in ihrer aktuellen Form:

„Daten über Daten“, d.h. ↗  Daten die andere Daten oder Objekte strukturiert beschreiben. Ob und um welche Art von M. es sich bei Daten handelt, hängt vom jeweiligen ↗ Kontext und Zweck der ihrer Anwendung ab.

Bis Ende der 1980er wurden lediglich bei ↗  Datenbanken deren technische Beschreibungsdaten wie ↗  Datenfeld und ↗  Datenmodell im Gegensatz zur ↗  Datenbasis als M. bezeichnet. Später wurden M. auf Beschreibungen von ↗  Primärdaten bei der ↗  Datendokumentation ausgeweitet. Ab Mitte der 1990er prägte das ursprünglich zur ↗  Katalogisierung von ↗  Netzpublikationen entwickelte ↗  Dublin Core Metadata Element Set die Vorstellung von M. Inzwischen können alle strukturierten Beschreibungen von ↗  Informationsobjekten und alle als Daten vorliegenden Formen der ↗  Erschließung als M. bezeichnet werden, also auch alle bibliographischen Daten.

Ein Metadatensatz fasst M., die sich auf ein Referenzobjekt (ein ↗  Dokument oder eine ↗  Dokumentarische Bezugseinheit) beziehen zu einer ↗  Dokumentationseinheit zusammen. Bei Containerformaten wie z.B. ↗  METS kann ein ↗  Datensatz auch M. zu mehreren Objekten enthalten. Die klassische Form eines M.satzes in der Bibliothekspraxis ist das ↗  Katalogisat.

Wesentlich für M. ist das Vorhandensein einer einheitlichen Struktur. Diese kann u.A. als Schema (↗  Kategorienkatalog, ↗  Datendefinitionssprache), Profil, Regelwerk, ↗  Datenformat oder Modell (↗  Ontologiesprache) vorliegen. Die Attribute und Beziehungstypen einer M.struktur sowie die in ihr verwendeten Einträge einer ↗  Indexierungssprache werden auch als Metadatenterme bezeichnet. Die Nutzbarkeit von M. über verschiedenen Systeme (↗  Interoperabilität) wird durch ↗  Standardisierung ermöglicht. Hilfreich sind dabei Metadaten-Registries und die Vergabe von ↗  URIs für M.terme. Zur ↗  Datenkonvertierung zwischen verschiedenen M.strukturen dienen M.mappings („crosswalks“). M.strukturen sind häufig in Beschreibungsebenen verschachtelt und aufeinander bezogen; so ist beispielsweise ↗  MODS durch ein ↗  XML Schema als ↗  XML-Format definiert.

Ob es sich bei konkreten Daten um M. handelt und welche Art von M. vorliegen, hängt jeweils vom ↗  Kontext der Anwendung ab. Ãœblich ist eine Unterteilung von M. in beschreibende M., verwaltende oder administrative M. und Strukturdaten. Beschreibende M. geben mittels ↗  Sacherschließung und ↗  Formalerschließung Inhalt und Form des Referenzobjekt wieder. Sie dienen vor allem seiner Auffindbarkeit und Identifizierung. Administrative Metadaten enthalten u.A. Angaben zu Nutzungsbedingungen, ↗  Provenienz und ↗  Archivierung sowie Angaben zur technischen Verarbeitung. Zu M. über das Objekt kommen dabei „Meta-Metadaten“ mit M. über dessen Beschreibung. Angaben über Beziehungen zu anderen Objekten sowie zur Bewertung und Nutzung gehören je nach Anwendung zu beschreibenden oder verwaltenden M. oder bilden eigene M.typen. Strukturdaten beschreiben die Gliederung des Objekts in ↗  Informationelle Einheiten, z.B. mittels ↗  METS und ↗  OAI-ORE. Je nach ↗  Granularität kann diese Beschreibung von einem einfachen ↗  Inhaltsverzeichnis bis zur detaillierten Repräsentation der Binnenstruktur reichen, so dass hier die Grenze zwischen M. und Objektdaten fließend ist. Da vernetze Informationsobjekte (z.B. im ↗  Semantic Web) im Gegensatz zu physischen Objekten keine eindeutigen Grenzen aufweisen, können M. auch als konstituierend für ein digitales Objekt angesehen werden. Dies spielt vor allem bei der ↗  digitalen Langzeitarchivierung eine Rolle, wo M. und Meta-M. über mehrere ↗  Migrationsschritte mitunter einen größeren Umfang als das ursprüngliche Dokument annehmen können.

Eine alternative Unterteilung von M.typen besteht aus konstituierenden M., die den eigentlichen Inhalt eines Dokuments beschreiben, abgeleiteten M., die sich automatisch aus dem Inhalt des Dokuments ermitteln lassen, beigefügten M., die Relationen zu anderen Objekten beinhalten, und operationalen M., die das Verhalten von M. verarbeitenden Systemen steuern (↗  Programmierung).

Über Korrekturen, Ergänzungen, Kritik und vorschläge für ein bis drei Literaturangaben würde ich mich freuen.

P.S.: Bei Mendeley habe ich eine Bibliographie mit Encyclopaedias of Library and Information Science erstellt. Im Terminosaurus Rex gibt es leider keinen Eintrag „Metadaten“.

14 Comments »

RSS feed for comments on this post. TrackBack URI

  1. […] @nichtich: Metadaten: Versuch einer umfassenden Definition in unter 4.000 Zeichen: http://jakoblog.de/?p=954 #metadata #encyclopaedia […]

    Pingback by tweets | 2011-02-26 « viola's blog — 27. Februar 2011 #

  2. Hallo Jakob,

    schön, dass du eine Art offenes Peer Review für deinen Artikel ermöglichst. Auch so könnte sich die deutschsprachige Bibliotheks- und Informationswissenschaft als auf der Höhe der Zeit darstellen, wenn andere Beiträger diesem Beispiel folgen würden…

    Zum Artikel: Mich würde natürlich zunächst der „Daten“-Artikel interessieren, der natürlich für den „Metadaten“-Beitrag grundlegend ist. Die Verweise auf andere Artikel sind – wie du schreibst – sicher wichtig, allerdings könnten es für meinen Geschmack auch etwas weniger sein.

    Den Text finde ich ansonsten gut und verständlich, nur der letzte Abschnitt ist z.T. unklar. Ich kann mir unter „konstituierenden M., die den eigentlichen Inhalt eines Dokuments beschreiben“ nicht viel vorstellen. Was soll das denn bitte sein, der „eigentliche Inhalt eines Dokuments“?

    Comment by Adrian — 28. Februar 2011 #

  3. […] beschäftigt, hört immer öfter den Begriff „Metadaten“. Eine Definition dazu hat sich Jakoblog entworfen und freut sich über Meinungen,  Korrekturen und […]

    Pingback by Gelesen in Biblioblogs (8.KW’11) « Lesewolke's Blog — 28. Februar 2011 #

  4. Hallo Adrian! Ich würde mir auch eine offenere Erstellung der Artikel in einem Wiki wünschen, auch um die Hypertext-Struktur eines Lexikons besser ausnutzen zu können. In gedruckter Form sind sicher weniger Verweise ausreichend, während bei einem Hypertext die Artikel besser aufeinander abgestimmt werden können. Der Artikel „Daten“ stammt von Philipp Mayr (GESIS) und ist in der dritten Lieferung des LBI enthalten, die bereits letztes Jahr herausgekommen ist (geplant sind 12 Lieferungen bis Mitte 2012). Mayr definiert Daten als „kleinste Einheit von Information“ (in der Bibliotheks- und Informationswissenschaft) bzw. als „alle denkbaren Formen von maschinenlesbaren Datenstrukturen“ (in der Informatik, wobei zwischen Daten und Programmen unterschieden werden kann), und weist darauf hin, dass die Verwendung des Begriffs oft unklar ist. Er weist auf die mögliche Einordnung in die Hierarchie ‚data, information, knowledge, wisdom‘ hin, aber auch darauf dass der Begriff theoretisch nicht gut ausgearbeitet ist (soweit meine urheberrechtlich unbedenkliche Zusammenfassung der Zusammenfassung).

    Mit dem „eigentlichen Inhalt eines Dokuments“ meine ich das, was das Dokument ausmacht. Eigentlich reicht der Begriff „Inhalt“, also könnte ich einfach das Wort „eigentlich“ streichen. Etwas ausführlicher meine ich mit diesem Inhalt die konstituierenden Eigenschaften eines Dokuments, ohne die das Dokument ein anderes wäre. Der Titel kann z.B. je nach Dokument zum eigentlichen Inhalt gehören, wenn er vom Autor vergeben wurde, oder erst später als „Titel unter dem das Dokument allgemein bekannt ist“ hinzugefügt worden sein. Ich überlege noch wie sich das in wenigen Wörtern ausdrücken lässt…

    Comment by jakob — 28. Februar 2011 #

  5. Hi Jakob,

    mir gefällt die Definition von Karen Coyle sehr gut (http://www.kcoyle.net/meta_purpose.html):

    „Metadata is…
    …constructed… (Metadata is wholly artificial, created by human beings.)
    … for a purpose … (There is no universal metadata. For metadata to be useful it has to serve a purpose.)
    … to facilitate an activity… (There’s something that you do with metadata.)“

    Comment by Johann — 28. Februar 2011 #

  6. @Johann Danke für den Hinweis. In einer späteren Publikation fasst Coyle ihre Definition als „constructed, constructive & actionable“ zusammen. Ich denke das ließe sich mit „Zweck- und Anwendungsbezogen erstellte Daten“ übersetzen, würde das aber eher als eine zusätzliche Anforderung an Metadaten sehen (und in den Artikel aufnehmen).

    Comment by jakob — 28. Februar 2011 #

  7. Hi Jakob,
    ich denke, es handelt sich um keine zusätzliche Anforderung, sondern um einen integralen Bestandteil der Definition. Die Metadatenmodellierung/-erstellung ist kein Selbstzweck, sondern erfolgt immer für bestimmte Zwecke und Anwendungen, die darauf aufsetzten.

    Comment by Johann — 28. Februar 2011 #

  8. Ich bin mir noch nicht ganz klar, was mich genau an Coyles Definition stört und weshalb ich das sehr allgemeine „Daten über Daten“ oder genauer „Strukturierten Beschreibungen von Dokumenten“ vorziehe. Zunächst einmal umfasst „constructed, constructive & actionable“ alle Daten, darunter auch jedes Computerprogramm. Was bei Coyle fehlt ist die Vorstellung von Metadaten als Daten über etwas (und zwar das Dokument oder die Dokumentarische Bezugseinheit). Ich verstehe ihre Kriterien deshalb als zusätzliche Anforderungen. Die berechtigte Frage ist allerdings, ob diese Anforderung notwendig (integral) für Metadaten sind. Ich schreibe Anfang des vierten Absatz:

    Ob es sich bei konkreten Daten um M. handelt und welche Art von M. vorliegen, hängt jeweils vom Kontext der Anwendung ab.

    Diese Aussage sollte etwas früher kommen und ausgebaut werden. Vielleicht Ende des ersten Absatz:

    Ob es sich bei Daten um M. handelt und welche Art von M. vorliegen, hängt vom Kontext, dem Zweck und der Anwendung der Daten ab.

    So wie ich dich und Coyle verstehe, ist es wichtig festzuhalten, dass Metadaten kein Selbstzweck sind und dass es keine absoluten Metadaten gibt. Sollte ich das noch deutlicher machen oder drückt der eben vorgeschlagene Satz das genügend aus?

    Comment by jakob — 28. Februar 2011 #

  9. Ich würde das stäker hervorheben, da ich gerade dies an Coyles Definition so passend finde und in bisherigen Definitionen vermisst habe. Gruß

    Comment by Johann — 28. Februar 2011 #

  10. Was hier nicht erwähnt wird, das ist die Geschichte von Jack E. Myers und seeiner Erfindung des Begriffs „Metadata“ im Sommer 1969, erstmals gedruckt verwendet in einer Broschüre 1973.
    Es war als ein Kunstwort gedacht und diente ihm zur Beschreibung von Metamodellen im Bereich von den Anfang der 70er Jahre als sehr innovativ geltenden neuen Datenbankstrukturen für die Gesundheitsfürsorge, in dem auch seine Firma „The Metadata Company“ tätig werden sollte.

    Comment by Jörg — 4. März 2011 #

  11. Ich glaube das mit der Metadata Company habe ich bei Greenberg (2005) gelesen, allerdings gibt sie auch keine genauere Quellenangabe für die „Broschüre 1973“ Ich habe mir bisher nur die auf metadata.com verfügbaren Publikationen angeschaut. Soweit ich es verstanden habe, handelt es sich wie du sagst um eine Sprache für Metamodelle („the Metamodel […] can impose the conceptual data structure on the logical data structure“). Dafür müsste aber erstmal erklärt werden, was ein Metamodell ist. Dafür müsste aber erstmal erklärt werden, was ein Datenmodell ist. Für den vorliegenden Artikel geht das viel zu weit, zumal der Begriff „Metadaten“ inzwischen viel allgemeiner verwendet wird und auch vorher schon anders verwendet wurde. Historisch lässt sich das noch genauer auseinander nehmen, dafür muss ich mir erstmal die Original-Artikel von Bagley (1968), Myers (1973?) u.A. besorgen. Danke für den Hinweis!

    Comment by jakob — 8. März 2011 #

  12. […] Artikel “Ontologie” und “Ontologiesprache” gehören neben dem Eintrag “Metadaten” zu den umfangreichsten Artikeln, die ich für das Lexikon der Bibliotheks- und […]

    Pingback by Ontologien und Ontologiesprachen definiert – ganz ohne “Semantik” « Jakoblog — Das Weblog von Jakob Voß — 14. März 2011 #

  13. […] Markup Language (XML). Wie bei den anderen Artikeln (vgl. Ontologie und Ontologiesprache sowie Metadaten) besteht die Kunst darin, sich auf das wesentliche zu Beschränken und sinnvoll mit den bereits […]

    Pingback by Was ist XML? « Jakoblog — Das Weblog von Jakob Voß — 15. April 2012 #

  14. […] Zunächst ist es notwendig die Kernbegriffe Diskurs und Metadaten zu […]

    Pingback by Gibt es Diskurse in Metadaten? « Jakoblog — Das Weblog von Jakob Voß — 9. Juli 2012 #

Sorry, the comment form is closed at this time.