Gibt es Diskurse in Metadaten?

9. Juli 2012 um 00:35 3 Kommentare

Im Libreas Weblog (wahrscheinlich unfreiwillig eines der Instanzen von #newLIS) haben Ben Kaden und Karsten Schuldt eine zwischen ihnen geführte Debatte zu folgender Forschungsfrage zusammengefasst:

Wie viel oder wie wenig Diskurs findet sich in Metadaten beziehungsweise Netzwerken von Metadaten Und was davon kann wie informationswissenschaftlich ausgewertet werden?

Grundsätzlich begrüße ich es sehr wenn die beiden ihre ausführlichen Informations-wissenchaftlichen Beiträge zusammenzufassen. Noch mehr begrüße ich Auseinandersetzungen mit Begriffen von Daten und Metadaten. Ich hoffe, deshalb, dass ihre Forschung nicht nur im Diskurs weiterlebt, sondern sich auch als Ergebnis in einer Beantwortung der Forschungsfrage niederschlägt. In ihrem Blogartikel äußern die beiden Autoren fünf Grundannahmen, von denen ich die ersten vier teile. Die fünfte Grundannahme, dass die „Bibliotheks- und Informationswissenschaft […] vorrangig eine befragende und beschreibende Wissenschaft“ sei, teile ich nicht. Ich befürchte stattdessen, dass die beiden beim Fragen und Beschreiben stehen (bzw. in Bewegung) bleiben. Nach meinem Eindruck ziehen sie es vor, darüber zu diskutieren, „was eine Bibliotheks- und Informationswissenschaft sein soll“ statt die eingangs gestellt Forschungsfrage zielgerichtet zu beantworten.

Mich interessieren jedenfalls Antworten auf die Frage nach Diskursen in Metadaten. Hier nur einige Anregungen:

(1) Zunächst ist es notwendig die Kernbegriffe Diskurs und Metadaten zu definieren.

(2) Interessant am Konzept der Metadaten sind zwei Aspekte: ihre beschreibende Funktion und ihre digitale Struktur.

(3) Hilfreich ist wie so oft der Blick über den Tellerand auf verwandte Phänomene. Aus der Forschungsfrage ergeben sich unter anderem folgende vorläufige Teilfragen:

1. Wie viel oder wie wenig Diskurs findet sich in (reinen) Beschreibungen?

2. Wie viel oder wie wenig Diskurs findet sich (reinen) Strukturen?

Für die Aufgabenstellung eine Master- oder die Ausgangslage einer Doktorarbeit sollte das genügen. Vielleicht lässt sich die Frage zumindest teilweise auch bereits in Form eines Fachartikels beantworten.

Metadaten – Versuch einer Kurzdefiniton

26. Februar 2011 um 17:21 14 Kommentare

Obgleich ich dem Lexikon der Bibliotheks- und Informationswissenschaft (LBI) von Anfang an mit gemischten Gefühlen gegenüber stand – das Vorhaben eines gedruckten Lexikons ist anachronistisch und verspielt eine Chancen, die deutschsprachige Bibliotheks- und Informationswissenschaft als auf der Höhe der Zeit darzustellen – habe ich als Enzyklopädist inzwischen einige Artikel übernommen. Ich muss zugeben, dass die Beschränkungen des LBI auch einen gewissen Reiz haben. Vor allem ist die Länge der Artikel vorgegeben, so dass es darauf ankommt, einen Begriff in seiner Gänze auf das Wesentliche zu reduzieren. Der Begriff „Metadaten“, für den nächste Woche Abgabefrist ist, fällt mit bis zu 4.000 Zeichen in die umfangreichste Kategorie. Ich habe mit der Geschichte des Begriffs begonnen und versucht, das Wesentliche in diesem Umfang zusammenzufassen. Da sich die Bedeutung eines Begriffs erst aus seinen Relationen zu anderen Begriffen ergibt, habe ich auf möglichst viele andere, verwandte Einträgen des LBI verwiesen. Im Laufe der Diskussion vorgenommene Änderungen sind orange markiert.

Bei Google Books Ngram kann man schön den Anstieg der Verwendung des Begriffs nachvollziehen: Der deutlich zu erkennende Knick 1995 ist auf die Dublin Core Initiative zurückzuführen. Nun aber die Definition in ihrer aktuellen Form:

„Daten über Daten“, d.h. ↗  Daten die andere Daten oder Objekte strukturiert beschreiben. Ob und um welche Art von M. es sich bei Daten handelt, hängt vom jeweiligen ↗ Kontext und Zweck der ihrer Anwendung ab.

Bis Ende der 1980er wurden lediglich bei ↗  Datenbanken deren technische Beschreibungsdaten wie ↗  Datenfeld und ↗  Datenmodell im Gegensatz zur ↗  Datenbasis als M. bezeichnet. Später wurden M. auf Beschreibungen von ↗  Primärdaten bei der ↗  Datendokumentation ausgeweitet. Ab Mitte der 1990er prägte das ursprünglich zur ↗  Katalogisierung von ↗  Netzpublikationen entwickelte ↗  Dublin Core Metadata Element Set die Vorstellung von M. Inzwischen können alle strukturierten Beschreibungen von ↗  Informationsobjekten und alle als Daten vorliegenden Formen der ↗  Erschließung als M. bezeichnet werden, also auch alle bibliographischen Daten.

Ein Metadatensatz fasst M., die sich auf ein Referenzobjekt (ein ↗  Dokument oder eine ↗  Dokumentarische Bezugseinheit) beziehen zu einer ↗  Dokumentationseinheit zusammen. Bei Containerformaten wie z.B. ↗  METS kann ein ↗  Datensatz auch M. zu mehreren Objekten enthalten. Die klassische Form eines M.satzes in der Bibliothekspraxis ist das ↗  Katalogisat.

Wesentlich für M. ist das Vorhandensein einer einheitlichen Struktur. Diese kann u.A. als Schema (↗  Kategorienkatalog, ↗  Datendefinitionssprache), Profil, Regelwerk, ↗  Datenformat oder Modell (↗  Ontologiesprache) vorliegen. Die Attribute und Beziehungstypen einer M.struktur sowie die in ihr verwendeten Einträge einer ↗  Indexierungssprache werden auch als Metadatenterme bezeichnet. Die Nutzbarkeit von M. über verschiedenen Systeme (↗  Interoperabilität) wird durch ↗  Standardisierung ermöglicht. Hilfreich sind dabei Metadaten-Registries und die Vergabe von ↗  URIs für M.terme. Zur ↗  Datenkonvertierung zwischen verschiedenen M.strukturen dienen M.mappings („crosswalks“). M.strukturen sind häufig in Beschreibungsebenen verschachtelt und aufeinander bezogen; so ist beispielsweise ↗  MODS durch ein ↗  XML Schema als ↗  XML-Format definiert.

Ob es sich bei konkreten Daten um M. handelt und welche Art von M. vorliegen, hängt jeweils vom ↗  Kontext der Anwendung ab. Ãœblich ist eine Unterteilung von M. in beschreibende M., verwaltende oder administrative M. und Strukturdaten. Beschreibende M. geben mittels ↗  Sacherschließung und ↗  Formalerschließung Inhalt und Form des Referenzobjekt wieder. Sie dienen vor allem seiner Auffindbarkeit und Identifizierung. Administrative Metadaten enthalten u.A. Angaben zu Nutzungsbedingungen, ↗  Provenienz und ↗  Archivierung sowie Angaben zur technischen Verarbeitung. Zu M. über das Objekt kommen dabei „Meta-Metadaten“ mit M. über dessen Beschreibung. Angaben über Beziehungen zu anderen Objekten sowie zur Bewertung und Nutzung gehören je nach Anwendung zu beschreibenden oder verwaltenden M. oder bilden eigene M.typen. Strukturdaten beschreiben die Gliederung des Objekts in ↗  Informationelle Einheiten, z.B. mittels ↗  METS und ↗  OAI-ORE. Je nach ↗  Granularität kann diese Beschreibung von einem einfachen ↗  Inhaltsverzeichnis bis zur detaillierten Repräsentation der Binnenstruktur reichen, so dass hier die Grenze zwischen M. und Objektdaten fließend ist. Da vernetze Informationsobjekte (z.B. im ↗  Semantic Web) im Gegensatz zu physischen Objekten keine eindeutigen Grenzen aufweisen, können M. auch als konstituierend für ein digitales Objekt angesehen werden. Dies spielt vor allem bei der ↗  digitalen Langzeitarchivierung eine Rolle, wo M. und Meta-M. über mehrere ↗  Migrationsschritte mitunter einen größeren Umfang als das ursprüngliche Dokument annehmen können.

Eine alternative Unterteilung von M.typen besteht aus konstituierenden M., die den eigentlichen Inhalt eines Dokuments beschreiben, abgeleiteten M., die sich automatisch aus dem Inhalt des Dokuments ermitteln lassen, beigefügten M., die Relationen zu anderen Objekten beinhalten, und operationalen M., die das Verhalten von M. verarbeitenden Systemen steuern (↗  Programmierung).

Über Korrekturen, Ergänzungen, Kritik und vorschläge für ein bis drei Literaturangaben würde ich mich freuen.

P.S.: Bei Mendeley habe ich eine Bibliographie mit Encyclopaedias of Library and Information Science erstellt. Im Terminosaurus Rex gibt es leider keinen Eintrag „Metadaten“.

Aktuelle Diskussionen zur informationswissenschaftlichen Fachkommunikation

1. September 2010 um 12:42 2 Kommentare

In der deutschsprachigen Biblioblogosphäre wird seit einigen Monaten verstärkt und gut mit Fakten und Argumenten unterlegt die Informationswissenschaftliche Fachkommunikation diskutiert. Ich möchte hier nur auf das neue Blog beyondthejournal.net von Lambert Heller und Heinz Pampel sowie auf den Diskussionsthread Bibliothekarische Fachkommunikation 2010 verweisen. Leider ist der Diskurs bislang sehr von Männern geprägt und wesentliche Stimmen fehlen. Ich denke, dass unter Anderem Wortmeldungen aus der Richtung von LIBREAS und von der Zukunftswerkstatt die Diskussion um weitere Gesichtspunkte bereichern dürften. Es fehlen aber auch Stimmen aus der analogen (gedruckten) Welt. So einfach lässt sich die Frage, wie und wo Fachleute aus Informationseinrichtungen kommunizieren, und was dabei wissenschaftliche Fachkommunikation ist, nämlich nicht beantworten.

In der vorigen (Heft 07-08/2010) und aktuellen Ausgabe (Heft 09/2010) der Fachzeitschrift Password ist ein Artikel erschienen, der sich kritisch mit der Informationswissenschaft und ihrer Publikationspraxis auseinandersetzt. Dazu wird exemplarisch auf die Proceedings des 11. Internationalen Symposions für Informationswissenschaft (ISI2009) eingegangen. Die Vortragsfolien der ISI2009 sind auf der Tagungshomepage unter CC-BY-SA verfügbar, während der Tagungsband nur auszugsweise und verstreut auf verschiedenen Repository-Servern zu finden ist. Dass es das deutschsprachige Bibliotheks- und Informationswesen bis heute weder geschafft hat, seine Publikationen direkt, noch die dazugehörigen Metadaten in geeigneter Weise ins Netz zu bringen, sagt schon einiges über ihren Zustand aus.

Auch der Artikel (bzw. die Artikelserie) „Kritik der Informationswissenschaft. Anmerkungen eines interessierten und besorgten Bürgers mit Common Sense“ des Password-Chefredakteurs Willi Bredemeier (@WilhelmHeinrich bei Twitter) ist nicht bzw. für Abbonnenten bislang nur teilweise online frei verfüg- und verlinkbar. Dies mag ein Grund sein, weshalb er in der Biblioblogosphäre noch nicht rezipiert wurde. Bredemeier verortet die Informationswissenschaft in den Geisteswissenschaften, wo ein additiver Erkenntnisgewinn selten möglich ist. Stattdessen sollte die Informationswissenschaft nach ihrer pragmatischen Relevanz bewertet werden. Angesicht der sich momentan technisch und gesellschaftlich vollziehenden Wandels wäre eine Relevanz der Informationswissenschaft eigentlich gegeben. Leider wird die (bzw. zumindest die deutschsprachige?) Informationswissenschaft ihrem eigenen Anspruch jedoch nicht gerecht: sie bringt – wie Bredemeier kritisiert – vor allem irrelevante und triviale Ergebnisse hervor, zerschnipselt Themen zu Mini-Fragestellungen, beschränkt wissenschaftliche Veröffentlichungen auf einzelne Forschungsphasen, produziert wissenschaftliche Beiträge als Nebenprodukt teilweise interessengeleiteter anderer Aktivitäten und besitzt keinen funktionierenden Peer-Review-Prozess.

Wer über seine Einrichtung die Password abbonniert hat sollte sich die Artikel durchlesen. Vielleicht kann sich Herr Bredemeier ja dazu durchringen seine Beitrag zur Diskussion um die informationswissenschaftliche Fachkommunikation auch online frei verfügbar und dauerhaft verlinkbar zu machen – am besten auf einem Dokumentenserver. Sein ebenfalls empfehlenswerter Artikel Zur mangelnden Funktionsfähigkeit von Fachinformations- und Fachzeitschriftenmärkten ist auf seiner Homepage einsehbar und bietet eine gute Ergänzung zu Lambert Hellers Blogartikel „Status Quo: Fachblogs — „Amateure“ erschließen das Web als Informationsraum„.

Das Internationales Symposium für Informationswissenschaft 2011 finden übrigens vom 9. bis 11. März 2011 in Hildesheim statt, der Call for Papers läuft noch bis zum 25. Oktober. Hoffentlicht nimmt das Programmkommitee Bredemeiers Kritik am Programm der vorigen Tagung zumindest zur Kenntnis.