Befremdliches, Allzumenschenverachtendes: Ein Katalogisat für feige Geister

24. September 2010 um 16:57 1 Kommentar

Axel Schaper hat in netbib über die Verwendung des SWD-Schlagwort Überfremdung zur Beschreibung von Sarrazins Buch geschrieben, für das ja in Spiegel, Bild & Co eifrig Werbung gemacht wurde. Anscheinend hat sich da jemand bei der Katalogisierung nichts bei der Übernahme von rechtem Vokabular gedacht, und das Unwort des Jahres 1993 als offizielles Sach-Schlagwort eingeführt.

Dass Medien und Politiker dabei helfen, bislang geächtete, menschenverachtende Rhetorik zu verbreiten, ist ja schon schlimm genug – aber Bibliotheken?! Ich hoffe, dieser peinliche Fehler wird wieder rückgängig gemacht. Stattdessen könnten Bibliotheken viel besser zur Versachlichung und Aufklärung beitragen, indem sie Bücher zu Integration und Fremdenfeindlichkeit aktiv herausstellen. Bibliotheken könnten sich zudem zu Recht als zu einer guten Integration Beitragende bekannter machen. Warum sind Bibliotheken so ängstlich?

Zugegeben: Katalogisierung ist subjektiv und nicht einfach. Aber Begriffe wie „Neger“ sind als Schlagwort zur inhaltlichen Erschließung von Büchern zu Recht auch nicht mehr gebräuchlich. In den USA gibt es eine ausgeprägtere Kultur des kritischen Katalogisierens, siehe zum Beispiel Radical Cataloging und Sorting things out.

Hier einige Alternativvorschläge aus der SWD: Rechtspopulismus, Soziale Ächtung, Ausländerfeindlichkeit, Islamophobie. Und weil es so schön und entlarvend ist, noch etwas von Karl Valentin und Liesl Karlstadt.

Valentin
Fremd ist der Fremde nur in der Fremde.
Karlstadt:
Das ist nicht unrichtig. – Und warum fühlt sich ein Fremder nur in der Fremde fremd?
Valentin:
Weil jeder Fremde, der sich fremd fühlt, ein Fremder ist und zwar so lange, bis er sich nicht mehr fremd fühlt, dann ist er kein Fremder mehr.
Karlstadt:
Sehr richtig! – Wenn aber ein Fremder schon lange in der Fremde ist, bleibt er dann immer ein Fremder?
Valentin:
Nein. Das ist nur so lange ein Fremder, bis er alles kennt und gesehen hat, denn dann ist ihm nichts mehr fremd.
Karlstadt:
Es kann aber auch einem Einheimischen etwas fremd sein!

P.S: Den Hinweis auf Axels Beitrag habe ich von Christian und von Lambert.

Is data a language? In search of the new discipline Data Linguistics

13. September 2010 um 01:24 33 Kommentare

Yesterday Jindřich asked me for a reason to treat data as a language. I really appreciate this little conversations in data philosophy, but after a while 140 characters get too limited. Half a year ago a similar discussion with Adrian became a small series of blog articles (in German). I doubt that you can find a simple and final answer to fundamental questions about data and meaning, because these questions touch the human condition. This is also the reason why we should never stop asking unless we give up being human beings.

JindÅ™ich’s question first made me wonder because for me data obviously is a language. All data is represented as sequence of bits, which can easily be defined as formal language. But this argument is stupid and wrong. Although language can be described by formal languages (as introduced by Noam Chomsky), this description only covers synax and grammar. Above all, a description of language must not be confound with language itself: the map is not the territory.

But data is used to communicate just like natural (written) language. The vast amount and heterogenity of data sometimes makes us forget that all data is created by humans for humans. Let me start with a simple argument against the view of data as language. A lot of data is created by measuring nature. As nature is not language, measured data is not language. This argument is also wrong. We (humans) design measuring devices and define their language (sic!) in terms of units like length, duration, blood pressure, and so forth. These units do not exist independent from language, but only communicated via it. And most units describe much more complex and fuzzy concepts like „name“, and „money“, which only exist as social construct. A piece of data is a statement that can be false, true, nonsense, or all of it, depending on context. Just like language.

Nowadays we create a lot of data for machines. Is this an argument against nature as language? I don’t think so. We may say that a piece of data made a machine to perform some task, but the machine was designed to act in a specific way. Machines do not „understand“ data, they just react. If I use an axe to cut a tree, I do not send the tree a message of data that it interprets to cut itself. Of course computers are much more complex then trees (and much simpler from another point of view). The chain of reaction is much more subtle. And most times there are more participants. If I create some data for a specific program, I do not communicate with the program itself, but with everyone involved in creating the program and its environment. This may sound strange but compare the situation with legal systems: a law is a piece of language, used to communicate to other people: „don’t step on the grass“. Unforunately society makes us think that laws are static and independent from us. In the same way people think that data is shaped by computers instead of people. Next time you get angry about a program, think about the vendor and programmer. Next time you get angry about a law, think about the lawmakers.

What follows from treating data as language? I think we need a new approach to data, a dedicated study of data. I would call this discipline data linguistics. Linguistics has many sub-fields concerned with particular aspects of natural language. The traditional division in syntax, semantics, and pragmatics only describes one direction to look at language. Anthropological linguistics and sociolinguistics study the relation between language and society, and historical linguistics studies the history and evolution of languages, only to mention a few disciplines. Suprisingly, the study of data is much more limited — up to now there is no data linguistics that studies data as language. The study of data is mainly focused on its form, for instance on the study of formal languages in computer science, the study of digital media in cultural studies and media studies, or the study of forms and questionnaire in graphic design and public administration (forms could be a good starting point for data linguistics).

There are some other fields that combine data and linguistics but from different viewpoints: computational linguistics studies natural language by computational means, similar to digital humanities in general. In one branch of data analysis, linguistic summaries of data are created based on fuzzy set theory. They provide natural language statements, that capture the main characteristics of data sets. Natural language processing analyses textual data by algorithmic methods. But data linguistics that analyses data in general is still waiting to be discovered. We can only conjecture possible reasons for this lack of research:

  • Data is not seen as language.
  • Digital data is a relatively new phenomenon. The creation of data on a large scale mainly began in the 20th century, so there is not enough time to historically explore the topic.
  • In contrast to natural language, data is too heterogenious to justify a combined look at data in general.
  • data seems to be well-defined, so no research is needed.

What do you think?

Aktuelle Diskussionen zur informationswissenschaftlichen Fachkommunikation

1. September 2010 um 12:42 2 Kommentare

In der deutschsprachigen Biblioblogosphäre wird seit einigen Monaten verstärkt und gut mit Fakten und Argumenten unterlegt die Informationswissenschaftliche Fachkommunikation diskutiert. Ich möchte hier nur auf das neue Blog beyondthejournal.net von Lambert Heller und Heinz Pampel sowie auf den Diskussionsthread Bibliothekarische Fachkommunikation 2010 verweisen. Leider ist der Diskurs bislang sehr von Männern geprägt und wesentliche Stimmen fehlen. Ich denke, dass unter Anderem Wortmeldungen aus der Richtung von LIBREAS und von der Zukunftswerkstatt die Diskussion um weitere Gesichtspunkte bereichern dürften. Es fehlen aber auch Stimmen aus der analogen (gedruckten) Welt. So einfach lässt sich die Frage, wie und wo Fachleute aus Informationseinrichtungen kommunizieren, und was dabei wissenschaftliche Fachkommunikation ist, nämlich nicht beantworten.

In der vorigen (Heft 07-08/2010) und aktuellen Ausgabe (Heft 09/2010) der Fachzeitschrift Password ist ein Artikel erschienen, der sich kritisch mit der Informationswissenschaft und ihrer Publikationspraxis auseinandersetzt. Dazu wird exemplarisch auf die Proceedings des 11. Internationalen Symposions für Informationswissenschaft (ISI2009) eingegangen. Die Vortragsfolien der ISI2009 sind auf der Tagungshomepage unter CC-BY-SA verfügbar, während der Tagungsband nur auszugsweise und verstreut auf verschiedenen Repository-Servern zu finden ist. Dass es das deutschsprachige Bibliotheks- und Informationswesen bis heute weder geschafft hat, seine Publikationen direkt, noch die dazugehörigen Metadaten in geeigneter Weise ins Netz zu bringen, sagt schon einiges über ihren Zustand aus.

Auch der Artikel (bzw. die Artikelserie) „Kritik der Informationswissenschaft. Anmerkungen eines interessierten und besorgten Bürgers mit Common Sense“ des Password-Chefredakteurs Willi Bredemeier (@WilhelmHeinrich bei Twitter) ist nicht bzw. für Abbonnenten bislang nur teilweise online frei verfüg- und verlinkbar. Dies mag ein Grund sein, weshalb er in der Biblioblogosphäre noch nicht rezipiert wurde. Bredemeier verortet die Informationswissenschaft in den Geisteswissenschaften, wo ein additiver Erkenntnisgewinn selten möglich ist. Stattdessen sollte die Informationswissenschaft nach ihrer pragmatischen Relevanz bewertet werden. Angesicht der sich momentan technisch und gesellschaftlich vollziehenden Wandels wäre eine Relevanz der Informationswissenschaft eigentlich gegeben. Leider wird die (bzw. zumindest die deutschsprachige?) Informationswissenschaft ihrem eigenen Anspruch jedoch nicht gerecht: sie bringt – wie Bredemeier kritisiert – vor allem irrelevante und triviale Ergebnisse hervor, zerschnipselt Themen zu Mini-Fragestellungen, beschränkt wissenschaftliche Veröffentlichungen auf einzelne Forschungsphasen, produziert wissenschaftliche Beiträge als Nebenprodukt teilweise interessengeleiteter anderer Aktivitäten und besitzt keinen funktionierenden Peer-Review-Prozess.

Wer über seine Einrichtung die Password abbonniert hat sollte sich die Artikel durchlesen. Vielleicht kann sich Herr Bredemeier ja dazu durchringen seine Beitrag zur Diskussion um die informationswissenschaftliche Fachkommunikation auch online frei verfügbar und dauerhaft verlinkbar zu machen – am besten auf einem Dokumentenserver. Sein ebenfalls empfehlenswerter Artikel Zur mangelnden Funktionsfähigkeit von Fachinformations- und Fachzeitschriftenmärkten ist auf seiner Homepage einsehbar und bietet eine gute Ergänzung zu Lambert Hellers Blogartikel „Status Quo: Fachblogs — „Amateure“ erschließen das Web als Informationsraum„.

Das Internationales Symposium für Informationswissenschaft 2011 finden übrigens vom 9. bis 11. März 2011 in Hildesheim statt, der Call for Papers läuft noch bis zum 25. Oktober. Hoffentlicht nimmt das Programmkommitee Bredemeiers Kritik am Programm der vorigen Tagung zumindest zur Kenntnis.