IT statt Informationskompetenz statt Bibliothekare?

21. April 2011 um 11:24 1 Kommentar

In der englischsprachigen Biblioblogosphäre wird gerade ein kontroverser Vortrag von Jeffrey Trzeciak, dem Bibliotheksdirektor der McMaster University, Penn State, diskutiert. Angeblich möchte er alle Bibliothekare abschaffen, worauf diese natürlich lautstark protestieren. Laika (Jacqueline) hat einige Aspekte des Vortrags und der Diskussion zusammengefasst (via @tillk) und versucht etwa Sachlichkeit in die Diskussion zu bringen. Wie in vielen Kontroversen geht es nämlich leider weniger um das Abwägen von Argumenten als darum, die eigene Meinung zu bestätigen. Eine ähnliche Diskussion könnte ich mir auch in der deutschsprachigen Bibliothekswelt vorstellen: die Kontroverse bestätigt leider einen typischen Konflikt (zu dem ich zugegeben nicht immer unschuldig bin): Auf der einen Seite überheblichen IT-affine, die alles besser wissen, und auf der anderen Seite Bibliothekaren mit Minderwertigkeitskomplex, die lieber nichts neues ausprobieren. Zum Glück bilden diese beiden Extreme nur einen Teil der Bibliothekswelt ab.

In der deutschsprachigen Biblioblogosphäre haben in ihren Weblogs Anne Christensen und Dörte Böhner die Kontroverse konstruktiv aufgenommen und diskutieren den Aspekt der Informationskompetenz, die Trzeciak scheinbar gleich mit entsorgen möchte. Anne hatte schon früher auf die Problematik des Begriffs Informationskompetenz hingewiesen, aber grundsätzlich halten beide Autoren nichts davon, Veranstaltungen zur Informationskompetenz völlig abzuschaffen. Allerdings kommt es eben auf die Umsetzung an. Wie Dörte treffend schreibt:

Ein einmal eingeworfenes “Man könnte auch mit einem anderen Begriff suchen oder das und das machen…” bewirkt häufig mehr als zwei Stunden IK-Schulung, selbst nach neusten Methoden.

Was für das Verhältnis zwischen Bibliothekaren und Nutzern bezüglich Informationskompetenz gilt, gilt ebenso für das Verhältnis zwischen IT-affinen und IT-zurückhaltenden Bibliothekaren (wobei „IT“ nicht ganz der treffende Begriff ist, es geht auch um eine allgemeine Kultur des Ausprobierens). Die eine Seite ist nicht dumm oder faul, sondern beide Seiten haben habe es sich jeweils in ihrer Haltung bequem gemacht. Vielleicht hilft dagegen etwas, einfach mehr miteinander zu reden?

Mapping bibliographic record subfields to JSON

13. April 2011 um 16:26 4 Kommentare

The current issue of Code4Lib journal contains an article about mapping a bibliographic record format to JSON by Luciano Ramalho. Luciano describes two approaches to express the CDS/ISIS format in a JSON structure to be used in CoudDB. The article already provoked some comments – that’s how an online journal should work!

The commentators mentioned Ross Singer’s proposal to serialize MARC in JSON and Bill Dueber’s MARC-HASH. There is also a MARC-JSON draft from Andrew Houghton, OCLC. The ISIS format reminded me at PICA format which is also based on fields and subfields. As noted by Luciano, you must preserves subfield ordering and allow for repeated subfields. The existing proposals use the following methods for subfields:

Luciano’s ISIS/JSON:

[ ["x","foo"],["a","bar"],["x","doz"] ]

Ross’s MARC/JSON:

"subfields": [ {"x":"foo"},{"a":"bar"},{"x":"doz"} ]

Bill’s MARC-HASH:

[ ["x","foo"],["a","bar"],["x","doz"] ]

Andrew’s MARC/JSON:

"subfield": [
  {"code":"x","data":"foo"},{"code":"a","data":"bar"},
  {"code":"x","data":"doz"} ]

In the end the specific encoding does not matter that much. Selecting the best form depends on what kind of actions and access are typical for your use case. However, I could not hesitate to throw my encoding used in luapica into the ring:

{ "foo", "bar", "doz", 
  ["codes"] = { 
    ["x"] = {1,3}
    ["a"] = {2}
}}

I think about further simplifying this to:

{ "foo", "bar", "doz", ["x"] = {1,3}, ["a"] = {2} }

If f is a field than you can access subfield values by position (f[1], f[2], f[3]) or by subfield code f[f.x[1]],f[f.a[1]],f[f.x[2]]. By overloading the table access method, and with additional functions, you can directly write f.x for f[f.x[1]] to get the first subfield value with code x and f:all("x") to get a list of all subfield values with that code. The same structure in JSON would be one of:

{ "values":["foo", "bar", "doz"], "x":[1,3], "a":[2] }
{ "values":["foo", "bar", "doz"], "codes":{"x":[1,3], "a":[2]} }

I think a good, compact mapping to JSON that includes an index could be:

[ ["x", "a", "x"], {"x":[1,3], "a":[2] },
  ["foo", "bar", "doz"], {"foo":[1], "bar":[2], "doz":[3] } ]

And, of course, the most compact form is:

["x","foo","a","bar","x","doz"]

Proposed changes in VIAF RDF

13. April 2011 um 13:42 2 Kommentare

The Virtual International Authority File (VIAF) is one of the distinguished showcases of international library community projects. Since more then five years, name authority files from different countries are mapped in VIAF. With VIAF you can look up records about authors and other people, and see which identifiers are used for the same person in different national library catalogs. For some people there are also links to bibliographic articles in Wikipedia (I think only English Wikipedia, but you can get some mappings to other Wikipedias via MediaWiki API), and I hope that there will be links to LibraryThing author pages, too.

However, for two reasons VIAF is not used as much as it could be: first not enough easy-to-understand documentation, examples, and simple APIs; and second difficulties to adopt technologies by potential users. Unfortunately the second reason is the larger barrier: many libraries cannot even provide a simple way to directly link to publications from and/or about a specific person, once you got the right person identifier from VIAF. If you cannot even provide such a fundamental method to link to your database, how should you be able to integrate VIAF for better retrieval? VIAF can do little about this lack of technical skills in libraries, it can only help integrating VIAF services in library software to some degree. This brings me to the other reason: you can always further improve documentation, examples, the design of you APIs, etc. to simplify use of your services. As a developer I found VIAF well documented and not very difficult to use, but there are many small things that could be made better. This is natural and a good thing, if you communicate with your users and adopt suggested changes, as VIAF does.

For instance yesterday Jeffrey A. Young, one of the developers behind VIAF at OCLC published a blog article about proposed changes to the RDF encoding of VIAF. I hope that other people will join the discussion so we can make VIAF more usable. There is also a discussion about the changes at the library linked data mailing list. And earlier this month, at the Code4Lib mailing list, there was a a controversial thread about the problems to map authority records that are not about people (see my statement here).

I appreciate the simplification of VIAF RDF and only disagree in some details. The current proposal is illustrated in this picture (copied from Jeffrey’s original article):

This looks straightforward, doesn’t it? But it only suits for simple one-to-one mappings. Any attempt to put more complex mappings into this scheme (as well as the existing VIAF RDF scheme) will result in a disaster. There is nothing wrong with simple one-to-one mappings, with SKOS you can even express different kinds of mappings (broader, narrower, exact, close), but you should not expect too much preciseness and detail. I wonder why at one side of the diagram links are expressed via foaf:focus and at the other side via owl:sameAs. In my opinion, as VIAF is about mapping authority files, all mapping links should use SKOS mapping properties. There is nothing wrong in declaring an URI like http://viaf.org/viaf/39377930/ to stand for both a foaf:Person, a rdaEnt:Person, and a skos:Concept. And the Webpage that gives you information about the person can also get the same URI (see this article for a good defense of the HTTP-303 mess). Sure Semantic Web purists, which still dream of hard artificial intelligence, will disagree. But in the end RDF data is alway about something instead of the thing itself. For practical use it would help much more to think about how to map complex concepts at the level of concept schemes (authority records, classifications, thesauri etc.) instead of trying to find a „right“ model reality. As soon as we use language (and data is a specific kind of language), all we have is concepts. In terms of RDF: using owl:Thing instead of skos:Concept in most cases is an illusion of control.

Was ist ein Publikationstyp?

7. April 2011 um 20:29 7 Kommentare

Im Rahmen der Weiterentwicklung von DAIA kam wiederholt der Wunsch auf, Exemplare als Netzpublikation zu kennzeichnen, so dass klar ist, dass man direkt über einen Link auf den Titel kommt. Uwe Reh wies in der Diskussion darauf hin, dass nach dem neuen Katalogisierungsstandard RDA eine „Manifestation“ (das entspricht etwa einer bestimmten Auflage oder Version einer Publikation) eine eindeutige Materialart haben muss (hier eine RDA-Ãœbersicht zur Manifestation [PDF]). Aber ist die Materialart das Gleiche wie ein Publikationstyp?

Das Konzept des Publikationstyps hat mich schon öfter etwas genervt wenn ich von irgend einer Anwendung oder einem Datenformat gezwungen wurde, für eine Publikation einen „Typ“ auszuwählen. In BibTeX gibt es beispielsweise 14 verschiedene Typen von „article“ über „proceedings“ bis „misc“. Daneben gibt es zahlreiche andere Listen von Typen. Also was ist das eigentlich, ein Publikationstyp?

In Wikipedia gibt es dazu bislang keinen Artikel, nur verschiedene Artikel zu einzelnen Literaturgattungen, Formen von wissenschaftlichen Arbeiten, oder allgemein Formen von Publikationen. Ãœber DBPedia ließen sich diese Listen auch zur Angabe von Publikationstypen verwenden. Das Glossar Informationskompetenz definiert Publikationstyp als „Form einer schriftlichen Veröffentlichung, von Zweck, Umfang und Inhalt bestimmt. In Katalogen und Datenbanken ist der Publikationstyp meist ein mögliches Suchkriterium, mit dem die Treffermenge bei einer Literatursuche formal eingeschränkt werden kann.“ Der Eintrag im Lexikon der Bibliotheks und Informationswissenschaft (LBI) erscheint gerade erst mit Band 9. Konrad Umlauf definiert Publikationstyp dort als “ Klasse von Publikationen mit mindestens einem gleichen Merkmal“ und weist angesichts überschneidender Begriffe wie „Dokumenttyp“, „Materialart“, „Editionsform“ und „Medientyp“ darauf hin, dass es „keinen einheitlichen Begriff von Publikationstyp“ gibt.

Wenn es jedoch keine einheitliche Definition von Publikationstyp gibt, ist der Zwang, dass eine Publikation genau einen Typ haben muss, um so unsinniger. Warum kann eine Publikation zum Beispiel nicht gleichzeitig Buch, Onlinepublikation und Dissertation sein? Oder gleichzeitig Mikroform, Onlinepublikation und Klaviernoten (die Links gehen auf die Klassifikationen von Publikationen aus RDA)? Sicher schließen sich einige der Typen aus, aber eben nicht alle. Sinnvoller wäre da eine Facettenklassifikation von Publikationstypen. Darauf werden sich die verschiedenen Anwender jedoch wahrscheinlich nie einigen werden. Stattdessen gibt es zahlreiche unabhängige Klassifikationen:

Und viele,viele weitere…

Vielleicht sollten wir einfach aufhören von Publikationstypen zu reden und uns stattdessen auf charakteristische Eigenschaften (Höhe, Breite, Umfang, Zielpublikum etc.) beschränken?

Führt das Ende der Alleinverdiener-Ehe zu mehr Ungleichheit?

3. April 2011 um 22:11 Keine Kommentare

Die wöchentliche Blogschau der Mädchenmannschaft verweist auf einen Artikel von Antje Schrupp. Sie berichtet darüber, dass das Ende der Alleinverdiener-Ehe zu mehr materieller Ungleichheit führt. Als Beleg führt Dr. Schrupp Nancy Fraser und einen Artikel von Spiegel Online an. SPON berichtet von einer Studie des Instituts der deutschen Wirtschaft (IW), welche inzwischen auch hier als PDF vorliegt. Demnach ist das „traditionelle Familienbild, in dem der Mann alleine für das Einkommen sorgt, […] ein Auslaufmodell“ und „immer häufiger gesellen sich Geringverdiener und Gutverdiener mit Partnern, die ähnliche Einkommen haben“ (Zitat SPON).

Soweit, so unüberraschend. Sowohl SPON als auch Schrupp machen allerdings in der Kombination der genannten Trends eine Ursache dafür aus, dass die „Kluft zwischen Arm und Reich“ zunimmt: Während es früher mehr Haushalte gab, bei denen ein Vielverdiener und ein Wenig- oder Garnichtverdiener (letzter in der Regel weiblich) zusammenkamen, gibt es heute mehr Paare bei denen beide viel oder beide wenig verdienen. Abgesehen von der monokausalen Darstellung bei SPON kann ich zumindest das Phänomen nachvollziehen: Unter dem Strich gibt es mehr ärmere Haushalte und mehr reichere Haushalte als noch zu Zeiten der Alleinverdiener-Ehe, was sich in der Studie an einem Anstiegt des Gini-Koeffizienten ablesen lässt.

Ãœberraschend finde ich allerdings, dass Antje diesen Sachverhalt aufgreift und hofft, das die Studie „hoffentlich zu weiterführenden Diskussionen [führt]“. Mittlerweile gibt es in ihrem Blog auch schon über 50 Kommentare mit Verweisen auf ähnliche Studien. Bisher hat aber niemand in der Diskussion die Begriffe „Hauptwiderspruch“ und „Nebenwiderspruch“ angeführt. Das Konzept von Haupt- und Nebenwiderspruch stammt aus der Marxistischen Theorie (hier die wissenschaftlich verschwurbelte Kurzdarstellung). Soweit ich es verstanden habe, war die Idee von Haupt- und Nebenwiderspruch lange ein Totschlagargument der Linken, um Themen wie die Gleichberechtigung der Frau als nebensächlich im Vergleich zum Grundproblem Kapitalismus abzutun. Wenn nur der Kapitalismus bzw. die Ungerechtigkeit von Produktions- und Eigentumsverhältnissen abgeschafft wäre, würden sich Ungerechtigkeiten in anderen Verhältnisse ganz einfach auflösen. Irgendwann wurde das den Frauen zu blöd (bzw. einigen schon von Anfang an, wie Dr. Schrupp anhand von vier Beispielen im Rahmen ihrer Promotion zeigt). Spätestens mit dem bemerkenswerten Tomatenwurf 1968 spaltete sich die (west)deutschen Frauenbewegung von der damaligen APO ab. Aber auch innerhalb der Frauenbewegung gab und gibt es immer wieder Spaltungen, was ja garnicht so schlimm sein muss.

Schlimm finde ich nur, wenn Ungerechtigkeiten gegeneinander ausgespielt werden oder wenn ein Problem zum Haupt- und ein anderes zum daraus ergebenen Nebenwiderspruch erklärt werden. Es kann zwar vorkommen, dass die Abschaffung der einen Ungerechtigkeit (hier: Modell Alleinverdiener) zu einer Verstärkung der anderen Ungerechtigkeit (hier: Einkommensschere) führt. Daraus eine Wertigkeit oder eine Kausalität abzuleiten ist jedoch falsch. Eine Verstärkung ist keine Ursache. Deshalb ist das Ende der Alleinverdiener-Ehe für die ungerechte Verteilung der Einkommen auch völlig egal. Entweder man packt das Übel bei der Wurzel, das hieße zum Beispiel Einkommen und Kapitalismus abschaffen, oder man versucht die Wirkungen zu lindern, zum Beispiel durch Steuern auf Einkommen. Die Verbindung zwischen feministischen Errungenschaften und einem Anstieg der Armut ist jedoch eine Verschleierung eigentlicher Ursachen, selbst wenn das nicht Antje Schrupps Absicht ist.