<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Jakoblog</title>
	<atom:link href="http://jakoblog.de/feed/" rel="self" type="application/rss+xml" />
	<link>http://jakoblog.de</link>
	<description>Das Weblog von Jakob Voß</description>
	<lastBuildDate>Wed, 01 Sep 2010 15:45:51 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Aktuelle Diskussionen zur informationswissenschaftlichen Fachkommunikation</title>
		<link>http://jakoblog.de/2010/09/01/aktuelle-diskussionen-zur-informationswissenschaftlichen-fachkommunikation/</link>
		<comments>http://jakoblog.de/2010/09/01/aktuelle-diskussionen-zur-informationswissenschaftlichen-fachkommunikation/#comments</comments>
		<pubDate>Wed, 01 Sep 2010 10:42:30 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[bid]]></category>
		<category><![CDATA[informationswissenschaft]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=851</guid>
		<description><![CDATA[In der deutschsprachigen Biblioblogosphäre wird seit einigen Monaten verstärkt und gut mit Fakten und Argumenten unterlegt die Informationswissenschaftliche Fachkommunikation diskutiert. Ich möchte hier nur auf das neue Blog beyondthejournal.net von Lambert Heller und Heinz Pampel sowie auf den Diskussionsthread Bibliothekarische Fachkommunikation 2010 verweisen. Leider ist der Diskurs bislang sehr von Männern geprägt und wesentliche Stimmen [...]]]></description>
			<content:encoded><![CDATA[<p>In der deutschsprachigen Biblioblogosphäre wird seit einigen Monaten verstärkt und gut mit Fakten und Argumenten unterlegt die Informationswissenschaftliche Fachkommunikation diskutiert. Ich möchte hier nur auf das neue Blog <a href="http://beyondthejournal.net/">beyondthejournal.net</a> von Lambert Heller und Heinz Pampel sowie auf den Diskussionsthread <a href="http://infobib.de/blog/2010/05/11/bibliothekarische-fachkommunikation-2010/">Bibliothekarische Fachkommunikation 2010</a> verweisen. Leider ist der Diskurs bislang sehr von Männern geprägt und wesentliche Stimmen fehlen. Ich denke, dass unter Anderem Wortmeldungen aus der Richtung von <a href="http://libreas.eu/">LIBREAS</a> und von der <a href="http://zukunftswerkstatt.wordpress.com/">Zukunftswerkstatt</a> die Diskussion um weitere Gesichtspunkte bereichern dürften. Es fehlen aber auch Stimmen aus der analogen (gedruckten) Welt. So einfach lässt sich die Frage, wie und wo Fachleute aus Informationseinrichtungen kommunizieren, und was dabei wissenschaftliche Fachkommunikation ist, nämlich nicht beantworten.</p>
<p>In der vorigen (Heft 07-08/2010) und aktuellen Ausgabe (Heft 09/2010) der Fachzeitschrift <a href="http://www.password-online.de/">Password</a> ist ein Artikel erschienen, der sich kritisch mit der Informationswissenschaft und ihrer Publikationspraxis auseinandersetzt. Dazu wird exemplarisch auf die Proceedings des 11. Internationalen Symposions für Informationswissenschaft (ISI2009) eingegangen. Die Vortragsfolien der ISI2009 <a href="http://www.isi2009.de/programm.html">sind auf der Tagungshomepage</a> unter CC-BY-SA verfügbar, während <a href="http://www.vwh-verlag.de/vwh/?p=336">der Tagungsband</a> nur auszugsweise und verstreut auf verschiedenen Repository-Servern zu finden ist. Dass es das deutschsprachige Bibliotheks- und Informationswesen bis heute weder geschafft hat, seine Publikationen direkt, noch <a href="http://dabi.ib.hu-berlin.de/">die dazugehörigen Metadaten</a> in geeigneter Weise ins Netz zu bringen, sagt schon einiges über ihren Zustand aus. </p>
<p>Auch der Artikel (bzw. die Artikelserie) <i>&#8220;Kritik der Informationswissenschaft. Anmerkungen eines interessierten und besorgten Bürgers mit Common Sense&#8221;</i> des Password-Chefredakteurs <a href="http://www.password-online.de/autoren/chefredakteur.html">Willi Bredemeier</a> (<a href="http://twitter.com/WilhelmHeinrich">@WilhelmHeinrich bei Twitter</a>) ist nicht bzw. <a href="http://www.password-online.de/go/geniosdb.html">für Abbonnenten bislang nur teilweise</a> online frei verfüg- und verlinkbar. Dies mag ein Grund sein, weshalb er in der Biblioblogosphäre noch nicht rezipiert wurde. Bredemeier verortet die Informationswissenschaft in den Geisteswissenschaften, wo ein additiver Erkenntnisgewinn selten möglich ist. Stattdessen sollte die Informationswissenschaft nach ihrer pragmatischen Relevanz bewertet werden. Angesicht der sich momentan technisch und gesellschaftlich vollziehenden Wandels wäre eine Relevanz der Informationswissenschaft eigentlich gegeben. Leider wird die (bzw. zumindest die deutschsprachige?) Informationswissenschaft ihrem eigenen Anspruch jedoch nicht gerecht: sie bringt &#8211; wie Bredemeier kritisiert &#8211; vor allem irrelevante und triviale Ergebnisse hervor, zerschnipselt Themen zu Mini-Fragestellungen, beschränkt wissenschaftliche Veröffentlichungen auf einzelne Forschungsphasen, produziert wissenschaftliche Beiträge als Nebenprodukt teilweise interessengeleiteter anderer Aktivitäten und besitzt keinen funktionierenden Peer-Review-Prozess.</p>
<p>Wer über seine Einrichtung <a href="http://dispatch.opac.d-nb.de/DB=1.1/CMD?ACT=SRCHA&#038;IKT=8&#038;SRT=LST_ty&#038;TRM=0930-3693">die Password abbonniert hat</a> sollte sich die Artikel durchlesen. Vielleicht kann sich Herr Bredemeier ja dazu durchringen seine Beitrag zur Diskussion um die informationswissenschaftliche Fachkommunikation auch online frei verfügbar und dauerhaft verlinkbar zu machen &#8211; am besten auf einem Dokumentenserver. Sein ebenfalls empfehlenswerter Artikel <a href="http://www.schreiber-und-schreiberlinge.de/epaper/mangelnde-funktionsfaehigkeit-von-fachzeitschriftenmaerkten.html">Zur mangelnden Funktionsfähigkeit von Fachinformations- und Fachzeitschriftenmärkten</a> ist auf seiner Homepage einsehbar und bietet eine gute Ergänzung zu Lambert Hellers Blogartikel &#8220;<a href="http://beyondthejournal.net/2010/08/23/fachblogs/">Status Quo: Fachblogs — „Amateure“ erschließen das Web als Informationsraum</a>&#8220;.</p>
<p>Das <a href="http://www.isi2011.de/">Internationales Symposium für Informationswissenschaft 2011</a> finden übrigens vom 9. bis 11. März 2011 in Hildesheim statt, der <a href="http://www.isi2011.de/?page_id=297">Call for Papers</a> läuft noch bis zum 25. Oktober. Hoffentlicht nimmt das Programmkommitee Bredemeiers Kritik am Programm der vorigen Tagung zumindest zur Kenntnis.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/09/01/aktuelle-diskussionen-zur-informationswissenschaftlichen-fachkommunikation/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Das Brennglas des Martin Schrettinger</title>
		<link>http://jakoblog.de/2010/08/23/das-brennglas-des-martin-schrettinger/</link>
		<comments>http://jakoblog.de/2010/08/23/das-brennglas-des-martin-schrettinger/#comments</comments>
		<pubDate>Mon, 23 Aug 2010 18:08:40 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Bibliothek]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Katalog]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=846</guid>
		<description><![CDATA[Im 1829 erschienenen 2. Band des &#8220;Versuch eines vollständigen Lehrbuches der Bibliothek-Wissenschaft&#8221; habe ich ein schönes Zitat von Martin Schrettinger  gefunden:

Ein systematischer Katalog wäre demnach einer optischen Maschine zu vergleichen in welcher alle Arten von Brenngläsern nach den Graden ihrer Konvexität nach den Verhältnissen ihrer Dimensionen und ihrer mehr oder minder Zirkel oder länglicht [...]]]></description>
			<content:encoded><![CDATA[<p>Im 1829 erschienenen 2. Band des &#8220;Versuch eines vollständigen Lehrbuches der Bibliothek-Wissenschaft&#8221; habe ich <a href="http://books.google.de/books?id=QkpDAAAAYAAJ&#038;ots=fuNQmpFwBg&#038;dq=Schrettinger%20Versuch%20eines%20%20Lehrbuches%20der%20Bibliothek-Wissenschaft&#038;pg=PA85&#038;ci=108%2C767%2C732%2C630&#038;source=bookclip">ein schönes Zitat</a> von <a href="http://de.wikipedia.org/wiki/Martin_Schrettinger">Martin Schrettinger</a>  gefunden:</p>
<p><img src="http://jakoblog.de/wp-content/uploads/2010/08/ZitatSchrettingerSemanticWeb.png" width="432" height="377" class="aligncenter size-full wp-image-848" /></p>
<blockquote><p>Ein systematischer Katalog wäre demnach einer optischen Maschine zu vergleichen in welcher alle Arten von Brenngläsern nach den Graden ihrer Konvexität nach den Verhältnissen ihrer Dimensionen und ihrer mehr oder minder Zirkel oder länglicht runden oder eckigten Form in Gestalt eines Stammbaumes über und neben einander systematisch geordnet und in dieser Ordnung befestigt wären oder wenn man lieber will einem Universal-Brennglase in welchem so viele Unterabtheilungen in systematischer Ordnung eingeschliffen wären dass durch die selben alle erdenklichen Grade von Brennpunkten erzielt werden sollten.</p></blockquote>
<p>Ab dem zweiten Band plädierte Schrettinger wie bereits Albrecht Christoph Kayser in &#8220;Ueber die Manipulation bey der Einrichtung einer Bibliothek und der Verfertigung der Bücherverzeichnisse&#8221; (1790) gegen einen systematischen Katalog, da dieser immer nur eine Sicht darstellen könne. Dass es einmal ein &#8220;Universal-Brennglase&#8221; geben würde, durch das sich alle erdenklichen Grade von Brennpunkten erzielen lassen, konnte er sicher nicht ahnen. Mit etwas Fantasie lässt sich Martin Schrettinger nicht nur <a href="http://jakoblog.de/2008/06/02/social-cataloging-ist-bibliothekswissenschaft-at-its-best/">als Vorreiter des Social Tagging</a> sondern auch von Linked Data (d.h. der beliebigen Rekombinierbarkeit von Katalogbestandteilen) ansehen.</p>
<p>Schrettinger und Kayser konnten sich unter den Bibliothekaren jedoch nicht durchsetzen &#8211; stattdessen dominierte <a href="http://de.wikipedia.org/wiki/Friedrich_Adolf_Ebert">Friedrich Adolf Ebert</a> die weitere Entwicklung in Deutschland. Mehr zur frühen Geschichte des Katalogs findet sich bei Uwe Jochum, u.A. in &#8220;Die Idole der Bibliothekare&#8221; (1995), <a href="http://books.google.de/books?id=-jcT00kuv6oC&#038;lpg=PP1&#038;ots=S3aSHYK0yx&#038;dq=jochum%20idole%20der%20bibliothekare&#038;pg=PA31#v=onepage&#038;q&#038;f=false">Kapitel 3</a>. Gut, dass sich viele von Jochums Texten <a href="http://www.ib.hu-berlin.de/~libreas/libreas_neu/ausgabe15/texte/006.htm#2">trotz seiner Kritik an Open Access</a> frei im Netz finden lassen (Weshalb &#8211; wie er argumentiert &#8211; durch die freie Verfügbarkeit von Publikationen die Forschungsfreiheit gefährdet sein soll, habe ich bislang nicht verstanden. Ich denke <a href="http://www.ib.hu-berlin.de/~libreas/libreas_neu/ausgabe15/texte/006.htm#fn39b">ab dieser Stelle</a> findet sich eine Antwort im <a href="http://de.wikipedia.org/wiki/Eigentum">Eigentumsbegriff</a>, über den sich an anderer Stelle streiten lässt).</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/08/23/das-brennglas-des-martin-schrettinger/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>What is Semantic Information Retrieval?</title>
		<link>http://jakoblog.de/2010/08/19/what-is-semantic-information-retrieval/</link>
		<comments>http://jakoblog.de/2010/08/19/what-is-semantic-information-retrieval/#comments</comments>
		<pubDate>Wed, 18 Aug 2010 22:45:20 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[Dissertation]]></category>
		<category><![CDATA[hype]]></category>
		<category><![CDATA[Meaning]]></category>
		<category><![CDATA[Semantic Web]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=843</guid>
		<description><![CDATA[The most fun part of my dissertation is when I can procastinate dig deeply to the foundation of computer and information science. Lately I tried to find out when the terms &#8220;file&#8221; and the &#8220;directory&#8221; were coined in its current sense. The first commercial disk drive was the IBM 350, introduced in 1956. It had [...]]]></description>
			<content:encoded><![CDATA[<p>The most fun part of my dissertation is when I can <s>procastinate</s> dig deeply to the foundation of computer and information science. Lately I tried to find out when the terms &#8220;file&#8221; and the &#8220;directory&#8221; were coined in its current sense. The first commercial disk drive was the <a href="http://en.wikipedia.org/wiki/Early_IBM_disk_storage#IBM_350">IBM 350</a>, introduced in 1956. It had the size of a wardrobe, stored 4.4 megabytes 6-bit-characters and could be leased for 3,200$/month. Instances of it were also called &#8220;files&#8221;. But <em>user files</em> first appeared in the early 1960s with the <a href="http://www.multicians.org/thvv/7094.html">Compatible Time-Sharing System</a> (CTSS), the earliest ancestor of Unix. You should watch <a href="http://www.youtube.com/watch?v=sjnmcKVnLi0">this great video</a> from 1964 in which <a href="http://en.wikipedia.org/wiki/Robert_Fano">Robert Fano</a> talks about making computers accessible to people. A wonderful demonstration of one of the very first command lines of a multi-user system! The explicit aims and concepts of computer systems are very similar to today. The more I read about history of computing, the more it seems to be that all important concepts were developed in the 1960s and 1970s. The rest is just reinventing and application on a broader scale.</p>
<p><object width="480" height="385"><param name="movie" value="http://www.youtube-nocookie.com/v/sjnmcKVnLi0?fs=1&amp;hl=de_DE&amp;rel=0"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><embed src="http://www.youtube-nocookie.com/v/sjnmcKVnLi0?fs=1&amp;hl=de_DE&amp;rel=0" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="480" height="385"></embed></object></p>
<p>Robert Fano was director of <a href="http://en.wikipedia.org/wiki/Project_MAC">project MAC</a>, a laboratory that brought together pioneers in operating systems, artificial intelligence, and other areas of the emerging discipline computer science. I browsed the historical <a href="http://publications.csail.mit.edu/lcs/">publications of the laboratory</a> at MIT where you can find a <a href="http://publications.csail.mit.edu/lcs/specpub.php?id=584">report of CTSS</a>. Also published at MAC in 1964, I stumbled upon <a href="http://en.wikipedia.org/wiki/Bertram_Raphael">Bertram Raphael</a>&#8217;s PhD thesis. It is titled <a href="http://publications.csail.mit.edu/lcs/specpub.php?id=574">SIR: A COMPUTER PROGRAM FOR SEMANTIC INFORMATION RETRIEVAL</a> and its abstracts sounds like todays Semantic Web propaganda:</p>
<blockquote><p>This system demonstrates what can reasonably be called an ability to &#8220;understand&#8221; semantic information. SIR&#8217;s semantic and deductive ability is based on the construction of an internal model, which uses word associations and property lists, for the relational information normally conveyed in conversational statements. [...] The system has some capacity to recognize exceptions to general rules, resolve certain semantic ambiguities, and modify its model structure in order to save computer memory space.</p></blockquote>
<p>The SIR expert system even seems to go beyong current RDF techniques in supporting exceptions. By the way Bertram Raphael was at MAC at the same time as <a href="http://en.wikipedia.org/wiki/Joseph_Weizenbaum">Joseph Weizenbaum</a>. Weizenbaum fooled expectations in articial intelligence with his program <a href="http://en.wikipedia.org/wiki/ELIZA">ELIZA</a> that he created between 1964 and 1966. He later became an <a href="">important critic</a> of artificial intelligence and the application of computer technology in general. By the way we need more like him instead of well-meaning, megalomaniac technology evangelists. See the documentary <a href="http://www.youtube.com/watch?v=F2lPVP2VYBU">Rebel at work</a> about Weizenbaum or even better the promising film <a href="http://www.plugandpray-film.de/en/">Plug &amp; Pray</a>!</p>
<p>So what is Semantic Information Retrieval? In short: bullshit. The term is also used independently for <a href="http://siren.sindice.com/">search indices on graph structured data</a> (2009), <a href="http://portal.acm.org/citation.cfm?id=273067">digital libraries</a> (1998) and more. But why bothering with words, meaning, and history if computers will surely &#8220;understand&#8221; soon?</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/08/19/what-is-semantic-information-retrieval/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tagging von OpenAccess-Artikeln mit Wikipedia</title>
		<link>http://jakoblog.de/2010/08/05/tagging-von-openaccess-artikeln-mit-wikipedia/</link>
		<comments>http://jakoblog.de/2010/08/05/tagging-von-openaccess-artikeln-mit-wikipedia/#comments</comments>
		<pubDate>Thu, 05 Aug 2010 05:38:04 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Open Access]]></category>
		<category><![CDATA[Tagging]]></category>
		<category><![CDATA[Wikipedia]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=837</guid>
		<description><![CDATA[Zur Zeit bekomme ich nur am Rande die tollen Beiträge der Biblioblogosphäre wie Ethik von unten und die Übersicht von Repository-Upload-Formularen mit, da ich intensiv an der Dissertation sitze (siehe meine Literatur). Lamberts Vorschlag Wikipedia zur Sacherschließung von Open Access zu nutzen, möchte ich jedoch nicht unkommentiert lassen.
Die Grundidee ist folgende: Wissenschaftliche Literatur aus Open [...]]]></description>
			<content:encoded><![CDATA[<p>Zur Zeit bekomme ich nur am Rande die tollen Beiträge der Biblioblogosphäre wie <a href="http://ethikvonunten.wordpress.com/">Ethik von unten</a> und die <a href="http://infobib.de/blog/2010/07/28/upload-formulare-in-repositorien-iii/">Übersicht von Repository-Upload-Formularen</a> mit, da ich intensiv an der Dissertation sitze (siehe <a href="http://www.bibsonomy.org/user/voj">meine Literatur</a>). Lamberts Vorschlag <b><a href="http://biblionik.de/2010/08/04/sacherschliessung-mit-wikipedia-spielidee/">Wikipedia zur Sacherschließung von Open Access</a></b> zu nutzen, möchte ich jedoch nicht unkommentiert lassen.</p>
<p>Die Grundidee ist folgende: <b>Wissenschaftliche Literatur</b> <a href="http://www.opendoar.org/">aus Open Access Repositorien</a> lässt sich 1.) direkt verlinken 2.) im Volltext analysieren und 3.) zur automatischen Erzeugung von Literaturangaben verwenden. Dagegen steht, dass die Sacherschließung dürftig ist und Artikel oft sehr speziell sind. <b><a href="http://de.wikipedia.org/">Wikipedia</a></b> ist dagegen ebenso für 1-3 verfügbar und bietet einen guten (manchmal sogar ausgewogenen) Einstiegspunkt in ein Thema &#8211; es fehlt jedoch oft an weiterführenden Hinweisen auf aktuelle Literatur. Lambert schlägt nun eine Webanwendung vor, in der Nutzer Wikipedia-Artikel und Open-Access Artikel einander zuordnen können. <a href="http://www.librarything.de">LibraryThing</a> hat vorgemacht, dass Sacherschließung nicht dröge sein muss, sondern durch spielerische Anreize gute Ergebnisse liefert. Deshalb sollte die Sacherschließung mit Wikipedia auch möglichst einfach als Spiel umgesetzt werden. Die Webanwendung könnte sowohl von einer eigenen Seite als auch als Widget direkt aus Wikipedia und aus OA-Repositorien <a href="http://base.ub.uni-bielefeld.de/">oder Suchmaschinen</a> benutzt werden und sollte mit möglichst wenigen Klicks (im Idealfall nur ein einziger!) zu bedienen sein. Durch Auswertung der Volltexte können mit herkömmlicher Suchmaschinentechnologie (z.B. <a href="http://lucene.apache.org/solr/">Solr</a> oder <a href="https://sites.google.com/a/medelyan.com/www/news/mauitopicindexerisnowavailableonsourceforge">Maui</a>) von OA-Artikeln bzw. Wikipedia-Artikeln <em>ähnliche</em> Artikel der jeweils anderen Textgattung vorgeschlagen werden. Nutzer können dann die Vorschläge als passend oder als unpassend bewerten.</p>
<p><img src="http://jakoblog.de/wp-content/uploads/2010/08/stackoverflowvoting.png" alt="" title="Voting bei Stackoverflow" width="51" height="128" class="alignright size-full wp-image-839" /> Ich stelle mir die Bewertung ähnlich <a href="http://blog.stackoverflow.com/2009/04/stack-overflow-voting-pattern-analysis/">wie bei Stackoverlow</a> vor (siehe Screenshot-Ausschnitt rechts). Nutzer können dort Reputations-Punkte für verschiedene Aktionen bekommen (oder verlieren) &#8211; siehe <a href="http://meta.stackoverflow.com/questions/7931/the-official-faq-for-stack-overflow-server-fault-and-super-user">Stackoverflow-FAQ</a>. Für das Hinzufügen eines nicht-automatisch vorgeschlagenen Artikels könnte es z.B. mehr Punkte geben als für das Bestätigen eines bereits vorhandenen Artikels, so dass zusätzliche Recherchen belohnt werden. In jedem Fall sollte die Weiterentwicklung der Idee erstmal <a href="http://www.codinghorror.com/blog/2008/04/ui-first-software-development.html">mit der Benutzeroberfläche beginnen</a> anstatt gleich über technische Möglichkeiten nachzudenken. Eine Übersicht von Webanwendungen für User-Interface Mockups <a href="http://stackoverflow.com/questions/528769/best-web-app-for-creating-screen-mockups">gibt es hier</a>. Papier oder Tafel und Stift reichen aber auch aus. Wichtig ist nur, dass das Design nicht von Fragen wie &#8220;wie setze ich das in HTML um?&#8221; oder &#8220;wo und wie sollen die Daten gespeichert werden?&#8221; beschränkt wird.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/08/05/tagging-von-openaccess-artikeln-mit-wikipedia/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Fundstücke aus der Gender-Blogosphäre</title>
		<link>http://jakoblog.de/2010/06/02/fundstucke-aus-der-gender-blogosphare/</link>
		<comments>http://jakoblog.de/2010/06/02/fundstucke-aus-der-gender-blogosphare/#comments</comments>
		<pubDate>Tue, 01 Jun 2010 23:34:55 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Gender]]></category>
		<category><![CDATA[Politik]]></category>
		<category><![CDATA[Prostitution]]></category>
		<category><![CDATA[Vorurteile]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=834</guid>
		<description><![CDATA[Die Mädchenmannschaft macht mit ihrer Rubrik &#8220;neues aus den Blogs&#8221; anhand der deutschsprachigen feministischen Blogosphäre vor, wie Vernetzung funktionieren kann &#8211; ein Thema, das in der deutschsprachige Biblioblogosphäre schon seit mehreren Wochen diskutiert wird. 
Oft wichtiger (und anstrengender) als Diskutieren ist jedoch Machen &#8211; das versucht die &#8220;2.0-Szene&#8221;, zu der ich irgendwie dazugehöre &#8211; den [...]]]></description>
			<content:encoded><![CDATA[<p>Die <a href="http://maedchenmannschaft.net/">Mädchenmannschaft</a> macht mit ihrer Rubrik &#8220;<a href="http://maedchenmannschaft.net/series/genderissimi/">neues aus den Blogs</a>&#8221; anhand der deutschsprachigen feministischen Blogosphäre vor, wie Vernetzung funktionieren kann &#8211; ein Thema, das in der deutschsprachige Biblioblogosphäre schon seit mehreren Wochen <a href="http://www.uebertext.org/2010/05/fachkommunizieren-aber-wie.html">diskutiert wird</a>. </p>
<p>Oft wichtiger (und anstrengender) als Diskutieren ist jedoch Machen &#8211; das versucht die &#8220;2.0-Szene&#8221;, zu der ich irgendwie dazugehöre &#8211; den &#8220;Offlinern&#8221; schon seit Jahren beizubringen. Peter Kruse stellte in einem vielbeachten <a href="http://re-publica.de/10/2010/04/15/peter-kruse-ist-die-nutzung-des-internets-eine-glaubensfrage/">Vortrag im April auf der re:publica</a> jedoch fest, dass die Trennung zwischen Onlinern und Offlinern irreführend ist. Stattdessen geht es um verschiedene Werte und Netzwerke (aber schaut euch den Vortrag lieber selber an).</p>
<p>Eine andere, tatsächlich auf Wertevorstellungen beruhende, Trennung ist die zwischen Geschlechtern: und zwar das &#8220;soziale oder psychologische Geschlecht einer Person&#8221; (<a href="http://de.wikipedia.org/wiki/Gender">gender</a>). Dem <a href="http://fxneumann.de/2010/06/01/bloggen-und-gender/">Artikel über Bloggen und Gender</a> von FxNeumann gestern entnehme ich eine mögliche Erklärung, warum es zwar mehr bloggende Frauen gibt, diese aber weniger wahrgenommen werden. Wie <a href="http://dorotheemarkert.wordpress.com/2010/05/24/primare-politik/">Dorothee Markert</a> beschreibt, unterscheidet die italienische Journalistin Marina Terragnis zwischen &#8220;primärer Politik&#8221; und &#8220;sekundärer Politik&#8221;: Primäre Politik bedeutet, etwas konkretes für das Zusammenleben von Menschen in einer Gesellschaft zu tun, und Sekundäre Politik bedeutet, darüber zu reden wie die Gesellschaft funktionieren sollte. Die sekundäre Politik ist jedoch das was gemeinhin als Politik verstanden wird: Menschen (vor allem Männer) sagen wie es laufen sollte und versuchen an Machtpositionen zu kommen, damit sie dann irgendwann mal etwas bewirken können. Möglicherweise bewirken viele Frauen lieber direkt etwas, oder platt ausgedrück: <em>Männer laber rum &#8211; Frauen machen einfach</em>. </p>
<p>Dieser Spruch ist natürlich quatsch, aber &#8211; um es mit Antje Schrupp auszudrücken, <a href="http://antjeschrupp.com/2010/05/25/funfzehn-thesen-zu-feminismus-und-post-gender/">auf deren Beitrag</a> ich eigentlich hinauswollte: Das Gegenteil ist genauso falsch! Klischees über Frauen und Männer sind <a href="http://de.wikipedia.org/wiki/Mario_Barth">zwar unterhaltsam</a> aber eben Klischees, die sich jeder/jede so biegt wie sie ihm/ihr am besten passen. Dabei biegen Menschen ihre Klischees jedoch nicht selber sondern sie werden gebogen &#8211; von der Gesellschaft. Diese Erkenntnis ist nicht neu, sie findet sich zum Beispiel bei Focault und Adorno (auf die ich lieber ständig verweise statt sie selber zu lesen. Kann mir jemand eine bekannte Frau nennen, die ich stattdessen verwenden kann? Solange Frauen weniger klar als [intellektuelle] Autoritäten anerkann werden, ist das schwierig).</p>
<p>Der Gender-Szene ist jedenfalls zu verdanken, die Konstruiertheit von Rollenbildern wie Männlich und Weiblich aufzuzeigen. Das klingt jetzt sicher völlig unverständlich, also lest euch Antje Schrupps <a href="http://antjeschrupp.com/2010/05/25/funfzehn-thesen-zu-feminismus-und-post-gender/">15 Thesen zu Feminismus und Post-Gender</a> durch. Hier die erste und die letzte These:</p>
<blockquote><p>1. Der wichtigste Punkt rund um das Thema „Gender“ hat nichts mit Frauen zu tun, sondern ist die Kritik an der Sich-zur-Normsetzung des Männlichen. Frauen kommen allerdings insofern ins Spiel, als Feministinnen die ersten waren, die dieses Sich-zur-Norm-Setzen des Männlichen hinterfragt haben.</p>
<p>15. Diese Praxis ist aber nicht auf Frauen beschränkt. Auch Männer und alle anderen Geschlechter können – und sollten – sich daran beteiligen. Denn es geht nicht um Lobbyarbeit für Fraueninteressen, sondern um eine Welt, in der gutes Leben für alle Menschen möglich ist.</p>
</blockquote>
<p>Als Individualanarchist interessiert mich das Thema Gender vor allem in Bezug auf den Freiheitsbegriff. Schrupp schreibt:</p>
<blockquote><p>8. Eine freiheitliche Politik besteht nicht in der Behauptung einer (immer nur abstrakt denkbaren) Gleichheit der Menschen, sondern in kreativen und dem jeweiligen Kontext angemessenen Wegen, mit der (real vorhandenen) Ungleichheit der Menschen umzugehen, ohne dass daraus Herrschaft entsteht.</p></blockquote>
<p>Hier liegt <s>der Hund</s> <s>die Katze</s> der Hase <s>in der Pfanne</s> <s>auf dem Dach</s> <s>im Pfeffer</s> begraben: Es reicht nicht aus, einfach zu behaupten, das Geschlecht spiele keine Rolle, weil wir alle Gleich sind (siehe Piratenpartei) oder der Staat solle sich aus allem heraushalten, weil wir ja alle selber entscheiden können auf was wir uns einlassen (siehe FDP). Wer danach handelt, handelt reaktionär und arbeitet für die Seite der Herrschenden. Denn wie Anatole France schreibt:</p>
<blockquote><p>Das Gesetz in seiner erhabenen Gleichheit verbietet es Reichen wie Armen, unter den Brücken zu schlafen, auf den Straßen zu betteln und Brot zu stehlen.</p></blockquote>
<p>Damit komme ich auch zum letzten Punkt dieses Artikels: Heute ist <em>Internationaler Hurentag</em>! Statt aus diesem Anlass die eigenen Vorurteile (Gesellschaft!) gegenüber Sexarbeitern von sich zu geben oder zu fordern, dass dringend etwas getan werden müsse (sekundäre Politik) ist dieser Tag vielleicht mal ein Anlass, sich mit der konkreten Lebenssituation von Huren auseinanderzusetzen. Kompetente Ansprechpartner dafür sind <a href="http://www.madonna-ev.de/index.php?option=com_weblinks&#038;catid=14&#038;Itemid=23">Selbsthilfeorganisationen</a> wie Hydra e.V. in Berlin, Madonna e.V. in Bochum und Doña Carmen e.V. in FFM.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/06/02/fundstucke-aus-der-gender-blogosphare/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>An impression of the OPDS/OpenPub catalog data model</title>
		<link>http://jakoblog.de/2010/05/27/an-impression-of-the-opdsopenpub-catalog-data-model/</link>
		<comments>http://jakoblog.de/2010/05/27/an-impression-of-the-opdsopenpub-catalog-data-model/#comments</comments>
		<pubDate>Wed, 26 May 2010 22:05:58 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[ATOM]]></category>
		<category><![CDATA[DAIA]]></category>
		<category><![CDATA[Data Modeling]]></category>
		<category><![CDATA[OPDS]]></category>
		<category><![CDATA[openpub]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=830</guid>
		<description><![CDATA[A few days ago Ed Summers pointed me to the specification of the Open Publication Distribution System (OPDS) which was just released as version 0.9. OpenPub (an alias for OPDS) is part of the Internet Archive&#8217;s BookServer project to build an architecture for  vending and lending digital books over the Internet. I wonder why [...]]]></description>
			<content:encoded><![CDATA[<p>A few days ago Ed Summers pointed me to the specification of the <a href="http://opds-spec.org/">Open Publication Distribution System (OPDS)</a> which was just released as version 0.9. <a href="http://code.google.com/p/openpub/">OpenPub</a> (an alias for OPDS) is part of the Internet Archive&#8217;s <a href="http://www.archive.org/bookserver">BookServer</a> project to build an architecture for  vending and lending digital books over the Internet. I wonder why I have not heard more of BookServer and OpenPub at recent library conferences, discussion lists, and journals but maybe current libraries prefer to stay in the physical world to become museums and archives. Anyway, I had a look at OpenPub, so here are my public notes of the first impressions &#8211; and my answer to the <a href="http://groups.google.com/group/openpub/browse_thread/thread/e51af9510f150d55">call for comments</a>. <a href="#comments">Please comment</a> if you have corrections or additions (or <a href="http://code.google.com/p/openpub/issues/entry">create an issue</a> in the tracker)!</p>
<p>OPDS is a syndication format for electronic publications based on Atom (<a href="http://tools.ietf.org/html/rfc4287">RFC 4287</a>). Therefore it is fully based on HTTP and the Web (this place that current libraries are still about to discover). Conceptually OPDS is somehow related to <a href="http://www.openarchives.org/ore/">OAI(-ORE)</a> and <a href="http://daia.sourceforge.net/">DAIA</a> but it is purely based on XML which makes it difficult to compare with RDF-based approaches. I tried to reengineer the conceptual data model to better seperate model and serialization like I did with DAIA. The goal of OPDS catalogs is &#8220;to make Publications both discoverable and straightforward to acquire on a range of devices and platforms&#8221;.</p>
<p>OPDS uses a mix of <a href="http://dublincore.org/documents/dcmi-terms/">DCMI Metadata Terms</a> (DC) elements and ATOM element enriched with some new OPDS elements. Furthermore it interprets some DC and ATOM elements in a special way (this is common in many data formats although frequently forgotten).</p>
<p><b>Core concepts</b></p>
<p>The core concepts of OPDS are <b>Catalogs</b> which are provided as ATOM Feeds (like <a href="http://www.jangle.org/">Jangle</a> which should fit nicely for library resources), Catalog <b>Entries</b> that each refer to one publication and <b>Aquisition Links</b>. There are two disjunct types of Catalogs: <i>Navigation Feeds</i> provide a browseable hierarchy and <i>Acquisition Feeds</i> contain a list of Publication Entries. I will skip the <a href="http://opds-spec.org/specs/opds-catalog-0-9-20100525/#Catalog_Relations">details on Navigation Feeds</a> and search facities (possible via <a href="http://www.opensearch.org/">OpenSearch</a>) but focus on Elements and Aquisition.</p>
<p><b>Catalog Elements</b></p>
<p>The specification distinguishes between Partial and Complete Catalog Entries but this is not relevant on the conceptual level. There we have two concepts that are not clearly seperated in the XML serialization: the <b>Catalog Record</b> and the <b>Publication</b> which a Catalog Record describes are mixed in one Catalog Element. The properties of a Catalog Record are:</p>
<dl>
<dt><tt>atom:id</tt></dt>
<dd>identifier of the catalog entry (MANDATORY)</dd>
<dt><tt>atom:updated</tt></dt>
<dd>modification timestamp of the catalog entry (MANDATORY)</dd>
<dt><tt>atom:published</tt></dt>
<dd>timestamp of when the catalog entry was first accessible</dd>
</dl>
<p>The properties of a Publication are:</p>
<dl>
<dt><tt>dc:identifier</tt></dt>
<dd>identifier of the publication</dd>
<dt><tt>atom:title</tt></dt>
<dd>title of the publication (MANDATORY)</dd>
<dt><tt>atom:author</tt></dt>
<dd>creator of the publication (possibly with sub-properties)</dd>
<dt><tt>atom:contributors</tt></dt>
<dd>additional contributors to the publication (dito)</dd>
<dt><tt>atom:category</tt></dt>
<dd>publication&#8217;s category, keywords, classification codes etc. (with sub-properties scheme, term, and label)</dd>
<dt><tt>dc:issued</tt></dt>
<dd>first publication date of the publication</dd>
<dt><tt>atom:rights</tt></dt>
<dd>rights held in and over the publications</dd>
<dt><tt>atom:summary</tt> and <tt>atom:content</tt></dt>
<dd>description of the publication (as plain text or some other format for atom:content)</dd>
<dt><tt>dc:language</tt></dt>
<dd>language(s) of the publication (<a href="http://code.google.com/p/openpub/issues/detail?id=35">any format?</a>)</dd>
<dt><tt>dc:extend</tt></dt>
<dd>size or duration of the publication (<a href="http://code.google.com/p/openpub/issues/detail?id=34">?</a>)</dd>
<dt><tt>dc:publisher</tt></dt>
<dd>Publisher of the publication</dd>
</dl>
<p>Moreover each publication may link to related resources. Unfortunately you cannot just use arbitrary RDF properties but the following relations (from <a href="http://tools.ietf.org/html/draft-nottingham-http-link-header-10">this draft</a>):</p>
<dl>
<dt><tt>alternate</tt></dt>
<dd>alternative description of the publication</dd>
<dt><tt>copyright</tt></dt>
<dd>copyright statement that applies to the catalog entry</dd>
<dt><tt>latest-version</tt></dt>
<dd>more recent version of the publication</dd>
<dt><tt>license</tt></dt>
<dd>license associated with the catalog entry</dd>
<dt><tt>replies</tt></dt>
<dd>comment on or discussion of the catalog entry</dd>
</dl>
<p>I consider this relation types one of the weakest points of OPDS. The domain and range of the links are not clear and there are much better vocabularies for links between publications, for instance in <a href="http://vocab.org/frbr/core.html">FRBR</a>, the <a href="http://bibliontology.com/">Bibliographic Ontology</a>, the <a href="http://www.crossref.org/CrossTech/2009/03/citation_typing_ontology.html">citation type ontology</a>, <a href="http://www.mementoweb.org/">Memento</a>, and <a href="http://sioc-project.org/">SIOC</a> (which also overlaps with ODPS at other places).</p>
<p>In addition each publication must contain at least one <tt>atom:link</tt> element which is used to encode an <i>Aquisition Link</i>.</p>
<p><b>Aquisition Links</b></p>
<p>OPDS defines two Aquisition types: &#8220;Direct Acquisition&#8221; and &#8220;Indirect Acquisition&#8221;. Direct Aquisition links must directly lead to the publication (in some format) without any login, meta or catalog page in front of it (!) while Indirect Acquisition links lead to such a portal pages that then links to the publications. There are five Aquisition types (called &#8220;Acquisition Relations&#8221;) similar to <a href="http://purl.org/NET/DAIA#2.4._Available_element">DAIA Service types</a>:</p>
<dl>
<dt><tt>odps:acquisition</tt></dt>
<dd>a complete representation of the<br />
publication that may be retrieved without payment</dd>
<dt><tt>odps:acquisition/borrow</tt></dt>
<dd>a complete representation of the publication<br />
that may be retrieved as part of a lending transaction</dd>
<dt><tt>odps:acquisition/buy</tt></dt>
<dd>a complete representation of the publication<br />
that may be retrieved as part of a purchase</dd>
<dt><tt>odps:acquisition/sample</tt></dt>
<dd>a representation of a subset of the publication</dd>
<dt><tt>odps:acquisition/subscribe</tt></dt>
<dd>a complete representation of the publication that may be retrieved as part of a subscription</dd>
</dl>
<p><tt>odps:acquisition</tt> can be mapped to <tt>daia:Service/Openaccess</tt> and <tt>odps:acquisition/borrow</tt> can be mapped to <tt>daia:Service/Loan</tt> (and vice versa). <tt>odps:acquisition/buy</tt> is not defined in DAIA but could easily be added while <tt>daia:Service/Presentation</tt> and <tt>daia:Service/Interloan</tt> are not defined in ODPS. At least the first should be added to ODPS to indicate publications that require you to become a member and log in or to physically walk into an institution to get a publication (strictly limiting OPDS to pure-digital publications accessible via HTTP is stupid if you allow indirect aquisition).</p>
<p>The remaining two acquisition types somehow do not fit between the others: <tt>odps:acquisition/sample</tt> and <tt>odps:acquisition/subscribe</tt> should be orthogonal to the other relations. For instance you could subscribe to a paid or to a free subscription and you could buy a subset of a publication.</p>
<p>In addition Aquisition links may or must contain some other properties such as <tt>odps:price</tt> (containing of a currency code from ISO4217 and a value).</p>
<p><b>Cover and artwork links</b></p>
<p>Beside Aquisition links the relations <tt>opds:cover</tt> and <tt>opds:thumbnail</tt> can be used to relate a Publication with it&#8217;s cover or some other visual representation. The thumbnail should not exceed 120 pixles in height or width and images must be either GIF, JPEG, or PNG. Thumbnails may also be directly embedded via the &#8220;data&#8221; URL schema from RFC2397.</p>
<p><b>Final thoughts</b></p>
<p>OPDS looks very promising and it is already used for benefit in practise. There are some minor issues that can easily be fixed. The random selection of relation types is surely I flaw that can be repaired by allowing arbitrary RDF properties (come on XML fanboys, you should notice that RDF is good at least at link types!) and the list of acquisition types should be cleaned and enhanced at least to support &#8220;presentation&#8221; without lending like DAIA does. A typical use case for this are National Licenses that require you to register to access the publications. For more details I would like to compare OPDS in more depth with models like DAIA, FRBR, SIOC, OAI-ORE, Europeana etc. &#8211; but not now.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/05/27/an-impression-of-the-opdsopenpub-catalog-data-model/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Die Citation Style Language (CSL) als Metadatenformat</title>
		<link>http://jakoblog.de/2010/04/29/citation-style-language-csl-als-metadatenformat/</link>
		<comments>http://jakoblog.de/2010/04/29/citation-style-language-csl-als-metadatenformat/#comments</comments>
		<pubDate>Thu, 29 Apr 2010 14:39:39 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[CSL]]></category>
		<category><![CDATA[Identifier]]></category>
		<category><![CDATA[Literaturverwaltung]]></category>
		<category><![CDATA[Metadata]]></category>
		<category><![CDATA[twitter]]></category>
		<category><![CDATA[Zotero]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=825</guid>
		<description><![CDATA[Auf der Code4Lib Mailingliste hat Tim Spalding vor einigen Tagen die Idee aufgeworfen, die angekündigten Twitter Annotations zur Übertragung von bibliographischen Daten zu verwenden. Die Beteiligten waren alle der Meinung, das bibliotheksspezifische Formate wie MARC und MODS unpassend sind; BibTeX scheidet ebenfalls aus.
Nach der Überlegung, dass Identifikation und Beschreibung zwei klar abzugrenzende Aufgaben von bibliographischen [...]]]></description>
			<content:encoded><![CDATA[<p>Auf der <a href="http://www.mail-archive.com/code4lib@listserv.nd.edu/msg07756.html">Code4Lib Mailingliste</a> hat Tim Spalding vor einigen Tagen die Idee aufgeworfen, die angekündigten <a href="http://www.sitepoint.com/blogs/2010/04/19/twitter-introduces-annotations-hash-tags-become-obsolete/">Twitter Annotations</a> zur Übertragung von bibliographischen Daten zu verwenden. Die Beteiligten waren alle der Meinung, das bibliotheksspezifische Formate wie MARC und MODS unpassend sind; BibTeX scheidet ebenfalls aus.</p>
<p>Nach der Überlegung, dass Identifikation und Beschreibung zwei klar abzugrenzende Aufgaben von bibliographischen Daten sind, habe ich mir mal genauer die <a href="http://citationstyles.org/">Citation Style Language (CSL)</a> angeschaut. CSL wird unter Anderem in den Literaturverwaltungsprogrammen Zotero und Mendeley benutzt, um Literaturangaben in <a href="http://www.zotero.org/styles">unzähligen Zitationsstilen</a> ausgeben zu können. Die Grundidee von CSL ist, Zitationsstile als <a href="http://citationstyles.org/downloads/specification.html">CSL-Styles</a> zu definieren, mit denen dann ein CSL-Prozessor aus bibliographischen Datensätzen schön formatierte Literaturangaben und Bibliographien erstellt. Der am weitesten fortgeschrittene CSL-Prozessor ist <a href="http://bitbucket.org/fbennett/citeproc-js">citeproc-js</a>. Er ist in JavaScript geschrieben und wurde als Modul aus dem Programmcode von Zotero herausgelöst, so dass er auch unabhängig verwendet werden kann (allerdings bislang <a href="http://gsl-nagoya-u.net/http/pub/citeproc-doc.html#javascript-interpreters">noch nicht</a> mit allen JavaScript-Interpretern).</p>
<p>Die Idee ist nun, das CSL-Eingabeformat als Metadatenformat für bibliographische Daten in Twitter-Annotationen zu verwenden. <a href="http://wiki.code4lib.org/index.php/Citation_Style_Language#Bibliographic_record_format">Im Code4lib-Wiki</a> habe ich mal zusammengefasst, was ich zur Spezifikation des CSL-Eingangsformat gefunden habe. Das Metadatenformat ist ziemlich einfach aufgebaut und soll sich dem Entwickler Frank Bennett nach in einer kommenden Zotero-Version auch einfacher aus dem Programm exportieren lassen.</p>
<p>Zur Vermeidung des Umwegs über Zotero fehlen nur Exportmöglichkeiten von CSL-Eingangsdaten aus Bibliothekskatalogen. Deren Titel könnten dann automatisch mit CSL in hunderten von Zitierstilen exportiert werden. In <a href="http://beluga.sub.uni-hamburg.de/">Beluga</a> wird dazu übrigens bislang <a href="http://www.refbase.net/">refbase</a> verwendet, das ebenso wie der CSL-Prozessor citeproc-js als Open Source verfügbar ist. Für die Wikimedia-Projekte bietet sich das Format ebenso an &#8211; so könnten die Leser auswählen, welchen Zitationsstil sie bevorzugen und Literaturangaben aus Wikipedia-Artikeln direkt in ihre Literaturverwaltung übernehmen.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/04/29/citation-style-language-csl-als-metadatenformat/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>William Kent: Ein weiterer Seelenverwandter?</title>
		<link>http://jakoblog.de/2010/04/28/william-kent-ein-weiterer-seelenverwandter/</link>
		<comments>http://jakoblog.de/2010/04/28/william-kent-ein-weiterer-seelenverwandter/#comments</comments>
		<pubDate>Tue, 27 Apr 2010 23:52:32 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Dissertation]]></category>
		<category><![CDATA[Literatur]]></category>
		<category><![CDATA[Personen]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=822</guid>
		<description><![CDATA[Bei meinen Recherchen zu Datenmodellierung etc. bin ich über Lambda the Ultimate auf den 2005 verstorbenen Computerwissenschaftler William (Bill) Kent gestoßen. Er hat  1978 ein Buch über &#8220;Data &#38; Reality&#8221; geschrieben hat und ebenso wie der von mir sehr geschätze Ted Nelson scheint Kent vom &#8220;Informatik-Establishment&#8221; nicht genügend rezipiert zu werden. Die meisten von [...]]]></description>
			<content:encoded><![CDATA[<p>Bei meinen Recherchen zu Datenmodellierung etc. bin ich <a href="http://lambda-the-ultimate.org/node/3762">über Lambda the Ultimate</a> auf den 2005 verstorbenen Computerwissenschaftler <a href="http://www.bkent.net/">William (Bill) Kent</a> gestoßen. Er hat  1978 ein Buch über &#8220;<a href="http://www.librarything.de/work/285339">Data &amp; Reality</a>&#8221; geschrieben hat und ebenso wie der von mir sehr geschätze <a href="http://en.wikipedia.org/wiki/Ted_Nelson">Ted Nelson</a> scheint Kent vom &#8220;Informatik-Establishment&#8221; nicht genügend rezipiert zu werden. Die meisten von Kent&#8217;s Texten sind <a href="http://www.bkent.net/catalogsource.htm">auf seiner ehemaligen Homepage</a> verfügbar.</p>
<p>In <a href="http://www.bkent.net/Doc/manyform.htm">The Many Forms of a Single Fact</a> zeigt Kent beispielsweise, wie sich eine Aussage im relationalen Datenmodell in dutzenden Varianten ausdrücken lässt. Ich bin sicher im RDF-Datenmodell ist das alles gaaanz anders und das Problem <em>gleiche Information &#8211; unterschiedliche Daten</em> löst sich in Luft auf <img src='http://jakoblog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  Die Ignoranz (oder der Fatalismus) der Mainstream-Informatik-Forschung gegenüber der dahinter liegenden fundamentalen Begrenzung technischer Systeme ist einer der Gründe, warum ich lieber in der Informationswissenschaft promoviere. Kent schreibt:</p>
<blockquote><p>“The questions aren&#8217;t so much about how we process data as about how we perceive reality, about the constructs and tactics we use to cope with complexity, ambiguity, incomplete information, mis­matched viewpoints, and conflicting objectives”.</p></blockquote>
<p>Dazu fällt mir <a href="http://en.wikipedia.org/wiki/Lotfi_Asker_Zadeh">Lotfi A. Zadeh</a>, der Erfinder der <a href="http://de.wikipedia.org/wiki/Fuzzy-Logik">Fuzzy Logik</a> ein. Die erste Anwendung der Fuzzy Logik auf Datenbanken stammt übrigens von <a href="http://www.nsf.gov/staff/staff_bio.jsp?lan=mzemanko">Maria Zemankova</a>, die auch im Bereich Digitaler Bibliotheken forscht. Aber zurück zu Kent: <a href="http://www.bkent.net/Doc/twobooks.htm">Diese Notiz von ihm über Bücher</a> verdeutlicht, warum ich über die Modellierung von <em>bibliographischen</em> Daten schreibe <img src='http://jakoblog.de/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
<blockquote><p>“It takes a good system and a lot of work to keep track of books.<br />
[...] Books hold our universe, past, present, and future, and other universes, too.”.</p></blockquote>
<p>Mit Ted Nelson hat William Kent meinem Eindruck nach gemeinsam, dass beide jahrzentelang aus verschiedenen Blickrichtungen gegen die Begrenztheit von vorhandenen Computersysteme angeschrieben haben. Man vergleiche beispielsweise Nelsons &#8220;The Tyranny of the File&#8221; (1986, <a href="http://www.xanadu.com.au/ted/TN/WRITINGS/TCOMPARADIGM/tedCompOneLiners.html">siehe dazu hier</a>) und Kents &#8220;<a href="http://www.bkent.net/Doc/limrec.htm">Limitations of Record Based Information Models</a>&#8221; (1979).</p>
<p>Wer sich weniger mit konkreten Strukturen der Datenverwaltung beschäftigen möchte aber das trotzdem alles irgendwie interessant findet: Passende Bücher sind <a href="http://www.librarything.com/work/62760">Sorting Things out</a> von Geoffrey Bowker und Susan Leigh Star sowie <a href="http://www.buzinkay.net/blog-de/2007/12/everything-is-miscellaneous/">Everything is Miscellaneous</a> von David Weinberger.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/04/28/william-kent-ein-weiterer-seelenverwandter/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Was sind eigentlich Daten?</title>
		<link>http://jakoblog.de/2010/04/19/was-sind-eigentlich-daten/</link>
		<comments>http://jakoblog.de/2010/04/19/was-sind-eigentlich-daten/#comments</comments>
		<pubDate>Mon, 19 Apr 2010 20:19:07 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Daten]]></category>
		<category><![CDATA[Dissertation]]></category>
		<category><![CDATA[Philosophie]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=819</guid>
		<description><![CDATA[Adrian Pohl ist in seinem Blog auf meinen in Zwickau gehaltenen Vortrag Semantic Web und Linked Data eingegangen (der Videomitschnitt des Vortrags ist noch nicht online, aber die Vortragsfolien) &#8211; vielen Dank für das Feedback! 
Definitionen von Daten
In der ersten Hälfte des Vortrags ging es mir darum zu erklären, was überhaupt Daten sind. Meine  [...]]]></description>
			<content:encoded><![CDATA[<p>Adrian Pohl <a href="http://www.uebertext.org/2010/04/wann-sind-daten.html">ist in seinem Blog</a> auf meinen <a href="http://biblog.fh-zwickau.de/2010/03/29/semantic-web-und-linked-data/">in Zwickau gehaltenen Vortrag</a> <em>Semantic Web und Linked Data</em> eingegangen (der Videomitschnitt des Vortrags ist noch nicht online, aber <a href="http://www.slideshare.net/nichtich/semantic-web-und-linked-open-data-eine-bibliothekarische-geschichte">die Vortragsfolien</a>) &#8211; vielen Dank für das Feedback! </p>
<p><b>Definitionen von Daten</b></p>
<p>In der ersten Hälfte des Vortrags ging es mir darum zu erklären, <em>was überhaupt Daten sind</em>. Meine  Kurzdefinition, die Adrian in seinem Beitrag auseinander nimmt ist:</p>
<blockquote><p>Daten: Strukturen aus unterscheidbaren Zeichen, die aufgrund von Vereinbarungen Informationen darstellen</p></blockquote>
<p>Dem setzt er folgende Definition entgegen (Hyperlinks wie im Original):</p>
<blockquote><p>Daten sind für mich in erster Linie eine Menge unterschiedener und unterscheidbarer, syntaktisch strukturierter <a href="http://de.wikipedia.org/wiki/Token_und_Type">Token</a>, die gespeichert sind und transportiert und kopiert werden können. Syntax in diesem Sinne setzt <a href="http://www.uebertext.org/2009/07/wann-ist-digitalitat.html">Digitalität</a> (d.h. eine endliche Menge klar abgegrenzter Typen) voraus und damit ist Digitalität auch Voraussetzung für Daten.</p></blockquote>
<p>Zum Vergleich hier noch die aktuelle Definition (19 April 2010 16:22 UTC) aus Wikipedia:</p>
<blockquote><p>The term data means groups of information that represent the qualitative or quantitative attributes of a variable or set of variables. [<a href="http://en.wikipedia.org/w/index.php?title=Data&#038;oldid=356240344">en.wikipedia</a>]</p></blockquote>
<blockquote><p>Daten sind logisch gruppierte Informationseinheiten [...], die zwischen Systemen übertragen werden oder auf Systemen gespeichert sind. [<a href="http://de.wikipedia.org/w/index.php?title=Daten&#038;oldid=71943210">de.wikipedia</a>, 19 April 2010 16:22 UTC]</p></blockquote>
<p><b>Kurze Analyse der Definitionen</b></p>
<p>Die Definitionen aus beiden Wikipedias halte ich für haltlos (Was heisst &#8220;logisch gruppiert&#8221;? Warum basieren Daten auf einer &#8220;variable&#8221;?) &#8211; sie zeigen allerdings, wie eng der Datenbegriff oft an den Informationsbegriff gekoppelt wird. Im Falle der Wikipedia-Definitionen, die Daten praktisch als eine Aggregat von Information(seinheiten) auffassen, ist diese Kopplung aber viel zu eng. Ich denke hier würde mir Adrian rechtgeben, da er schreibt &#8220;Nach meinem Dafürhalten [...] stellen Daten <em>keine</em> Information dar, wenn sie auch gespeicherte Information sein mögen.&#8221; Nach einer Trennung des Begriffs in einen rein syntaktischen Teil (siehe seine Definition oben), auf welchen aufbauend ein &#8220;aufnehmen&#8221;, &#8220;erfassen&#8221; oder &#8220;verstehen&#8221; zu Informationen möglich ist, schlägt er in Abwandlung meiner Definition vor:</p>
<blockquote><p>Daten: Syntaktisch geordnete Mengen von Token, in denen Information gespeichert ist</p></blockquote>
<p>Ich halte diese Definition für ebenso problematisch, da unklar ist was eine &#8220;syntaktisch geordnete Menge&#8221; sein soll und da Informationen nicht objektiv in Daten &#8220;gespeichert&#8221; sind sondern erst <em>aufgrund von Vereinbarungen</em> als Informationen interpretiert werden. Von der Aussage her &#8211; so denken ich &#8211; liegen Adrian und ich jedoch nicht weit auseinander. Man könnte zugespitzt sagen, dass wir uns nicht über die Daten einig sind (wie soll die Definition lauten) aber über die Information (was soll die Definition bedeuten).</p>
<p><b>Daten als Strukturen</b></p>
<p>Der Begriff &#8220;Token&#8221; zur Definition der Bestandteile von Daten ist vielleicht besser als &#8220;Zeichen&#8221; und ich möchte Adrian ausdrücklich für den Hinweis auf den Unterschied zwischen <a href="http://de.wikipedia.org/wiki/Token_und_Type">Token und Type</a> danken. Voraussetzung für Daten ist die Möglichkeit einer Unterscheidung. Erstens ist notwendig zu unterscheiden, wo ein Token anfängt und endet, um überhaupt &#8220;Mengen&#8221; identifizieren zu können. Zweitens setzen Daten die Möglichkeit voraus, dass zwei Token identisch &#8211; also eine Type &#8211; sind. Zusätzlich ist es notwendig, dass die Token in einer Struktur angeordnet sind, zum Beispiel eine Reihenfolge. Ich würde sogar fast soweit gehen, die Definition auf &#8220;Daten sind Strukturen&#8221; zu verkürzen, weil Strukturen aus unterscheidbaren Elementen bestehen. Diese Definition blendet jedoch &#8211; auch in ausführlicherer Form wie zum Beispiel als &#8220;Daten sind strukturierte Mengen unterscheidbarer Elemente&#8221; &#8211; den Begriff der Information völlig aus.</p>
<p><b>Informationen</b></p>
<p>Ohne Daten kann es keine Informationen geben. Der <a href="http://www.philosophyofinformation.net/">Philosoph Luciano Floridi</a> &#8211; vermutlich der renommierteste Experte auf dem Gebiet der Informationsphilosophie &#8211; <a href="http://plato.stanford.edu/entries/information-semantic/">bezeichnet diese Annahme</a> als <em>Ontological Neutrality</em>. Obgleich umgekehrt Daten möglicherweise ohne Informationen existieren können (darüber wäre zu diskutieren) finde ich es angemessen bei der Definition von Daten direkt auf Informationen zu verweisen. Bei der Definition von Information beziehe ich mich auf die von Floridi dargestellte <em>General Definition of Information</em> (GDI). In <em><a href="http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.32.6977">Is Information Meaningful Data?</a></em> fasst er diese Definition zusammen und argumentiert, dass (semantische) Information zusätzlich <em>wahr</em> sein muss. Diese Annahme ist umstritten, während die  GDI eine stabilere Grundlage bietet. Demnach ist etwas Information genau dann wenn:</p>
<ol>
<li>es aus einem oder mehreren <em>Daten</em> besteht</li>
<li>die Daten <em>wohlgeformt</em> (syntaktisch korrekt) sind</li>
<li>die wohlgeformten Daten eine <em>Bedeutung</em> (Semantik) besitzen</li>
</ol>
<p>Im Rahmen meiner Dissertation beschäftige ich mich damit, wie die Beziehung zwischen Daten, Wohlgeformtkeit und Bedeutung in der Praxis hergestellt wird. Wie ich <a href="http://www.libreas.eu/ausgabe15/texte/002.htm">in Libreas</a> skizziert habe, sind dabei die Begriffe <em>Format</em> und <em>Modell</em> hilfreich. Auf das Modell, welches meiner Meinung nach notwendig ist, um aus Daten bedeutungsvolle Informationen zu lesen (aufnehmen, erfassen, verstehen&#8230;) verweise ich in meiner Definition mit der &#8220;Vereinbarung&#8221;. Die Vereinbarung muss implizit oder explizit als Hintergrundwissen, Kontextinformation, <a href="http://www.sil.org/linguistics/GlossaryOfLinguisticTerms/WhatIsGivenInformation.htm">given information</a>, Exformation o.Ä. vorliegen, um Daten interpretieren zu können &#8211; denn prinzipiell kann ein gegebenes Datum sehr viele verschiedene Informationen enthalten.</p>
<p><b>Digitalität und Wissen</b></p>
<p>Auf den Begriff der Digitalität möchte ich hier erstmal nicht weiter eingehen &#8211; finite Strukturen sind immer digital kodierbar also ist Digitalität nicht Voraussetzung sondern Folge von Daten. Und was Wissen ist weiß ich auch nicht: es hängt jedenfalls sehr davon ab, was man vom Wissensbegriff wissen möchte <img src='http://jakoblog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  Hinweisen möchte ich aber auf die Zitatesammlung mit <a href="http://beat.doebe.li/bibliothek/w00600.html">weiteren Definitionen von Daten</a> von Beat Döbeli Honegger und auf den schon oben verlinkten Artikel <a href="http://plato.stanford.edu/entries/information-semantic/">Semantic Conceptions of Information</a> von Luciano Floridi. Und natürlich freue ich mich sehr über weitere Kommentare!</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/04/19/was-sind-eigentlich-daten/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Qualitätssicherung von Freien Daten</title>
		<link>http://jakoblog.de/2010/04/14/qualitatsssicherung-von-freien-daten/</link>
		<comments>http://jakoblog.de/2010/04/14/qualitatsssicherung-von-freien-daten/#comments</comments>
		<pubDate>Wed, 14 Apr 2010 21:26:22 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[open data]]></category>
		<category><![CDATA[Qualität]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=814</guid>
		<description><![CDATA[Vor etwas über einem Monat hat Nat Torkington einen Blogbeitrag mit dem Titel Truly Open Data veröffentlicht, auf den ich hier kurz hinweisen möchte.  Nat versucht seit geraumer Zeit verschiedene Einrichtungen dazu zu überzeugen, ihre Daten als (Linked) Open Data freizugeben. In Truly Open Data beschreibt er, warum das Freigeben alleine leider nicht ausreicht, [...]]]></description>
			<content:encoded><![CDATA[<p>Vor etwas über einem Monat hat Nat Torkington einen Blogbeitrag mit dem Titel <a href="http://radar.oreilly.com/2010/03/truly-open-data.html">Truly Open Data</a> veröffentlicht, auf den ich hier kurz hinweisen möchte.  Nat versucht seit geraumer Zeit verschiedene Einrichtungen dazu zu überzeugen, ihre Daten als <a href="http://www.slideshare.net/nichtich/semantic-web-und-linked-open-data-eine-bibliothekarische-geschichte">(Linked) Open Data</a> freizugeben. In <em>Truly Open Data</em> beschreibt er, warum das Freigeben alleine leider nicht ausreicht, sondern ein offenes Qualitätsmanagement notwendig ist.</p>
<p>Freie Daten lassen sich prinzipiell mit Freier Software vergleichen: dank expliziter Lizensierung (<a href="http://creativecommons.org/choose/zero">zum Beispiel CC0</a>) kann jeder die Daten kopieren, ändern (mit anderen Daten kombinieren, bereinigen, Ausschnitte bilden etc.) und weitergeben. Wenn man sich allerdings erfolgreiche Open Source Projekte anschaut, passiert in der Praxis noch mehr: Vor allem gibt es eine Community, die das Projekt pflegt und vorantreibt.</p>
<p>Ned weist darauf hin, dass Open Data vergleichbare Praktiken und Werzeuge benötigt, wie Open Source: Die Daten müssen gemeinsam bearbeitet werden können und es muss Personen geben, die sich für ein Datenset verantwortlich fühlen und im Zweifelsfall Entscheidungen treffen können. Zur Kommunikation und Kollaboration sind zahlreiche Tools wie Mailinglisten, Chat, Bug-Tracking-Systeme etc. hilfreich. Es muss einfach sein, sich Änderungen anzeigen zu lassen (<a href="http://de.wikipedia.org/wiki/Diff">Diff</a>) und Vorschläge für Änderungen weitergeben zu können (<a href="http://de.wikipedia.org/wiki/Patch_(Unix)">Patch</a>) &#8211; das was in Softwareprojekten durch <a href="http://de.wikipedia.org/wiki/Versionsverwaltung">Versionsverwaltung</a> unterstützt wird. Außerdem mangelt es häufig &#8211; wie bei Software &#8211; an guter Dokumentation. </p>
<p>Insgesamt dürfen Daten nicht nur als Endprodukt gesehen werden. Es reicht nicht, Daten zu öffnen (auch wenn das der erste Schritt ist), sondern es muss sich auch die Erstellung, Pflege und Weiterverarbeitung der Daten öffnen.</p>
<p>Ich kann Net nur Recht geben und darauf hinweisen, dass die von ihm angesprochenen Punkte eigentlich eine Frage des Qualitätsmanagement sind. Sowohl bei Software als auch bei Daten sieht es jedoch oft sehr schlecht aus, wenn man mal schaut, wie sie entstehen und gewartet werden &#8211; wenn sie überhaupt gewartet werden anstatt vor sich <a href="http://en.wikipedia.org/wiki/Software_rot">hinzurotten</a>. Open Source ist unter Anderem deshalb oft kommerziellen Produkten überlegen, weil offene Systeme nicht so einfach ihren Dreck unter den Teppich kehren können. Kein Wunder, dass viele Produzenten von Daten davor zurückschrecken, ihre Daten freizugeben: Dann wäre ja sichtbar, wie schlecht die Daten tatsächlich gepflegt sind!</p>
<p>Aber es gibt auch gute Beispiel und Vorbilder für offene, lebendig Datenbestände: <a href="http://www.openstreetmap.de/">OpenStreetmap</a>, <a href="http://musicbrainz.org/">MusicBrainz</a>, Wikipedia und <a href="http://sourceforge.net/projects/dbpedia/">DBPedia</a> etc. Das <a href="http://www.ckan.net/">Comprehensive Knowledge Archive Network</a> (CKAN) und <a href="http://blog.okfn.org/2010/02/23/introducing-datapkg/">datapkg</a> sind gute Ansätze. In einem Kommentare <a href="http://radar.oreilly.com/2010/03/truly-open-data.html#comment-2376996">beschreibt Gerry Creager</a> wie die Datenqualität in Forschungsprojekten durch einige Regeln verbessert werden konnte. Und Bibliotheksverbünde bieten bereits seit Jahrzehnten Werkzeuge zur gemeinsamen Datenpflege (wenn auch inzwischen etwas veraltet). Wesentlich ist aus meiner Sicht erst einmal die eindeutige Referenzierbarkeit von publizierten Daten (siehe z.B. <a href="http://www.datacite.org/">datacite.org</a>)</p>
<p>Grundsätzlich steht die kollaborative Pflege von Datenbeständen noch in den Anfängen und es gibt noch kein allgemeines <a href="http://www.w3.org/DesignIssues/Diff">Diff/Path für RDF</a>. Ich sehe diese Herausforderungen trotzdem nicht als Grund, den ersten Schritt hinauszuzögern, bis irgendwann ein <a href="http://www.biomedcentral.com/1471-2105/10/S14/S2">Data Publishing Framework</a> etabliert ist. Die Freigabe von Daten als Linked Open Data kann und sollte jetzt geschehen und darauf aufgebaut werden.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2010/04/14/qualitatsssicherung-von-freien-daten/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
