<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Jakoblog &#187; Standards</title>
	<atom:link href="http://jakoblog.de/tag/standards/feed/" rel="self" type="application/rss+xml" />
	<link>http://jakoblog.de</link>
	<description>Das Weblog von Jakob Voß</description>
	<lastBuildDate>Tue, 01 Jun 2010 23:34:55 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Who identifies the identifiers?</title>
		<link>http://jakoblog.de/2009/05/10/who-identifies-the-identifiers/</link>
		<comments>http://jakoblog.de/2009/05/10/who-identifies-the-identifiers/#comments</comments>
		<pubDate>Sun, 10 May 2009 15:39:43 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[Formats]]></category>
		<category><![CDATA[Identifier]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/?p=712</guid>
		<description><![CDATA[A few days ago, after a short discussion on Twitter, Ross Singer posted a couple of open questions about identifiers for data formats on code4lib and other related mailing lists. He outlined the problem that several APIs like Jangle, unAPI, SRU, OpenURL, and OAI-PMH use different  identifiers to specify the format of data that [...]]]></description>
			<content:encoded><![CDATA[<p>A few days ago, after a short discussion on Twitter, Ross Singer <a href="http://www.mail-archive.com/code4lib@listserv.nd.edu/msg05236.html">posted a couple of open questions</a> about <b>identifiers for data formats</b> on code4lib and other related mailing lists. He outlined the problem that several APIs like <a href="http://jangle.org/">Jangle</a>, <a href="http://unapi.info/specs/">unAPI</a>, <a href="http://www.loc.gov/standards/sru/">SRU</a>, <a href="http://alcme.oclc.org/openurl/">OpenURL</a>, and <a href="http://www.openarchives.org/OAI/openarchivesprotocol.html">OAI-PMH</a> use different  identifiers to specify the format of data that is transported (MARC-XML, Dublin Core, MODS, BibTeX etc.). It is remarable that all these APIs are more or less relevant only in the libraries sector while the issue of data formats and its identifiers is also relevant in other areas &#8211; looks like the ivory tower of library standards is still beeing build on.</p>
<p>The problem Ross issued is that there is little coordination and each standard governs its own registry of data format identifiers. An <a href="http://web.archive.org/web/20080115184611/http://unapi.stikipad.com/unapi/show/existing+formats">inofficial registry for unAPI</a> [archive] disappeared (that&#8217;s why I started the discussion), there is a <a href="http://www.loc.gov/standards/sru/resources/schemas.html">registry for SRU</a>, a <a href="http://alcme.oclc.org/openurl/servlet/OAIHandler?verb=ListRecords&#038;metadataPrefix=oai_dc&#038;set=Core:Metadata+Formats">registry for OpenURL</a>, and a <a href="http://jangle.org/vocab/formats#">list for Jangle</a>. In OAI-PMH and unAPI each service hosts its own list of formats, OAI-PMH includes a method to <a href="http://www.openarchives.org/OAI/openarchivesprotocol.html#MetadataNamespaces">map local identifier to global identifiers</a>.</p>
<p>On code4lib several arguments and suggestions where raised which almost provoced me to a rant on library standards in general (everyone want&#8217;s to define but noone likes to implement and reuse. Why do librarians ignore W3C and IETF?). Identifiers for data formats should neither be defined by creators of transport protocols nor do we need yet another über-registry. In my point of view the problem is less technical but more social. Like Douglas Campbell writes in <a href="http://www.dcmipubs.org/ojs/index.php/pubs/article/view/34/16">Identifying the identifiers</a>, one of the rare papers on identifier theory: it&#8217;s not a technology issue but a commitment issue.</p>
<p>First there is a misconception about <b>registries</b> of data format identifiers. You should distinguish <em>descriptive</em> registries that only list identifiers and formats that are defined elsewhere and <em>authoritative</em> registries that define identifiers and formats. Yes: <em>and formats</em>. It makes no sense to define an identifier and say that is stands for data format X if you don&#8217;t provide a specification of format X (either via a schema or via a pointer to a schema). This already implies that the best actor to define a format identifier is the creator of the format itself.</p>
<p>Second local identifiers that depend on context are always problematic. There is a well-established global identifier system called <b>Uniform Resource Identifier</b> (URI) and there is no excuse not to use URIs as identifiers but incapability, dullness, laziness, or ignorance. The same reasons apply if you create a new identifier for a data format that already has one. One good thing about URI is that you can always find out who was responsible for creating a given identifier: You start with the <a href="http://www.iana.org/assignments/uri-schemes.html">URI Scheme</a> and drill down the namespaces and standards. I must admin that this process can be laborious but at least it makes registries of identifiers descriptive for all identifiers but the ones in their own namespace.</p>
<p>Third you must be clear on the <b>definition of a format</b>. For instance the local identifier &#8220;MARC&#8221; does not refer to a format but to many variants (USMARC, UNIMARC, MARC21&#8230;) and encodings (MARCXML/MARC21). This is not unusual if you consider that many formats are specializations of other formats. For instance <a href="http://en.wikipedia.org/wiki/Atom_(standard)">ATOM</a> (defined by RFC4287 and RFC5023, identified either its <a href="http://en.wikipedia.org/wiki/Internet_media_type">Mime Type</a> &#8220;application/atom+xml&#8221; which can could expressed as URI http://www.iana.org/assignments/media-types/application/atom%2Bxml or by its XML Namespace &#8220;http://www.w3.org/2005/Atom&#8221;)* is extended from XML (specified in <a href="http://www.w3.org/TR/xml">http://www.w3.org/TR/xml</a> [XML 1.0] and <a href="http://www.w3.org/TR/xml11">http://www.w3.org/TR/xml11</a> [XML 1.1], identified by this URLs or by the Mime Type &#8220;application/xml&#8221; which is URI http://www.iana.org/assignments/media-types/application/xml)*.</p>
<p>The problem of identifying the right identifiers for data formats can be reduced to two fundamental rules of thumb:</p>
<p>1. <b>reuse</b>: don&#8217;t create new identifiers for things that already have one.</p>
<p>2. <b>document</b>: if you have to create an identifier describe its referent as open, clear, and detailled as possible to make it reusable.</p>
<p>If there happen to exist multiple identifiers for one thing, choose the one that is documented and adopted best. There will always be multiple identifiers for the same thing &#8211; don&#8217;t make it worse.</p>
<p>*Footnote: The identification of Internet Media Types with URIs that start with <a href="http://www.iana.org/assignments/media-types/">http://www.iana.org/assignments/media-types/</a> is neither widely used nor documented well but it&#8217;s the most official URI form that I could find. If for a particular format there is a better identifier &#8211; like an XML or RDF namespace &#8211; then you should use that, but if there is nothing but a Mime Type then there is no reason to create a new URI on your own.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2009/05/10/who-identifies-the-identifiers/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Jangle-API für Bibliothekssysteme</title>
		<link>http://jakoblog.de/2008/07/10/jangle-api-fuer-bibliothekssysteme/</link>
		<comments>http://jakoblog.de/2008/07/10/jangle-api-fuer-bibliothekssysteme/#comments</comments>
		<pubDate>Thu, 10 Jul 2008 13:00:26 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[digital library]]></category>
		<category><![CDATA[Jangle]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2008/07/10/jangle-api-fuer-bibliothekssysteme/</guid>
		<description><![CDATA[Im VuFind-Projekt wird überlegt, Jangle als allgemeine Schnittstelle für Bibliothekssysteme zu verwenden, anstatt für jedes System die Anbindung neu anzupassen. Jangle wird von Ross Singer (Talis) vorangetrieben und steht anscheinend sowohl in Konkurrenz als auch in Kooperation mit der DLF working group on digital library APIs. Ob Jangle etwas wird und ob es sich durchsetzt, [...]]]></description>
			<content:encoded><![CDATA[<p>Im <a href="http://www.vufind.org/">VuFind-Projekt</a> wird überlegt, <a href="http://www.jangle.org/">Jangle</a> als allgemeine Schnittstelle für Bibliothekssysteme zu verwenden, anstatt für jedes System die Anbindung neu anzupassen. Jangle wird von Ross Singer (Talis) <a href="http://blogs.talis.com/panlibus/archives/2008/05/the-iron-fist-of-interoperability.php">vorangetrieben</a> und steht anscheinend sowohl in Konkurrenz als auch in Kooperation mit der <a href="http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/">DLF working group on digital library APIs</a>. Ob Jangle etwas wird und ob es sich durchsetzt, ist noch offen &#8211; zumindest ist mehr technischer Sachverstand dabei als bei anderen bibliothekarischen Standards.</p>
<p>Ich halte es zumindest für wichtig, in etwa auf dem Laufenden zu sein und bei Bedarf zu versuchen, Einfluss zu nehmen, falls die Entwicklung völlig an den eigenen Bedürfnissen vorbeigeht. So ganz verstanden habe ich Jangle allerdings bisher noch nicht. Statt eine neue Gesamt-API zu entwickeln, sollte meiner Meinung nach besser bei den <a href="http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/">existierenden Schnittstellen</a> aufgeräumt werden &#8211; anschließend können diese dann ja in Jangle o.Ä. zusammengefasst werden.</p>
<p>Larry stellt <a href="http://nodalib.wordpress.com/2008/06/05/jangle-vs-primo/">Jangle und Primo</a> gegenüber: auf der einen Seite der systematische OpenSource-Ansatz, in den man sich erstmal einarbeiten muss und der dafür insgesamt effizienter und flexibler ist und auf der anderen Seite das teure, unflexible Gesamtprodukt, das dafür schick aussieht. Leider geht es bei den Entscheidungsträgern meist primär um die Fassade, so dass sich OpenSource nur langsam (aber sicher) durchsetzt.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2008/07/10/jangle-api-fuer-bibliothekssysteme/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Working group on digital library APIs and possible outcomes</title>
		<link>http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/</link>
		<comments>http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/#comments</comments>
		<pubDate>Sun, 13 Apr 2008 12:48:50 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[ATOM]]></category>
		<category><![CDATA[digital library]]></category>
		<category><![CDATA[OAI]]></category>
		<category><![CDATA[Seealso]]></category>
		<category><![CDATA[SOA]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/</guid>
		<description><![CDATA[Last year the Digital Library Federation (DLF) formed the &#8220;ILS Discovery Interface Task Force&#8220;, a working group on APIs for digital libraries. See their agenda and the current draft recommendation (February, 15th) for details [via Panlibus]. I&#8217;d like to shortly comment on the essential functions they agreed on at a meeting with major library system [...]]]></description>
			<content:encoded><![CDATA[<p>Last year the <a href="http://www.diglib.org/">Digital Library Federation</a> (DLF) formed the &#8220;<a href="http://blogs.lib.berkeley.edu/shimenawa.php/2008/04/04/ils_basic_discovery">ILS Discovery Interface Task Force</a>&#8220;, a working group on <a href="http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/">APIs for digital libraries</a>. See <a href="https://project.library.upenn.edu/confluence/display/ilsapi/Charge+and+Agenda">their agenda</a> and the <a href="https://project.library.upenn.edu/confluence/display/ilsapi/Draft+Recommendation">current draft recommendation</a> (February, 15th) for details [<a href="http://blogs.talis.com/panlibus/archives/2008/04/ils-vendors-support-berkeley-accord-on-apis.php">via Panlibus</a>]. I&#8217;d like to shortly comment on the essential functions they agreed on at a meeting with major library system (ILS) vendors. <a href="http://dltj.org/article/dlf-ils-statement/">Peter Murray summarized</a> the functions as &#8220;automated interfaces for offloading records from the ILS, a mechanism for determining the availability of an item, and a scheme for creating persistent links to records.&#8221;</p>
<p>On the one hand I welcome if vendors try to agree on (open) standards and service oriented architecture. On the other hand the working group is yet another top-down effort to discuss things that just have to be implemented based on existing Internet standards.</p>
<p><b>1. Harvesting</b>: In the library world this is mainly done via <a href="http://www.openarchives.org/OAI/openarchivesprotocol.html">OAI-PMH</a>. I&#8217;d also consider <a href="http://en.wikipedia.org/wiki/RSS">RSS</a> and  <a href="http://atompub.org/rfc4287.html">Atom</a>. To fetch single records, there is <a href="http://unapi.info/">unAPI</a> &#8211; which the DLF group does not mention. There is no need for <em>any</em> other harvesting API &#8211; missing features (if any) should be integrated into extensions and/or next versions of OAI-PMH and ATOM instead of inventing something new. P.S: <a href="http://www.jasonkolb.com/weblog/2009/09/why-google-wave-is-the-coolest-thing-since-sliced-bread.html">Google Wave</a> shows what to expect in the next years.</p>
<p><b>2. Search</b>: There is still good old overblown Z39.50. The near future is (slightly overblown) <a href="http://www.loc.gov/standards/sru/">SRU/SRW</a> and (simple) <a href="http://www.opensearch.org/">OpenSearch</a>. There is no need for discussion but for open implementations of SRU (I am still waiting for a full client implementation in Perl). I suppose that next generation search interfaces will be based on SPARQL or other RDF-stuff.</p>
<p><b>2. Availability</b>: The <a href="http://blogs.lib.berkeley.edu/shimenawa.php/2008/04/04/ils_basic_discovery">announcement</a> says: &#8220;This functionality will be implemented through a simple REST interface to be specified by the ILS-DI task group&#8221;. Yes, there is definitely a need (in december I <a href="http://jakoblog.de/2007/12/23/heidelberger-katalog-auf-dem-weg-zu-serviceorientierter-architektur/">wrote about such an API</a> in German). However the main point is not the API but to define what &#8220;availability&#8221; means. Please focus on this. P.S: <a href="http://purl.org/NET/DAIA">DAIA</a> is now available.</p>
<p><b>3. Linking:</b> For &#8220;Linking in a stable manner to any item in an OPAC in a way that allows services to be invoked on it&#8221; (announcement) there is no need to create new APIs. Add and propagate clean URIs for your items and point to your APIs via autodiscovery (HTML link element). That&#8217;s all. Really. To query and distribute general links for a given identifier, I created <a href="http://www.gbv.de/wikis/cls/SeeAlso_Simple_Specification">the SeeAlso API</a> which is used more and more in our libraries.</p>
<p>Furthermore the draft contains a section on &#8220;<a href="https://project.library.upenn.edu/confluence/display/ilsapi/Patron+Functionality">Patron functionality</a>&#8221; which is going to be based on <a href="http://www.niso.org/committees/committee_at.html">NCIP</a> and <a href="http://multimedia.mmm.com/mws/mediawebserver.dyn?6666660Zjcf6lVs6EVs66S0LeCOrrrrQ-">SIP2</a>. Both are dead ends in my point of view. You should better look at projects <em>outside the library world</em> and try to define schemas/ontologies for patrons and patron data (hint: patrons are also called &#8220;customer&#8221; and &#8220;user&#8221;). Again: the API itself is not underdefined &#8211; it&#8217;s the data which we need to agree on.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Pseudo-URIs als Identifikatoren für Normdaten der Deutschen Nationalbibliothek</title>
		<link>http://jakoblog.de/2008/04/07/pseudo-uris-als-identifikatoren-fuer-normdaten-der-deutschen-nationalbibliothek/</link>
		<comments>http://jakoblog.de/2008/04/07/pseudo-uris-als-identifikatoren-fuer-normdaten-der-deutschen-nationalbibliothek/#comments</comments>
		<pubDate>Mon, 07 Apr 2008 01:31:03 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Bibliothek]]></category>
		<category><![CDATA[dnb]]></category>
		<category><![CDATA[Identifier]]></category>
		<category><![CDATA[Katalog]]></category>
		<category><![CDATA[Semantic Web]]></category>
		<category><![CDATA[Standards]]></category>
		<category><![CDATA[URI]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2008/04/07/pseudo-uris-als-identifikatoren-fuer-normdaten-der-deutschen-nationalbibliothek/</guid>
		<description><![CDATA[Die Deutsche Nationalbibliothek (DNB) hat anscheinend Ende März eine neue Katalog-Oberfläche online gestellt &#8211; der alte OPAC ist auch noch verfügbar. Dabei sind unter Anderem die Normdaten (SWD, GKD, PND) teilweise besser integriert. Ich warte ja schon seit einiger Zeit darauf, dass endlich richtige URIs vergeben werden, so dass sich Normdaten global referenzieren lassen. Bei [...]]]></description>
			<content:encoded><![CDATA[<p>Die Deutsche Nationalbibliothek (DNB) hat anscheinend Ende März eine <a href="https://portal.d-nb.de/opac.htm?method=showSearchForm#top">neue Katalog-Oberfläche</a> online gestellt &#8211; der alte OPAC <a href="http://dispatch.opac.d-nb.de/DB=4.1/">ist auch noch verfügbar</a>. Dabei sind unter Anderem die Normdaten (SWD, GKD, PND) teilweise besser integriert. Ich warte ja schon seit einiger Zeit darauf, dass endlich richtige <a href="http://de.wikipedia.org/wiki/URI">URIs</a> vergeben werden, so dass sich Normdaten global referenzieren lassen. Bei der aktuellen Lösung ist aber leider einiges schiefgelaufen.</p>
<p><strong>Was ist eine URI?</strong><br /> Die <a href="http://www.ub.uni-dortmund.de/listen/inetbib/msg36139.html">Diskussion zum Thema URI/URN/URL auf Inetbib</a> hat mal wieder gezeigt, dass es beim Thema Identifikatoren oft Missverständnisse gibt. Die international allgemeine Form globaler Identifikatoren ist der &#8220;Uniform Resource Identifier&#8221; (URI) bzw. die Erweiterung &#8220;Internationalized Resource Identifier&#8221; (IRI). Sie sind in <a href="http://tools.ietf.org/html/rfc3986">RFC 3986</a> und <a href="http://tools.ietf.org/html/rfc3987">RFC 3987</a> standardisiert. Die Vergabe von UR regelt <a href="http://tools.ietf.org/html/rfc4395">RFC 4395</a>. Verschiedene URI-Schemata (gekennzeichnet durch den Teil einer URI bis zum ersten Doppelpunkt) sind jeweils mit einem eigenen Standard registriert und definiert, zum Beispiel URNs durch <a href="http://tools.ietf.org/html/rfc2141">RFC 2141</a>.</p>
<p>Viele URI-Schemata legen Namensräume und eigene Regeln zur Struktur und Vergabe von Identifikatoren fest. So zum Beispiel <a href="http://tools.ietf.org/html/rfc3406">RFC 3406</a> für URNs und <a href="http://tools.ietf.org/html/rfc3044">RFC 3044</a> für den URN-Namensraum <tt>urn:issn</tt> zur Abbildung von <a href="http://de.wikipedia.org/wiki/ISSN">ISSNs</a>. Durch die Formulierung von ISSNs als URI können diese bereits etablierten aber nur begrenzt nutzbaren Identifikatoren auch global genutzt werden, beispielsweise im Rahmen des Semantic Web. Während die Zeichenfolge &#8220;0024-9319&#8243; sehr unterschiedliches identifizieren kann, weist &#8220;urn:issn:0024-9319&#8243; eindeutig auf die amerikanische Ausgabe des <a href="http://en.wikipedia.org/wiki/Mad_(magazine)">MAD-Magazins</a> hin.</p>
<p><strong>Um welche Identifikatoren geht es?</strong><br />
Zur Identifikation von Personen (<a href="http://de.wikipedia.org/wiki/Personennamendatei">PND</a>), Begriffen (<a href="http://de.wikipedia.org/wiki/Schlagwortnormdatei">SWD</a>) und Körperschaften (<a href="http://de.wikipedia.org/wiki/Gemeinsame_K%C3%B6rperschaftsdatei">GKD</a>) gibt es im deutschen Bibliothekssystem seit vielen Jahren etablierte Normdaten. Abgesehen von <a href="http://de.wikipedia.org/wiki/Hilfe:PND">wenigen Ausnahmen</a> fristen diese Normdaten bzw. ihre Identifikatoren jedoch eher ein Schattendasein. Andere Identifikatoren, wie beispielsweise die Nummern von OCLC und der Library of Congress werden dagegen auch zunehmend von den &#8220;global players&#8221; im Netz verwendet (von <a href="http://code.google.com/apis/books/getting-started.html">Google</a> und <a href="http://www.librarything.com/thingology/2008/02/thingisbn-adds-lccns-oclc-numbers.php">LibrayThing</a>). Wenn sie endlich mit URIs versehen und frei veröffentlicht würden, könnten die deutschen Normdateien ebenfalls weitere Verbreitung finden &#8211; oder andernfalls an Bedeutung verlieren.</p>
<p><strong>Was hat die DNB falsch gemacht?</strong> <br />
Anscheinend ist nun bei der Erstellung von Identifikatoren für Normdaten bei der Deutschen Nationalbibliothek gleich an mehreren Stellen etwas schief gelaufen. Dabei sieht es auf den ersten Blick ganz gut aus: <a href="https://portal.d-nb.de/resolver.htm?identifier=info://d-nb.de/965692973">Beim SWD-Eintrag  &#8220;Poetry Slam&#8221;</a> ist beispielsweise dort als &#8220;Id&#8221; die Zeichenkette &#8220;<tt>info://d-nb.de/965692973</tt>&#8221; angegeben:</p>
<p><img src='http://jakoblog.de/wp-content/uploads/2008/04/dnb-uri-failure.png' /></p>
<p>Ist das eine URI? Nein. In der <a href="http://www.iana.org/assignments/uri-schemes.html">offiziellen Liste von URI-Schemata</a> ist &#8220;info:&#8221; als gültiges URI-Schema eingetragen, das durch <a href="http://tools.ietf.org/html/rfc4452">RFC 4452</a> definiert wird. Die dort festgelegte Maintenance Authority <a href="http://www.niso.org/">NISO</a> hat die Verwaltung von Namensräumen an OCLC weitergegeben. Nun bekleckert sich OCLC mit dem seit Wochen nicht erreichbaren <a href="http://info-uri.info/registry">Verzeichnis der vergebenen Unternamensräume</a> auch nicht gerade mit Ruhm, aber immerhin gibt es klare Standards (mehr <a href="http://www.loc.gov/standards/uri/info.html">Informationen bei der LOC</a>). Eine info-URI ist aufgebaut nach dem Schema &#8220;<tt>info:NAMENSRAUM/LOKALTEIL</tt>&#8220;. Die Zeichenkette &#8220;info://d-nb.de/965692973&#8243; kann also schon formal keine URI sein. Außerdem ist &#8220;d-nb.de&#8221; nicht als gültiger info-URI Namensraum registriert. Zu allem Überfluss wird nicht auf die etablierten SWD-Nummern zurückgegriffen (die SWD-Nummer für den <a href="http://dispatch.opac.d-nb.de/DB=4.1/PRS=PP%7F/PPN?PPN=965692973">SWD-Datensatz</a> ist &#8220;4709615-9&#8243;), sondern als lokaler Bestandteil die nicht standardisierte, systemabhängige PND-Nummer (hier: 965692973) verwendet!</p>
<p><strong>Wie lässt sich der Schlamassel beheben?</strong> <br />
Leider ist dies nicht das erste mal, dass sich die DNB im Internet lächerlich macht. Zum Glück lassen sich die Fehler relativ einfach beheben.</p>
<p>1. Die bereits existierenden &#8220;Standards&#8221; für die existierenden Normdaten-Nummern werden explizit und verlässlich festgeschrieben, d.h. erlaubte Zeichen und Wertebereiche, Berechnung der Prüfziffer und Normalisierung (siehe <a href="http://www.loc.gov/marc/lccn-namespace.html#normalization">LCCN-Normalisierung</a>).</p>
<p>2. Die DNB reserviert für die Normdaten-Nummern einen URI-Namensraum (beispielsweise info:swd, info:pnd, info:gkd). Dabei sind die Regeln zur Syntax und Vergabe von URI-Schemata und Namensräumen einzuhalten. Internationale Standards sind zum Lesen und Einhalten da und nicht zum Ignorieren und Uminterpretieren.</p>
<p>3. Die URIs werden verständlich dokumentiert und propagiert. Die Kür wäre eine völlige Freigabe der Normdaten als öffentlicher Datenbank-Abzug unter einer freien Lizenz.</p>
<p>Zur Klärung der Konfusion bezüglich URI und URL sei auf die Artikel <a href="http://www.w3.org/TR/uri-clarification/">URIs, URLs, and URNs: Clarifications and Recommendations</a> (via Kay Heiligenhaus) und <a href="http://www.w3.org/2001/tag/doc/alternatives-discovery.html">On Linking Alternative Representations To Enable Discovery And Publishing</a> hingewiesen.</p>
<p>P.S: Eine bibliotheksrelevante Anwendung von von Identifikatoren für Personen wurde letzte Woche von Arjan Hogenaar and Wilko Steinhoff im Vortrag <a href="http://pubs.or08.ecs.soton.ac.uk/12/">Towards a Dutch Academic Information Domain</a> auf der <a href="http://or08.ecs.soton.ac.uk/">Open Repositories 2008</a> vorgestellt. </p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2008/04/07/pseudo-uris-als-identifikatoren-fuer-normdaten-der-deutschen-nationalbibliothek/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Freies Linux-Handy Neo 1973 mit OpenMoko</title>
		<link>http://jakoblog.de/2008/03/12/freies-linux-handy-neo-1973-mit-openmoko/</link>
		<comments>http://jakoblog.de/2008/03/12/freies-linux-handy-neo-1973-mit-openmoko/#comments</comments>
		<pubDate>Wed, 12 Mar 2008 11:13:05 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Handy]]></category>
		<category><![CDATA[Open Source]]></category>
		<category><![CDATA[OpenMoko]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2008/03/12/freies-linux-handy-neo-1973-mit-openmoko/</guid>
		<description><![CDATA[Angesichts der Verzögerung beim ersten freien Handys &#8220;Neo 1973&#8243; von OpenMoko (siehe OpenMoko-Wiki und Fotos) hatte ich die Hoffnung auf ein Linux-Handy schon aufgegeben und war kurz davor, mir ein normalen Mobiltelefon zu kaufen. Seit Wochen bin ich deshalb auf der Suche nach einem einfachen Handy, dass auch als MP3-Player verwendet werden kann (gerne auch [...]]]></description>
			<content:encoded><![CDATA[<p>Angesichts der Verzögerung beim ersten freien Handys &#8220;Neo 1973&#8243; von <a href="http://www.openmoko.com/">OpenMoko</a> (siehe <a href="http://wiki.openmoko.org/wiki/Main_Page/de">OpenMoko-Wiki</a> und <a href="http://www.flickr.com/search/?q=openmoko">Fotos</a>) hatte ich die Hoffnung auf ein Linux-Handy schon aufgegeben und war kurz davor, mir ein normalen Mobiltelefon zu kaufen. Seit Wochen bin ich deshalb auf der Suche nach einem einfachen Handy, dass auch als MP3-Player verwendet werden kann (gerne auch Videos) und über einen Standard-Klinkenstecker für Audio (!) und einen (micro-)USB Anschluss zum Aufladen (!) verfügt. Der Speicher für MP3s, Videos und beliebige andere Dateien soll ohne irgendwelche Spezialsoftware per USB zugänglich sein, so dass sich dass Handy mit einem stinknormalen USB-Kabel auch als USB-Stick verwenden lässt. Außerdem sollte wenigstens das Adressbuch unter Linux synchronisierbar sein. Anscheinend ist das zuviel verlangt, denn proprietäre Spezialkabel, Aufladegeräte und Synchronisierungssoftware sind der Normalfall. Wie ignorant die Hersteller in diesem Punkt sind, zeigt die Recherchemöglichkeit nach praktisch allen Eigenschaften der Geräte &#8211; außer den von mir geforderten! Ich verlange ja nicht, dass alles Open Source sein muss, aber <a href="http://de.wikipedia.org/wiki/Offener_Standard">offene Standards</a> sollten schon sein. </p>
<p>Gestern hat OpenMoko die CAD-Baupläne des Neo 1973 unter der <a href="http://creativecommons.org/licenses/by-sa/3.0/deed.de">CC BY-SA Lizenz</a> freigegeben &#8211; neben der Software ist also auch das Gehäusedesign frei veränderbar. Die für den Massenmarkt geplante, überarbeitete &#8220;Neo FreeRunner&#8221; soll noch im &#8220;<s>Frühjahr</s> Frühsommer 2008&#8243; verfügbar sein &#8211; ich schätze mal, dass heisst dann frühestens im August.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2008/03/12/freies-linux-handy-neo-1973-mit-openmoko/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Aktuelle Projekte und Formate zu Strukturdaten</title>
		<link>http://jakoblog.de/2008/02/18/aktuelle-projekte-und-formate-zu-strukturdaten/</link>
		<comments>http://jakoblog.de/2008/02/18/aktuelle-projekte-und-formate-zu-strukturdaten/#comments</comments>
		<pubDate>Mon, 18 Feb 2008 17:04:43 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Archivierung]]></category>
		<category><![CDATA[Erschließung]]></category>
		<category><![CDATA[Informationsarchitektur]]></category>
		<category><![CDATA[Metadata]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2008/02/18/aktuelle-projekte-und-formate-zu-strukturdaten/</guid>
		<description><![CDATA[Mit zunächst ZVDD und nun TextGrid gibt es im deutschen Sprachraum mindestens ein größeres bibliothekarisches DFG-Projekt, dass sich auch der Erschließung von Dokumenten unterhalb der bibliographischen Ebene annimmt. Inzwischen werden im bibliothekarischen Umfeld diese Erschließungsdaten wie zum Beispiel Kapitelgliederung und Paginierung als &#8220;Strukturdaten&#8221; bezeichnet (wie es im Englischsprachigen Umfeld aussieht, weiß ich nicht). Standardformate zur [...]]]></description>
			<content:encoded><![CDATA[<p>Mit zunächst <a href="http://www.zvdd.de/dokumentation.html#strukturdaten">ZVDD</a> und nun <a href="http://www.textgrid.de">TextGrid</a> gibt es im deutschen Sprachraum mindestens ein größeres bibliothekarisches DFG-Projekt, dass sich auch der Erschließung von Dokumenten unterhalb der bibliographischen Ebene annimmt. Inzwischen werden im bibliothekarischen Umfeld diese Erschließungsdaten wie zum Beispiel Kapitelgliederung und Paginierung als &#8220;Strukturdaten&#8221; bezeichnet (wie es im Englischsprachigen Umfeld aussieht, weiß ich nicht). Standardformate zur Kodierung von Stukturdaten sind der <a href="http://www.loc.gov/standards/mets">Metadata Encoding and Transmission Standard</a> (METS) und das Format der <a href="http://www.tei-c.org/">Text Encoding Initiative</a> (TEI). Der vor kurzem in einer ersten Version veröffentlichte <a href="http://dfg-viewer.de/">DFG-Viewer</a> basiert auf Strukturdaten im MODS-Format, bislang werden allerdings noch keine Inhaltsverzeichnisses unterstützt. Bislang werden Strukturdaten vor allem im Rahme der Digitalisierung und Archivierung eingesetzt. Ein Beispiel zur Archivierung ist die <a href="http://edoc.hu-berlin.de/diml/">Dissertation Markup Language</a> (DiML) &#8211; als ich als HiWi daran gesessen habe, hat das allerdings noch niemand ein Strukturdatenformat genannt. Ein weiteres Format, das zur Speicherung von Strukturdaten eingesetzt werden kann ist <a href="http://de.wikipedia.org/wiki/OpenDocument">OpenDocument</a> (ODF). Mit der nächsten Version dürfte ODF noch interessanter werden &#8211; derzeit sitzt <a href="http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office-metadata">eine Arbeitsgruppe</a> daran, die Einbindung von Metadaten in ODF-Dokumenten auszubauen &#8211; wer sich mit Strukturdaten beschäftigt, sollte sich das <a href="http://www.oasis-open.org/committees/documents.php?wg_abbrev=office-metadata">aktuelle Proposals</a> anschauen &#8211; wie man dort sieht, geht alles in Richtung RDF. Wann welches Format vorzuziehen ist bzw. ob und wie ODF beispielsweise TEI verdrängt oder in welchem Kontext die existierenden Formate nebeneinander existieren werden, bleibt abzuwarten.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2008/02/18/aktuelle-projekte-und-formate-zu-strukturdaten/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Relevant APIs for (digital) libraries</title>
		<link>http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/</link>
		<comments>http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/#comments</comments>
		<pubDate>Fri, 30 Nov 2007 13:50:11 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[ATOM]]></category>
		<category><![CDATA[COinS]]></category>
		<category><![CDATA[Identity Management]]></category>
		<category><![CDATA[Microformats]]></category>
		<category><![CDATA[OAI]]></category>
		<category><![CDATA[OpenId]]></category>
		<category><![CDATA[Shibboleth]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/</guid>
		<description><![CDATA[My current impression of OCLC/WorldCat Service Grid is still far to abstract &#8211; instead of creating a framework, we (libraries and library associations) should agree upon some open protocols and (metadata) formats. To start with, here is a list of relevant, existing open standard APIs from my point of view:
Search: SRU/SRW (including CQL), OpenSearch, Z39.50
Harvest/Syndicate: [...]]]></description>
			<content:encoded><![CDATA[<p>My current impression of OCLC/WorldCat Service Grid is still far to abstract &#8211; instead of creating a framework, we (libraries and library associations) should agree upon some open protocols and (metadata) formats. To start with, here is a list of relevant, existing open standard APIs from my point of view:</p>
<p><b>Search:</b> <a href="http://www.loc.gov/standards/sru/">SRU/SRW</a> (including <a href="http://www.loc.gov/standards/sru/specs/cql.html">CQL</a>), <a href="http://www.opensearch.org">OpenSearch</a>, <a href="http://www.loc.gov/z3950/agency/">Z39.50</a></p>
<p><b>Harvest/Syndicate:</b> <a href="http://www.openarchives.org/OAI/openarchivesprotocol.html">OAI-PMH</a>, <a href="http://en.wikipedia.org/wiki/RSS">RSS</a>, <a href="http://atompub.org/rfc4287.html">Atom Syndication</a> (also with <a href="http://www.intertwingly.net/wiki/pie/#head-656bcfe284e2da39c77d4fdab55b16ad3c654719">ATOM Extensions</a>)</p>
<p><b>Copy/Provide:</b> <a href="http://unapi.info">unAPI</a>, <a href="http://ocoins.info">COinS</a>, <a href="http://microformats.org">Microformats</a> (<small>not a real API but a way to provide data</small>)</p>
<p><b>Upload/Edit:</b> <a href="http://www.loc.gov/standards/sru/record-update/">SRU Update</a>, <a href="http://www.ibm.com/developerworks/library/x-atompp1/">Atom Publishing Protocol</a></p>
<p><b>Identity Management:</b> <a href="http://shibboleth.internet2.edu/">Shibboleth</a> (and other <a href="http://en.wikipedia.org/wiki/SAML">SAML</a>-based protocols), <a href="http://www.openid.net/">OpenID</a> (see also <a href="http://osis.netmesh.org/">OSIS</a>)</p>
<p>For more complex applications, additional (REST)-APIs and common metadata standards need to be found (or defined) &#8211; but only if the application is just another kind of search, harvest/syndicate, copy/provide, upload/edit, or Identity Management.</p>
<p><strong>P.S:</strong> I forgot <a href="http://ncip.envisionware.com/">NCIP</a>, a &#8220;standard for the exchange of circulation data&#8221;. Frankly I don&#8217;t fully understand the meaning and importance of &#8220;circulation data&#8221; and the standard looks more complex then needed. More on APIs for libraries can be found <a href="http://worldcat.org/devnet/">in WorldCat Developer Network</a>, in <a href="http://www.jangle.org/">the Jangle project</a> and a <a href="http://jakoblog.de/2008/04/13/working-group-on-digital-library-apis-and-possible-outcomes/">DLF Working group on digital library APIs</a>. For staying in the limited world if libraries, this may suffice, but on the web simplicity and availability of implementations matters &#8211; that&#8217;s why I am working on the <a href="http://www.gbv.de/wikis/cls/SeeAlso_Simple_Specification">SeeAlso linkserver protocol</a> and now at a simple API to query availaibility information (more in August/September 2008).</p>
<p><strong>P.P.S:</strong> A more detailed <a href="http://techessence.info/apis">list of concrete library-related APIs</a> was published by Roy Tennant based on <a href="http://tinyurl.com/59hop2">a list by Owen Stephens</a>.</p>
<p><strong>P.P.S:</strong> And <a href="http://stephenslighthouse.sirsidynix.com/archives/2009/09/apis_and_librar.html">another list by Stephen Abram</a> (SirsiDynix) from September 1st, 2009</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2007/11/30/relevant-apis-for-digital-libraries/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Von ISBD zum Web 2.0 mit Mikroformaten</title>
		<link>http://jakoblog.de/2007/07/26/von-isbd-zum-web-20-mit-mikroformaten/</link>
		<comments>http://jakoblog.de/2007/07/26/von-isbd-zum-web-20-mit-mikroformaten/#comments</comments>
		<pubDate>Thu, 26 Jul 2007 12:18:04 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Bibliothek]]></category>
		<category><![CDATA[ISBD]]></category>
		<category><![CDATA[Microformats]]></category>
		<category><![CDATA[Semantic Web]]></category>
		<category><![CDATA[Standards]]></category>
		<category><![CDATA[Web 2.0]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2007/07/26/von-isbd-zum-web-20-mit-mikroformaten/</guid>
		<description><![CDATA[Den folgenden Beitrag habe ich bereits in ähnlicher Form in INETBIB gepostet. Um ihn in die Blogosphäre einzubinden, poste ich ihn hier nochmal als Blogeintrag.
Um sich nicht im Sommerloch langweilen zu müssen, habe ich hier eine kleine Aufgabe für ISBD-Experten, Bibliothekare und andere Zukunftsinteressierte: Es geht um nicht weniger als die die Entwicklung eines bibliothekarischen [...]]]></description>
			<content:encoded><![CDATA[<p><em>Den folgenden Beitrag habe ich bereits in ähnlicher Form <a href="http://http://www.ub.uni-dortmund.de/listen/inetbib/msg34114.html">in INETBIB gepostet</a>. Um ihn in die Blogosphäre einzubinden, poste ich ihn hier nochmal als Blogeintrag.</em></p>
<p>Um sich nicht im Sommerloch langweilen zu müssen, habe ich hier eine kleine Aufgabe für ISBD-Experten, Bibliothekare und andere Zukunftsinteressierte: Es geht um nicht weniger als die die Entwicklung eines <a href="http://www.allegro-c.de/formate/formate.htm">bibliothekarischen Datenformates</a>. Da der Beitrag etwas länger ist, hier eine </p>
<p><b>Zusammenfassung</b></p>
<p>1. Im Web sind mehr und mehr Daten direkt und in standardisierten Formaten zur Weiterverarbeitung verfügbar<br />
2. Durchsetzen wird sich am Ende das, was im Browser ohne Plugin unterstützt wird<br />
3. So wie es aussieht, werden dies Mikroformate sein<br />
4. Für Bibliographsche Daten fehlt bislang ein Mikroformat<br />
5. Wenn sich Bibliothekare nicht mit ihrem Sachverstand an der Entwicklung eines solchen Formates beteiligen, tun es andere &#8211; und das nicht unbedingt nach bibliothekarischen Gesichtspunkten.</p>
<p><b>Worum geht es?</b><br />
<span id="more-122"></span></p>
<p>Im Rahmen des &#8220;Web 2.0&#8243;-Hypes tauchen immer wieder Begriffe wie &#8220;Web 3.0&#8243; oder &#8220;Semantic Web&#8221; auf. Damit wird (abgesehen von der Verwendung als Buzzword) auf die folgende wichtige Entwicklung des Webs angespielt: Immer mehr Daten stehen direkt und in standardisierten Formaten zur Weiterverarbeitung zur Verfügung. Einfache Beispiele sind RSS und Dublin Core; auf der anderen Skala der Komplexität stehen Ontologien und RDF. Auch das <a href="http://theseus-programm.de">Millionenprojekt Theseus</a> hat zum Ziel, so genannte &#8220;semantische Technologien&#8221; zu entwickeln.</p>
<p>Ich gehe jede Wette ein, dass in Zukunft mehr und mehr Daten mittels &#8220;Semantischem Markup&#8221; in Webseiten integriert werden &#8211; bislang fehlte es jedoch an einer  &#8220;Killerapplikation&#8221; und noch ist nicht festgelegt, in welcher Form die Daten in Webseiten eingebunden werden. Eine bereits jetzt nutzbare Form für bibliographische Daten ist das auf OpenURL basierende <a href="http://de.wikipedia.org/wiki/COinS">COinS</a> (ContextObjects in Spans). Allgemeinere Formen für verschiedene Arten von Daten sind <a href="http://mikroformate.de">Microformats</a> und <a href="http://rdfa.info/">RDFa</a> (<a href="http://evan.prodromou.name/RDFa_vs_microformats">hier ein Vergleich der beiden</a> und ein Beispiel auf Deutsch <a href="http://www.collidoscope.de/index.php?id=73&#038;tx_ttnews[tt_news]=71&#038;tx_ttnews[year]=2007&#038;tx_ttnews[month]=07&#038;tx_ttnews[day]=23&#038;cHash=8e5a947b12">hier von Carsten  Schulze</a>).</p>
<p>Ob und wo sich Webstandards langfristig durchsetzen, hängt nicht zuletzt davon ab, ob sie standardmäßig von Webbrowsern unterstützt werden &#8211; bislang ist dies an über HTML hinausgehenden Formaten nur für RSS der Fall. Nun ist es so, dass die vorraussichtlich Ende 2007 erscheinende Version 3.0 des Firefox-Webbrowsers <a href="http://bibliothek2.wordpress.com/2007/01/15/firefox-30-furs-web-30-light/">Microformats unterstützen wird</a>. Und Microsoft ist dabei, die Zwischenablage so zu erweitern, dass einzelne <a href=" http://rayozzie.spaces.live.com/blog/cns!FB3017FBB9B2E142!285.entry">Objekte von Webseiten kopiert werden können</a> (auszuprobieren mit <a href="http://www.liveclipboard.org/">Live Clipboard</a>)- die ersten Anwendungen sind die Mikroformate <a href="http://microformats.org/wiki/hcalendar">hCal</a> und <a href="http://microformats.org/wiki/hcard">hCard</a>. Damit ist klar, wohin die Entwicklung geht.</p>
<p><b>Was sind Mikroformate?</b></p>
<p>Mit Mikroformaten können Webseiten so durch Markup angereichert werden, dass ihre Inhalte möglichst detailliert auch für Computerprogramme verarbeitbar sind (dazu gibt es eine <a href="http://mikroformate.de/grundlagen/s5/">gute Einführung</a>). Hier als Beispiel meine Dienstanschrift:</p>
<p>So kann es ein Mensch verstehen:</p>
<pre>Verbundzentrale des GBV
Jakob Voß
Platz der Goettinger Sieben 1
37073 Göttingen
+49 (0)551 39-10242
jakob.voss@gbv.de</pre>
<p>Und so muss es in HTML als vcard-Microformat angegeben sein, damit es auch Computer verstehen (erstellt mit dem <a href="http://bueltge.de/hcard/">Generator für hCard</a>:</p>
<pre>
&lt;div class="vcard"&gt;
 &lt;div class="org"&gt;Verbundzentrale des GBV&lt;/div&gt;
 &lt;span class="fn"&gt;Jakob Voß&lt;/span&gt;
 &lt;div class="adr" class="work"&gt;
   &lt;div class="street-address"&gt;Platz der Goettinger Sieben 1&lt;/div&gt;
     &lt;span class="postal-code"&gt;37073&lt;/span&gt;
     &lt;span class="locality"&gt;Göttingen&lt;/span&gt;
 &lt;/div&gt;
 &lt;div class="tel"&gt;+49 (0)551 39-10242&lt;/div&gt;
 &lt;div class="email"&gt;
     &lt;a href="mailto:jakob.voss@gbv.de"; class="email" &gt;jakob.voss@gbv.de&lt;/a&gt;
 &lt;/div&gt;
&lt;/div&gt;
</pre>
<p>Derzeit gibt es eine Reihe von etablierten Mikroformaten und weitere sind in Entwicklung. Die Dokumentation und Diskussion findet <a href="http://microformats.org/wiki/ ">offen in einem Wiki</a> statt. Eine Einführung in Mikroformate bietet auch das Buch &#8220;Microformats: Empowering Your Markup for Web 2.0&#8243; und ein weiteres <a href="http://www.oreilly.de/catalog/pdf_microformatsger/toc.html">eBook auf deutsch</a>. </p>
<p><b>Was hat das alles mit Bibliotheken zu tun?</b></p>
<p>Derzeit gibt es noch kein einheitliches Microformat für bibliographische Angaben &#8211; allerdings schon <a href="http://microformats.org/wiki/citation">einige Ansätze</a>. Es ist zwar alles andere als trivial, ein bibliographisches Datenformat zu entwickeln, aber das Web funktioniert pragmatisch &#8211; ich gehe davon aus, dass sich ein citation-Microformat durchsetzen wird, sobald jemand einen Standard dafür festlegt und umsetzt. Dabei kommt es <em>nicht</em> darauf an, wie gut dieser Standard ist, sondern dass er gut dokumentiert, verfügbar und benutzbar ist und dass er von einer kritischen Masse von Anbietern verwendet wird (siehe dazu VHS vs. Betamax und Video 2000).</p>
<p>Nun können wir als bibliothekarisches Fachpersonal a) entweder abwarten, bis sich der citation-Microformat-Standard stabilisiert hat und danach darüber wundern, dass er aus bibliothekarischer Sicht an der einen oder anderen Stelle völlig unzureichend ist oder b) uns aktiv an der <a href="http://microformats.org/wiki/citation">Entwicklung des citation-Microformat-Standards beteiligen</a> und ihre bibliothekarische Sachkompetenz einfließen lassen.</p>
<p><b>Und hier kommt ISBD ins Spiel!</b></p>
<p>Ich möchte zunächst betonen, dass die der Katalogisierung, Ansetzung und dem Aufbau von Titelanzeigen nicht mein Fachgebiet sind. Soweit ich das Konzept der <a href="http://en.wikipedia.org/wiki/International_Standard_Bibliographic_Description">International Standard Bibliographic Description</a> (ISBD) verstanden habe, legt dieser Standard fest, wie eine Titelaufnahme im Katalog aussehen sollte &#8211; vereinfacht gesagt also die Reihenfolge und Trennzeichen von Autor, Titel, Verlag und all die anderen Datenfelder einer Titelaufnahme. Obgleich viele Kataloge sich nicht streng an ISBD halten ist das Prinzip das gleiche: irgendwo ist festgelegt, welche Titeldaten in welcher Weise formatiert angezeigt werden.</p>
<p>Bei Mikroformaten ist es ganz ähnlich. Nur wird bei einem Mikroformat statt mit Sonderzeichen wie ; &#8211; [..] und , mit HTML-Tags &lt;div&gt; &lt;span&gt; und dem class-Attribut strukturiert.</p>
<p>Die Aufgabe besteht, <a href="http://www.ub.uni-dortmund.de/listen/inetbib/msg33525.html">wie schon von anderer Seite angedeuted</a> also darin, eine Abbildung von ISBD (bzw. der am häufigsten in OPAC-Titelanzeigen verwendeten Untermenge) auf ein Mikroformat zu finden. Hier mal ein naiver Ansatz anhand eines konkreten Beispiels <a href="http://gso.gbv.de/DB=2.1/PPNSET?PPN=526230460&#038;PRS=HOL">der folgenden Titelaufnahme</a> (übrigens Herzlichen Glückwunsch an die Braunschweiger, die als erste GBV-Verbundbibliothek den neuen Harry Potter im Bestand haben <img src='http://jakoblog.de/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
<p>Titel:  Harry Potter and the deathly hallows / Joanne K. Rowling. &#8211; [Children's ed.], 1. ed. &#8211; London : Bloomsbury, 2007<br />
ISBN:   0-7475-9105-9 &#8211; 978-0-7475-9105-4 (Children&#8217;s edition)</p>
<p>Die bedeutungstragenden Bestandteile werden nun hierarchisch ausgezeichnet, ohne den Text selber zu verändern (das geht auch gut mit Papier und verschiedenfarbigen Stiften):</p>
<pre>&lt;div class='hCitation'&gt;
  Titel:
  &lt;span class='title'&gt;Harry Potter and the deathly hallows&lt;/span&gt; /
  &lt;span class='n'&gt;
    &lt;/span&gt;&lt;span class='given-name'&gt;Joanne K.&lt;/span&gt;
    &lt;span class='family-name'&gt;Rowling&lt;/span&gt;
  &lt;/div&gt;. -
  [&lt;span class='edition'&gt;Children's ed.&lt;/span&gt;], &lt;span class='edition-number'&gt;1.&lt;/span&gt; ed. -
  &lt;span class='location'&gt;London&lt;/span&gt; : &lt;span class='publisher-name'&gt;Bloomsbury&lt;/span&gt;,
  &lt;span class='publication-year'&gt;2007&lt;/span&gt;
&lt;/div&gt;
&lt;div&gt;
  ISBN:
  &lt;span class='ISBN'&gt;0-7475-9105-9&lt;/span&gt; -
  &lt;span class='ISBN'&gt;978-0-7475-9105-4&lt;/span&gt;
  (&lt;span class='edition'&gt;Children's edition&lt;/span&gt;)
&lt;/div&gt;</pre>
<p>Dabei muss festgelegt werden, wie fein die Daten aufgespalten werden sollen und wie die einzelnen Elemente mit class=&#8221;&#8230;&#8221; benannt werden. Sicherlich können nicht alle in ISBD vorhandenen Spezialfelder und Sonderregeln berücksichtigt werden, die Anzahl der Felder soll schließlich überschaubar bleiben. Aüßerdem müssen wo möglich, <a href="http://microformats.org/about/">bereits bestehende Microformats</a> und andere Formate berücksichtigt werden &#8211; so sind die Feldbezeichnungen für Namen mit &#8216;n&#8217;, &#8216;given-name&#8217; und<br />
&#8216;familiy-name&#8217; bereits <a href="http://microformats.org/wiki/hcard#Property_List">im hCard-Standard festgelegt</a>, da gibt es also nichts zu ändern.</p>
<p>Was also zu erstellen ist, ist eine genaue Festlegung eines Mikroformats für bibliographische Angaben. Vielleicht kann auch von anderen Standards als ISBD ausgegangen werden (OpenURL, RAK, AACR, MAB, MARC, MODS, BibTeX&#8230;) &#8211; in jedem Fall muss aber die Titelanzeige ausgezeichnet werden, so wie sie der Nutzer im Katalog sieht. Um es nochmal zu betonen: Wenn Firefox und Microsoft sich auf Mikroformate festlegen und diese von Haus aus unterstützen, ist es völlig egal, wie gut Mikroformate sind und ob es Alternativen gibt. </p>
<p>Der traditionelle Weg wäre vermutlich, <a href="http://www.ub.uni-dortmund.de/listen/inetbib/msg34115.html">eine Arbeitsgruppe &#8220;Mikroformate&#8221;</a> mit den entsprechenden Experten einzurichten. Das kann<br />
zwar grundsätzlich nicht schaden, jedoch sollte folgendes bedacht werden: Erstens hätte diese AG sowieso keinerlei Entscheidungsbefugnisse, da die Diskussion offen im Microformate-Wiki stattfindet, wo sich jeder beteiligen kann und zweitens haben wir keine Zeit für langwierige Projektplanungsphasen. Was zählt ist nur das direkt online verfügbare Ergebnis und kein Projektbericht oder Sitzungsprotokoll. Siehe dazu <a href="http://onebiglibrary.net/story/software-simplicity-librarian-corner-case">dieses schöne Posting</a>, das den Konflikt von Bibliothekaren mit solch pragmatischen Lösungen darlegt.</p>
<p>Das das Format am Ende allen erdenklichen bibliothekarischen Ansprüchen genügen wird, bezweifle ich, aber es besteht zumindest die Möglichkeit, Einfluss zu nehmen und den bibliothekarischen Sachverstand einfliessen zu lassen &#8211; noch.</p>
<p><b>Wie kommen nun bibliothekarisches Know-How und Mikroformate zusammen?</b></p>
<p>Zunächst einmal sollte man sich etwas mit Mikroformaten vertraut machen &#8211; dazu gibt es die genannten Bücher und verschiedene <a href="http://mikroformate.de/grundlagen/s5/">Einführungen</a> im Netz. Danach sind ISBD oder die Regeln zur Erzeugung der Titelanzeige im eigenen Katalog vorzunehmen und die atomaren bedeutungstragenden Bestandteile herauszuarbeiten. Diese sollten danach übersichtlich <a href="http://microformats.org/wiki/citation-formats">im Microformats-Wiki</a> dargestellt und dort an konkreten Beispielen ausdiskutiert werden.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2007/07/26/von-isbd-zum-web-20-mit-mikroformaten/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Entwicklungen an der Nationalbibliothek von Australien</title>
		<link>http://jakoblog.de/2007/07/23/entwicklungen-an-der-nationalbibliothek-von-australien/</link>
		<comments>http://jakoblog.de/2007/07/23/entwicklungen-an-der-nationalbibliothek-von-australien/#comments</comments>
		<pubDate>Mon, 23 Jul 2007 08:10:58 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[de]]></category>
		<category><![CDATA[Australien]]></category>
		<category><![CDATA[Bibliothek]]></category>
		<category><![CDATA[Standards]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2007/07/23/entwicklungen-an-der-nationalbibliothek-von-australien/</guid>
		<description><![CDATA[
Die Nationalbibliothek von Australien (NLA) hat vor einiger Zeit einen sehr ansehnlichen Lucene-basierten Katalog-Prototypen veröffentlicht. Dass die NLA zukunftsweisende Entwicklungen betreibt, zeigt auch die geospatial search (deren Eingabemaske allerdings nicht sehr komfortabel ist) und den im März diesen Jahres veröffentlichten National Library of Australia IT Architecture Project Report auf den ich hiermit hinweisen möchte. Den [...]]]></description>
			<content:encoded><![CDATA[<div style="float:right"><a href="htttp://www.nla.gov.au/dsp/documents/itag.pdf" title="National Library of Australia IT Architecture Project Report"><img src='http://jakoblog.de/wp-content/uploads/2007/07/nla-it-report-2007.png' alt='National Library of Australia IT Architecture Project Report' /></a></div>
<p>Die <a href="http://www.nla.gov.au">Nationalbibliothek von Australien</a> (NLA) hat vor einiger Zeit einen sehr ansehnlichen <a href="http://ll01.nla.gov.au/">Lucene-basierten Katalog-Prototypen</a> veröffentlicht. Dass die NLA zukunftsweisende Entwicklungen betreibt, zeigt auch die <a href="http://catalogue.nla.gov.au/cgi-bin/Pwebrecon.cgi?PAGE=mbSearch">geospatial search</a> (deren Eingabemaske allerdings nicht sehr komfortabel ist) und den im März diesen Jahres veröffentlichten <a href="htttp://www.nla.gov.au/dsp/documents/itag.pdf">National Library of Australia IT Architecture Project Report</a> auf den ich hiermit hinweisen möchte. Den folgenden Absatz aus dem Report könnte ich direkt unterschreiben:</p>
<blockquote><p>The benefits of having a native level of support for standard protocols in the architecture cannot be overestimated. A standards-based service-oriented approach for core services such as Contribute, Alert, Harvest and Request will allow protocols such as SRU Update, RSS, OAI-PMH and OpenURL to be supported across all applications. It will also ensure that these protocols are part of the Library&#8217;s way of thinking when training new staff or prototyping new requirements; and that gaps in standards are identified and addressed through a testbed approach, as part of the development process.</p></blockquote>
<p>Übrigens setzt die NLA wie der GBV auch als Zentralsystem das CBS von <a href="http://de.wikipedia.org/wiki/OCLC_PICA">OCLC PICA</a> ein.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2007/07/23/entwicklungen-an-der-nationalbibliothek-von-australien/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>The many standards for structured vocabularies for information retrieval</title>
		<link>http://jakoblog.de/2007/05/01/the-many-standards-for-structured-vocabularies-for-information-retrieval/</link>
		<comments>http://jakoblog.de/2007/05/01/the-many-standards-for-structured-vocabularies-for-information-retrieval/#comments</comments>
		<pubDate>Tue, 01 May 2007 17:46:16 +0000</pubDate>
		<dc:creator>jakob</dc:creator>
				<category><![CDATA[en]]></category>
		<category><![CDATA[Semantic Web]]></category>
		<category><![CDATA[Standards]]></category>
		<category><![CDATA[Thesauri]]></category>

		<guid isPermaLink="false">http://jakoblog.de/2007/05/01/the-many-standards-for-structured-vocabularies-for-information-retrieval/</guid>
		<description><![CDATA[
 I am currently browsing through the draft of British Standard BS 8723: Structured vocabularies for information retrieval, part 3 (Vocabularies other than thesauri) and 4 (Interoperability between vocabularies). I must confess that reading standards is mostly a pain, especially this old-fashioned pre-web standards in information retrieval. I tried to find out the ancestors of [...]]]></description>
			<content:encoded><![CDATA[<div style="float:right; padding-left: 5px;"><a href='http://jakoblog.de/wp-content/uploads/2007/05/vocabularystandards.png' title='Vocabulary standards'><img src='http://jakoblog.de/wp-content/uploads/2007/05/vocabularystandards.thumbnail.png' alt='Vocabulary standards' /></a></div>
<p> I am currently browsing through the draft of British Standard BS 8723: <em>Structured vocabularies for information retrieval</em>, part 3 (<em>Vocabularies other than thesauri</em>) and 4 (<em>Interoperability between vocabularies</em>). I must confess that reading standards is mostly a pain, especially this old-fashioned pre-web standards in information retrieval. I tried to find out <a href="http://jakoblog.de/wp-content/uploads/2007/05/vocabularystandards.png">the ancestors of BS 8723</a> but it took me almost hours. There are dozen of poorly documented related standards and versions (BS 5723, BS 6723, ISO 2788, ISO 5964, DIN 1463, ANSI/NISO Z39.19, AFNOR Z 47 etc.) and most of them are not freely available (and the only available standards are paper-centered PDF instead of web-centered HTML/XML). A standard that is not accesible is pretty worthless! I often complain about the <a href="http://www.w3.org/2001/sw/">Semantic Web community</a> that ignores most of traditional information retrieval &#8211; but they understandably ignore previous results: If traditional information retrieval has not even achieved to visibly and clearly document its own standards on the web &#8211; what is it worth for? A general overhaul is necessary: SKOS and collaborative tagging are only two representatives of this change. I fear that BS 8723 will not be part of the new times unless it becomes available Hypertext.</p>
]]></content:encoded>
			<wfw:commentRss>http://jakoblog.de/2007/05/01/the-many-standards-for-structured-vocabularies-for-information-retrieval/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
