2007 August « Jakoblog — Das Weblog von Jakob VoÃŸ

Blog
About

Eingeschlossene Nutzer im Datengrab Web 2.0

28. August 2007 um 00:51 1 Kommentar

Gestern Nacht hat Ã¼berraschend Blogscout seinen Dienst eingestellt. Ich hatte den kostenlosen, privaten Dienst bei Markus kennengelernt und gerne genutzt, um zu schauen, von wo und wie oft mein Blog aufgerufen wird und Ã¼ber welche Suchanfragen and Referrer die Besucher kommen – beispielsweise wollen sie wissen, wer Bundeskanzler ist. Jetzt sind diese ganzen Statistiken weg. Das Beispiel erinnert mich daran, dass inzwischen statt Software Webservices und Daten im Zentrum stehen. Die wenigsten Webanwendungen bieten jedoch eine vollstÃ¤ndige Exportfunktion, um die Daten auch wieder herauszubekommen. Und selbst dann ist der vollstÃ¤ndige Umstieg auf einen anderen Dienst problematisch. FÃ¼r Backups ist anscheinend der Anbieter des Webservices da (im Zweifellsfall haben die Amerikaner und Chinesen jeweils noch eine Kopie). Ein wenig erinnert mich das an die Microsoft-Produkte, deren Dateiformate den Softwarewechsel auch stark behindert haben. Tim O`Reilly hat es in einem Wired-Interview im April auf den Punkt gebracht: Web 2.0 Is About Controlling Data (aufgegriffen aber bisher nicht viel weitergesponnen von einigen Bibliotheken).

Idealerweise sollten nicht nur die Daten wieder aus dem Webdienst heraus und in eine eigene Anwendung hereinkommen sonder gleich die ganze Webanwendung frei sein. Ein Beispiel dafÃ¼r ist LiPost, das man sich auch auf dem eigenen Server installieren kann. FÃ¼r freie Software, die unter der Affero GPL (AGPL) lizensiert ist, ist die Zur-VerfÃ¼gung-Stellung des Quelltextes bei einer Anwendung als Webdienst sogar zwingend.

Eine ausfÃ¼hrlichere Auseinandersetzung mit dem Problem, dass Web 2.0 die durch Freie Software gewonnene Freiheit bedroht, findet sich im Artikel Free Software and the Web von Alejandro Forero Cuervo.

Tags: Freie Dienste, Langzeitarchivierung, Web 2.0, Webservices 1 Kommentar

Persistent Identifiers: Irony of Fate or just absurd?

24. August 2007 um 01:20 4 Kommentare

The report „Implementing Persistent Identifiers: overview of concepts, guidelines and recommendations“ shows you the impracticality of URN and URN:NBN – you do not even have to read any of the 70 report’s pages to find out: If you try the „persistent identifier“ http://nbn-resolving.de/urn:nbn:de:gbv:7-isbn-90-6984-508-3-8 to get the report’s PDF, you get the following message by a resolver at http://resolver.sub.uni-goettingen.de/purl/?isbn-90-6984-508-3:

Unfortunately the URL could not be resolved. None of the underlying local document resolver were able to find a document with the given identifier. Maybe one of the services is down or a document with the number doesn’t exist. As your URL should contain a persistent identifier, please check again later.

I’d call this 404 2.0! Furthermore at http://www.cerl.org/news.htm one of the report’s publisher (CERL) points out to a review of the report at http://www.clir.org/pubs/issues/index.html#found – which gives you the current issue of CLIR issues (printed version’s ISSN 1098-6383 is not mentioned anywhere) instead of http://www.clir.org/pubs/issues/issues55.html#found. If you ask Google for the title you easily find the PDF. If you ask WorldCat for the ISBN 90-6984-508-3 you get a record where you have to click and search a lot to guess which link will bring you to the PDF – but it’s only the unresolvable URN again.

If people are already to dump to use existing identifier systems (URL, ISBN, ISSN) in the right way, I strongly doubt that persistent identifier systems will solve any problem.

Tags: Identifier, persistent 4 Kommentare

Little more about The European Library (TEL)

24. August 2007 um 00:17 1 Kommentar

Patrick, who is enjoying the Winter in South Africa, went down well with his presentation (but I cannot find the slides?). In his blog he pointed out before IFLA that you can find more about The European Library (TEL) in Fleur Stigter’s blog. There is also a blog about the European Digital Library (EDL, very confusing) and a customized search engine for the projects. But I still have not found out what TEL and EDL are really about. To me as a library 2.0 developer one of the most interesting features of TEL is its SRU-interface which showed me that data quality needs to be the next hype. By the way TEL is hiring. If I could clone myself, I would apply here. In the context of Theseus there will surely also be some interesting jobs. Skilled library (2.0) developers where are you? Not every organization can do a hunt on you and reward 1.000$ like LibraryThing just did!

Tags: Bibliothek, EDL, EU, TEL 1 Kommentar

MilitÃ¤r-„Lego“ in Hongkong

22. August 2007 um 23:43 3 Kommentare

Wenn man erstmal weiÃŸ wo, ist Hongkong eine Fundgrube fÃ¼r Spielzeug und Figuren aller Art. Als ich in einem Laden mit Lego auf diese nachgestellte MilitÃ¤rszene stieÃŸ, musste ich aber doch etwas stutzen. Ok, im Laden nebenan stand schon das gesamte FÃ¼hrerhauptquartier in Form von Actionfiguren zusammen aber Lego macht doch keinen MilitÃ¤rkram?! Es handelt sich hierbei hÃ¶chstwahrscheinlich um BÃ¤usÃ¤tze der Firma Mega Brands deren Bausteine nicht nur
schlechten Geschmack beweisen, sondern vor allem mit Lego kompatibel sind (nach Auslauf der Lego-Patente ist dies auch anderen Firmen mÃ¶glich). Neben Militaria bietet Mega Brands unter Anderem auch PokÃ©mon (dessen verherrlichende Darstellung Ã¼brigens zumindest in der deutschsprachigen Wikipedia eher verhindert werden konnte als bei MilitÃ¤rthemen). Aber auch mit Lego selber kÃ¶nnen kleine FlugzeugtrÃ¤ger, groÃŸe FlugzeugtrÃ¤ger und andere KampfgerÃ¤te (hier und hier und hier) zusammengebaut werden. Lego Mindstorms-Selbstschussanlagen und -Minen gibt es zum GlÃ¼ck noch nicht.

Dann doch lieber einen netten Brickfilme anschauen, zum Beispiel Monty Python and the Holy Grail.

Tags: lego, mega briks, spielzeug 3 Kommentare

Wird dem Theseus-Projekt (100 Millionen) Geld fÃ¼r eine Begleitstudie hinterhergeworfen?

21. August 2007 um 23:48 1 Kommentar

Bis zum 15.9. lÃ¤uft eine Ausschreibung des Bundesministerium fÃ¼r Wirtschaft und Technologie zu einer „Begleitforschung fÃ¼r das Forschungsprogramm THESEUS“ (ich berichtete bereits letzten Monat). Mit der Begleitforschung soll „sichergestellt werden, dass die FÃ¶rdermaÃŸnahme mit hoher Effizienz umgesetzt, die QualitÃ¤t der wissenschaftlichen Arbeiten gesiÂchert und das im Rahmen von THESEUS gewonnene Know-How schnell verbreitet wird“. Ich stelle hiermit meine folgende Begleitstudie dem BMWi vorab und kostenlos zur VerfÃ¼gung:

Im Projekt THESEUS wurden mit Hilfe vieler Buzzwords zahlreiche Berichte, Studien und Prototypen erstellt und 100 Millionen Euro Forschungsgelder an 30 Partner aus Industrie, Wissenschaft und Forschung verteilt. Ende der Studie.

Mal im Ernst: Evaluation ist ja eine gute Idee, aber ich Frage mich, ob einem GroÃŸprojekt (bei dem jeder Teilnehmern hauptsÃ¤chlich fÃ¼r sich mÃ¶glichst viel Renommee und Geld abgreifen mÃ¶chte aber am Ende fÃ¼r nichts in die Verantwortung genommen wird), mit solch zusÃ¤tzlicher Metaforschung (bei der doch wieder die Freunde und Bekannten der Auftragnehmer im Boot sitzen) beizukommen ist. Wenn schon groÃŸspurig in der Projektbeschreibung von Web 2.0 und Web 3.0 die Rede ist, dann sollte das auch bei der Planung und Begleitung des Projektes deutlich werden. Wie wÃ¤re es statt einer aufwendigen und intransparenten Begleitstudie (die eigentlich ja auch wiederum evaluiert werden mÃ¼sste) mit einigen wenigen, klaren Regeln fÃ¼r alle Beteiligten:

Â§ 1) alle im Rahmen von Theseus entwickelten Computerprogramme und Programmbibliotheken werden als Freie Software verÃ¶ffentlicht und im Laufe des Projektes als Open Source zur VerfÃ¼gung gestellt, so dass sie von unabhÃ¤ngiger Seite evaluiert, weitergenutzt und weiterentwickelt werden kÃ¶nnen.

Â§ 2) alle im Rahmen von Theseus erstellten Dokumente (Berichte, Anleitungen, Dokumentationen, Digitalisate etc.) werden im Laufe des Projektes als Freie Inhalte verÃ¶ffentlicht, so dass sie von unabhÃ¤ngiger Seite evaluiert, weitergenutzt und weiterentwickelt werden kÃ¶nnen.

Â§ 3) die unter Â§ 2 genannten Dokumente umfassen insbesondere auch alle im Rahmen des Theseus-Projektes anfallenden VertrÃ¤ge, Protokolle, Absprachen und Standards, fÃ¼r die zusÃ¤tzlich eine zeitnahe VerÃ¶ffentlichung bindent ist, so dass die innerhalb des Projektes getroffenen Entscheidungen von unabhÃ¤ngiger Seite kommentiert und ihre Einhaltung kontrolliert werden kÃ¶nnen sowie Geldverschwendung und Korruption durch Transparenz vermieden werden.

Â§ 4) bei VerstÃ¶ÃŸen gegen Â§Â§ 1-3 werden den Beteiligten Projektpartern die FÃ¶rdermittel gekÃ¼rzt.

Zu einfach? Naiv? Undurchsetzbar? Na dann fÃ¤llt bei 100 Millionen das Geld zur Augenwischerei in Form einer konsequenzlosen Begleitstudie ja auch nicht mehr ins Gewicht.

Apropos naiv: Das BMWi fordert, dass „FÃ¼r die Darstellung von Ergebnissen [der Begleitstudie] […] die bestehende Internetseite http://theseus-programm.de in Absprache mit der hierfÃ¼r vom THESEUS-Programm-BÃ¼ro beauftragten Agentur genutzt werden [soll]“.

Abgesehen davon, dass jede qualifizierte Studie angesichts dieser Forderung zum Ergebnis kommen sollte, dass Geld fÃ¼r eine „Agentur“ rausgeschmissen wurde, weil die Projektpartner zu inkompetent waren, ein CMS bzw. eine gemeinsame Kommunikations- und Publikationsplattform zu nutzen, wird diese Agentur bzw. das „THESEUS-Programm-BÃ¼ro“ wohl kaum relevante Kritik auf der eigenen Seite ermÃ¶glichen. Oder verÃ¶ffentlicht die Chinesische Nachrichtenagentur Xinhua plÃ¶tzlich auch Nachrichten Ã¼ber Menschenrechtsverletzungen in China?

P.S: Letzten Freitag wurde Theseus auf der Veranstaltung „Wag the long tail“ des Verbandes der deutschen Internetwirtschaft e.V Theseus „erstmals der Ã–ffentlichkeit vorgestellt“. Die dazugehÃ¶rige Pressemitteilung wurde an verschiedener Stelle (u.A. heise) rezipiert – was die viertelstÃ¼ndige (sic!) Vorstellung durch Stefan Wess (GeschÃ¤ftsfÃ¼hrer der Bertelsmann-Tochter Empolis) enthielt, erfÃ¤hrt die Ã–ffentlichkeit aber nicht. Bei Linuxworld schreibt schreibt dazu John Blau, der anscheinend dabei war.

Tags: Bibliothek, Suchmaschine, Theseus, Web 2.0 1 Kommentar

Bunte Bibliotheks-Tagwolke

21. August 2007 um 14:21 1 Kommentar

Auf Web4Lib haben mit der Edmont Public Library und der Elisabeth C. Miller Library zwei kleinere Bibliotheken darauf hingewiesen, dass sie die SacherschlieÃŸung ihrer BestÃ¤nde als Tagcloud anbieten. Alles schÃ¶n bunt und eine tolle Vorlage fÃ¼r ein Poster, aber so ganz erschlieÃŸt sich mit der Nutzen nicht. Nicht, dass es nicht auch sinnvolle Anwendungen fÃ¼r Tagclouds gÃ¤be (zum Beispiel eine Auswertung der Demokratischen PrÃ¤sidentschaftskandidaten) aber mehr als einen oberflÃ¤chlichen Eindruck Ã¼ber den Gesamtbestand bieten die Tagclouds nicht und aufgrund des unterschiedlichen Layouts ist der Vergleich (zum Beispiel mit dem LibraryThing-Bestand) schwierig.

Tags: Bibliothek, Tagcloud, Tagging 1 Kommentar

GBV-Verbunddaten weiterverarbeiten mit SRU-Schnittstelle und Perl

20. August 2007 um 14:58 2 Kommentare

Ende Juli habe ich im Rahmen meiner Arbeit bei der VZG mit PICA::Record eine Perl-API zur Verarbeitung von PICA+-Daten verÃ¶ffentlicht. PICA+ ist das interne Katalogformat von PICA-Bibliothekssystemen, die neben dem GBV und den VerbÃ¼nden HeBIS und SWB auch bei der Deutschen Nationalbibliothek und fÃ¼r Zentralsysteme in den Niederlanden, Australien, Frankreich und England eingesetzt werden. Inzwischen ist PICA Ã¼brigens eine vollstÃ¤ndige OCLC-Tochterfirma. Mehr zum PICA+ Format findet sich in den jeweiligen Katalogisierungsrichtlinien, zum Beispiel beim GBV und in dieser kurzen EinfÃ¼hrung.

PICA::Record ist sozusagen ein Pendant zu Mike Rylanders CPAN-Modul MARC::Record, das bereits seit einigen Jahren bei MARC-Anwendern genutzt und in der Mailingliste perl4lib diskutiert wird. Feedback in Form von Anwendungen, Ideen, Bugreports etc. ist sehr willkommen – zum Beispiel Ã¶ffentlich bei der Dokumentation im GBV-Wiki. Neben der Erzeugung von DatensÃ¤tzen in PICA+, um diese in Katalogsysteme einzuspielen, eignet sich PICA::Record auch fÃ¼r die umgekehrte Richtung. Dazu ist ein einfacher SRU-Client implementiert; die entsprechende SRU-Schnittstelle bietet der GBV seit einiger Zeit inoffiziell und nun auch Ã¶ffentlich an. FÃ¼r Bibliotheks-Mashups ist die SRU-Schnittstelle ein Baustein und die Perl-API ein mÃ¶gliches Bindemittel. NatÃ¼rlich kann der Webservice auch mit anderen Methoden als mit Perl abgefragt werden.

Beispiele und Anleitungen gibt es unter Anderem in der API-Dokumentation, im Quelltext oder hier.

Tags: Bibliothek, GBV, Mashup, Perl, PICA, Webservices 2 Kommentare

ZurÃ¼ck in Deutschland

17. August 2007 um 18:29 Keine Kommentare

Heute morgen sind wir wieder gut in Frankfurt angekommen – nachdem wir im grÃ¶ÃŸten Casino in Macao beim Roulette auf die richtige Zahl getippt haben (setz‘ auf die 23! Und die 42! … es gibt keine 42! Dann 5, die Quersumme von 23! …und es fÃ¤llt… die 5!!!) sind wir auch noch mit der Business-Class nach Hause geflogen: Besseres Essen und GetrÃ¤nke, mehr Filmauswahl und vor allem einen riesiegen Liegesessel! Ab sofort nur noch Business 😉 Nee, wir hatten einfach das GlÃ¼ck, dass unser Flieger Ã¼berbucht war, wir Ã¼berpÃ¼nktlich am Schalter waren und auf die Fragen „Do you have to travel together?“ mit „Yes“ geantwortet haben: Also haben wir ein „Upgrade“ und einen frÃ¼heren Flug in einer kleineren Maschine bekommen. Alles zusammengerechnet waren die drei Wochen gÃ¼nstiger als erwartet: der niedrige US-Dollar macht sich auch in anderen LÃ¤ndern positiv fÃ¼r EU-BÃ¼rger bemerkbar – also ab nach Asien und Amerika! ZurÃ¼ck in Deutschland kÃ¶nnen wir erstmal hunderte von Fotos sichten und uns an die heimischen Sitten zurÃ¼ckgewÃ¶hnen (wie ging das nochmal mit Messer und Gabel?). Schade, ich wÃ¼rde gerne noch mal schnell auf den Nachtmarkt 🙁

Tags: Hongkong, Taiwan, Urlaub Keine Kommentare

Neues aus Taiwan

7. August 2007 um 20:24 Keine Kommentare

Nachdem dem Abschluss der erfolgreichen Wikimania 2007 auf Taiwan und dem festen Entschluss, nÃ¤chstes Jahr wieder dabei zu sein, haben wir den Dienstag in Tainan, der viertgrÃ¶ÃŸten und Ã¤ltesten Stadt Taiwans verbracht. Momentan zieht ein kleiner Taifun Ã¼ber die SÃ¼dspitze der Insel (aktueller Verlauf und sehr schÃ¶n auf den Japanischen Satellitenbildern mit Animation zu sehen). Nach Wikimedia-Konferenz und stÃ¤dtischer Unterhaltung (unter Anderem hat eine Chinesin mich und zwei weitere Kerle ins Plush und Room 18 mitgenommen, so dass ich jetzt von Taiwanesinnen schwÃ¤rme), sowie vor allem Essen und Trinken werden wir morgen mit der Alishan-Bergbahn ins Gebirge fahren, wo es etwas kÃ¼hler ist als die sonst mindestens 30Â°C.

Tags: Taiwan, Wikimania2007 Keine Kommentare

Wiki-basiertes Video-Dokumentationssystem MediaVid

4. August 2007 um 23:09 Keine Kommentare

Professionelle Video-Dokumentationssysteme sind noch immer ziemlich teuer, erfordern Expertenwissen und spezielle Hardware und sind relativ unflexibel. Auf der Wikimania2007 wurde von Michael Dale mit MediaVid ein vielversprechendes Video-Dokumentationssystem vorgestellt, das webbasiert als Wiki funktioniert.

Die Erstellung und Verbreitung von Videos ist dank gÃ¼nstigen Equipments inzwischen nicht mehr Herrschaftswissen sondern steht prinzipiell jedem offen. Zur PopularitÃ¤t haben nicht zuletzt Web 2.0-Dienste wie YouTube & Co. beigetragen. Im Gegensatz zu diesen unterstÃ¼tzt die kommende Version von Metavid allerdings die Segmentierung von Videos und die Annotierung mit Metadaten – und das alles vollstÃ¤ndig auf Basis von Open Source (MediaVid basierend auf MediaWiki mit der Semantic MediaWiki Extension).

Statt also fÃ¼r im Web darstellbare Videos nur einige freien SchlagwÃ¶rter (Tags) zu vergeben, kÃ¶nnen Videos in einzelne Szenen zerlegt werden, zu denen beliebige Daten wie dargestellte Personen, Orte, Themen, Texte etc. in frei definierbaren Feldern verwaltet und durchsucht werden kÃ¶nnen.

Als Beispielanwendungen hat das Team von MediaVid Mitschnitte des amerikanischen Senats annotiert, wie sie C-SPAN gegen teures Geld anbietet. Auf diese Weise kÃ¶nnen beispielweise alle ErwÃ¤hnungen von „drugs and medicines“ in Reden von Senatoren, die Spenden von Pharmaunternehmen erhalten haben, per RSS abonniert werden.

Die auf der Wikimania vorgestellte Version von MediaVid soll in etwa 1-2 Monaten verÃ¶ffentlicht werden. Das sollten sich Videoaktivisten-Gruppen aber auch professionelle Mediendokumentare, wie zum Beispiel die Dokumentationsabteilung des Bundestages mal ansehen. Einen ersten Eindruck geben die Vortragsfolien und dieser Screencast (der allerdings noch nicht alle Wiki-Funktionen enthÃ¤lt). Weitere Informationen gibt es im MediaVid Wiki.

Tags: Dokumenation, MediaVid, Video, Wikimania2007, Wikis Keine Kommentare

Nächste Seite »

Jakoblog — Das Weblog von Jakob VoÃŸ

Eingeschlossene Nutzer im Datengrab Web 2.0

Persistent Identifiers: Irony of Fate or just absurd?

Little more about The European Library (TEL)

MilitÃ¤r-„Lego“ in Hongkong

Wird dem Theseus-Projekt (100 Millionen) Geld fÃ¼r eine Begleitstudie hinterhergeworfen?

Bunte Bibliotheks-Tagwolke

GBV-Verbunddaten weiterverarbeiten mit SRU-Schnittstelle und Perl

ZurÃ¼ck in Deutschland

Neues aus Taiwan

Wiki-basiertes Video-Dokumentationssystem MediaVid

Neueste Beiträge

Neueste Kommentare

Blogroll

Feeds

Siehe auch