Neues aus Taiwan

7. August 2007 um 20:24 Keine Kommentare

Nachdem dem Abschluss der erfolgreichen Wikimania 2007 auf Taiwan und dem festen Entschluss, nächstes Jahr wieder dabei zu sein, haben wir den Dienstag in Tainan, der viertgrößten und ältesten Stadt Taiwans verbracht. Momentan zieht ein kleiner Taifun über die Südspitze der Insel (aktueller Verlauf und sehr schön auf den Japanischen Satellitenbildern mit Animation zu sehen). Nach Wikimedia-Konferenz und städtischer Unterhaltung (unter Anderem hat eine Chinesin mich und zwei weitere Kerle ins Plush und Room 18 mitgenommen, so dass ich jetzt von Taiwanesinnen schwärme), sowie vor allem Essen und Trinken werden wir morgen mit der Alishan-Bergbahn ins Gebirge fahren, wo es etwas kühler ist als die sonst mindestens 30°C.

Wiki-basiertes Video-Dokumentationssystem MediaVid

4. August 2007 um 23:09 Keine Kommentare

Professionelle Video-Dokumentationssysteme sind noch immer ziemlich teuer, erfordern Expertenwissen und spezielle Hardware und sind relativ unflexibel. Auf der Wikimania2007 wurde von Michael Dale mit MediaVid ein vielversprechendes Video-Dokumentationssystem vorgestellt, das webbasiert als Wiki funktioniert.

Die Erstellung und Verbreitung von Videos ist dank günstigen Equipments inzwischen nicht mehr Herrschaftswissen sondern steht prinzipiell jedem offen. Zur Popularität haben nicht zuletzt Web 2.0-Dienste wie YouTube & Co. beigetragen. Im Gegensatz zu diesen unterstützt die kommende Version von Metavid allerdings die Segmentierung von Videos und die Annotierung mit Metadaten – und das alles vollständig auf Basis von Open Source (MediaVid basierend auf MediaWiki mit der Semantic MediaWiki Extension).

Statt also für im Web darstellbare Videos nur einige freien Schlagwörter (Tags) zu vergeben, können Videos in einzelne Szenen zerlegt werden, zu denen beliebige Daten wie dargestellte Personen, Orte, Themen, Texte etc. in frei definierbaren Feldern verwaltet und durchsucht werden können.

Als Beispielanwendungen hat das Team von MediaVid Mitschnitte des amerikanischen Senats annotiert, wie sie C-SPAN gegen teures Geld anbietet. Auf diese Weise können beispielweise alle Erwähnungen von „drugs and medicines“ in Reden von Senatoren, die Spenden von Pharmaunternehmen erhalten haben, per RSS abonniert werden.

Die auf der Wikimania vorgestellte Version von MediaVid soll in etwa 1-2 Monaten veröffentlicht werden. Das sollten sich Videoaktivisten-Gruppen aber auch professionelle Mediendokumentare, wie zum Beispiel die Dokumentationsabteilung des Bundestages mal ansehen. Einen ersten Eindruck geben die Vortragsfolien und dieser Screencast (der allerdings noch nicht alle Wiki-Funktionen enthält). Weitere Informationen gibt es im MediaVid Wiki.

Quality studies at Wikimania2007

4. August 2007 um 05:38 Keine Kommentare

I just participated in a Wikimania 2007 session with two very smart talks about quality studies in Wikipedia. Both were examples of rare (but hopefully growing) number of scientific studies with knowledge of Wikipedia internals and relevance to the practical needs of Wikipedia. Last but not least they both include working implementations instead of ideas only.

First there is Using Natural Language Processing to determine the quality of Wikipedia articles by Brian Mingus, Trevor Pincock and Laura Rassbach. Brian, an undergraduate student at Colorado, presented a rating system that was trained by existing Quality assesments of Wikipedia articles and a large set of features that may possible be related to quality, mainly computed by methods of natural language processing. Machine classification could predict ratings very well. Brian believes (and convinced me) that the best approach to determining article quality is a combination of human ratings and machine classifications. Human ratings serve as training data and algorithms can reverse engineer the human ratings. You should not think that binary, top-down ratings like the upcoming stable versions done by expert are the definite solution – but they may be additional information to predict quality and to train automatic systems that reproduce and summarize quality ratings. I will publish links to Brian’s slides, paper and code as soon as I get them (we collect all slides). A preliminary paper is in the Wikimania Wiki.

In the second talk Luca De Alfaro presented A Content-Driven Reputation System for the Wikipedia. The basic idea of his clever algorithm to predict trustability of Wikipedia texts is that authors of long-lived contributions gain reputation and authors of reverted contributions lose reputation. The detection and rating of remaining, changed, and reverted contributions is similar to WikiBlame but much more elaborated. Based on the analysis of the whole English, Italian, and French Wikipedia paragraphs and words can be coloured: text that is likely to be trusted is white while text that better should be checked is more orange. See the demo and the paper presented at WWW2007 (slides will follow).

I hope that Wikipedians and local Wikimedia chapters will catch up these efforts to get the tools usable in practise, for instance at Wikimedia Toolserver. Wikipedians, developers, Wikimedia organizations, and scientists need to work together tightly to bring smart ideas in Wikipedia quality research to real applications.

Blogtip und Programmtip

2. August 2007 um 20:30 Keine Kommentare

Unter www.microformats.dk betreibt Søren Johannessen ein kleines, feines Blog über Mikroformate und Mashups, auf dass ich dank Trackback gestoßen bin. Einiges versteht man vom Dänischen auch so und im Zweifel ist der persönliche Nachbarländer des Vertrauens zu fragen (eine Automatische Übersetzung Dänisch-Deutsch würde mich wundern, da ist einfach der Markt nicht groß genug). Dänen habe ich hier auf der Wikimania bisher nicht getroffen aber neben Taiwanesen viele andere Nationalitäten. Die Erfahrung, mal so völlig Ausländer zu sein, weder Sprache noch Schrift noch die besonderen Gewohnheiten zu verstehen, ist für mich doch noch etwas neues und sehr interessant. Heute habe ich fast den ganzen Tag damit verbracht, das Programm für morgen fertigzustellen (hier die Endversion als PDF) und mich danach noch an meinen eigenen Vortrag gesetzt. Dafür war das Abendessen in einem guten vegetarischen (sic!) Restaurant phänomenal. Mit umgerechnet 18 Euro war das überaus umfangreiche Buffet eher am oberen Ende der Preisskala, ich habe auch schon sehr lecker für etwa 1,50 mich an Dumplings sattgegessen. Das Taiwanesische Essen ist kurzgesagt unglaublich vielfältig und lecker.