OpenRefine (vorher Google Refine, vorher Freebase Gridworks) hat in der letzten Zeit einige Änderungen erfahren. Unter anderem hat das Projekt eine neue Homepage http://openrefine.org und ist zu GitHub umgezogen, Überbleibsel gibt es aber nach wie vor noch unter der alten Adresse http://code.google.com/p/google-refine/. Damit der Einstieg in die Arbeit mit Refine etwas leichter fällt, hier kurz ein paar Eckpunkte zur Orientierung, vom Download über Starten/Sichern/Beenden, erste Schritte mit der GREL und zum Schluss noch ein paar weitere Quellen.
Schlagwort: Refine
Vor nicht allzu langer Zeit hab ich in diesem Blog noch über die mögliche Überführung von Needlebase-UI und -Features in Google Refine sinniert und es als sinnvolle Erweiterung des Projekts eingeschätzt. Jetzt sieht es so aus, als werden die Karten neu gemischt denn Refines‘ Zukunft in der Google Familie wird bald enden.
Google Refine hat jetzt offiziel die Version 2.5 erreicht. Das Changelog, das neue Features, Bugfixes und Verbesserungen auflistet, ist umfangreich. Insgesamt wurde die Integration mit Google Spreadsheets und Fusion Tables vorangetrieben.
Das Open Source Datenbreinigungstool Google Refine ist in Version 2.1 erschienen. Die offizielle Ankündigung spricht zwar von einem „maintenance release“ mit diversen Bugfixes, einige neue Funktionen sind trotzdem dazugekommen. Interessant finde ich dabei den Import von Google Fusion Tables und den jsoup basierten HTML Parser, der jetzt Funktionen wie parseHtml, select, htmlAttr, htmlText, innerHtml, ownText unterstützt. Die Tutorial Videos wurden ebenfalls erneuert, auch wenn sie weiterhin die irreführende Betitelung „Goolge Refine 2.0“ tragen.
Google Refine (ehemals Freebase Gridworks) ist in der Version 2.0 erschienen. Wie im Google Open Source Blog nachzulesen ist, hat sich das Tool zur Datenbereinigung seit der Übernahme von Metaweb wieder einen großen Sprung weiterentwickelt. Neben einer neuen Extension Architektur und verbesserten Datenabgleichmöglichkeiten hat es auch eine Reihe neuer Features gegeben. Dazu zählen neue Commands, erweiterte Importfunktionen zu CSV und TSV und die Erweiterung der Google Refine Expression Language, die nun auch JSON unterstützt. Alle Änderungen gibt es im Überblick im Changelog
Außerdem hat Google drei neue Einführungsvideos zu Refine veröffentlicht. Das erste habe ich mal eingebunden, alle weiteren stehen im Open Source Blog bzw auf Youtube.
Hier wieder einige interessante Netzfundstücke der letzten Tage. Angesichts akuten Zeitmangels diesmal wahllos in einen Topf geworfen und frei von jeder Kategorisierung. Viel Spaß!
Über die letzten Tage haben sich einige interessante Videos angesammelt, die euch nicht vorenthalten möchte. Ich hab die Videos hier allerdings nicht direkt eingebunden, sondern nur verlinkt. Die Links führen dafür nicht nur zu den Videos, sondern auch den passenden Kommentaren und weiterführenden Links. Viel Spaß dabei!
- Freebase Gridworks 1.0 sieht nach einem vielversprechenden Open Source Tool zur Handhabung von Datensätzen aus. Aus der Selbstbeschreibung:
„Freebase Gridworks is a power tool that allows you to load data, understand it, clean it up, reconcile it internally, augment it with data coming from Freebase, and optionally contribute your data to Freebase for others to use. All in the comfort and privacy of your own computer.“
Freebase selbst versteht sich als eine Art Information-Hub, als „strukturierte Datenbank trifft Wiki„, wie Golem.de es nennt. Die Inhalte stehen unter Creative Commons und können von jedem eingebunden und verarbeitet werden. Ein Blick lohnt sich allemal.
- Was das Semantic Web ist und wie diverse Netzpersönlichkeiten dazu stehen zeigt die 15-Minütige Doku von Kate Ray Wb 3.0 – A story about the Semantic Web Mit dabei sind unter anderem Tim Berners-Lee, Clay Shirky, Chris Dixon, David Weinberger und Nova Spivack.
- Ein interessantes Video über Googles Public Data Explorer läuft auf Fora.tv Der Vortrag an der Berkeley Graduate School of Journalism behandelt unter anderem Themen wie „Making Public Data Accessible and Useful“ und „Using Google to Search and Graph Statistics“. Übrigens:So sollte eine Navigation innerhalb eines Videos aussehen!