OpenRefine gegen Datenchaos

OpenRefine, vormals Google Refine, ist ein Tool, um inkonsistente Daten aufzubereiten.

Screenshot Google Refine
Google Refine

Auf dem offiziellen YouTube-Kanal gibt es eine Reihe an Videos, die die Verwendung des Werkzeugs demonstrieren. Datensätze können bereinigt, zusammengeführt und analysiert werden. Die Daten können aus verschiedenen Quellen (auch Online) geholt werden, und verlassen den lokalen PC nicht – wichtig bei sensiblen Daten. Seit kurzem hat Google angekündigt, die Projektleitung aufzugeben, und das Tool von der Community weiterpflegen zu lassen. Damit wanderte auch der Code von Google Code zu GIThub.

Definitiv ein Werkzeug, welches mir bei der nächsten Datenanalyse helfen darf.