Cómo usar OpenRefine para trabajar una base de datos

Por Natalia Sampietro(*) (**)

Cuando trabajamos con datos buena parte de nuestros esfuerzos y tiempo se va en el acondicionamiento, limpieza y puesta en orden de los mismos. Problemas de codificación, estándares, delimitadores, errores de tipeo, entre otros, se convierten en uno de los primeros obstáculos a superar en el camino hacia la generación de información de calidad.

En la búsqueda de una herramienta que simplifique ese camino nos encontramos con Open Refine, antes conocido como Google Refine, un producto de código abierto que ofrece múltiples funcionalidades que van desde limpieza, organización y transformación en diferentes formatos, hasta la posibilidad de extender los datos a través de web services y relacionar con bases de datos como Freebases. Seguir leyendo

#WJCHAT: Matemática para periodistas

 

Flickr/CC Atribution: FMCKINLAY

 

El 14 de marzo en Estados Unidos celebran el día del número π – símbolo Pi. (3/14) También la fecha coincide con el nacimiento de Albert Einstein.

El chat twittero en inglés #WJCHAT fue dedicado el miércoles pasado a Matemáticas para Periodistas y Visualización de Datos.

El invitado de honor fue  Len de Groot (@lendegroot), profesor del KDMC – Knight Digital Media Center de la Universidad de Berkeley en California.

Armé un Storify con las 10 preguntas de @wjchat, las respuestas de Len y frases mechadas de otros participantes.

También seleccioné algunos tweets que intento reflejar en español:

 

“Lo que más me gusta de trabajar con bases de datos es descubrir cosas. Todos esos momentos … ¡AJA!”

Vía @lendergroot

“¿Deberían las redacciones publicar las bases de datos junto con la historia que se basa en ellos o es un desperdicio de recursos? Via @wjchat

Seguir leyendo