Cómo usar OpenRefine para trabajar una base de datos

Por Natalia Sampietro(*) (**)

Cuando trabajamos con datos buena parte de nuestros esfuerzos y tiempo se va en el acondicionamiento, limpieza y puesta en orden de los mismos. Problemas de codificación, estándares, delimitadores, errores de tipeo, entre otros, se convierten en uno de los primeros obstáculos a superar en el camino hacia la generación de información de calidad.

En la búsqueda de una herramienta que simplifique ese camino nos encontramos con Open Refine, antes conocido como Google Refine, un producto de código abierto que ofrece múltiples funcionalidades que van desde limpieza, organización y transformación en diferentes formatos, hasta la posibilidad de extender los datos a través de web services y relacionar con bases de datos como Freebases. Seguir leyendo

Hackaton ShowTimeLine – Juicio Marita Verón

 

 

El sábado estuvimos reunidos en un nuevo Hackaton de Hacks/Hackers Buenos Aires.

El equipo de LA NACION fue representado por Momi Peralta Ramos, Ricardo Brom, Gabriela Bouret y  Florencia Coelho.

Dentro de las tres propuestas del Hackaton Mapa76, Malvinas30 y el Juicio de Marita Verón-, nos sumamos a la convocatoria de Sergio Sorín, junto con Florencia Bianco y Ariel Aizemberg para delinear el Timeline del  Juicio por Trata Sexual.

Esta era la consigna en el sitio del MeetUp.

Para hacks:

– Análisis de la cobertura del juicio de Marita Verón en los diarios nacionales y regionales. Visualización en línea de tiempo de la cobertura.
– Desarrollo estructurado de datos para contar el caso de Marita Verón

Para hackers: Implementación del scraping de datos de medios (con asesoramiento de periodistas).

Aquí puede ver el  resultado de un día de trabajo basándonos en el Timeline desarrollado por Zach Wise para Knight News Innovation Lab .

 

http://hhba.info/marita-veron/

 

Al final de la jornada, unificamos la experiencia en un “wiki resumen” del equipo armado por Sergio Sorín y Ariel Aizemberg. Seguir leyendo