THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra

 

Flickr/Ben Sutherland – CC Attribution

Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.

El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.

El 18 de junio el Parlamento inglés publicó en su sitio oficial un informe más detallado de los reclamos de gastos luego de una larga batalla de requerimientos de información en base a la Freedom of Information Act.

Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.

A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso  (via “crowdsourcing”)

B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.

C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.

D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.

E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz

Seguir leyendo

NPR: Qué es CAR y una visualización eléctrica

 

Les presento algunos trabajos de NPR (EEUU) que inspiraron mi camino de interiorización en periodismo de base de datos.

La primera es una entrevista realizada por la IJNet (International Journalists Network) a Robert Benincasa donde el periodista explica los rudimentos del CAR (Computer-Assisted Reporting)

El video está en inglés pero dejo las ideas principales traducidas más abajo.

 

 

Definiciones y Objetivo

Benincasa define “CAR” como la disciplina que usa análisis de data para contar una historia; encuentra información escondida y la pone a disposición de la opinión pública.

Define “Data” como aquella información altamente estructurada que puede ser leída por software. La información sigue un patrón y está bien documentada. No obstante, las bases de datos en crudo pueden tener errores y debilidades.

El desafío es encontrar tendencias o asociaciones en la data que sean relevantes periodísticamente.

 

Caso Aceleración Involuntaria Automotor.

Comenta y muestra planillas del caso donde se producían aceleraciones involuntarias en el parque automotor de Estados Unidos, principalmente en modelos Toyota (Unintended Acceleration Not Limited To Toyotas).  Seguir leyendo

CSV: Comma Separated Values – Glosario

 

CSV: Comma Separated Values (valores separados por comas) es un formato de archivo de texto donde cada dato, columna o valor se presenta separado por comas (,) y cada fila o registro por saltos de linea.

Este formato es ideal para intercambiar archivos entre planillas de cálculo , procesadores de texto, aplicaciones y bases de datos. Para prevenir confusiones cuando los datos presentan comas dentro del mismo campo, se utilizan también las comillas u otros delimitadores (“). Algunas aplicaciones soportan el uso de caracteres alternativos como delimitadores como el punto y coma (;) o las barras verticales (|) actuando como separadores.

Ejemplo:

340, Juan, 32, Sistemas
463, Mariana, 45, Diseñadora
334, Ricardo, 46, Ingeniero

Ejemplo 2:

“340”, “Juan”, “32”,”Lic. Sistemas”, “Callao 54, Ciudad Autónoma de Buenos Aires”
“463”,”Mariana”,”45”,”Diseñadora”,”Av. Cabildo 1200, Belgrano”
“334”,”Ricardo”,”46”,”Ingeniero”,”Av. Sucre 3354, Beccar”

 

Fuentes donde ver más:
Wikipedia en Español: http://es.wikipedia.org/wiki/CSV
Wikipedia en Inglés: http://en.wikipedia.org/wiki/Comma-separated_values
Hacks and Hackers Survival Glossary: http://hackshackers.com/resources/hackshackers-survival-glossary/