Una base de datos con “mucha carne”

Flickr/Creative Commons / Diego3336

El periodismo económico –el más ortodoxo inspirado en el trabajo de los economistas– desde siempre ha utilizado bases de datos para construir información: la tendencia del data-journalism llega para profundizar este proceso y democratizar el conocimiento.

Seamos abiertamente honestos con la comunicación. Al hacer pública una base de datos producimos efectos informativos ampliamente superadores a un buen artículo periodístico.

El punto de vista que puede ofrecer un artículo periodístico construido a partir del análisis de una base de datos es limitado y finito [hay espacios y formatos preestablecidos para su publicación]. Al abrir la fuente al público damos la posibilidad de expandir curiosidad y conocimiento más allá de lo sospechado.

1. CARNE CRUDA

A mitad de octubre del año pasado, en una discusión de sumario (reuniones que se realizan entre redactores y editores para presentar propuestas de notas) surgió la inquietud de los coletazos de la inflación en la microeconomía. La palabra “precios” rápidamente se trasladó al concepto “góndola”. Había observado que en el hipermercado de mi barrio habían decidido achicar el sector de carnicería.

¿Dónde podemos consultar el consumo de carne? El Instituto de Promoción de la Carne Vacuna Argentina (IPCVA) tiene un buen sector de estadísticas económicas. En su sitio de Internet desde hace algún tiempo tomaron la decisión de hacer públicas las bases de datos que utilizan para analizar el mercado bovino.

Al chequear las métricas históricas de consumo promedio (en kilos) por habitante caímos en cuenta de que en 2011 Argentina tocó su mínimo histórico: 53,4 kg. El dato más bajo en los últimos cincuenta años –cuando se empezó la serie-.

2. CARNE PROCESADA

Consideramos este hecho como relevalente: la carne, alimento ícono de la tradición gastronómica argentina, registraba su menor nivel de ventas en un contexto circundado por la expansión del PBI y la inflación.

Consultamos a especialista del mercado cárnico para ayudarnos a descifrar el por qué. Todos arribaron a una explicación más o menos unánime. Entre 2007 y 2011, el stock de vacas cayó 17% y los precios escalaron 222%. Conclusión: menos consumidores pueden comprar ese bien.

El 18 de octubre pasado el corolario fue la publicación del artículo “La mesa de los argentinos reduce el consumo de carne al mínimo histórico”.

3. CARNE HIPERVISUAL Y EN EQUIPO

Uno de los vicios que el periodismo económico en medios digitales heredó del papel es creer que podemos explicar una serie estadística sólo con palabras y sin aburrir al lector que fija la mirada en una pantalla.

Explicar signos (números) con más signos (palabras) parece a simple vista un despropósito semántico para el ecosistema digital, que ofrece como nunca múltiples herramientas para visualizar información.

En el artículo teníamos 3 bases de datos para armonizar en el contenido: consumo anual per cápita, precio promedio del kilo y cabezas de ganado. Para brindar al lector una perspectiva de estas tres variables, Mariana Trigo Viera, subjefa de diseño interactivo, creó esta infografía:

¡Es importante el trabajo en equipo! Debatir con el infógrafo el tenor de los datos a comunicar y cómo se desarrollarán le ayudará a optimizar su graficación. Asimismo, el ordenamiento visual ayuda a clarificar los conceptos que se explican. Entonces:

  • Los gráficos ayudarán al ojo a leer datos complejos ordenados en una serie y permitirán al usuario explorarlos de modo dinámico
  • El texto será el soporte fundamental para explicar por qué esos datos son noticia

El periodismo económico nutrido de bases de datos tiene la posibilidad inédita de potenciar su trabajo. No sólo por la funcionalidad de arribar a noticias gracias a la lectura comparada de una estadística y enriquecerla con multimedia. La finalidad va más allá.

Al “abrir” datos y hacerlos accesibles a cualquiera, generaremos la oportunidad de pensar nuestra propia fuente primaria para disparar otros puntos de vista y análisis. Incluso, más allá de lo planteado por nosotros. Quizás este sea otro modo de lograr que los lectores puedan arribar a sus propias conclusiones.

La película Moneyball, Yale y el Periodismo de Base de Datos

 

 

El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.

 

Panel I: Formas y Prácticas de Periodismo de Base de Datos

Panel II: La Influencia de la Data en el Proceso de la Noticias

Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.

Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.

“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic

 

 

Otros tweets traducidos al castellano:

Seguir leyendo

THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra

 

Flickr/Ben Sutherland – CC Attribution

Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.

El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.

El 18 de junio el Parlamento inglés publicó en su sitio oficial un informe más detallado de los reclamos de gastos luego de una larga batalla de requerimientos de información en base a la Freedom of Information Act.

Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.

A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso  (via “crowdsourcing”)

B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.

C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.

D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.

E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz

Seguir leyendo

Casos: el círculo de Murdoch alrededor del escándalo News Corp.

Un trabajo presentado recientemente por el equipo de periodismo de base de datos de ProPublica muestra de una manera clara e interactiva el círculo que rodea a Rupert Murdoch -magnate australiano propietario de News Corporation– en el escándalo de las escuchas ilegales que lo involucra y que provocó ya la renuncia de los dos principales jefes de Scotland Yard y de algunos de los máximos responsables del multimedio.

El desarrollo permite navegar entre todos los protagonistas, aquellos personajes que fueron arrestados y los que tuvieron que dimitir. El despliegue visual permite distinguir cada persona de acuerdo a su proximidad con Rupert Murdoch, James Murdoch y otros altos funcionarios.

————————-

De qué hablamos cuando hablamos de visualizaciones

Datos, datos y más datos; esa es la materia prima de las visualizaciones. Sin datos, no podemos hacer nada. Pero bueno, el tema es que cuando se produce el “milagro” y aparecen los datos, nunca están presentados de una manera “digerible” para el usuario común. «¿A quién le puede servir un montón de planillas de Excel con múltiples columnas y miles de filas de números?», me pregunté varias veces. No cualquiera los entiende y, mucho menos, interpreta lo que esos datos quieren decir.

Cifras, fechas, lugares, personas, todos son datos; pero no todos son información relevante para aquello que queremos contar. «¿Y qué quiero contar?», se preguntarán. Bueno, en este punto es donde comienza para mí el proceso de visualización de datos. Un proceso que presenta múltiples aristas.

  • Periodística
    Hay que saber qué historia quiero contar y para ello es sumamente necesario comprometerse con la información. Entenderla de la “A” hasta la “Z”. Si no entiendo qué quiero contar, menos va a entender el lector que ve nuestras visualizaciones.
  • Visual
    Tenemos que diseñar la manera en que se va a ver nuestra visualización. Niveles de lectura, colores, formas, tipografías, etc.
  • Infográfica
    «¿Qué tomamos de este mundo?» La síntesis y su manera de graficar. Barras, tortas, fiebres, etc.
  • Interactiva
    Este punto se focaliza en la manera que el usuario va a navegarlas. Todas las opciones que le demos al lector deben haber sido pensadas previamente por nosotros y deben verse en forma clara. Para confundirlos, ya existen las eternas planillas de Excel con miles de datos. O no?

Seguir leyendo

NPR: Qué es CAR y una visualización eléctrica

 

Les presento algunos trabajos de NPR (EEUU) que inspiraron mi camino de interiorización en periodismo de base de datos.

La primera es una entrevista realizada por la IJNet (International Journalists Network) a Robert Benincasa donde el periodista explica los rudimentos del CAR (Computer-Assisted Reporting)

El video está en inglés pero dejo las ideas principales traducidas más abajo.

 

 

Definiciones y Objetivo

Benincasa define “CAR” como la disciplina que usa análisis de data para contar una historia; encuentra información escondida y la pone a disposición de la opinión pública.

Define “Data” como aquella información altamente estructurada que puede ser leída por software. La información sigue un patrón y está bien documentada. No obstante, las bases de datos en crudo pueden tener errores y debilidades.

El desafío es encontrar tendencias o asociaciones en la data que sean relevantes periodísticamente.

 

Caso Aceleración Involuntaria Automotor.

Comenta y muestra planillas del caso donde se producían aceleraciones involuntarias en el parque automotor de Estados Unidos, principalmente en modelos Toyota (Unintended Acceleration Not Limited To Toyotas).  Seguir leyendo