Datos abiertos con impronta propia

 

Unos días antes del comienzo de los Juegos Olímpicos de Londres 2012 accedimos a una gran base de datos del portal inglés The Guardian integrada por 29.217 registros. Es un interesantísimo listado de todos los atletas que ganaron una medalla a lo largo de la historia, desde Atenas 1896 hasta Pekín 2008. The Guardian, en su Data Blog compartió una galería de visualizaciones y abrió los datos para que la audiencia pudiera hacer sus propios análisis. Y así lo hicimos, bajamos los datos en formato Excel y empezamos a procesarlos.  Seguir leyendo

Si el Indec fuera creíble habría una migración masiva a Capital Federal

Foto: Flickr /CC/ Proimos

El Gobierno suele invitar a los porteños y habitantes del conurbano a hacer las compras en el Mercado Central para bajar el costo de la alimentación. Pero es un mecanismo que no está disponible para la mayoría de la población del área metropolitana, que no vive cerca del mercado concentrador.  Seguir leyendo

Incentivo Docente en 8 años: ¿Cuánto aumentó?

De casi $ 520 millones en 2003, a más de $ 3.166 millones en 2011. Es lo que el Gobierno Nacional giró desde el Fondo de Incentivo Docente, al total de las provincias argentinas. La variación en 8 años fue del 509 %.  ¿Cómo llegamos a esa conclusión? La historia comienza a principios de abril de este año, cuando la Dra. Dolores Lavalle Cobo (@doloreslavalle) decidió realizar un pedido de información al Ministerio de Educación de La Nación. Dolores es miembro del Centro para la Información Ciudadana, una iniciativa cívica relacionada con el acceso y la calidad de la información pública en nuestro país.  Seis días después de la petición, recibió la respuesta, en soporte papel, documento que nos hizo llegar para que podamos capturar la información allí contenida y obtener un documento en formato digital.  Los resultados se visualizan en el gráfico superior. Seguir leyendo

El ahorro en dólares de los ministros

«Haz lo que yo digo pero no lo que yo hago», fue lo primero que se me vino a la cabeza cuando recibí los datos de los ahorros de los ministros según la declaración jurada presentada por cada uno de ellos en 2011 (correspondiente al período 2010).

Como verán, los datos no son muchos, pero sí, bastante jugosos. La visualización es muy sencilla y la interacción con el usuario, también. Este solo debe seleccionar el nombre del ministro y el gráfico le devuelve el detalle de sus ahorros en pesos y en dólares.

Algunos pormenores del trabajo

  • Los datos: Con las declaraciones juradas enfrente nuestro, cargamos los datos de los ahorros de cada ministro en una planilla de Excel, pero teníamos un problema: los números absolutos solos, no nos decían mucho. O conseguíamos los ingresos de cada uno para así lograr un porcentaje de ahorro o le buscábamos la vuelta por otro lado.
  • Una historia para contar: El tema es que cualquier visualización, por más sencilla que sea, debe encontrar una historia que contar con los datos. Por eso, y con ayuda de las funciones de cálculo que posee el software Tableau Public pudimos pasar los valores absolutos a porcentajes. De esta manera pudimos generar una torta que expresara el 100% de ahorros de cada ministro discriminada por el tipo de moneda elegida (pesos y/o dólares).
  • Una pequeña revelación: La percepción de los mismos datos expresados de esta manera sería más clara y reveladora para el lector, ya que no sería lo mismo detallar únicamente el tipo y monto absoluto de ahorro de cada ministro, que también otorgarle la posibilidad de resumir todos esos datos en una seductora torta de porcentajes.
  • Una decisión: Sé que algunos lectores hubiesen querido ver a simple vista un ranking de los ministros que tenían mayor porcentaje de ahorros en dólares, pero la verdad es que preferí que el usuario pudiera descubrirlo por si mismo interactuando con la información que le brindábamos.

Creo que este es buen ejemplo para demostrar que una pequeña visualización de datos puede ser entendida como una evidencia, porque nos demuestra de manera más clara aquellos que suponíamos.

No se pierdan la nota que escribió Maia Jastreblansky sobre este tema. Ver nota de lanacion.com

Y acá les dejo los datos en crudo para que prueben otras visualizaciones, si es que lo desean. Bajar datos

Flickr: Images_of_Money

Los datos no hablan por sí mismos

¿Creyeron que los datos hablaban? Bueno, disculpen que les pinche el globo, pero no. Les cuento el porqué.

Para explicar esta frase encontré una metáfora muy conocida y súper popular; la del vaso medio lleno o medio vacío.

Un vaso contiene líquido hasta la mitad de su volumen. Un optimista diría que el vaso está medio lleno, pero un pesimista, con una visión totalmente diferente, diría que el vaso está medio vacío. Ambos miran lo mismo, pero llegan a conclusiones diferentes.

  • Los datos no dan un mensaje inequívoco, necesitamos de un marco que los valide.
  • La percepción de los datos varía según cada intérprete, porque cada uno de ellos utiliza un lente diferente para mirarlos.
  • Cualquier conjunto de datos es sólo una colección de números abstractos que sólo toman sentido luego de una interpretación. De esta manera, es entendible que frente a los mismos datos se llegue a conclusiones diferentes, hasta opuestas; como es el caso del vaso del agua, ambas interpretaciones son “correctas”, pero el hecho real es que el vaso está por la mitad.

Entonces, cuando alguien dice: “los datos hablan por sí solos”, en realidad quiere decir “si mirás los datos con el marco que los estoy viendo yo, seguramente veas lo mismo que yo”.

Ej.: La producción de petróleo

Hace unos días tuve acceso a una base de datos bastante interesante y resonante en estos días. El archivo contenía el total de yacimientos petroleros de YPF, dividido por cuencas petrolíferas, provincias y cantidad de petróleo producido durante 2009, 2010 y 2011. Estos son los datos crudos. Prueben a ver si les hablan jajaj  Seguir leyendo

El martillo, la cebolla y la ecuación

La visualización de datos es un lenguaje, el lenguaje que le da forma a los datos. El tema es: «¿cuál es la mejor forma para visualizar mis datos?»

Esa pregunta me la hago todo el tiempo. Primero tengo que tener en claro cual será la función de mi gráfico y solo después puedo preguntarme qué forma quiero para él. La función no determina la forma, pero la restringe.

Alberto Cairo dice que una buena visualización es aquella que es funcional como un martillo, explorable por capas, como una cebolla y exacta y bella como una ecuación.

Vayamos por partes:

  • Funcional como un martillo: Así como la forma de un martillo responde a la función específica para la que fue creado, un gráfico es una herramienta que se le brinda al lector, una herramienta cognitiva.
  • Explorable por capas como una cebolla: Una vez que se presenta la información y se le dan pistas al lector para que navegue y explore a piacere la base de datos. Esta función es más ambiciosa que la anterior. También la veo similar a un iceberg, porque en un primer pantallazo solo muestra parte de la información que contiene, y hay que zambullirse en el gráfico para verlo en su totalidad. El vínculo que se genera con el lector es más íntimo. Un lector que no interactúa, es un lector que se pierde la posibilidad de indagar en esa base de datos.
  • Exacta y bella como una ecuación: Como ya sabemos, los datos son la savia que dan vida a nuestra visualización, por eso deben ser precisos y tenemos que poder dosificados. Si llenamos al lector de datos, se marea; y si le damos muy pocos, se queda con las ganas. Mostrar la dosis justa de información, depende de nosotros.

«¿Cada visualización tiene que tener todas estas características al mismo tiempo?», se preguntarán. La respuesta es “ni”. Mi consejo es que todas deben estar presentes, pero el secreto es saber quién será el protagonista de cada una de ellas: si “el martillo”, “la cebolla” o “la ecuación”.

Les doy 2 ejemplos:

Acciones de YPF

  1. La función es simple, mostrarle al lector la curva del precio de las acciones. Para ello, consideramos que la mejor manera de graficarlo era mediante una fiebre, ya que es la forma más correcta de mostrar la evolución de un mismo elemento a lo largo del tiempo.
  2. «¿Qué posibilidades de exploración tiene el lector?» El filtro de tiempo. El lector puede acercarse y descubrir el precio día por día, o alejarse y evaluar su evolución desde 2007.
    Podrían decirme que no es muy explorable que digamos, ¿no?,
    y que requiere de una baja interactividad por parte del lector; pero lo que hay que tener en claro es que esto no fue azaroso. Nuestra intención fue esa, una presentación sencilla y un nivel básico de exploración. Si si, en este caso vendría a ser una cebolla poco explorable, o quizás una pequeña cebolla.
  3. Y por último, la función de ecuación. Fechas y valores exáctos al cierre de cada cotización. Nada muy complicado de entender.

Diría entonces que la función protagonista es “el martillo”, luego “la ecuación” y como actor de reparto, “la cebolla”.

 

Ministerio de Salud

  1. Sin lugar a duda los datos numéricos son los protagonistas visuales. Seducen por su ubicación (bien arriba), por escala y por la exactitud. Queríamos que el usuario vea en una primera lectura las diferencias que había entre una licitación y la otra. Lo acompañan dos ilustraciones del edificio para darle un contexto más cercano de la construcción a la que nos vamos a referir.
  2. En un segundo nivel de lectura le pedimos al lector que interactúe para ver en detalle los datos, y es ahí donde aparece la función “cebolla”, ya que el lector tiene la posibilidad de meterse en los datos y saber por ej. a cuánto se pagó el m2 de revoque y cuántos m2 tuvieron que aplicar. Sin olvidarnos obviamente, que la idea es poder comparar los mismos productos/servicios entre ambas licitaciones.
  3. Y luego vemos las barras, y son ellas las que nos ayudan a comparar gráficamente ambos presupuestos.

Entonces, en este caso, tenemos la función “ecuación” como protagonista, luego, “la cebolla”, y por último “el martillo”.

Bueno, espero que les haya gustado el post.

Del Flash al Tableau, una elección en favor del usuario

En NACION Data queremos compartir con ustedes la “cocina” de una producción periodística, basada en el desarrollo de un Tableau. Se trata de una tecnología gratuita que permite realizar visualizaciones sustentadas en bases de datos en diferentes formatos (planillas Excel, por ejemplo).

Cuenta Mariana Trigo Viera, jefa de diseño interactivo de lanacion.com, que el año pasado se había armado una infografía en Flash sobre el mismo tema. “Cuando Maia Jastreblansky -redactora de Política- me contó que tenía un nuevo informe y que quería publicarlo con datos actualizados, decidimos utilizar Tableau para armar una base de datos en Excel”, detalla Trigo Viera, y agrega: “Así, el usuario podía relacionarse con la información de otra manera. El desarrollo en Flash era muy visual, pero consideré que este tipo de datos eran óptimos para que el usuario pudiera explorar la información según sus intereses y/o inquietudes personales”.

A partir de allí, diseñadora y redactora ordenaron las tablas del archivo Excel. Maia cargó los datos y Mariana los graficó.

Se publicó un artículo en home, que se ubicó en el top 10 del ránking de notas más leídas del día:  Pauta oficial: ¿A quién beneficia Cristina Kirchner? ¿Y Macri? ¿Y Scioli?

Y el resultado final del Tableau se puede apreciar, a continuación:

Si conocés otros gobiernos en Argentina con iniciativaes similares , escribinos a lndata@lanacion.com.ar

 

 

Una base de datos con “mucha carne”

Flickr/Creative Commons / Diego3336

El periodismo económico –el más ortodoxo inspirado en el trabajo de los economistas– desde siempre ha utilizado bases de datos para construir información: la tendencia del data-journalism llega para profundizar este proceso y democratizar el conocimiento.

Seamos abiertamente honestos con la comunicación. Al hacer pública una base de datos producimos efectos informativos ampliamente superadores a un buen artículo periodístico.

El punto de vista que puede ofrecer un artículo periodístico construido a partir del análisis de una base de datos es limitado y finito [hay espacios y formatos preestablecidos para su publicación]. Al abrir la fuente al público damos la posibilidad de expandir curiosidad y conocimiento más allá de lo sospechado.

1. CARNE CRUDA

A mitad de octubre del año pasado, en una discusión de sumario (reuniones que se realizan entre redactores y editores para presentar propuestas de notas) surgió la inquietud de los coletazos de la inflación en la microeconomía. La palabra “precios” rápidamente se trasladó al concepto “góndola”. Había observado que en el hipermercado de mi barrio habían decidido achicar el sector de carnicería.

¿Dónde podemos consultar el consumo de carne? El Instituto de Promoción de la Carne Vacuna Argentina (IPCVA) tiene un buen sector de estadísticas económicas. En su sitio de Internet desde hace algún tiempo tomaron la decisión de hacer públicas las bases de datos que utilizan para analizar el mercado bovino.

Al chequear las métricas históricas de consumo promedio (en kilos) por habitante caímos en cuenta de que en 2011 Argentina tocó su mínimo histórico: 53,4 kg. El dato más bajo en los últimos cincuenta años –cuando se empezó la serie-.

2. CARNE PROCESADA

Consideramos este hecho como relevalente: la carne, alimento ícono de la tradición gastronómica argentina, registraba su menor nivel de ventas en un contexto circundado por la expansión del PBI y la inflación.

Consultamos a especialista del mercado cárnico para ayudarnos a descifrar el por qué. Todos arribaron a una explicación más o menos unánime. Entre 2007 y 2011, el stock de vacas cayó 17% y los precios escalaron 222%. Conclusión: menos consumidores pueden comprar ese bien.

El 18 de octubre pasado el corolario fue la publicación del artículo “La mesa de los argentinos reduce el consumo de carne al mínimo histórico”.

3. CARNE HIPERVISUAL Y EN EQUIPO

Uno de los vicios que el periodismo económico en medios digitales heredó del papel es creer que podemos explicar una serie estadística sólo con palabras y sin aburrir al lector que fija la mirada en una pantalla.

Explicar signos (números) con más signos (palabras) parece a simple vista un despropósito semántico para el ecosistema digital, que ofrece como nunca múltiples herramientas para visualizar información.

En el artículo teníamos 3 bases de datos para armonizar en el contenido: consumo anual per cápita, precio promedio del kilo y cabezas de ganado. Para brindar al lector una perspectiva de estas tres variables, Mariana Trigo Viera, subjefa de diseño interactivo, creó esta infografía:

¡Es importante el trabajo en equipo! Debatir con el infógrafo el tenor de los datos a comunicar y cómo se desarrollarán le ayudará a optimizar su graficación. Asimismo, el ordenamiento visual ayuda a clarificar los conceptos que se explican. Entonces:

  • Los gráficos ayudarán al ojo a leer datos complejos ordenados en una serie y permitirán al usuario explorarlos de modo dinámico
  • El texto será el soporte fundamental para explicar por qué esos datos son noticia

El periodismo económico nutrido de bases de datos tiene la posibilidad inédita de potenciar su trabajo. No sólo por la funcionalidad de arribar a noticias gracias a la lectura comparada de una estadística y enriquecerla con multimedia. La finalidad va más allá.

Al “abrir” datos y hacerlos accesibles a cualquiera, generaremos la oportunidad de pensar nuestra propia fuente primaria para disparar otros puntos de vista y análisis. Incluso, más allá de lo planteado por nosotros. Quizás este sea otro modo de lograr que los lectores puedan arribar a sus propias conclusiones.

De qué hablamos cuando hablamos de visualizaciones

Datos, datos y más datos; esa es la materia prima de las visualizaciones. Sin datos, no podemos hacer nada. Pero bueno, el tema es que cuando se produce el “milagro” y aparecen los datos, nunca están presentados de una manera “digerible” para el usuario común. «¿A quién le puede servir un montón de planillas de Excel con múltiples columnas y miles de filas de números?», me pregunté varias veces. No cualquiera los entiende y, mucho menos, interpreta lo que esos datos quieren decir.

Cifras, fechas, lugares, personas, todos son datos; pero no todos son información relevante para aquello que queremos contar. «¿Y qué quiero contar?», se preguntarán. Bueno, en este punto es donde comienza para mí el proceso de visualización de datos. Un proceso que presenta múltiples aristas.

  • Periodística
    Hay que saber qué historia quiero contar y para ello es sumamente necesario comprometerse con la información. Entenderla de la “A” hasta la “Z”. Si no entiendo qué quiero contar, menos va a entender el lector que ve nuestras visualizaciones.
  • Visual
    Tenemos que diseñar la manera en que se va a ver nuestra visualización. Niveles de lectura, colores, formas, tipografías, etc.
  • Infográfica
    «¿Qué tomamos de este mundo?» La síntesis y su manera de graficar. Barras, tortas, fiebres, etc.
  • Interactiva
    Este punto se focaliza en la manera que el usuario va a navegarlas. Todas las opciones que le demos al lector deben haber sido pensadas previamente por nosotros y deben verse en forma clara. Para confundirlos, ya existen las eternas planillas de Excel con miles de datos. O no?

Seguir leyendo