La relación de los argentinos con la inflación podría dividirse en dos grandes grupos: en conjunto de las personas que tienen más de 35 años y los que tienen menos de 30. El primer grupo tuvo al menos doce años durante la hiperinflación de fines de la década del ’80; mientras que el segundo empezó a tomar decisiones económicas pequeñas, como ir al kiosko a comprar golosinas, una vez iniciada la Convertibilidad. Seguir leyendo
Categoría: Datasets
Incentivo Docente en 8 años: ¿Cuánto aumentó?
De casi $ 520 millones en 2003, a más de $ 3.166 millones en 2011. Es lo que el Gobierno Nacional giró desde el Fondo de Incentivo Docente, al total de las provincias argentinas. La variación en 8 años fue del 509 %. ¿Cómo llegamos a esa conclusión? La historia comienza a principios de abril de este año, cuando la Dra. Dolores Lavalle Cobo (@doloreslavalle) decidió realizar un pedido de información al Ministerio de Educación de La Nación. Dolores es miembro del Centro para la Información Ciudadana, una iniciativa cívica relacionada con el acceso y la calidad de la información pública en nuestro país. Seis días después de la petición, recibió la respuesta, en soporte papel, documento que nos hizo llegar para que podamos capturar la información allí contenida y obtener un documento en formato digital. Los resultados se visualizan en el gráfico superior. Seguir leyendo
El ahorro en dólares de los ministros
«Haz lo que yo digo pero no lo que yo hago», fue lo primero que se me vino a la cabeza cuando recibí los datos de los ahorros de los ministros según la declaración jurada presentada por cada uno de ellos en 2011 (correspondiente al período 2010).
Como verán, los datos no son muchos, pero sí, bastante jugosos. La visualización es muy sencilla y la interacción con el usuario, también. Este solo debe seleccionar el nombre del ministro y el gráfico le devuelve el detalle de sus ahorros en pesos y en dólares.
Algunos pormenores del trabajo
- Los datos: Con las declaraciones juradas enfrente nuestro, cargamos los datos de los ahorros de cada ministro en una planilla de Excel, pero teníamos un problema: los números absolutos solos, no nos decían mucho. O conseguíamos los ingresos de cada uno para así lograr un porcentaje de ahorro o le buscábamos la vuelta por otro lado.
- Una historia para contar: El tema es que cualquier visualización, por más sencilla que sea, debe encontrar una historia que contar con los datos. Por eso, y con ayuda de las funciones de cálculo que posee el software Tableau Public pudimos pasar los valores absolutos a porcentajes. De esta manera pudimos generar una torta que expresara el 100% de ahorros de cada ministro discriminada por el tipo de moneda elegida (pesos y/o dólares).
- Una pequeña revelación: La percepción de los mismos datos expresados de esta manera sería más clara y reveladora para el lector, ya que no sería lo mismo detallar únicamente el tipo y monto absoluto de ahorro de cada ministro, que también otorgarle la posibilidad de resumir todos esos datos en una seductora torta de porcentajes.
- Una decisión: Sé que algunos lectores hubiesen querido ver a simple vista un ranking de los ministros que tenían mayor porcentaje de ahorros en dólares, pero la verdad es que preferí que el usuario pudiera descubrirlo por si mismo interactuando con la información que le brindábamos.
Creo que este es buen ejemplo para demostrar que una pequeña visualización de datos puede ser entendida como una evidencia, porque nos demuestra de manera más clara aquellos que suponíamos.
No se pierdan la nota que escribió Maia Jastreblansky sobre este tema. Ver nota de lanacion.com
Y acá les dejo los datos en crudo para que prueben otras visualizaciones, si es que lo desean. Bajar datos
Inflación Verdadera: Una Lata de Atún por las Nubes
Desarrollado por Junar
¿Tenía en mente preparar una ensalada de atún? Deberá pensarlo dos veces. Esta semana la lata aumentó en promedio el 42,53 % con relación al precio que se pagaba hace 7 días. Y no fue el único producto que tuvo un ascenso considerable: un kilo de tapa de asado de novillito cuesta ahora un 32,07% más caro. Los datos surgen a partir del relevamiento que un grupo de economistas realiza diariamente, tomando como base los precios publicados por los principales supermercados de la ciudad de Buenos Aires. A través del sitio “Inflación Verdadera” todos los días se comparan las variaciones porcentuales de precios y se calculan el Índice de Alimentos y Bebidas y el Índice de la Canasta Básica Alimentaria. La inflación anual (que se visualiza en el gráfico superior), es el cambio porcentual en el promedio de cada índice, cada 30 días, con respecto al promedio del período el año anterior. La series comienza a fines del 2008 y llega hasta el 2012. El equipo de Nación Data se vale de la plataforma de Junar, para publicar sus set de datos, los que permiten, además, que el lector los comparta en redes sociales a través de sus cuentas de Twitter y/o Facebook.
Los datos no hablan por sí mismos
¿Creyeron que los datos hablaban? Bueno, disculpen que les pinche el globo, pero no. Les cuento el porqué.
Para explicar esta frase encontré una metáfora muy conocida y súper popular; la del vaso medio lleno o medio vacío.
Un vaso contiene líquido hasta la mitad de su volumen. Un optimista diría que el vaso está medio lleno, pero un pesimista, con una visión totalmente diferente, diría que el vaso está medio vacío. Ambos miran lo mismo, pero llegan a conclusiones diferentes.
- Los datos no dan un mensaje inequívoco, necesitamos de un marco que los valide.
- La percepción de los datos varía según cada intérprete, porque cada uno de ellos utiliza un lente diferente para mirarlos.
- Cualquier conjunto de datos es sólo una colección de números abstractos que sólo toman sentido luego de una interpretación. De esta manera, es entendible que frente a los mismos datos se llegue a conclusiones diferentes, hasta opuestas; como es el caso del vaso del agua, ambas interpretaciones son “correctas”, pero el hecho real es que el vaso está por la mitad.
Entonces, cuando alguien dice: “los datos hablan por sí solos”, en realidad quiere decir “si mirás los datos con el marco que los estoy viendo yo, seguramente veas lo mismo que yo”.
Ej.: La producción de petróleo
Hace unos días tuve acceso a una base de datos bastante interesante y resonante en estos días. El archivo contenía el total de yacimientos petroleros de YPF, dividido por cuencas petrolíferas, provincias y cantidad de petróleo producido durante 2009, 2010 y 2011. Estos son los datos crudos. Prueben a ver si les hablan jajaj Seguir leyendo
BAhackaton de aplicaciones móviles y datos abiertos
El sábado pasé por #Bahackaton, el primer hackaton de aplicaciones móviles de código abierto en Argentina. Se realizó durante el viernes 11 y sábado 12 de mayo de 2012 en el Centro Metropolitano de Diseño. Seguir leyendo
Periodismo de Datos y Salud: “Hospitales: No hagan daño”
CASO “DO NOT HARM” de LAS VEGAS SUN
Para empezar voy a contarles un caso emblemático de periodismo de investigación y bases de datos. A partir de la información recaudada, cruzada, rectificada, se logró un gran impacto periodístico y mejora en la salud de los habitantes de Las Vegas.
El proyecto “Do No Harm” (“No Hagan Daño”) de Las Vegas Sun, fue publicado en forma de serie durante el año 2010.
Un equipo liderado por los periodistas Marshall Allen y Alex Richards, analizó 2,9 millones de registros de facturación a pacientes de hospitales locales. Los datos se obtuvieron a través de una solicitud de acceso a los registros en poder del estado de Nevada donde los centros de salud deben presentar dicha información. Seguir leyendo
El Banco Mundial abre sus bases de datos
Vía Mauricio Caminos (@mauric88), redactor de Política de lanacion.com, nos enteramos que el mismísimo Banco Mundial acaba de abrir una gran cantidad de bases de datos a través de un software estadístico llamado Stata y el módulo WBOpenData.
¿Por qué utilizar el módulo wbopendata para acceder a los datos?
El módulo wbopendata se conecta a la API de Datos de libre acceso del Banco Mundial y proporciona acceso directo a la última versión de los datos del Banco a través de la interface Stata. No se requiere ninguna descarga o gestión innecesaria de los datos.
¿Qué novedades presenta esta versión de wbopendata?
- Acceso a 1.000 nuevos indicadores, aumentando el total de las series cronológicas de 4.200 a 5.300.
- Acceso a los metadatos de la serie descargada, que incluyen las definiciones de los indicadores, la organización y/u organismo responsable de su recopilación, y los enlaces a la información de respaldo disponible.
- Fácil vinculación de los indicadores descargados con mapas del programa Stata.
- Acceso a datos en tres idiomas respaldados por Stata: inglés, español o francés.
El módulo wbopendata permite el acceso a información de más de 256 países y regiones desde 1960. Los conjuntos de datos incluyen:
- Indicadores del desarrollo mundial (WDI, por sus siglas en inglés)
- Flujos mundiales de financiamiento para el desarrollo
- Indicadores del desarrollo de África
- Doing Business
- Estadísticas sobre educación
- Encuestas de empresas
- Estadísticas sobre género
- Estadísticas sobre salud, nutrición y población
- Objetivos de desarrollo del milenio
- Indicadores mundiales de buen gobierno
——————–
- + info: Cómo tener acceso a los datos del Banco Mundial
- + link: El sitio de datos abiertos del Banco Mundial
Simon Rogers: Los datos están cambiando al periodismo
Comparto con ustedes una presentación de Simon Rogers, el número uno de periodismo de base de datos de The Guardian y autor del DataBlog yDataStore del mismo medio. Un ejemplo que marca tendencia, del autor de“Facts are Sacred”:
Y también realizó el siguiente Storify: Seguir leyendo
Panel #DoingDataJ en el Tow Center de Columbia University
En el Tow Center de Columbia University se llevó a cabo un panel auspiciado por ONA “Doing Data Journalism”. Los congregados fueron Julia Angwin (WSJ), Scott Klein (ProPublica), Jo Craven McGinty (NYT), Aron Pilhofer (NYT), Ashkan Soltani y Mo Tamman (Reuters). Susan E. McGregor (CU) resultó una excelente anfitriona y moderadora.
¡Ví el video 3 veces! Realmente muy enriquecedor el debate. Todos ofrecieron agudas reflexiones y mucha información. Si pueden entenderlo en inglés no duden en verlo entero. Me resultó apasionante y diré que, en muchos momentos, ¡sin censura!
Jo Craven McGinty del New York Times, todo un hallazgo.
Descubrí varios personajes nuevos pero voy a concentrarme en ella.
En 1995, realizó una Maestría de Periodismo con Base de Datos en la Universidad de Missouri, cuna de varios data ninjas.
Revisando un dataset con registros de homicios del FBI, encontró que faltaba información sobre varios homicidios causados por policías, pero ahí quedó la cosa. Al terminar sus estudios, ingresó al Washington Post donde sugirió retomar la investigación e integró el team que ganó un Pulitzer Prize for Public Service en 1999 con esta historia de corrupción policial.
Jo mencionó otro caso donde la historia surgió a partir de la imposibilidad de armar un data set coherente. Fue en relación a facturas de agua impagas en la ciudad de Nueva York. Supusieron que muchos podían pagar y no lo hacían, aprovechándose de la inoperancia del gobierno. En efecto, las sumas adeudadas resultaron un agujero negro ante la desprolijidad en la gestión.
Con respecto a herramientas de visualización, las utiliza para “consumo personal”. Es decir, para analizar información. Destacó el uso de software de mapeo, charts de Excel, etc. que le facilitan detectar puntas de investigación.
Por último, concluye de su experiencia personal que, entre estar sentada en una sección específica (estuvo en Metro) o junto al Data Team, le resulta profesionalmente más enriquecedora esta última opción. Le permite continuar aprendiendo de las conversaciones diarias entre el equipo. Eso sí, su desafío es que las distintas secciones de la Redacción no se olviden de involucrarla en historias que podrían incluir bases de datos.
En la Redacción: Números versus testimonios.
Lo que más me impresionó de todo el video fueron dos testimonios de Tamman y Pilhofer.
Ambos fueron consultados por sendos compañeros de redacción por una historia en desarrollo. Los dos hicieron una devolución negativa con fundamento en base de datos y al poco tiempo, la historia salió publicada con los errores oportunamente advertidos por ellos.
Aron Pilhofer: We continue to reward crap journalism that uses anecdotes which run contrary to available data. #doingdataj
— KatherineFink (@KatherineFink) marzo 28, 2012
La conclusión de ambos es que todavía en las redacciones suelen ser más valorados los testimonios, anécdotas o percepciones empíricas frente a la contundencia de las bases de datos.
Pilhofer lo comenta muy enojado a partir del minuto 42:00. ¡Creo que después se arrepintió de haberlo compartido! Seguir leyendo