“El Indultómetro”, un proyecto español basado en datos

Por Eva Belmonte – Responsable de proyectos de Civio

La ley dice que se trata de una medida excepcional, pero desde 1996 los gobiernos españoles han concedido más de 10 mil indultos con los que han anulado sin ofrecer explicaciones las sentencias impuestas por los jueces. Algunos de ellos han ocupado portadas de periódicos (policías torturadores, políticos corruptos, jueces prevaricadores…) ante la indignación ciudadana, pero en la mayoría de esos casos se trataba el problema como un abuso de poder puntual y no se abarcaba la realidad del uso sistemático de esta medida de gracia en España. El objetivo de El Indultómetro es justo ese: ofrecer una visión sistematizada, global y lista para el análisis.

La web de la Fundación Ciudadana Civio, creada por dos informáticos y una periodista  (Juan Elosua, David Cabo y Eva Belmonte), enumera y clasifica todos los indultos concedidos por tipo de delito, año de concesión de la medida de gracia y provincia, entre otros parámetros, a partir de una información oficial -cada indulto se publica en el Boletín Oficial del Estado (BOE) a través de un Real Decreto- que siempre ha sido pública pero cuyo formato no permite un tratamiento sencillo que de paso a realizar análisis, comparaciones o investigaciones basadas en datos. Lo habitual en algunas redacciones de periódicos españoles para sumar los indultos de un año, por ejemplo, era encargar a alguien (el pobre becario de turno) la farragosa lectura manual de los resultados del motor de búsqueda del propio BOE. El resultado no era ni práctico ni mucho menos preciso o fiable.

La base de datos nace, pues, en el BOE. El primer paso era descargar todas las disposiciones de la sección relacionada en formato HTML a través de un programa escrito en Ruby, que también se utilizó para procesar todas esas disposiciones, seleccionar las que contenían indultos y separar la información relevante de cada uno de ellos (identificador de la disposición del BOE, fecha de publicación, si se trata del Ministerio de Justicia o de Defensa, el género del indultado, el tribunal sentenciador, la fecha de la condena, el crimen por el que fue condenado y la sentencia, el tipo de indulto, los condicionantes del indulto, la fecha de concesión y el ministro firmante en cada caso).

Con todos los datos clasificados, se realizaron dos verificaciones: una interna (corregir indultos que no habían sido procesados correctamente de forma automática) y una externa (utilizando el propio buscador del BOE).

Así pues, El Indultómetro es la primera base de datos global y esquematizada de la información sobre indultos en España, realizada utilizando herramientas como Ruby, Excel, Google Refine, y D3.js. El resultado es una visualización sencilla y un buscador que permiten analizar este fenómeno al detalle, acompañado de una cronología con los casos más destacados que complementa la base de datos con las historias periodísticas paralelas. Es un proyecto de periodismo de datos que relaciona lo global -las grandes cifras- con el detalle de algunos de los casos más destacables.

————————–

  • + info: El Indultómetro cuenta con una sección que detalla la metodología paso a paso que han seguido sus creadores para la obtención y tratamiento de los datos. Tanto el procesamiento de la información como la propia web han sido realizados bajo licencia de software libre, y la documentación técnica de todo el proyecto estará también disponible en la web, junto con la API de acceso y el código fuente.

Facts are Sacred de Simon Rogers, el libro.

Hoy es el último día de Simon Rogers (@smfrogers) en The Guardian (@guardiandata). Quiero homenajearlo compartiendo con Uds. este video donde muestro mis contenidos preferidos de la versión impresa del libro Facts are Sacred..

 

¡Gracias Simon por inspirarnos! Mucha suerte en la soleada California. 🙂

NACION Data finalista de los Data Journalism Awards

 

Compartimos con Uds .esta gran noticia.

El sábado anunciaron en Perugia, Italia (Intenational Journalism Festival) los 73 candidatos a finalistas que quedaron de los 300 presentados este año para los premios Google – GEN (Global Editors Network) Datajournalism Awards.

Es el segundo año que se presenta LA NACION, el año pasado el proyecto Subsidios al Transporte de Colectivos (Diego Cabot) también quedó finalista y recibió la Mención Especial de Honor entregada por Paul Steiger de Propublica.

Este año LA NACION quedó finalista en dos de las tres categorías que presentó:  Seguir leyendo

Manual de Periodismo de Datos en español

El Manual de Periodismo de Datos en Español

 

Hoy lanzamos el Manual de Periodismo de Datos (Data Journalism Handbook) traducido al español. Es un libro gratuito y de código abierto que busca ayudar a periodistas en el uso de “datos” para mejorar las noticias.

Ahora más que nunca, los periodistas necesitan trabajar con “datos”. Cubrir gasto público, elecciones, los cables de Wikileaks, la crisis finaciera, etc.  Seguir leyendo

Jaimi Dowdell y el aprendizaje en periodismo de datos

 

Jaimi Dowdell (@jaimidowdell) es directora de training del IRE (Investigative Reporters and Editors) desde 2008, especializada en “periodismo asistido por computadores (CAR – Computer Assisted Reporting) ” últimamente renombrado como “periodismo de bases de datos”.  Seguir leyendo

NACION DATA en STRATA Conference

 

Momi Peralta Ramos y Sandra Crucianelli, del International Center for Journalists Knight International Fellowships Program, presentaron en la Strata Conference, en California, el trabajo en conjunto realizado con LA NACION durante el año 2012, abriendo datos públicos y desarrollando el periodismo de datos.

 

Estas fueron sus respectivas presentaciones.  Seguir leyendo

Preguntar en 140 caracteres

Twitter puede no ser el canal más efectivo, pero es un medio totalmente válido para preguntar por información pública en Inglaterra. No sólo eso. En noviembre de 2012, la Oficina del Comisionado de Información (ICO, sus siglas en inglés), órgano destinado a fomentar el acceso a datos oficiales y proteger la información personal en ese país, elaboró una breve guía donde explica los requisitos que deben cumplirse para que el pedido sea considerado. Aquí, las claves:  Seguir leyendo

Periodismo de Datos en Español vía Hangout

No abundan las herramientas para hacer periodismo datos en español. Tampoco las lecturas, manuales o textos que ayuden, en nuestro idioma, a aprender cómo involucrarnos en esta apasionante disciplina. Por eso, para entender de qué de trata,  para quienes no han incursionado en el tema, vale la pena compartir con nuestros seguidores la conferencia y debate en línea realizado hoy al mediodía, convocado por Mauricio Jaramillo Marín, creador de  Hangouts de Periodismodel que participamos junto a periodistas de la talla de Mar Cabra (España) y Olga Lucía Lozano (Colombia). Mar vive en Madrid y es Project Research Manager del Consorcio Internacional de Periodistas de Investigación. Olga Lucía es editora de La Silla Vacía. Son dos horas completas en video de un diálogo enriquecedor vía Web, que incluyen desde nuestras concepciones sobre la definición de periodismo de datos, hasta las herramientas que usamos para su práctica, incluidas las que son de uso habitual en el equipo periodístico de datos de La Nación.

Seguir leyendo

El desempleo en personas como vos

Desde que comenzamos a hacer periodismo de datos en LA NACION, hemos tratado de sistematizar con visualizaciones las bases de datos de la información que tratamos con más frecuencia en la sección economía. La desocupación es una de estas.

El 28 de enero pasado, cuando la Presidenta anticipó que la desocupación del cuarto trimestre fue 6,9% estrenamos la primera visualización, con la evolución de la tasa durante los últimos tres años.

Ahora, dimos un segundo paso para informar al respecto de este problema macroeconómico. Pocas cosas más injustas que una tasa nacional: el dato pondera una variable sobre la población económicamente activa (PEA), pero se pierde de reflejar las particularidades de los grandes centros urbanos del país, de acuerdo al perfil de sexo y edad de sus habitantes.

Es por eso que junto a Mariana Trigo Viera, subjefa del equipo de diseño interactivo de lanacion.com, diseñamos una aplicación para que cada lector –sin importar en qué parte del país esté- pueda conocer la curva de desocupación de acuerdo a su propio persona. En otras palabras, pueda personalizar su información y conocer qué tan lejos o cerca está de la media del lugar donde vive.

Desarrollo de la idea

La propuesta de trabajo comenzó a partir de la observación de un dato puntual. Revisando el informe “Encuesta Permanente de Hogares – Mercado Laboral” del tercer trimestre de año, nos percatamos que lejos de la media nacional, las mujeres jóvenes eran las personas con mayores problemas para conseguir un empleo.  Seguir leyendo

Los perros de New York por WNYC

 

Les presento Dogs of NYC del equipo de datos de la radio WNYC (@datanews). Armé un video tour en castellano porque me gustó mucho el proyecto. Aclaro, ¡no soy locutora!

 

Los detalles se aprecian mejor en 720 HD pantalla completa

 

Como menciono en el video, me parece que Dogs of NYC reúne varios elementos que suelen verse en proyectos de periodismo de datos.

– Pedido de acceso a la información pública (FOIA request) al Departamento de Salud e Higiene Mental de la ciudad (NYC Dept of Health and Mental Hygiene). Según me confirmó Steven Melendez, les entregaron una gran planilla de datos, con una fila por cada perro según los registros de la base de dicha repartición.

– Uso de Google Fusion Tables para trabajar y abrir la base.

– Oportunidad de usar herramientas de terceros para mapping de código abierto o bajo licencia Creative Commons.

En este caso, el diseño tipo acuarela Watercolor del mapa era de los multipremiados Stamen Design, bajo licencia CC BY 3.0. La base de datos se manejó con   OpenStreetMap, bajo licencia CC BY SA. Las capas de navegación por nombres y razas de perros fueron desarrolladas usando Tilemill y alojadas en Mapbox.

Aprovecho para presentarles a Cookie, una de mis perras, que tiene el número 28 en cuanto a popularidad de su nombre según los parámetros de los perros registrados en la ciudad de New York. Seguir leyendo