El detrás de escena de la investigación y clasificación de las 40.000 escuchas de Nisman

I. Especial Video Presentación.

II. Antecedentes.

Por orden judicial, la ex Secretaría de Inteligencia del Estado (SIDE) intervino el teléfono de Jorge Yussuf Khalil, descripto por Alberto Nisman como “la voz y oídos de Irán” en Argentina y persona de confianza de Mohsen Rabbani, principal sospechoso por el atentado a la AMIA. Nisman como titular de la Unidad Fiscal de la AMIA utilizó las escuchas realizadas entre noviembre de 2012 y octubre 2014 para la elaboración de la denuncia que presentó ante Ariel Lijo, cuatro días antes de su muerte.

La denuncia contempla la existencia de un plan delictivo orquestado por las altas autoridades del gobierno nacional argentino y destinado a dotar de impunidad a los imputados de nacionalidad iraní en la causa AMIA con el fin restablecer plenas relaciones comerciales a nivel estatal.

III. Investigación periodística.

El equipo de La Nación Data, junto con voluntarios y estudiantes universitarios (periodismo, derecho, ciencias políticas) inició un largo proceso investigación que abarcó la clasificación de las 40.000 escuchas.

La tarea de análisis implicó la carga de los audios en Voz Data, una plataforma colaborativa desarrollada por La Nación con el apoyo de Knight Mozilla Open News y Civicus Alliance. Se trata de una aplicación web de código abierto que permitió convertir los audios a un formato amigable y clasificar cada uno de ellos en base a diversas categorías establecidas por el equipo de Data. El trabajo se dividió en dos etapas. En 2015 se seleccionaron los 20.000 audios cuya fecha corresponden a los 6 meses antes y después de la firma del Memorándum, y los restantes se examinaron al año siguiente.


IV: El imprescindible rol de los voluntarios.

La investigación involucró a grupos de voluntarios registrados y distribuidos en equipos: estudiantes de las universidades Austral, UCA, Di Tella; y voluntarios de Abogados Ruralistas, Poder CiudadanoCentro Latinoamericano de Derechos Humanos (CLADH) y Datos Concepción. Y si bien la mayoría del trabajo se hizo a distancia, se realizaron cuatro maratones cívicas intensivas de escuchas en la redacción del diario, en la que se compartieron los múltiples hallazgos y se elaboraron los perfiles de los personajes involucrados.

¡No se pierdan los testimonios adicionales que pueden leer al final del post!

V. Notas Publicadas

 

-          La comunidad iraní financió a Esteche

-         Revelan audios de negocios con Irán. Rol del Senador FPV Juan Irrazabal

-          ESPECIAL ANIVERSARIO: Dos años de escuchas

-          Una escucha asocia a Milani con el manejo de una red ilegal de espionaje 

-          Cristina avaló una marcha anti EE.UU. financiada por Irán

 

VI. Aplicación interactiva

El trabajo duró dos años y culminó con el desarrollo de una plataforma interactiva que permite navegar las escuchas a través de los temas y personajes más relevantes. Además, incluye la opción de escuchar los audios completos o tramos destacados, provee diversas biografías para contextualizar y permite descargar todos los datos disponibles.

VII. Datos Abiertos

La aplicación permite la descarga de los datos en Google Spreadsheets.

 

VIII. Impacto

La investigación fue reconocida por Patricia Bullrich, la Ministra de Seguridad destacó el trabajo realizado por La Nación en ausencia de actividad judicial.

“La investigación en este caso la realizó un medio de comunicación”

 

Asimismo, la Investigación fue requerida por la Justicia Federal, dentro de la causa que investiga al Ex Canciller Héctor Timerman por Traición a la Patria.

Las publicaciones obtuvieron una amplia repercusión en las distintas redes y medios. Una de las notas que acompañó el lanzamiento incluso fue trending topic en Twitter Argentina.

Además, se recibieron 23 colaboraciones de información por parte de la audiencia a través de un formulario en Google Forms que estaba incluido en la aplicación.

IX. Datos curiosos:

- Número total de audios clasificados: 40.353

- Suma total de la duración de los audios: 986 horas, 41 días corridos

- Audios que aparecen en la denuncia de Nisman: 103

- Audios publicados que no estaban en la denuncia: 71

- Audios que son contestador automático o no atienden: 21.918

- Tamaño total: 10,9 GBytes

 

X. Tecnología.

Para las distintas etapas del proyecto utilizamos las siguientes tecnologías: HTML, Javascript “Isotope” “Wavesurfer.js ” libraries, Google Spreadsheets, Excel, Google Forms y XMind.

 

XI. Testimonios de los voluntarios:

“Como bibliotecario me interesa involucrarme en iniciativas “incómodas” que tengan el potencial de transformar la sociedad y mejorar el país. ¿Una anécdota? Algunas madrugadas mientras procesaba los audios se cortaba el suministro eléctrico, continuaba en la notebook mientras durara la batería, luego en la netbook. Terminaba haciendo malabares desde la pantallita del smartphone”, Javier Areco

“Trabajar con el grupo de La Nación Data y más de 100 voluntarios fue una experiencia increíble. Destaco el espíritu colaborador, el compromiso y la solidaridad de un gran equipo de gente que durante extensas jornadas escuchó y transcribió estos 40.000 audios”, Jimena Travieso

“Al principio me sentí como una intrusa ya que tuve acceso a situaciones cotidianas de una persona a quien no conozco, pero después lo encaré más profesionalmente y me concentré totalmente en el tema. Participé para que los investigadores no bajen los brazos, porque quiero que el caso se resuelva”, Mari Maquieira

“Con este proyecto me quedo con la conciencia tranquila, el día de mañana podré decirle a mis hijos que ayudé a aclarar el magnicidio que marcó al país.Todas las noches me dormía tarde, escuchando audios, siempre decía “uno más” con la esperanza de que ese próximo sería el que resolviera el caso”, Angel Vallejos

“Para esto hay que tener curiosidad, dedicación y perseverancia a pesar de lo que se escucha. Lo que más me costaba era aguantar el lenguaje bajo de las conversaciones. Me sorprendió que entre algunas personas involucradas se exigiera lealtad a los que de alguna forma estaban actuando contra los intereses de nuestro país”, Lidia Lavalle Cobo.

“La experiencia fue enriquecedora para trabajar espectros de análisis básicos desde la herramienta. Todo esto, profundizado luego por el diario y los demás voluntarios, logrando resultados que superaron la media proyectada. Un orgullo aportar valor a este equipo”, Agustín Lorenzo

La experiencia hermosa. Deseo fervientemente que se haga justicia. Tengo 74 años y soy discapacitada motriz.Recorrí la avenida Juan B. Justo y Bahía Blanca deseando encontrar la casa donde vivian los iraníes. Pertenezco al grupo de Ruralistas. Mi nombre y apellido son Elena Ferenza, egresada de la Facultad de Ciencias Físico-matemáticas de la Universidad Nacional de La Plata. En mi época no existía la Facultad de Ingeniería.Emocionante el encuentro en el Diario La Nación. Trabajábamos con mucha cordialidad entre los distintos grupos”, Elena Ferenza

Para mí, haber tenido la oportunidad de dar una mano fue un lujo. Me impresionó mucho estar metida en la cocina de una investigación tan importante y palpar el nivel de bajeza al que puede llegar un gobierno. Que gente como la que escuchamos haya tenido alguna relevancia en decisiones de alcance internacional es terrible. Así nos dejaron…Felicitaciones por lo que ha hecho todo el equipo de La Nación Data. Ojalá sirva para acelerar el proceso y que todo los involucrados terminen presos”, Carolina Llosa

XII. Conclusión

Lo que aprendimos desde La Nación Data es a nunca pensar que un proyecto es imposible. Con un equipo comprometido, la tecnología correcta y algunas noches largas, cualquier dato puede ser transformado en una historia que impacte.

>> Todo el contenido de LA NACION sobre la Denuncia de Nisman <<

 

Sin comentarios

S.O.S Riachuelo: cómo trabajamos el especial sobre el río más contaminado de Argentina

Por Gabriela Bouret y Mariana Trigo Viera

Mucho se habló, mucho se escribió y mucho más se prometió en relación a la contaminación y la posible limpieza del Riachuelo, el río más contaminado de la Argentina. Pero la realidad es que los años pasan y la contaminación avanza sin pedir permiso. Las enfermedades se multiplican y afectan a los miles de vecinos de los 15 partidos que lo rodean.

S.O.S. Riachuelo es un especial multimedia que utiliza datos abiertos para mostrar la calidad del agua y su relación con las enfermedades causadas por la contaminación.

Seguir leyendo

Una mirada al portal de datos abiertos del Ministerio de Agroindustria

Agroindustria fue el segundo ministerio que adhirió al Decreto 117/2016 que creó el Plan de Apertura de Datos con el objetivo de garantizar el derecho de acceso a la información pública. A la fecha, ya son 3 los ministerios adheridos: Energía, Agroindustria y Justicia.

En la plataforma se puede encontrar información relevante sobre producción, comercio, inversión, precios y padrones de todas las actividades agroindustriales del país. Todos los datasets son producidos por la Secretaría de Mercados Agroindustriales a través de la Subsecretaría de Información y Estadística Pública, y se descargan en formato .csv.

 

En algunos casos se puede acceder a información histórica, de períodos de tiempo que inician en 1969 y están actualizados a hoy. Al elegir las variables a consultar, la plataforma ofrece dos opciones: descargar los datos o simplemente visualizarlos y descargar el gráfico como .jpg.

A continuación, presentamos un ejemplo sencillo de los análisis que se pueden aplicar a los dataset publicados por el ministerio.

 

Al analizar las diversos datos y variables que ofrece el portal, se pueden encontrar algunos datos curiosos:  Seguir leyendo

Sin comentarios

¡Lanzamos Dónde van mis impuestos – Ciudad de Buenos Aires!

¡Sí! ¡Llegó el día! Hoy presentamos ¿Dónde van mis Impuestos? Ciudad de Buenos Aires (http://presupuestos.lanacion.com.ar/). Con él queremos mostrar el detalle de los presupuestos de la Ciudad: en qué se gasta, cómo se gasta y quién lo gasta. Una visión sobre los gastos del 2015 existe ya en el portal que desarrolló el gobierno (http://gcba.github.io/presupuesto-gcba/) pero nosotros queríamos llegar a un nivel mayor de profundidad, añadiendo además históricos de los años anteriores.

Demo Tutorial en HD por Marta Alonso Fernandez

Utilizando el desglose del presupuesto anual, disponible en el portal de Datos Abiertos del Gobierno de la Ciudad (http://data.buenosaires.gob.ar/), representamos los datos desde diferentes puntos de vista, de manera gráfica, para hacerlos más accesibles a todos los ciudadanos.  De este modo, se podrá consultar no sólo la sanción presupuestaria sino también el gasto ejecutado real al final del año, sin olvidarse de los recursos que ingresa cada año el Gobierno para hacer frente a esos gastos.

En colaboración con Marta Alonso (@malonfe) creamos esta aplicación utilizando el código desarrollado por la Fundación Ciudadana Civio (http://www.civio.es/) en España para la presentación de datos presupuestarios de la Comunidad Atónoma de Aragón y de otras regiones y municipios de ese país.. Al tratarse de código Open Source lo adaptamos a las necesidades concretas del caso porteño (¡gracias Civio!).

El resultado es un proyecto que presenta una foto global de los gastos frente a los ingresos, para pasar luego a un detalle en el que se desagregan los recursos y los gastos, estos últimos a través de dos interrogantes:cómo se gasta y en qué se gasta. La primera pregunta se responde mediante una clasificación económica, mientras que la segunda mediante una clasificación funcional.

 Es importante resaltar que las cantidades se pueden ver ajustadas o no a la inflación (para años anteriores al último), pero también per-cápita y en valores porcentuales del total. Además, quien navega  la aplicación y quiere descargar los datos que está viendo, puedo hacerlo en formato CSV (valores separados por comas) y Excel o compartirlos en tus redes sociales.

Fuentes:

Portal de datos del Gob de la Ciudad: http://data.buenosaires.gob.ar/

Página de estadística presupuestaria: http://www.buenosaires.gob.ar/hacienda/presupuesto/estadistica-presupuestaria

Dirección General de Estadística y Censos: http://www.estadisticaciudad.gob.ar/eyc/

Sin comentarios

¿Qué países vieron nacer más Premios Nobel?

LA NACION DATA escrapeó la página oficial de los Premios Nobel e investigó en qué países nacieron los Premios Nobel desde la primera entrega en 1901.

Estados Unidos encabeza el ránking de países en el que más Premios Nobel nacieron con 258 premios en total, casi 3 veces más que el segundo puesto, el Reino Unido, que recibió 94 premios. Le siguen de cerca Alemania con 80; Francia con 60; y Suecia con 54.

Sin embargo, si bien los Estados Unidos lidera en casi todas las categorias, el Premio Nobel de literatura todavia está encabezado por Francia, dónde nacieron 12 escritores ganadores del galardón.

En total, cuatro Premios Nobel nacieron en Argentina: Adolfo Peréz Esquivel, Carlos Saavedra Lamas, Bernardo Houssay y César Milstein. Contrariamente a lo que se piensa, el medico Luis Federico Leloir, quien realizó su carrera en Argentina,  nació en París en 1906

Seguir leyendo

Los datos toman vida en el arte: Big Bang Data

World Processor de Ingo Günthe

Por Silvia Parra (*) y Macarena Roggiero (**)

Una instalación de globos terráqueos con información político-social, una visualización de la película Kill Bill cuadro por cuadro y el flujo de más de 200.000 vuelos estadounidenses son algunas de las obras de Big Bang Data.  Es una exposición que a través de 16 instalaciones reúne diversos trabajos artísticos en base a los datos.

La exposición Big Bang Data llegó a Buenos Aires y abrió sus puertas en el Espacio Fundación Telefónica en coproducción con el Centro de Cultura Contemporánea de Barcelona. La exposición presentada en cuatro bloques temáticos es una muestra significativa del inmenso flujo de datos que Olga Subirós (@osubiros) y José Luis de Vicente (@jldevicente), los curadores, la conceptualizan como un punto de partida para “provocar conversaciones”.

La Nación Data asistió a la conferencia realizada por los curadores, donde se resaltaron a “los grandes actores que son los datos”.

Asimismo, presentaron este video referido al principio  “Data Cannot”, una recopilación de diversas opiniones de expertos alrededor del auténtico valor humano de los datos y todo aquello que estos no alcanzan a hacer.

La obra World Processor de Ingo Günther, Seguir leyendo

Sin comentarios

Las 3 elecciones de la ciudad

Este año, en la Ciudad de Buenos Aires tuvimos 3 elecciones: las elecciones primarias (PASO), realizadas el 26 de abril; las elecciones generales del 5 de julio y el ballottage porteño realizado el domingo pasado, el 19 de julio. En el equipo de visualizaciones de LA NACION trabajamos intensamente para poder brindarle a la audiencia los resultados de manera clara y rápida a través de nuestras dos plataformas, la edición impresa del diario y la edición digital.

Trabajar para ambas plataformas a la vez implicó un continuo trabajo de coordinación, en el que se focalizó en las necesidades específicas de cada soporte. Pensar un mapa de resultados que luego sería impreso en nuestro tradicional formato sábana no es lo mismo que pensar una aplicación electoral para ser navegada en tiempo real desde una computadora de escritorio y, mucho más diferente aún, si se piensa en quienes lo harían desde un celular. Sin embargo, la información sería la misma, sólo había que maquillarla de la manera correcta, según el soporte en el que se publicara.

Armé un pequeño interactivo en donde incluí algunas de las piezas visuales publicadas. Deslizando el mouse sobre las imágenes pueden acceder a las aplicaciones interactivas en su tamaño real.

Una vez comenzado el recuento de votos oficiales, durante los tres domingos de votación, las aplicaciones electorales interactivas que publicamos en nuestra edición digital fueron reflejando los resultados en tiempo real. Esos mismo datos fueron desplegados para el formato impreso al día siguiente a través de distintas páginas, brindando al lector una selección informativa y visual.

PRINCIPALES OBJETIVOS

Nuestras metas confluyeron en dos grandes focos: por un lado, lograr una coherencia visual y de contenidos en ambas plataformas y, por el otro lado, hacer frente a un gran desafío técnico: las visualizaciones debían verse y navegarse de manera clara y sencilla independientemente del tipo de dispositivo que elija la audiencia, el tipo de conexión y/o el navegador seleccionado. Les cuento brevemente en qué consistió cada uno.

. Coherencia visual y de contenidos. «¿Para qué sirve la coherencia en este caso?», se preguntarán. Para entender que el interlocutor no cambia y que el mensaje sigue siendo el mismo, sólo que adopta características propias según el soporte en donde se muestra. La edición papel tiene un blanco limitado, y aunque existen niveles de lectura dentro de una misma visualización, la información es la que está impresa, ni más ni menos. En cambio, en las visualizaciones interactivas la información se presenta en forma dosificada y cada usuario puede realizar una experiencia propia en función de sus intereses.

Pero ambas plataformas no sólo estuvieron hermanadas por la coherencia visual sino que también estuvieron conectadas a través de un código QR impreso en cada edición papel. El lector podía escanearlo con su celular y acceder a la aplicación digital correspondiente en apenas unos pocos segundos, sin necesidad de ir a buscarla en su computadora de escritorio. Allí encontraría más detalles de las producciones electorales.

. Desafío técnico. Los principales pilares de este desafío fueron lograr visualizar en una aplicación amigable para el lector los resultados electorales en tiempo real y aplicar un diseño responsive a todas las piezas interactivas a desarrollar, teniendo en cuenta el crecimiento del público mobile.

Datos en tiempo real. Una vez que la Dirección Electoral comienza a publicar los datos, el mayor trabajo es conectarlos a una visualización entendible para la audiencia y, como si todo esto fuera poco, hacer que todo funcione correctamente en vivo. Para una aplicación de resultados electorales como esta, se trabaja con varias semanas de anticipación, imposible hacerlo de un día para el otro. Se necesita planificación y coordinación entre los distintos profesionales que forman parte del equipo interdisciplinario: los programadores que se encarguen de obtener y procesar los datos (Back-end), los programadores que logran conectar esos datos con la aplicación web (Front-end), los diseñadores web y periodistas especializados en el tema.

Les cuento un poco la cocina de las PASO. En ese caso, se trabajó con una posible estructura de datos, similar a la que la Dirección Electoral nos enviaría el domingo de votación para poder empezar a hacer las pruebas necesarias e ir chequeando el buen funcionamiento del mapa. El jueves anterior nos enviaron la documentación final que usarían ese día y recién ahí pudimos comenzar con los ajustes necesarios. El domingo 26 de abril, luego de algunos imprevistos (de los que siempre hay), nuestra aplicación tomó vida y logró alimentarse de los resultados oficiales en forma automática. No fue magia, fue el resultado de mucho trabajo y de una buena previsión de posibles problemas. 

Nuestra aplicación electoral se convirtió en la fuente de información principal debido a que teníamos el detalle de todos los resultados en tiempo real, mientras que la página oficial estaba inaccesible, durante las primeras horas del escrutinio.

Diseño responsive. Otro gran tema, fue, es y seguirá siendo, la necesidad de hacer que todas las aplicaciones se vean correctamente en cualquier dispositivo (desktop, tabletas y celulares), a eso se lo llama “diseño responsive“. Hasta hace un tiempo, bastaba con pensar el diseño para una computadora de escritorio, el avance tecnológico nos obliga a diseñar pensando en los distintos dispositivos.

TECNOLOGÍA UTILIZADA

. Mapas de resultados por comunas: el mapa de las PASO fue desarrollado en HTML5, CSS3 y Javascript, y a los de las elecciones generales y de ballottage se le sumó el uso de D3.js
. Hemiciclo de la Legislatura porteña:
se utilizó HTML5, CSS3, Javascript y D3.js
. Mapas de resultados por centros de votación:
en este caso se utilizó CartoDB como base de datos, Mapbox, HTML5, CSS3, D3.js y Javascript.

EQUIPO DE TRABAJO

Pablo Loscri estuvo a cargo de los equipos de visualizaciones interactivas e impresas en coordinación con Florencia Fernández Blancoencargada de la parte periodística, junto con el equipo de Política. El grupo interactivo estuvo compuesto por Gastón de la Llana, Cristian Bertelegni, Juan Elousa (becario del programa Knight-Mozilla Opennews), Marta Alonso y Mariana Trigo Viera; y el grupo de visualizaciones impresas, por Alejandro Bogado, Giselle Ferro, Marcelo Regalado, Gabriel Podestá, Josefina Pagani y Gustavo Olaizola.

Sin comentarios

Uxatón: un hackathon sobre la inexperiencia del usuario

Hacks/Hackers Buenos Aires convoca el sábado 23 de mayo a una jornada de trabajo colaborativo dedicada a mejorar la experiencia del usuario en proyectos de periodismo de datos y aplicaciones cívicas.

Cómo se leen noticias en la web o en el móvil, cómo y porqué acceden o encuentran un contenido, cómo interactúan con él; qué hace que lleguen hasta el final de una nota; cómo facilitar la comprensión de un tema o una postura; cuáles son las mejores herramientas para personalizar la consulta de grandes volúmenes de datos de acuerdo a los propios intereses; cómo cautivar a los usuarios para que sigan o vuelvan a consultarnos; qué hace que compartan algo en redes sociales, etc. son todas preguntas nuevas y claves en el medio, y el diseño UX (User Experience, en inglés) viene ayudar en este desafío.

Por eso, esta vez Hacks/Hackers BA convoca a un UXatón: una jornada productiva dedicada exclusivamente a mejorar la experiencia del usuario de proyectos web o móvil de periodismo de datos, apps cívicas o medios digitales.  Seguir leyendo

Sin comentarios

LA NACION Data lanza una página de indicadores económicos interactivos

LA NACION Data ofrece un nuevo servicio a sus lectores. Desde esta semana, en lanacion.com ya se pueden consultar en forma de gráficos interactivos, 9 de los principales indicadores de la economía argentina.

Para acceder a ellos, solo hay que ingresar a través de la home de LA NACION Data o desde la página Indicadores económicos. Seguir leyendo

Muertes por accidentes de tránsito

Si bien siempre me dedico a escribir sobre visualizaciones, hoy quería contarles como trabajamos con Gabriela Bouret, los datos sobre muertes por accidentes de tránsito en la República Argentina.

Luchemos por la Vida es una asociación civil sin fines de lucro que se dedica a la prevención de accidentes de tránsito en nuestro país. Como desde hace ya varios años, los primeros días de enero publica un mapa en formato de imagen (jpg) con el total de muertes en accidentes de tránsito durante todo el año anterior. El mapa de la Argentina publicado este año detalla el número absoluto de víctimas en 2014 discriminado por provincia.

Seguir leyendo