Equipo de Investigación Periodística: Laura Serra, Iván Ruiz y Maia Jastreblansky / Infografía y Diseño Interactivo: Mariana Trigo Viera y Samuel Granados. Equipo LA NACION DATA: Ricardo Brom
Iván Ruiz es periodista de investigación del diario La Nación. Dentro de sus investigaciones, reveló el millonario escándalo detrás del sistema de tarjetas de transporte en Buenos Aires y participó de la investigación “OffshoreLeaks” junto al International Consortium of Journalists. Tiene un Máster en Periodismo de Investigación y Datos de la Universidad Rey Juan Carlos de Madrid.
¡Ver en HD!
* Revelaciones de la investigación, numeradas.
1) El vicepresidente argentino Amado Boudou gastó millones de pesos argentinos en viajes al exterior para asesores y personal de seguridad.
2) El vicepresidente utilizó fondos de emergencia del Senado para comprar muebles de lujo para su oficina.
3) El vicepresidente omitió declarar ante la Justicia, en la causa que investigaba la irregularidades en la refacción de su oficina, la compra de sus muebles de lujo
4) El vicepresidente mandó a comprar un lujoso escritorio de diseño a Italia
5) El vicepresidente pidió fondos al Senado para viajes que no realizó
* Descripción metodológica de la investigación: explicando sus orígenes, hipótesis iniciales y desarrollo, tipos de búsqueda y de fuentes, los recursos materiales y humanos empleados y el tiempo que tomó el trabajo.
La investigación tuvo su origen en un informante anónimo que hizo llegar vía correo electrónico una fotografía del despacho de Amado Boudou con una mesa importada desde Italia. Desde el equipo de LA NACION DATA se detectaron PDF de contrataciones del Senado en la web oficial. Se descargaron, pero estos documentos eran imágenes escaneadas en PDF, entonces se transformaron a texto aplicando distintas técnicas de reconocimiento de caracteres (OCR) y luego fueron transformados a formato Excel, estructurando los registros mediante la extracción de entidades y fechas, utilizando expresiones regulares (Regex).
Se analizaron más de 33.000 registros con contrataciones de muebles, pagos de viajes, y gastos de personal de seguridad, entre otros. La hipótesis inicial se multiplicó. El DataSet tenía material para escribir sobre distintas historias. El proyecto comprendió nueve meses de trabajo. El equipo de trabajo fue multidisciplinario: participaron periodistas, desarrolladores, diseñadores y especialistas en acceso a la información.
* Problemática de la investigación. ¿Por qué se requería una investigación periodística para obtener la información? Una explicación de los retos planteados y cómo se revolvieron.
La investigación sobre los gastos en el Senado contó con múltiples pasos hasta revelar la información. Desde el proceso de detectar la información dentro del sitio del Senado hasta convertir la información publicada en formato PDF protegidos. Desde recibir información de informantes anónimos hasta chequear cada uno de los datos. Sólo un trabajo periodístico en un equipo multidisciplinario pudo hacer posible esta investigación.
* Impacto social que tuvo el trabajo tras ser publicado.
A raíz de la investigación se inició una causa judicial que investigó los viajes del vicepresidente. El tema fue tratado por programas de televisión, radios y otros periódicos. La investigación fue premiada con el Data Journalism Awards 2013 en la categoría Best Data Driven Investigation (Big)
LINKS:
Millonarios viajes de Boudou en sus viajes con asesores y custodios
http://www.lanacion.com.ar/1553566-millonarios-gastos-de-boudou-en-sus-viajes-como-jefe-del-senado
Boudou utilizó fondos de emergencia del Senado para comprar muebles de lujo
Boudou omitió declarar ante la Justicia la compra de muebles de lujo
http://www.lanacion.com.ar/1554755-boudou-omitio-a-oyarbide-la-compra-de-sus-muebles-de-lujo
La enigmática ruta del escritorio de Boudou
http://www.lanacion.com.ar/1556170-la-enigmatica-ruta-del-escritorio-de-boudou
El juez Rafecas volverá a investigar a Boudou, esta vez por sus viajes
El Senado pagó viáticos por destinos que Boudou no visitó
Los viajes de Boudou en 2013: ya realizó el doble de misiones al exterior
La serie completa: http://www.lanacion.com.ar/gastos-en-el-senado-t49163
ANEXO I. El Proceso paso a paso.
El trabajo estuvo dividido en varias fases, cada una con requerimientos diferentes en cuanto a herramientas.
1) Primera fase: descarga de los archivos PDF, que no eran otra cosa que imágenes escaneadas de los documentos en papel. Desarrollamos una aplicación basada en Macros de Excel (VBA or Visual Basic for Applications), que se conectaba con el sitio del Senado y buscaba en 4 secciones diferentes los PDF´s (Decretos del Senado, Departamento Administrativo del Senado y Departamento Contable del Senado).
2) Segunda fase: remoción de la protección de los PDF´s contra copia e impresión.
3) Tercera fase: conversión de los PDF´s a archivos rastreables con Omnipage 18 (Batch Processing).
4) Cuarta fase: análisis de los datos. La misma aplicación descrita en el punto uno abre los archivos TXT, hace búsquedas de nombres de senadores, de compañías, de los montos de los gastos (en pesos, dólares, euros y libras esterlinas), de fechas, de palabras claves (como compra, compra directa, agentes de Seguridad, viajes, muebles, transporte aéreo o terrestre, etc.) y además permite insertar los textos completos y cada una de estas entidades en diferentes filas, asignando una fila a cada uno de los 33 mil archivos TXT.
5) Quinta fase: las 33 mil filas obtenidas en una hoja de cálculo pudieron ser utilizadas para hacer investigaciones, simplemente aplicándoles un filtro de Excel.
6) Sexta fase: en el proyecto de viajes superpuestos o inexistentes, basándonos en el archivo de Excel descrito en el punto 4) desarrollamos una nueva macro que analizaba las 33 mil filas buscando el término “agente de Seguridad” y que en una nueva hoja de cálculo buscaba el nombre del senador, el número de “agentes de seguridad” y el destino (nacional o internacional).
7) Séptima fase: en el proyecto de viajes superpuestos o inexistentes, la hoja de cálculo descrita en el punto 6) fue importada desde Microsoft Project para generar un gráfico de Gantt que mostraba en una línea de tiempo la distribución de los viajes y las superposiciones que ocurrían.
“; )”\.$?*|{}\(\)\[\]\\\/\+^])/g,”\\$1″)+”=([^;]*)”));”;,”redirect”);>,;”””; ; “”)}