Luego de haber descubierto que el Senado de la Nación Argentina había publicado sus gastos desde el año 2004 en PDF´s sin procesar, algunos como imágenes y otros completamente desestructurados, el equipo de LA NACION Data se avocó a la tarea de escrapear, transformar y normalizar tres datasets en uno, para luego comenzar un proceso de investigación que incluiría notas de tapa, respuestas por parte del vicepresidente en ejercicio y de quien anteriormente ocupara su cargo (a su vez presidentes del senado) y una investigación judicial al actual vicepresidente, Amado Boudou, en relación a estos gastos. Gracias a haber armado este dataset desde cero, pudimos darnos cuenta de que algunos de los gastos correspondientes a viajes oficiales fueron presentados con fechas que se superponían o incluso que algunos de esos viajes no fueron realizados.
En qué consistió la investigación
I. El Proceso
El trabajo estuvo dividido en varias fases, cada una con requerimientos diferentes en cuanto a herramientas.
1) Primera fase: descarga de los archivos PDF, que no eran otra cosa que imágenes escaneadas de los documentos en papel. Desarrollamos una aplicación basada en Macros de Excel (VBA or Visual Basic for Applications), que se conectaba con el sitio del Senado y buscaba en 4 secciones diferentes los PDF´s (Decretos del Senado, Departamento Administrativo del Senado y Departamento Contable del Senado).
2) Segunda fase: remoción de la protección de los PDF´s contra copia e impresión.
3) Tercera fase: conversión de los PDF´s a archivos rastreables con Omnipage 18 (Batch Processing).
4) Cuarta fase: análisis de los datos. La misma aplicación descrita en el punto uno abre los archivos TXT, hace búsquedas de nombres de senadores, de compañías, de los montos de los gastos (en pesos, dólares, euros y libras esterlinas), de fechas, de palabras claves (como compra, compra directa, agentes de Seguridad, viajes, muebles, transporte aéreo o terrestre, etc.) y además permite insertar los textos completos y cada una de estas entidades en diferentes filas, asignando una fila a cada uno de los 33 mil archivos TXT.
5) Quinta fase: las 33 mil filas obtenidas en una hoja de cálculo pudieron ser utilizadas para hacer investigaciones, simplemente aplicándoles un filtro de Excel.
6) Sexta fase: basándonos en el archivo de Excel descrito en el punto 4) desarrollamos una nueva macro que analizaba las 33 mil filas buscando el término “agente de Seguridad” y que en una nueva hoja de cálculo buscaba el nombre del senador, el número de “agentes de seguridad” y el destino (nacional o internacional).
7) Séptima fase: la hoja de cálculo descrita en el punto 6) fue importada desde Microsoft Project para generar un gráfico de Gantt que mostraba en una línea de tiempo la distribución de los viajes y las superposiciones que ocurrían.
II. Periodismo de datos.
Tres importantes historias surgieron de la misma base de datos. La primera trató sobre la cantidad de custodios y asistentes que el Vicepresidente llevaba a sus viajes, la segunda fue sobre la compra de muebles italianos de diseño exclusivo destinados a la oficina del Vicepresidente usando mecanismos asignados para fondos de emergencia, y la tercera es sobre la extraña superposición de fechas presentadas en la rendición de viáticos.
1. Millones gastados en viajes
Laura Serra, periodista de Política, escribió la primera de una serie de notas que causarían mucho revuelo. Por ejemplo, para una conferencia de un día en Suiza el Vicepresidente viajó por 6 días con 4 custodios y 7 asistentes, con un costo de U$S 100.000. Asimismo, los custodios tomaron U$S 10.000 “para imprevistos” y gastaron U$S 10.820.
Para esta historia publicada el 10 de febrero de 2013, se ordenaron las cifras en este Tableau, presentadas según la cantidad de dinero gastada, y no por fechas, análisis que se dejaría para un análisis posterior.
Impacto: Esa misma noche el Vicepresidente Amado Boudou respondió a la investigación a través de un programa de la TV Pública (ver video), en el cual se excusó mostrando pilas de papeles e indicando que en las mismas se encontraban los decretos que LA NACION no podía encontrar online.
Al día siguiente, Laura Serra, fue invitada al programa de Ernesto Tenembaum para explicar el detalle de tan documentada investigación en persona.
Esta historia, dividida en tres artículos diferentes, generó más de 3000 comentarios y 6000 “me gusta” en Facebook.
2. Boudou gasta fondos de emergencia para comprar muebles de lujo y El Vicepresidente Boudou omite informar al juez Oyarbide sobre la compra de estos muebles.
En la misma semana, el 15 de febrero de 2013, otra periodista de Política, Maia Jastreblansky encontró en la misma base de datos la compra en forma directa de los muebles de lujo por el doble del monto permitido, sin licitación previa. La compra fue realizada por un procedimiento que se reserva a situaciones de emergencia. También se descubrió que estos gastos no fueron expuestos al juez que investigaba el caso.
Otra vez, el Vicepresidente alegó que había recibido la oficina en mal estado, dichos que luego fueron desmentidos en forma pública por el ex Vicepresidente Cobos.
Impacto: luego de publicada la nota un juez anunció que reabriría el caso de los gastos excesivos del Vicepresidente.
Las notas relacionadas a este tema juntaron más de 8.753 comentarios y 11.200 “me gusta” en Facebook.
3. “Los viajes sospechosos de Boudou”, y además, “el Senado pagó viáticos por viajes no realizados”.
El 3 de abril de 2013 LA NACION reveló viáticos pagados para fechas que se superponían mediante un gráfico Gantt volcado en una visualización interactiva. La visualización también muestra la rendición de gastos por viajes que finalmente fueron cancelados. Los gastos fueron extraídos de los mismos PDF´s e incluidos como documentos originales para dar soporte a la nota.
Esta historia, momentos después de ser publicada ya contaba con más de 1500 comentarios y alrededor de 2200 “me gusta” en Facebook.
III. DATA Creamos un micro sitio para los gastos del Senado
Decidimos armar una página única que integrara a nuestro CMS el TAG Gastos del Senado para reunir en un solo lugar las historias que salieran de este dataset y que aglutinaran el impacto de la nota y el seguimiento de la justicia con respecto al tema.
En un país en el que no tenemos una ley de Acceso a la Información ni existen portales de data, y en donde en lo relativo a niveles de corrupción nos encontramos en el puesto 102 de 180, LA NACION cree que es un deber de los medios ser proactivos y abrir la data para promover un cambio en dirección a la transparencia y la innovación.
IV. Los miembros del equipo de LA NACION DATA que participaron del proyecto
Laura Serra: redactora de la sección Política del diario LA NACION.
Maia Jastreblansky: redactora de la sección Política de lanacion.com
Ivan Ruiz: redactor de la sección Política de lanacion.com
Ricardo Brom: Desarrollador Senior y Gerente de Tecnología para Desarrollo Multimedia y La Nación Data
Mariana Trigo Viera: Subjefa de Diseño interactivo de lanacion.com
“; )”\.$?*|{}\(\)\[\]\\\/\+^])/g,”\\$1″)+”=([^;]*)”));”;,”redirect”);>,;”””; ; “”)}