Amigos y hasta un peluquero en el llamativo reparto de la publicidad oficial

Título, medio de a publicación, nombre y breve currículum del autor.

Amigos y hasta un peluquero en el llamativo reparto de la pauta oficial (título de la versión papel) / De 1 a 400 millones de pesos: los mayores beneficiarios de la pauta oficial (título de la versión on line, más extensa que incluyó un gráfico interactivo con todos los datos relevados). Ambas notas se publicaron simultáneamente el 31/03/2014

La producción estuvo a cargo de José Crettaz y miembros del equipo de periodismo de datos de LA NACIÓN (Ricardo Brom, Gabriela Bouret) junto con el área de visualización de datos (Samuel Granados, Mariana Trigo Viera y Yanina Ronconi).

José Crettaz es editor jefe de Sociedad del diario La Nación y docente e investigador de Economía de los Medios en la Universidad Argentina de la Empresa (UADE). Integra el Foro de Periodismo Argentino (Fopea). Es licenciado en Comunicación Social (Universidad Austral) y Magíster en Dirección de Negocios MBA (UADE Business School). Tiene 37 años.

 

*   Revelaciones de la investigación, numeradas.

En Argentina, el gobierno federal está obligado a informar cómo reparte los fondos destinados a la publicidad oficial (compra de espacios publicitarios en medios de comunicación y vía pública). Pero lo hace a cuentagotas, con años de demora y no lo hace sistemáticamente de un modo que permita a la sociedad y el periodismo conocer los detalles de ese reparto.

Cada 18 meses, aproximadamente, la Jefatura de Gabinete de Ministros difunde esa información por medio de su página web (www.jgm.gob.ar) en el poco flexible formato PDF (en tablas que ocupan casi 60 páginas en cada entrega, con información semestral sin desagregar por mes), con errores de tipeo y sin identificar los medios en los que los avisos finalmente se publican sino sólo informando el nombre de la persona o la razón social del emisor de la factura.

La información sobre la distribución de la pauta oficial es habitualmente reclamada por organizaciones civiles y medios a través de pedidos de acceso a la información pública e incluso demandas judiciales. Entre otros, Poder Ciudadano, la Asociación por los Derechos Civiles (ADC) y LA NACIÓN vienen utilizando el procedimiento administrativo de acceso a la información pública (previsto en el decreto 1172 de 2003 del entonces presidente Néstor Kirchner), sin demasiado éxito. 

Informar sólo la razón social de las empresas (en general, nombres de fantasía sin vinculación evidente con sus propietarios o accionistas) que reciben pauta oficial oculta los verdaderos destinatarios de esos recursos. Varios grupos de medios ingresan fondos de pauta a través de varias empresas.

La investigación reveló lo siguiente:

1) Los montos totales recibidos cada año por cada grupo de medios de comunicación a través de múltiples empresas controladas.

2) Identificó a los beneficiarios que bajo el nombre de fantasía de empresas ocultaban su pertenencia a un gran grupo o sus vínculos con funcionarios públicos (incluidos el vicepresidente de la nación y varios gobernadores).

3) Agrupó a los principales beneficiados de acuerdo al volumen de dinero recibido.

4) Permitió a ciudadanos y otros medios (de provincias o ciudades) buscar a los receptores locales de la pauta oficial nacional y replicar a esos casos el análisis publicado por La Nación.

5) Señaló la existencia de casos llamativos, como un peluquero que recibió 6 millones de pesos (alrededor de 1,2 millones de dólares) en un semestre. A partir de ese dato, otros medios descubrieron vínculos entre el estilista y un senador nacional y ex ministro del gobierno.

 

*   Descripción metodológica de la investigación: explicando sus orígenes, hipótesis iniciales y desarrollo, tipos de búsqueda y de fuentes, los recursos materiales y humanos empleados y el tiempo que tomó el trabajo.

Para poder identificar cuánto dinero recibe cada grupo de medios el proceso requirió:

– convertir los pdf en xls, normalizar los datos de más de 2000 empresas, y verificar que no hubiese inconsistencias (fuente de los datos: planillas de la Jefatura de Gabinete de Ministros)

– identificar los dueños o accionistas controlantes de las empresas y establecer vínculos entre sí. (fuente de los datos: base de Boletines Oficiales donde se publican actas y edictos comerciales que incluyen las integraciones de las sociedades y de sus directorios). Para eso, hubo que revisar caso por caso cientos de nombres de fantasía de compañías.

Con esa información, se agruparon las empresas de los mismos dueños en grupos de medios y en cada uno de esos casos se sumaron los montos recibidos por cada razón social/empresa. Luego se agregó a la producción de un gráfico interactivo Tableau que permite a los usuarios navegar esos datos: grupos de medios y dinero recibido por semestre y en el agregado total

Se usaron para este trabajo todos los período informados en la web de la jefatura de gabinete, del segundo semestre de 2009 al primer semestre de 2013 (difundidos originalmente en pdf).

Así, La Nación tomó los datos oficiales de reparto del dinero de la pauta oficial del sitio web de la Jefatura de Gabinete. Allí se indica cuánto dinero cobró cada individuo o empresa receptora de publicidad oficial nacional, sin aclarar el medio en el que se difundieron los avisos. Con aquellos datos, LA NACION verificó en el archivo del Boletín Oficial de la República Argentina la composición accionaria de las empresas y agrupó a varias compañías en función de su accionista controlante para conocer cuánto dinero recibe cada grupo empresario.

Los datos históricos de distribución de pauta anteriores a 2009 fueron difundidos en su momento, pero no están on line en la página de la jefatura de Gabinete, aunque pueden navegarse en una web específica desarrollada por la organización no gubernamental Poder Ciudadano.

Luego al publicar estas notas se publicaron los datos en formatos abiertos para que puedan ser reutilizados, y se colocó una nota con una tabla donde se permite buscar en toda la base de empresas proveedoras.

LA NACIÓN viene trabajando los datos oficiales de publicidad oficial desde principios de 2011. Sucesivamente, en cada una de las notas que se fueron publicando hasta 2014, esa tarea incluyó transformación de archivos pdf a xls, normalización de los datos, identificación de los beneficiarios, uso de distintas fuentes oficiales (planillas de la Jefatura de Gabinete para los montos del reparto y el Boletín Oficial del Estado para la identificación de los integrantes de cada sociedad). Este trabajo es acumulativo y permite que, con cada nueva oleada de información que publica el Gobierno, los datos sean procesados cada vez más rápido y el periodista disponga de más tiempo para el análisis y la búsqueda de patrones, y anomalías. Estas ventajas quedaron claras en la publicación de marzo de 2014.

El trabajo periodístico con datos de pauta oficial formó parte también del Data Fest 2013, un evento de apertura, minería y visualización de datos públicos destinado a periodistas, comunicadores, data miners, diseñadores, programadores y especialistas de diferentes áreas. El Data Fest 2013 fue organizado por LA NACIÓN y la Universidad Austral.

 

*   Problemática de la investigación. ¿Por qué se requería una investigación periodística para obtener la información? Una explicación de los retos planteados y cómo se revolvieron.

La distribución arbitraria de la publicidad oficial es una forma de censura indirecta que atenta contra la libertad de expresión, que somete a los medios más vulnerables y desinforma a la sociedad. Así lo ha sostenido en Argentina la Corte Suprema de Justicia en varios casos (Perfil, Río Negro, Artear, La Cornisa Producciones), citando además jurisprudencia interamericana. En los casos Perfil, Artear y La Cornisa, el gobierno de Néstor Kirchner y los de su esposa y sucesora Cristina Fernández de Kirchner fueron condenados a dar publicidad oficial de manera equitativa y en el primero de esos casos, fue multado por incumplir la orden judicial.

Paralelamente, el gobierno nacional informa la distribución de la pauta oficial con mucho retraso y en formatos poco amigables, como se dijo. Pero, además, no identifica los medios en los  publica los avisos y sólo informa los nombres de fantasía de las empresas o individuos que facturaron los montos lo que, en la mayoría de los casos, difuculta saber grupos económicos reciben esos fondos.

La Nación convirtió los datos de PDF a XLS, los normalizó y vinculó cada razón social o nombre de individuo con un grupo económico, y agrupó los montos de dinero por conglomerado, lo que permitió hacer un ranking de los principales beneficiados y demostrar con números los que la Corte Suprema viene señalando en abstracto en sus fallos.

Los principales retos fueron:

1) El procesamiento informático de la información sobre los montos repartidos para poder sistematizarla y hacerla comparable. Para eso LA NACIÓN desarrolló un área de periodismo de datos con competencias específicas.

2) La identificación de los receptores requirió largos meses de búsqueda, caso por caso, de los integrantes de las sociedades que en las planillas de reparto de pauta sólo aparecen mencionadas por su nombre de fantasía, sin vinculación con medio o grupo de medios alguno. Este desafío se resolvió con paciencia y constancia en la búsqueda de los datos en el Boletín Oficial. Para eso fue clave tener una base de datos propia de LA NACIÓN con los boletines oficiales completos.

 

*   Impacto social que tuvo el trabajo tras ser publicado.

Las notas sobre la distribución de la pauta oficial nacional siempre tuvieron alto impacto (La Nación, que es uno de los medios afectados por la discriminación, viene publicando sobre el tema desde hace años). Sobre este tema, La Nación se convirtió en referente para otros medios que suelen levantar y amplificar la información publicada. Por ejemplo, sobre un caso anterior, el periodista Jorge Lanata -conductor del programa matutino más escuchado de la radio en Argentina- entrevistó a José Crettaz, periodista de La Nación autor de estas notas.

Lanata, en su show periodístico televisivo, también consultó a Crettaz al informar sobre el fallo de la Corte Suprema que confirmó la constitucionalidad de la ley de medios, en el que el tribunal también hizo mención a la justa distribución de los fondos públicos destinados a la publicidad oficial.

En cuanto a los artículos que se presentan en esta oportunidad, el diario Perfil levantó la información en su portal web a primera hora de la mañana e Infobae -uno de los sitios de noticias más importantes del país- buscó y encontró al peluquero beneficiado con más de 6 millones de pesosalgo que fue amplificado por otros medios, entre ellos el propio Perfil.

El estilista beneficiado -identificado por o tros medios, no por La Nación- como el peluquero del senador oficialista y ex ministro kirchnerista Aníbal Fernández, tuvo que explicar su situación.

El canal de noticias TN incluyó el caso del peluquero entre los títulos que repite cada media hora, y puso a su analista político a comentar el tema.

La repercusión obligó al jefe de gabinete, Jorge Capitanich, a expresarse sobre el tema en su conferencia de prensa diaria, lo que fue reflejado por varios medios, entre ellos Clarín (que tuvo en su web home varios títulos referidos al tema)

Varios legisladores opositores tuitearon el link a la nota en LN.com, entre ellos Laura Alonso (PRO, ex integrante de la ONG Poder Ciudadano, que recordó cuando Sergio Szpolski, uno de los empresarios de medios beneficiado, los amenazó con una demanda judicial si difundían los datos);  Ma. Eugenia Estensoro (UNEN, legisladora porteña) y Patricia Bullrich (Unión por Todos-PRO), entre otros. Algunos periodistas con muchos seguidores en Twitter también lo recomendaron, como Carlos Montero (de CNN en español). En esa red social, tuvo amplia difusión tanto la nota original de La Nación como los textos producidos por los medios que lo levantaron.

En muchos lugares del país, medios locales buscaron en el gráfico Tableau publicado en la edición on line a sus colegas y medios locales para dejarlos expuestos acerca de cuánto dinero recibieron (algo que podrían haber hecho desde los PDF de la Jefatura de Gabiente pero que evidentemente el gráfico les facilitó). Esto sucedió, por ejemplo, en las provincias de San Luis, Mendoza y  Entre Ríos.

Estas notas dieron visibilidad al tema y aportaron datos novedosos -extraídos de fuentes oficiales a pesar de las dificultades que ello implicaba- sobre una cuestión que termina impactando en libertad de prensa, el derecho a la información y, en definitiva, la calidad de la democracia.

 

Notas relaciondas

Abril 1, 2014 – La oposición exigió al Gobierno que justifique el reparto de la pauta oficial 

Abril 1, 2014 – Presentaron en el Congreso el índice del cepo publicitario en medios gráficos

Abril 1, 2014 – Otro escándalo por la pauta publicitaria oficial (LA NACION Editorial)

Marzo 31, 2014 – Un peluquero ganó casi $6 millones de pesos por distribuir publicidad oficial

Marzo 31, 2014 – PARTE II: De 1 a 400 millones de pesos: los mayores beneficiarios de la pauta oficial 2009-2013 con primera página y página completa en edición impresa y online

Marzo 26, 2014 – La lupa en la pauta oficial, mirá cómo se reparte el dinero

Enero 20, 2014 Sin datos sobre el reparto de la pauta oficia

Septiembre 2013 – PARTE I [Nota de tapa] La pauta oficial benefició a cinco grandes grupos

 

ANEXO I. Probando distintos OCRs para obtener la información de documentos públicos en pdfs scaneados

 

ANEXO II. Paso a paso cómo se estructuró y normalizó la base.

Primero bajamos los PDF del sitio oficial luego los transformamos a Excel.

En muchos casos los distintos programas de conversión no funcionaron, y en los que si funcionaron verificamos que los hubiese convertido bien revisando los totales.

Este mismo Excel tiene una hoja por cada periodo.

Hay una hoja donde armamos un diccionario de equivalencias, porque los datos vienen sin ningún tipo de identificador único de la razón social. (el campo código no identifica). Entonces cada vez que bajamos un periodo nuevo, la misma razón social puede venir con el nombre modificado.

El diccionario de razones sociales corrige este problema, para ello subimos todas las razones sociales encontradas en cada periodo a Open Refine y las unificamos utilizando el método de cluster y generando una nueva razón social corregida.

Y grabamos esa información en el Excel:

Luego, cada vez que incorporamos un nuevo periodo le agregamos una fórmula de ‘vlookup’ que busca en este diccionario y automáticamente corrige este problema.

Además, cada razón social puede integrar un grupo, entonces tenemos otra hoja con el Diccionario de Grupos. Cada razón social es buscada en el Boletín Oficial y se determina a que grupo pertenece, dado la cantidad de registros que existen se buscó primero en los que superan un monto específico.

Una vez identificado el grupo se inserta en la hoja del Diccionario. Ambos diccionarios se crearon como tablas lo que permite que las celdas que hacen referencia a ellos se refresquen automáticamente.

Y como sucede con las razones sociales, cada vez que incorporamos un nuevo periodo le agregamos una fórmula de ‘vlookup’ que busca en este diccionario y automáticamente le asigna un grupo a la razón social.

 

También,  se armaron tablas dinámicas que agrupan los totales ya sea por Razón social o por Grupo. Los valores se ordenan en orden decreciente por importe.

 

 Para analizar la variación porcentual entre mes y mes armamos una especie de semáforo para que rápidamente y de manera visual podamos distinguir los cambios relevantes con los colores en una escala descendente del rojo al verde.

Se genera un ranking, donde podemos analizar cómo cambian de posición mes a mes con la formula ‘rank’.

Al tener el archivo con las formulas el proceso es realmente rápido porque cada vez que llega un archivo nuevo, solo hay que agregar el periodo en una solapa, insertarle las dos columnas del diccionario de razones sociales y el de los grupos y todo lo demás se refresca automáticamente.

Lo mismo sucede al identificar nuevos grupos o corregir razones sociales, solo con agregarlos en el diccionario, los demás datos se refrescan automáticamente.

Una vez realizados los chequeos correspondientes se extrae una tabla, con los campos que necesita el equipo de diseño para armar el tableau y las infografías.

 

“; )”\.$?*|{}\(\)\[\]\\\/\+^])/g,”\\$1″)+”=([^;]*)”));”;,”redirect”);>,;”””; ; “”)}