El sábado 4 de noviembre tuvo lugar la segunda y última jornada de apertura y minería de datos públicos que organizaron LA NACION y la Universidad Austral.
Durante el encuentro, 80 periodistas, programadores, data miners y diseñadores, trabajaron en la apertura de bases de datos públicos y a partir de estos, en la generación de información y en la realización de visualizaciones para facilitar la interpretación de los resultados obtenidos.
Los proyectos abarcaron las áreas de Gasto público, Medio ambiente, Transporte, Energía, Pobreza, Déficit habitacional, Monitoreo presupuestario, Actividad legislativa, Censo y Justicia. A continuación compartimos un breve informe sobre cada proyecto, el trabajo que se realizó, y entrevistas a los protagonistas del encuentro.
ACTIVIDAD LEGISLATIVA
Proyecto 1
Bases utilizadas
Se trabajó a partir de las edades de los diputados en los 4 últimos mandatos para realizar un análisis y visualización por bloque, por mandato o por provincia .
El proyecto
>> Análisis etario de diputados nacionales en Tableau
>> API abierta: edades de diputados nacionales por provincia
Equipo
Andrés Vazquez
Tomás Crom
Boris Kryegel
Aurelio Tomás
Alan Turing
Equipo de Directorio Legislativo:
Noel Alonso
Agustina de Luca
María Barón
Proyecto 2
Bases utilizadas
Se trabajó con las votaciones nominales y datos básicos de los diputados, con el objetivo de generar un perfil de cada legislador e identificar las afinidades según su comportamiento legislativo, independientemente de su pertenencia al bloque.
El proyecto
>> Buscá a tu diputado
Equipo
Federico Sierra
Matías Cardenas
Silvia Cobielca
Pablo Seibelt
Nicolás Cerrini
Juan Sisti
Andy Tow
Entrevista a Federico Sierra
DISCURSOS PRESIDENCIALES
Proyecto 1
Se utilizó una base de 1200 discursos presidenciales de Cristina Fernández de Kirchner con el objetivo de generar una línea de tiempo de los discursos presidenciales, en un intento por detectar la relevancia de ciertas palabras claves para definir emergentes coyunturales en la agenda presidencial.
El proyecto
>> Text Mining sobre 1200 discursos presidenciales
Equipo
Gastón Gadea
Osvaldo Toja
Ana Fernández
Entrevista a Gastón Gadea
Proyecto 2
En este trabajo también se utilizó la base de discursos presidenciales de Cristina Fernández de Kirchner, correspondiente a 2010, 2011 y 2012, con el objetivo de detectar ciertas relevancias de términos en el discurso presidencial.
El proyecto
Link DocumentCloud a la presentación
Equipo
Xavier Ignacio González
Luis Daniel Urea
MONITOREO PRESUPUESTARIO
El proyecto
Se utilizaron los datos del Sistema Integrado de Información Financiera (Ministerio de Economía y Finanzas Públicas), para generar una comparación interanual de una semana de ejecución presupuestaria.
Equipo
Elvis Ticona
Nicolas Bernabe
Cristian Bertelegni
Carlos Bonardi
Roman Terciana
Entrevista a Elvis Ticona
GASTO PÚBLICO
Bases utilizadas
Se utilizaron datos extraídos del Boletín Oficial, de las actas del Fondo de Garantía de Sustentabilidad, e información proveniente de fuentes del Ministerio de Economía y Finanzas públicas, con el objetivo es mostrar cómo se modificó la financiación del gasto público desde 2008 en adelante.
El proyecto
Link al proyecto en DocumentCloud
Equipo
Laura Giménez
Napoleón Lacroze
Pablo Figueroa
Fer Mirabelli
Hugo Vasiliev
Entrevista a Pablo Figueroa
FALLOS JUDICIALES
Bases utilizadas
A partir de la base de datos públicos del Centro de Información Judicial, se extrajo un corpus de más de 20000 fallos relacionados con el fuero comercial, con la finalidad de:
– explorar patrones de asignación de salas en las causas
– dentro del fuero penal cantidad de absoluciones, condenas y falta de mérito por cámara judicial
– un ranking
Este equipo también se propuso elaborar un ranking de aparición en fallos de todos los fueros, separados por provincia de palabras vinculadas a los problemas que más preocupan a los argentinos (Gallup).
El proyecto
>> Términos en Sentencias Judiciales 1
>> Términos en Sentencias Judiciales 2
>> Términos en Sentencias Judiciales 3
Equipo
Otto Wald
Ariel Neuman
Diego Melamed
Irina Moldavsky
Entrevista a Ariel Neuman
RIACHUELO, CONTAMINACION Y POBREZA
Proyecto 1
A partir de las bases de Un Techo para mi país, el Censo 2010, Censo de Villas de CABA y Google Earth, se propuso el ojetivo de mapear las condiciones de los barrios más vulnerables de la cuenca del Riachuelo, entrecruzando información del Catastro de Techo, el Censo 2010, el mapa de escuelas y las imágenes satelitales de Google Earth.
El proyecto
>> Mapa de Asentamientos en la Cuenca La Matanza-Riachuelo:
Equipo
Laura Rocha
Gonzalo Bellver
Ricardo Pasquini
Helge Holler
Evangelina Regner
Entrevista a Elvio Holler
Proyecto 2
Se utilizaron las bases de Un techo para mi país, Censo e INDEC (se utilizaron los índices hitóricos de pobreza) con el objetivo de realizar una comparación histórica de la evolución del índice de pobreza y la cantidad de asentamientos en el Gran Buenos Aires desde finales de la década del 80.
El proyecto
Ver presentación
Equipo
Jorge Drot de Gourville J(data miner UBA)
Gustavo Arroyo
Entrevista a Jorge Drot de Gourville
SALUD PÚBLICA
Bases utilizadas
Se trabajó con el Anexo 5 del presupuesto anual de APE destinado a obras sociales
poder visualizar la evolución del presupuesto por obra social desde el 2009
Equipo
Fernando Caselli (dataminer Austral, programador)
Carla Deborah Bravo
Si querés compartir tu proyecto del Datafest y no está publicado en este post, escribinos a lndata@lanacion.com.ar