Los proyectos que el Datafest nos dejó

 

El sábado 4 de noviembre tuvo lugar la segunda y última jornada de apertura y minería de datos públicos que organizaron LA NACION y la Universidad Austral.

Durante el encuentro, 80 periodistas, programadores, data miners y diseñadores, trabajaron en la apertura de bases de datos públicos y a partir de estos, en la generación de información y en la realización de visualizaciones para facilitar la interpretación de los resultados obtenidos.

Los proyectos abarcaron las áreas de Gasto público, Medio ambiente, Transporte, Energía, Pobreza, Déficit habitacional, Monitoreo presupuestario, Actividad legislativa, Censo y Justicia. A continuación compartimos un breve informe sobre cada proyecto, el trabajo que se realizó, y entrevistas a los protagonistas del encuentro.

ACTIVIDAD LEGISLATIVA

Proyecto 1

Bases utilizadas

Se trabajó a partir de las edades de los diputados en los 4 últimos mandatos para realizar un análisis y visualización por bloque, por mandato o por provincia .

El proyecto
>> Análisis etario de diputados nacionales en Tableau
>> API abierta: edades de diputados nacionales por provincia

Equipo
Andrés Vazquez
Tomás Crom
Boris Kryegel
Aurelio Tomás
Alan Turing

Equipo de Directorio Legislativo:
Noel Alonso
Agustina de Luca
María Barón

Proyecto 2

Bases utilizadas
Se trabajó con las votaciones nominales y datos básicos de los diputados, con el objetivo de generar un perfil de cada legislador e identificar las afinidades según su comportamiento legislativo, independientemente de su pertenencia al bloque.

El proyecto
>> Buscá a tu diputado

Equipo
Federico Sierra
Matías Cardenas
Silvia Cobielca
Pablo Seibelt
Nicolás Cerrini
Juan Sisti
Andy Tow

Entrevista a Federico Sierra

DISCURSOS PRESIDENCIALES

Proyecto 1
Se utilizó una base de 1200 discursos presidenciales de Cristina Fernández de Kirchner con el objetivo de generar una línea de tiempo de los discursos presidenciales, en un intento por detectar la relevancia de ciertas palabras claves para definir emergentes coyunturales en la agenda presidencial.

 

El proyecto
>> Text Mining sobre 1200 discursos presidenciales

Equipo
Gastón Gadea
Osvaldo Toja
Ana Fernández

Entrevista a Gastón Gadea

Proyecto 2
En este trabajo también se utilizó la base de discursos presidenciales de Cristina Fernández de Kirchner, correspondiente a 2010, 2011 y 2012, con el objetivo de detectar ciertas relevancias de términos en el discurso presidencial.

El proyecto
Link DocumentCloud a la presentación

Equipo
Xavier Ignacio González
Luis Daniel Urea

MONITOREO PRESUPUESTARIO

El proyecto
Se utilizaron los datos del Sistema Integrado de Información Financiera (Ministerio de Economía y Finanzas Públicas), para generar una comparación interanual de una semana de ejecución presupuestaria.

Equipo
Elvis Ticona
Nicolas Bernabe
Cristian Bertelegni
Carlos Bonardi
Roman Terciana

Entrevista a Elvis Ticona

 

GASTO PÚBLICO

Bases utilizadas
Se utilizaron datos extraídos del Boletín Oficial, de las actas del Fondo de Garantía de Sustentabilidad, e información proveniente de fuentes del Ministerio de Economía y Finanzas públicas, con el objetivo es mostrar cómo se modificó la financiación del gasto público desde 2008 en adelante.

El proyecto

Link al proyecto en DocumentCloud

Equipo
Laura Giménez
Napoleón Lacroze
Pablo Figueroa
Fer Mirabelli
Hugo Vasiliev

Entrevista a Pablo Figueroa

FALLOS JUDICIALES

Bases utilizadas
A partir de la base de datos públicos del Centro de  Información Judicial, se extrajo un corpus de más de 20000 fallos relacionados con el fuero comercial, con la finalidad de:
- explorar patrones de asignación de salas en las causas
- dentro del fuero penal cantidad de absoluciones, condenas y falta de mérito por cámara judicial
- un ranking

Este equipo también se propuso elaborar un ranking de aparición en fallos de todos los fueros, separados por provincia de palabras vinculadas a los problemas que más preocupan a los argentinos (Gallup).

El proyecto

>> Términos en Sentencias Judiciales 1

>> Términos en Sentencias Judiciales 2

>> Términos en Sentencias Judiciales 3

Equipo
Otto Wald
Ariel Neuman
Diego Melamed
Irina Moldavsky

Entrevista a Ariel Neuman

RIACHUELO, CONTAMINACION Y POBREZA

Proyecto 1
A partir de las bases de Un Techo para mi país, el Censo 2010, Censo de Villas de CABA y Google Earth, se propuso el ojetivo de mapear las condiciones de los barrios más vulnerables de la cuenca del Riachuelo, entrecruzando información del Catastro de Techo, el Censo 2010, el mapa de escuelas y las imágenes satelitales de Google Earth.

El proyecto
>> Mapa de Asentamientos en la Cuenca La Matanza-Riachuelo:

Equipo
Laura Rocha
Gonzalo Bellver
Ricardo Pasquini
Helge Holler
Evangelina Regner

Entrevista a Elvio Holler

Proyecto 2
Se utilizaron las bases de Un techo para mi país, Censo e INDEC (se utilizaron los índices hitóricos de pobreza) con el objetivo de realizar una comparación histórica de la evolución del índice de pobreza y la cantidad de asentamientos en el Gran Buenos Aires desde finales de la década del 80.

El proyecto
Ver presentación

Equipo
Jorge Drot  de Gourville J(data miner UBA)
Gustavo Arroyo

Entrevista a Jorge Drot de Gourville

SALUD PÚBLICA

Bases utilizadas
Se trabajó con el Anexo 5 del presupuesto anual de APE destinado a obras sociales
poder visualizar la evolución del presupuesto por obra social desde el 2009

Equipo
Fernando Caselli (dataminer Austral, programador)
Carla Deborah Bravo

Si querés compartir tu proyecto del Datafest y no está publicado en este post, escribinos a lndata@lanacion.com.ar

  • Fede

    Off-topic: en la nota “Falta gas para un ardiente verano” ( http://www.lanacion.com.ar/1528148-falta-gas-para-un-ardiente-verano ) se adjunta un gráfico, que tiene un problema de base importante: no sirve para nada. Las dimensiones de las burbujas no pueden compararse ni entre las mismas series ni entre las distintas series, porque las diferencias son muy pequeñas en relación al valor total. Tal vez hubiese estado mejor hacer las burbujas sobre la tercer serie, la de diferencias, para que la relación sea evidente por lo menos en una serie. De todas maneras, tal vez el gráfico de burbujas no sea el más adecuado; tal vez un gráfico de líneas o de barras hubiese sido suficiente, o tal vez la tabla plana y sencilla.

    Me gustaría poder comentar en la otra nota, pero no incluye Disqus, y no voy a registrarme para publicar un comentario, y no tengo Facebook.

  • Pingback: Del Datafest a Desarrollando América Latina sin escalas | DosCeroLife

  • Pingback: Comunicació » » arxiu de blog » Curs d’introducció a l’Open Data -

  • Pingback: #NGODay: ONG´s y Datos Abiertos en Argentina - Blogs lanacion.com