Proyecto censo, paso a paso

 

Hace poco más de un mes lanzamos “Proyecto censo”, un micrositio que reúne las principales variables de los censos de 2001 y 2010.

La iniciativa surgió el año pasado, durante Hacks/Hackers Media Party. Allí, uno de los tantos equipos que se formaron en el hackathon comenzó a descargar parte de los datos que el Indec subió a su sitio. Esto se convirtió en el puntapié inicial para el desarrollo de una aplicación que incluye mapas, un motor de búsqueda, especificaciones y, por sobre todo, una nueva manera de acercarse a la información pública.

En este post, te contamos el paso a paso del proyecto.

Los datos

Cuando finalizó el Hacks/Hackers Media Party nos preguntamos cómo trabajar los datos de los censos para que las personas pudieran realizar comparaciones entre ellos y promover la reutilización de la información de modo amigable para todos. Así llegaron los “Censothones”: 2 encuentros de jornada completa dedicados a explorar en detalle los archivos que el Indec tiene en su página web para bajarlos y agruparlos de modo comprensible.

Una vez que logramos entender en profundidad las variables de 2001, buscamos el correlato de cada una de ellas en el último censo. La tarea no fue sencilla. Por eso, trabajamos en conjunto con Roberto Kalauz, economista y especialista en estudios de estadística. También contamos con la ayuda de Sandra CrucianelliKnight International Journalism Fellow. Ambos nos asesoraron para evitar unir datos que no guardaran lógica entre sí o que hicieran mención a elementos diferentes.

Finalmente dividimos las variables por grupo, en las tres unidades de relevamiento: Población, Hogares y Viviendas. En cada uno de los casos chequeamos la coherencia de los datos entre un censo y otro. Además, armamos rankings, histogramas y gráficos  para buscar posibles inconsistencias.

La tecnología

El Proyecto Censo se construyó utilizando tecnologías estándares, disponibles en cualquier navegador moderno. Entre ellas, SVG (Scalable Vector Graphics) y D3.js (Data Driven Documents).

La elección de los rangos de valores para cada variable se hizo automáticamente, mediante el uso de estos métodos, según el caso:

Jenks Natural Breaks

Head/tail breaks

En algunos mapas, dado que los métodos automáticos no proveían una solución satisfactoria, se eligieron los rangos manualmente.

¿Y el diseño?

En lo que respecta al diseño, la idea principal fue geolocalizar en diferentes mapas de la Argentina los valores emitidos por el Indec para ambos censos y la variación producida entre las dos mediciones. Estas visualizaciones se convirtieron en protagonistas de la aplicación, otorgando al usuario la posibilidad de comparación. Además, al deslizar el mouse por cada departamento o municipio se obtienen más detalles de los mismos, y en el caso de ser muy pequeños, se les puede hacer zoom para verlos con mayor facilidad.

Para cada una de las unidades se relevamiento se eligieron tres cromas fríos; azul (Población), violeta (Hogares) y verde (Viviendas). En todos los cosas, estos colores grafican datos estadísticos con valores en positivos; para los negativos, el croma elegido fue el naranja. De esta manera logramos un alto impacto visual por contraste.

Por último, los mapas fueron acompañados por un ránking que ayuda al lector a organizar los departamentos o municipios con mayor crecimiento.

¡Contamos qué te parece el micrositio!

+ Información

Glosario censo 2001

Glosario censo 2010

Especificaciones sobre los datos trabajados

 Equipo de trabajo

Producción y análisis de datos: Gabriela Bouret.

Diseño interactivo: Mariana Trigo Viera.

Programación: Manuel Aristarán (Knight Mozilla OpenNews) y Cristian Bertelegni.

Consultora: Sandra Crucianelli (Knight International Journalism Fellow)

Consultor estadístico: Roberto Kalauz