Cómo usar OpenRefine para trabajar una base de datos

Por Natalia Sampietro(*) (**)

Cuando trabajamos con datos buena parte de nuestros esfuerzos y tiempo se va en el acondicionamiento, limpieza y puesta en orden de los mismos. Problemas de codificación, estándares, delimitadores, errores de tipeo, entre otros, se convierten en uno de los primeros obstáculos a superar en el camino hacia la generación de información de calidad.

En la búsqueda de una herramienta que simplifique ese camino nos encontramos con Open Refine, antes conocido como Google Refine, un producto de código abierto que ofrece múltiples funcionalidades que van desde limpieza, organización y transformación en diferentes formatos, hasta la posibilidad de extender los datos a través de web services y relacionar con bases de datos como Freebases. Seguir leyendo

Se viene el Foro PoliTICs #joven

El 12 de diciembre, en el Centro Metropolitano de Diseño de la Ciudad de Buenos Aires, se desarrollará el Foro PoliTICs #joven, una iniciativa de la Fundación CiGob y MINU Asociación Civil, que busca incorporar a los jóvenes para explorar el impacto de las nuevas tecnologías de la información y la Comunicación (TICs) en las transformaciones sociales y políticas.

Seguir leyendo

Sin comentarios

Desarrollando América Latina abre sus postulaciones en Argentina

Por segundo año consecutivo se realizará la hackathon “Desarrollando América Latina”, iniciativa liderada por la Wingu y que convoca a desarrolladores web de 8 países de la región. El objetivo es lograr la creación de diversas aplicaciones que apunten a solucionar problemas sociales transversales en Latinoamérica, durante 36 horas consecutivas de programación.

Durante los días 1 y 2 de diciembre se realizará en 8 países de América Latina, y por 36 horas consecutivas, la segunda versión de “Desarrollando América Latina”. Dicha iniciativa es liderada en Argentina por Wingu, y apunta a convocar equipos multidisciplinarios de desarrolladores, diseñadores, periodistas, líderes de proyectos, emprendedores y ciudadanos motivados en encontrar -a través de herramientas tecnológicas- soluciones a problemas transversales de la región.

Seguir leyendo

Sin comentarios

Peligra el proyecto de ley de acceso a la información pública

Vía Flickr

Si la Cámara de Diputados no trata antes de fin de año el proyecto de ley de acceso a la información pública, el expediente podría perder estado parlamentario y la Argentina continuaría sin una normativa emanada por el Congreso que consagre el derecho a preguntar en los tres poderes del Estado.

Seguir leyendo

Los proyectos que el Datafest nos dejó

El sábado 4 de noviembre tuvo lugar la segunda y última jornada de apertura y minería de datos públicos que organizaron LA NACION y la Universidad Austral.

Durante el encuentro, 80 periodistas, programadores, data miners y diseñadores, trabajaron en la apertura de bases de datos públicos y a partir de estos, en la generación de información y en la realización de visualizaciones para facilitar la interpretación de los resultados obtenidos.

Los proyectos abarcaron las áreas de Gasto público, Medio ambiente, Transporte, Energía, Pobreza, Déficit habitacional, Monitoreo presupuestario, Actividad legislativa, Censo y Justicia. A continuación compartimos un breve informe sobre cada proyecto, el trabajo que se realizó, y entrevistas a los protagonistas del encuentro.

ACTIVIDAD LEGISLATIVA

Proyecto 1

Bases utilizadas

Se trabajó a partir de las edades de los diputados en los 4 últimos mandatos para realizar un análisis y visualización por bloque, por mandato o por provincia .

El proyecto
>> Análisis etario de diputados nacionales en Tableau
>> API abierta: edades de diputados nacionales por provincia

Equipo
Andrés Vazquez
Tomás Crom
Boris Kryegel
Aurelio Tomás
Alan Turing

Equipo de Directorio Legislativo:
Noel Alonso
Agustina de Luca
María Barón

Seguir leyendo

Innovation Fund: financiamiento para proyectos de transparencia

 

Por Hernán Charosky

@charosky

Una idea te da vueltas por la cabeza. Abrir los datos de una repartición pública, compartir experiencias en el uso de un servicio público, desarrollar una aplicación que ayude a los ciudadanos a acercarse a los datos públicos, a las autoridades, a coordinarse colectivamente. Ahora hay una posibilidad de poner a prueba esa idea.

El Innovation Fund (Fondo para la Innovación) que abrió la organización estadounidense Global Integrity te propone lanzarte con tu idea. El fondo va a distribuir hasta 10 mil dólares en hasta 15 proyectos de innovación en el campo de la transparencia. Específicamente, todo lo relacionado con datos abiertos genera un interés en especial.

Más allá de las limitaciones que hay al acceso a la información pública en distintos niveles de gobierno, hay mucho por hacer en términos de aprovechar los datos públicos existentes, buscar los que podrían estar disponibles, y ayudar a las personas a compartir los que tienen y a coordinar sus acciones para conseguirlos. Si tenés alguna idea que quieras probar en este sentido, hasta el 30 de noviembre tenés tiempo para pensarla y escribirla.

En el sitio web vas a encontrar todos los datos necesarios para orientarte, y también hay una introducción en castellano.

La propuesta es simple: enviar al sitio web, en no más de 400 palabras (en inglés) un proyecto que implique un incremento de transparencia para los ciudadanos, mediante un desarrollo metodológico o tecnológico que hasta ahora no se haya probado, o no se lo haya hecho del modo en que se propone. Es importante que en la propuesta queden claros cuatro elementos, de un modo muy breve: en qué consiste el proyecto, de qué modo incrementa la transparencia, cuál es el aspecto de innovación, y cómo contribuye a un cambio. Pueden presentarse personas individuales y organizaciones. Es una oportunidad para sacarte de la cabeza la idea y ver cómo funciona en la realidad. Si creés que te puedo ayudar, no dudes en escribirme vía twitter: @charosky.

 

Ocho redacciones del mundo reciben becarios Knight-Mozilla OpenNews


¡Y llegó el día! El jueves 8 de noviembre se anunció quién va a ser el programador becario que se integrará a LA NACION Data gracias al Programa OpenNews de la Knight y Mozilla Foundations.

Durante el mes de junio invitamos a la comunidad de programadores a unirse a esta desafio. El objetivo del Programa OpenNews de las becas Knight-Mozilla es incorporar programadores y desarrolladores en las redacciones periodísticas alrededor del mundo para construir herramientas y pensar soluciones que aporten valor a las historias relevantes de cada jornada.  Seguir leyendo

Gracias por tanto, #Datafest

Parte del equipo de LNData y la Universidad Austral que organizó el evento.

El sábado 4 de noviembre tuvo lugar la segunda y última jornada del encuentro de apertura y minería de datos públicos que organizaron LA NACION y la Universidad Austral.

Los participantes llegaron temprano en la mañana para sumarse a los 9 equipos de trabajo que se formaron el día anterior.  La meta era abrir datos y a partir de éstos, cruzar las distintas variables relacionadas con diferentes temáticas, así como diseñar visualizaciones interactivas, para facilitar la interpretación de los grandes volúmenes de información sobre los que se trabajó.
Alrededor de 80 periodistas, programadores, data miners y diseñadores, trabajaron codo a codo durante toda la jornada en proyectos vinculados a Gasto público, Medio ambiente, Transporte, Energía, Pobreza, Déficit habitacional, Monitoreo presupuestario, Actividad legislativa, Censo y Justicia,  alcanzando prometedores resultados que daremos a conocer en los próximos días.

Seguir leyendo

Exposiciones y talleres en la primera jornada del #Datafest

El encuentro de apertura y minería de datos públicos que reúne a más de 250 periodistas, programadores, data miners y diseñadores, tuvo una completa agenda de actividades durante su primera jornada en la Universidad Austral.

Por la tarde se organizaron diferentes equipos de trabajo interdisciplinarios con el objetivo de analizar, desarrollar y diseñar visualizaciones interactivas, así como participar en la construcción y apertura de fuentes de información pública, para obtener conclusiones de interés social.

Por otra parte, se realizaron una serie de charlas complementarias que estuvieron a cargo del equipo de @LNData.

El programa comenzó con Gastón Roitberg, Secretario de Redacción Multimedia de LA NACION, quien presentó el proyecto @LNData, puesto en marcha hace más de un año. “En las redacciones vienen surgiendo nuevos perfiles profesionales híbridos como productores de datos, líderes de proyecto, analistas de datos, programadores, diseñadores interactivos y scrappers que se están integrando a los roles tradicionales. Es importante que los medios reserven una parte del tiempo para explorar algunas alternativas de cómo contar historias a través de los datos, con un objetivo de laboratorio en tiempo real”, sostuvo Roitberg.

Seguir leyendo

Sin comentarios

Así empezó el #DataFest

Damián Fernández Pedemonte, Director de la Escuela de Posgrado de la Universidad Austral

Con más de 250 asistentes comenzó el primer DataFest de Argentina, organizado por LA NACION y la Universidad Austral. Se trata de un encuentro de apertura y minería de datos públicos, destinado a periodistas, programadores, data miners y diseñadores.

Desde hoy y durante la jornada de mañana, los participantes trabajarán en equipos multidisciplinarios en proyectos que abarcan áreas temáticas como Gasto Público, Medio Ambiente, Transporte, Energía. Pobreza, Déficit Habitacional, Monitoreo Presupuestario, Censo, Actividad Legislativa y Justicia.

A través de las bases de datos facilitadas durante el evento, los distintos grupos comenzaron  a analizar y diseñar visualizaciones interactivas, así como participar en la construcción y apertura de fuentes de información pública, para obtener conclusiones de interés social.

El inicio de la jornada estuvo a cargo de Damián Fernández Pedemonte, Director de la Escuela de Posgrados en Comunicación de la Universidad Austral, quien destacó el valor que tiene el periodismo basado en datos para la ciudadanía en general.

Por su parte, Carlos Guyot, Director de Innovación y Prosecretario General de LA NACION, hizo hincapié en el desafío que representa la apertura de datos para crear conocimiento y generar información; la idea es acercar estos datos a las audiencias.

“No es una tarea para héroes solitarios, es una disciplina que demanda diferentes enfoques”, sostuvo Guyot.

El cierre estuvo a cargo de Darío Wayner, Director ejecutivo de GarageLab, quien sostuvo que estamos en una transición de un modelo de noticias basado en narrativas, a uno que tiene a los datos como soporte.

Seguir leyendo