LA NACION abre sus bases de datos de interés público

A través de la plataforma de Junar -un desarrollo argentino localizado en Silicon Valley- los usuarios pueden acceder a una serie de indicadores, descargar datos y publicarlos en sus propios espacios online; detalles del proyecto experimental e inédito para un medio en español.

—————————–

Junar en lunfardo significa “mirar” y, en otro sentido, se usa también para decir que a una persona le conocemos su “modus operandi”, sus puntos débiles y fortalezas. Ese nombre eligieron los argentinos Diego May (leer entrevista en el blog NACION Data) y Javier Pájaro -ex compañeros de facultad- para bautizar una plataforma que pretende resolver el problema de cómo conseguir datos en la web.

Después de ganar competencias de emprendedores en el Instituto Tecnológico de Massachusetts (MIT) y con la financiación de importantes inversionistas, levantaron una ronda inicial de 1.2 millones de dólares y lograron armar una estructura de trabajo de 10 personas con base en Santiago de Chile y el Silicon Valley.

¿Qué es Junar? Es una plataforma web montada en la nube que permite a la gente abrir datos al mundo. “Si antes un blog permitía abrir los pensamientos propios al mundo, hoy este tipo de  plataforma consigue que los usuarios compartan datos relevantes y organizados de manera abierta y pública”.

Después de su participación en HacksHackers Buenos Aires, comenzaron a explorar la idea de asociarse a los medios de comunicación, una alianza que tiene sentido en un contexto marcado por una zona de cruce del trabajo periodístico con bases de datos. Presentaron su proyecto a medios de EE.UU y también trabajaron con el diario Nación de Costa Rica.

Una experiencia inédita

Esta semana, Junar y LA NACION lanzaron un nuevo proyecto experimental llamado “Data”. Para ingresar hay que hacer clic en la sección de Información de la barra de canales del sitio y acceder a Data. Una vez dentro de la sección es posible visualizar diferentes indicadores, separados por temas. Muchos de los datos disponibles son los que están utilizando los periodistas de LA NACION en sus artículos o producciones especiales.

La navegación por los diferentes indicadores es muy sencilla y el usuario puede utilizar los datos de diferentes maneras:

– Descargarlos para utilizarlos en planillas de cálculo como Excel
– Compartirlos a través redes sociales
– Insertarlos dentro de otros sitios web

Todos los datos de LA NACION Data pueden ser incluidos en planillas de Google Spreadsheets o inclusive en Excel. Los datos, montados sobre la plataforma de Junar, serán actualizados automáticamente a medida que se vayan modificando.

Una tendencia mundial

“De aquí a diez años no solo los gobiernos, sino las instituciones, las ONGs, etc., cualquier persona que escriba un documento o libro va a tener que considerar abrirlo al resto del mundo. Va a tener que hacerlo con todos los estándares de open data”, pronostica Diego May, uno de los fundadores.

“Está claro que la tendencia de data.gov que impuso EE.UU con la campaña presidencial y luego la gestión de Barack Obama, que se copió en Gran Bretaña y en otros países, ya está haciendo presión en América latina”, afirma May y agrega: “El BID, la Cepal y otras organizaciones multilaterales, están presionando mucho para lograr mayor transparencia en las gestiones. Chile, Uruguay, Colombia y Brasil están liderando este tema en la región”.

La película Moneyball, Yale y el Periodismo de Base de Datos

 

 

El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.

 

Panel I: Formas y Prácticas de Periodismo de Base de Datos

Panel II: La Influencia de la Data en el Proceso de la Noticias

Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.

Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.

“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic

 

 

Otros tweets traducidos al castellano:

Seguir leyendo

Diego May de Junar.com: “Los datos abiertos pueden ser un motor de innovación e impacto”

En una entrevista exclusiva para el blog NACION Data de lanacion.com, Diego May -cofundador de la plataforma de datos abiertos Junar– explica por qué este movimiento de transparencia y datos abiertos es tan crucial en el mundo en el que vivimos, explica los alcances del proyecto con base en Chile y EE.UU y sostiene que es fundamental crear plataformas que faciliten la apertura de los datos a la ciudadanía.

Junar desarrolló una nueva plataforma en lanacion.com (“Data”) para que los usuarios puedan acceder a diferentes bases de datos e indicadores, descargarlos y republicarlos.

– ¿Por qué el movimiento de open data es tan importante en el mundo en el que vivimos?

– Es importante aclarar que cuando en Junar nos referimos a “data” hablamos de información en formato tabular: rankings, estadísticas, y resultados de encuestas, pero también datos geográficos, científicos, macroeconómicos, financieros y de mercados, entre otros. Open data es tan importante como open web. En algún momento del pasado existía Internet pero casi no había contenidos. De a poco las tecnologías fueron avanzando, las plataformas fueron apareciendo y hoy no hay empresa o persona que no tenga un sitio con sus propios contenidos. Y existen muchas tecnologías que nos permiten buscarlo, ordenarlo y distribuirlo de diversas maneras. Cuando pensamos en datos, es fácil imaginar datos relevantes en poder de gobiernos, corporaciones, ONG, instituciones o individuos. Estos datos no se publican de manera abierta y pública porque no es tan fácil hacerlo, y en los casos en los que se concreta la publicación los usuarios apenas los pueden ver, pero no los pueden utilizar. Open data es la promesa de hacer que estos datos relevantes puedan ser hallables, fácilmente utilizables y estén disponibles para compartir entre los ciudadanos. Con esta apertura se abre la posibilidad de mucha innovación, con la construcción de transparencia y responsabilidad.

– ¿Qué organizaciones son fundamentales para reclamar la transparencia de la información pública?

– En los últimos años se fue incrementando la presión por parte de ciudadanos en general y de empresas. Muchas de estas iniciativas son canalizadas por ONG como Transparencia Internacional y sus capítulos en diferentes países, y otras como Ciudadano Inteligente, Poder Ciudadano y Sunlight Foundation. También las universidades son ambientes que generan mucho contenido, datos, información, innovación, aprendizaje y conocimiento. Las universidades deben ser también motores de open data y dar ejemplos en temas de transparencia.

Seguir leyendo

O’Reilly Strata Conference – Simon Rogers & Co.

 

 

Hace un par de horas se llevó a cabo en Santa Clara, California, una nueva edición de la Conferencia de O’Reilly “Strata”.

Estuve monitoreando el hashtag y los ponentes de The Guardian, Simon Rogers y Michael Brunton-Spall.

Con eso pude armar un mix de tweets apasionante. Demuestran que la dupla del diario inglés compartió mucha información con el auditorio.

A continuación, una selección de tweets traducidos al español. Sino pueden pasar directo al Storify completo (en inglés):

“Resultó que los soldados son buenos para ingresar datos #wikileaks” via @kinlane

“El enemigo de los Datos Abiertos es el PDF” via @clairedwillett

“El 80% del tiempo del staff de @datastore se pasa limpiando datos mal formateados” via @clairedwillett

“Ya nadie confía en los periodistas. El Data Blog es ahora más popular que el blog de noticias de The Guardian” via @jarib

“El material producido por @datastore es reutilizado por el Gobierno. Es trágico que un tercero le organice las bases de datos al gobierno.via @David_R8.

“Los lectores del Data Blog incluyen personas comunes y desarrolladores” via @clairedwillett

“Cómo encontrar una aguja en un pajar: quemar el pajar” via @clairedwillett

“El trabajo de campo con la audiencia (Crowdsourcing) sirve para encontrar historias pero usualmente no se acompaña con información de soporte.” via @David_R8

“En suma, el compromiso de transparencia y acceso a la información de The Guardian es un modelo para todos nosotros (los estoy mirando a Uds.: gobierno y finanzas)” via @clairedwillett

Cuando consiga el video de la ponencia lo embebo.

Ahora sí, el jugoso compendio en Storify.  🙂

Seguir leyendo

Conferencia IRE NICAR – Día 3

 

Momi Peralta Ramos con el equipo de PANDA

Tercer día de maratón de tweets, fotos y videos en el hashtag #nicar12 de Twitter.

En el Schedule de la Conferencia pueden encontrar el detalle de las sesiones del sábado 25/02.

Antes de recorrer el Storify completo, a continuación destaco algunos tweets traducidos al castellano:

“Chris Amico (NPR) usa Estadísticas de Búsqueda, Twitter y Facebook como rastreo policial.” Via @ultracasual

“Chris Amico (NPR): Acabamos de identificar a la víctima de un asesinato a través de Estadísticas de Búsqueda.” Via @digiphile

“Hicimos scraping de un sitio usando una sencilla extensión de Chrome con Michelle Minkoff de AP.” Via @ChrisLKeller

“Limpieza de Data – Lección N° 1: Si alguien te da un archivo con 65.536 datos, tenés un problema.” Via @JKeefe

“Brian Boyer (Chicago Tribune) Mi respuesta directa al que solicita poner data en un mapa: 1) No 2) Convenceme que el mapa es la mejor manera de presentar la data.Via @richgor

“¿Por qué construir API’s? Pueden adelantar trabajo pero también porque otros lo pueden usar y aprovecharlo para otros usos” Via @ChrisLKeller

Y ahora sí, a perderse entre TANTOS disparadores de inquietudes en esta colección tan variada. ¡Qué los disfruten y aprovechen! >>>

 

Seguir leyendo

Conferencia IRE NICAR – Día 2

 

Foto Gentileza: Instagram de @hbillings

 

Otra sesión maratónica que pude monitorear desde Buenos Aires. Ésto de internet, Twitter, etc. ¡es mágico!

Creo que la selección que compilé de tweets y fotos -levantados del hashtag #nicar12-, les va a servir como termómetro de la Conferencia y como estímulo inspirador para sus inquietudes en esta materia.

Había varias sesiones al mismo tiempo. Los tweets los puse en orden cronológico para seguir un criterio básico. Por eso pueden estar mezclados temáticamente.

Destaco algunas como muestra.

“Si el Excel es marihuana, entonces Access es la Heroína. ¿Drogas para Data Nerds? Matt Carroll, Boston Globe.” Via @alicitabrennan

“¿Cuánta Data se pone en una visualización de datos? La suficiente para decir la verdad, sin causar confusión innecesaria.” Via @hbillings

“Aron Pilhofer: Las redes sociales se han convertido en una segunda homepage para nosotros (NYT) y se traduce en aplicaciones más usables.” Via @richgor

“Aron Pilhofer: Primero Social suele significar -en mi mente-, primero el lector.” Via @lxbarth

“John Keefe resume lo que para muchos significa aprender de libros: No lo hagan. Empiecen por un proyecto que quieran hacer. Suéñenlo, háganlo”. Via @hbillings

Seguir leyendo

Conferencia IRE NICAR – Día 1

 

Armé una colección con los mejores tweets, fotos y videos del día 1 en el hashtag de Twitter  #nicar12 Destaco tres frases sueltas que traduzco del inglés:

“Data es la moneda de la democracia” via @AllisonPrang

“Quiero aprender a extraer información de audio y video” via @HilkeSchellmann

“Seguir el dinero es seguir el dinero (sin distinguir si son fondos públicos, privados, de asociaciones sin fines de lucro, …)” via @RobLeo

Y ahora sí, ¡a perderse entre tanta pre-selección! >>>

Seguir leyendo

THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra

 

Flickr/Ben Sutherland – CC Attribution

Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.

El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.

El 18 de junio el Parlamento inglés publicó en su sitio oficial un informe más detallado de los reclamos de gastos luego de una larga batalla de requerimientos de información en base a la Freedom of Information Act.

Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.

A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso  (via “crowdsourcing”)

B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.

C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.

D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.

E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz

Seguir leyendo