A través de la plataforma de Junar -un desarrollo argentino localizado en Silicon Valley- los usuarios pueden acceder a una serie de indicadores, descargar datos y publicarlos en sus propios espacios online; detalles del proyecto experimental e inédito para un medio en español.
—————————–
Junar en lunfardo significa “mirar” y, en otro sentido, se usa también para decir que a una persona le conocemos su “modus operandi”, sus puntos débiles y fortalezas. Ese nombre eligieron los argentinos Diego May (leer entrevista en el blog NACION Data) y Javier Pájaro -ex compañeros de facultad- para bautizar una plataforma que pretende resolver el problema de cómo conseguir datos en la web.
Después de ganar competencias de emprendedores en el Instituto Tecnológico de Massachusetts (MIT) y con la financiación de importantes inversionistas, levantaron una ronda inicial de 1.2 millones de dólares y lograron armar una estructura de trabajo de 10 personas con base en Santiago de Chile y el Silicon Valley.
¿Qué es Junar? Es una plataforma web montada en la nube que permite a la gente abrir datos al mundo. “Si antes un blog permitía abrir los pensamientos propios al mundo, hoy este tipo de plataforma consigue que los usuarios compartan datos relevantes y organizados de manera abierta y pública”.
Después de su participación en HacksHackers Buenos Aires, comenzaron a explorar la idea de asociarse a los medios de comunicación, una alianza que tiene sentido en un contexto marcado por una zona de cruce del trabajo periodístico con bases de datos. Presentaron su proyecto a medios de EE.UU y también trabajaron con el diario Nación de Costa Rica.
Una experiencia inédita
Esta semana, Junar y LA NACION lanzaron un nuevo proyecto experimental llamado “Data”. Para ingresar hay que hacer clic en la sección de Información de la barra de canales del sitio y acceder a Data. Una vez dentro de la sección es posible visualizar diferentes indicadores, separados por temas. Muchos de los datos disponibles son los que están utilizando los periodistas de LA NACION en sus artículos o producciones especiales.
La navegación por los diferentes indicadores es muy sencilla y el usuario puede utilizar los datos de diferentes maneras:
– Descargarlos para utilizarlos en planillas de cálculo como Excel
– Compartirlos a través redes sociales
– Insertarlos dentro de otros sitios web
Todos los datos de LA NACION Data pueden ser incluidos en planillas de Google Spreadsheets o inclusive en Excel. Los datos, montados sobre la plataforma de Junar, serán actualizados automáticamente a medida que se vayan modificando.
Una tendencia mundial
“De aquí a diez años no solo los gobiernos, sino las instituciones, las ONGs, etc., cualquier persona que escriba un documento o libro va a tener que considerar abrirlo al resto del mundo. Va a tener que hacerlo con todos los estándares de open data”, pronostica Diego May, uno de los fundadores.
“Está claro que la tendencia de data.gov que impuso EE.UU con la campaña presidencial y luego la gestión de Barack Obama, que se copió en Gran Bretaña y en otros países, ya está haciendo presión en América latina”, afirma May y agrega: “El BID, la Cepal y otras organizaciones multilaterales, están presionando mucho para lograr mayor transparencia en las gestiones. Chile, Uruguay, Colombia y Brasil están liderando este tema en la región”.
El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.
Panel I: Formas y Prácticas de Periodismo de Base de Datos
Reginald Chua, Editor, Data and Innovation, Thomson Reuters
Steve Waldman, Senior Advisor to the Chairman, Federal Communications Commission
Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.
Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.
“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic
NOTA DEL EDITOR: Teresa Bouza, Knight Fellow en la Universidad de Stanford, quien asistió a la Conferencia de Periodistas y Editores de Investigación 2012, en St. Louis, Missouri, entrevistó a Aron Pilhofer, editor de “Interactive News” (Noticias Interactivas) en The New York Times, antes de su charla del viernes (24 de febrero). Pilhofer, que está en la junta directiva del IRE (Organización de Periodistas y Editores de Investigación, en idioma español), lidera un equipo de reporteros y desarrolladores que diseña aplicaciones de bases de datos con el fin de mejorar la información online de The Times.
La expresión “periodismo de base de datos” se ha convertido de repente en popular. Pero Pilhofer destaca que hay un elevado “analfabetismo” en temas de datos entre los periodistas. El editor del Times subrayó, de todos modos, que para hacer periodismo de datos no hace falta ser un científico espacial e insistió en que es “vital” para los periodistas el adquirir al menos ciertos conocimientos básicos. Según Pilhofer, todavía es difícil lograr que los periodistas piensen en utilizar datos como una fuente y que consideren diferentes formas y ángulos a la hora de contar una historia. Pero la verdadera barrera para las historias que se basan en datos es que, “en los niveles más altos”, la importancia del periodismo de base de datos no ha llegado lo suficientemente lejos. En los niveles más altos, es un conocimiento que se ha “infravalorado”, aseguró el editor del New York Times. De modo que no es simplemente un tema de “cuán importante son estas habilidades para uno como periodista” sino de “cuán importante cree que son tu jefe y el jefe de tu jefe”.
– Dadas las herramientas que tenemos ahora, ¿cuál piensa que es el principal desafío al que se enfrentan los periodistas cuando manejan datos? – Para mí, no es un problema de herramientas. Quiero decir, tenemos computadoras más potentes, contamos con más capacidad que nunca para hacer cosas. Con Amazon EC2, se puede básicamente acelerar una supercomputadora durante una tarde, si se quiere, y pagar 100 dólares o una cifra similar, si es necesario analizar grandes cantidades de datos. No es un problema de tecnología, es un problema de personas.
“El 80% del tiempo del staff de @datastore se pasa limpiando datos mal formateados”via @clairedwillett
“Ya nadie confía en los periodistas. El Data Blog es ahora más popular que el blog de noticias de The Guardian”via @jarib
“El material producido por @datastore es reutilizado por el Gobierno. Es trágico que un tercero le organice las bases de datos al gobierno.” via @David_R8.
“Los lectores del Data Blog incluyen personas comunes y desarrolladores”via @clairedwillett
“El trabajo de campo con la audiencia (Crowdsourcing) sirve para encontrar historias pero usualmente no se acompaña con información de soporte.”via @David_R8
“En suma, el compromiso de transparencia y acceso a la información de The Guardian es un modelo para todos nosotros (los estoy mirando a Uds.: gobierno y finanzas)”via @clairedwillett
Antes de recorrer el Storifycompleto, a continuación destaco algunos tweets traducidos al castellano:
“Chris Amico (NPR) usa Estadísticas de Búsqueda, Twitter y Facebook como rastreo policial.”Via @ultracasual
“Chris Amico (NPR): Acabamos de identificar a la víctima de un asesinato a través de Estadísticas de Búsqueda.”Via @digiphile
“Hicimos scraping de un sitio usando una sencilla extensión de Chrome con Michelle Minkoff de AP.”Via @ChrisLKeller
“Limpieza de Data – Lección N° 1: Si alguien te da un archivo con 65.536 datos, tenés un problema.”Via @JKeefe
“Brian Boyer (Chicago Tribune) Mi respuesta directa al que solicita poner data en un mapa: 1) No 2) Convenceme que el mapa es la mejor manera de presentar la data.” Via @richgor
“¿Por qué construir API’s? Pueden adelantar trabajo pero también porque otros lo pueden usar y aprovecharlo para otros usos” Via @ChrisLKeller
Y ahora sí, a perderse entre TANTOS disparadores de inquietudes en esta colección tan variada. ¡Qué los disfruten y aprovechen! >>>
Otra sesión maratónica que pude monitorear desde Buenos Aires. Ésto de internet, Twitter, etc. ¡es mágico!
Creo que la selección que compilé de tweets y fotos -levantados del hashtag #nicar12-, les va a servir como termómetro de la Conferencia y como estímulo inspirador para sus inquietudes en esta materia.
Había varias sesiones al mismo tiempo. Los tweets los puse en orden cronológico para seguir un criterio básico. Por eso pueden estar mezclados temáticamente.
Destaco algunas como muestra.
“Si el Excel es marihuana, entonces Access es la Heroína. ¿Drogas para Data Nerds? Matt Carroll, Boston Globe.”Via @alicitabrennan
“¿Cuánta Data se pone en una visualización de datos? La suficiente para decir la verdad, sin causar confusión innecesaria.”Via @hbillings
“Aron Pilhofer: Las redes sociales se han convertido en una segunda homepage para nosotros (NYT) y se traduce en aplicaciones más usables.”Via @richgor
“Aron Pilhofer: Primero Social suele significar -en mi mente-, primero el lector.”Via @lxbarth
“John Keefe resume lo que para muchos significa aprender de libros: No lo hagan. Empiecen por un proyecto que quieran hacer. Suéñenlo, háganlo”. Via @hbillings
Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.
El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.
Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.
A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso (via “crowdsourcing”)
B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.
C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.
D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.
E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz