#WJCHAT: Matemática para periodistas

Publicado el 17.03.12 por Florencia Coelho

El 14 de marzo en Estados Unidos celebran el día del número π – símbolo Pi. (3/14) También la fecha coincide con el nacimiento de Albert Einstein.

El chat twittero en inglés #WJCHAT fue dedicado el miércoles pasado a Matemáticas para Periodistas y Visualización de Datos.

El invitado de honor fue Len de Groot (@lendegroot), profesor del KDMC – Knight Digital Media Center de la Universidad de Berkeley en California.

Armé un Storify con las 10 preguntas de @wjchat, las respuestas de Len y frases mechadas de otros participantes.

También seleccioné algunos tweets que intento reflejar en español:

“Lo que más me gusta de trabajar con bases de datos es descubrir cosas. Todos esos momentos … ¡AJA!”

Vía @lendergroot

“¿Deberían las redacciones publicar las bases de datos junto con la historia que se basa en ellos o es un desperdicio de recursos? Via @wjchat

Seguir leyendo →

LA NACION abre sus bases de datos de interés público

Publicado el 14.03.12 por Gastón Roitberg

A través de la plataforma de Junar -un desarrollo argentino localizado en Silicon Valley- los usuarios pueden acceder a una serie de indicadores, descargar datos y publicarlos en sus propios espacios online; detalles del proyecto experimental e inédito para un medio en español.

—————————–

Junar en lunfardo significa “mirar” y, en otro sentido, se usa también para decir que a una persona le conocemos su “modus operandi”, sus puntos débiles y fortalezas. Ese nombre eligieron los argentinos Diego May (leer entrevista en el blog NACION Data) y Javier Pájaro -ex compañeros de facultad- para bautizar una plataforma que pretende resolver el problema de cómo conseguir datos en la web.

Después de ganar competencias de emprendedores en el Instituto Tecnológico de Massachusetts (MIT) y con la financiación de importantes inversionistas, levantaron una ronda inicial de 1.2 millones de dólares y lograron armar una estructura de trabajo de 10 personas con base en Santiago de Chile y el Silicon Valley.

¿Qué es Junar? Es una plataforma web montada en la nube que permite a la gente abrir datos al mundo. “Si antes un blog permitía abrir los pensamientos propios al mundo, hoy este tipo de plataforma consigue que los usuarios compartan datos relevantes y organizados de manera abierta y pública”.

Después de su participación en HacksHackers Buenos Aires, comenzaron a explorar la idea de asociarse a los medios de comunicación, una alianza que tiene sentido en un contexto marcado por una zona de cruce del trabajo periodístico con bases de datos. Presentaron su proyecto a medios de EE.UU y también trabajaron con el diario Nación de Costa Rica.

Una experiencia inédita

Esta semana, Junar y LA NACION lanzaron un nuevo proyecto experimental llamado “Data”. Para ingresar hay que hacer clic en la sección de Información de la barra de canales del sitio y acceder a Data. Una vez dentro de la sección es posible visualizar diferentes indicadores, separados por temas. Muchos de los datos disponibles son los que están utilizando los periodistas de LA NACION en sus artículos o producciones especiales.

La navegación por los diferentes indicadores es muy sencilla y el usuario puede utilizar los datos de diferentes maneras:

– Descargarlos para utilizarlos en planillas de cálculo como Excel
– Compartirlos a través redes sociales
– Insertarlos dentro de otros sitios web

Todos los datos de LA NACION Data pueden ser incluidos en planillas de Google Spreadsheets o inclusive en Excel. Los datos, montados sobre la plataforma de Junar, serán actualizados automáticamente a medida que se vayan modificando.

Una tendencia mundial

“De aquí a diez años no solo los gobiernos, sino las instituciones, las ONGs, etc., cualquier persona que escriba un documento o libro va a tener que considerar abrirlo al resto del mundo. Va a tener que hacerlo con todos los estándares de open data”, pronostica Diego May, uno de los fundadores.

“Está claro que la tendencia de data.gov que impuso EE.UU con la campaña presidencial y luego la gestión de Barack Obama, que se copió en Gran Bretaña y en otros países, ya está haciendo presión en América latina”, afirma May y agrega: “El BID, la Cepal y otras organizaciones multilaterales, están presionando mucho para lograr mayor transparencia en las gestiones. Chile, Uruguay, Colombia y Brasil están liderando este tema en la región”.

La película Moneyball, Yale y el Periodismo de Base de Datos

Publicado el 10.03.12 por Florencia Coelho

El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.

Panel I: Formas y Prácticas de Periodismo de Base de Datos

Reginald Chua, Editor, Data and Innovation, Thomson Reuters
Amanda Cox, Graphics Editor, New York Times
Simon Ferrari, Video Game Designer and Doctoral Researcher in Digital Media, Georgia Institute of Technology
Katharine Jarmul, Lead Developer, Loud3r
Dafna Linzer, Senior Investigative Reporter, ProPublica

Panel II: La Influencia de la Data en el Proceso de la Noticias

C.W. Anderson, Assistant Professor of Media Culture, College of Staten Island (CUNY)
Brian Boyer, News Applications Editor, Chicago Tribune
Hannah Fairfield, Graphics Director, Washington Post
Matt Stiles, Data Journalist, NPR
Steve Waldman, Senior Advisor to the Chairman, Federal Communications Commission

Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.

Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.

“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic

Otros tweets traducidos al castellano:

Seguir leyendo →

NY TIMES: Aron Pilhofer y el estado del periodismo de datos.

Publicado el 05.03.12 por Florencia Coelho

Aron Pilhofer, editor de Interactive News en The New York Times

Periodismo de datos, por qué no se hace tanto como sería necesario según editor del New York Times

Por Teresa Bouza

NOTA DEL EDITOR: Teresa Bouza, Knight Fellow en la Universidad de Stanford, quien asistió a la Conferencia de Periodistas y Editores de Investigación 2012, en St. Louis, Missouri, entrevistó a Aron Pilhofer, editor de “Interactive News” (Noticias Interactivas) en The New York Times, antes de su charla del viernes (24 de febrero). Pilhofer, que está en la junta directiva del IRE (Organización de Periodistas y Editores de Investigación, en idioma español), lidera un equipo de reporteros y desarrolladores que diseña aplicaciones de bases de datos con el fin de mejorar la información online de The Times.

La expresión “periodismo de base de datos” se ha convertido de repente en popular. Pero Pilhofer destaca que hay un elevado “analfabetismo” en temas de datos entre los periodistas. El editor del Times subrayó, de todos modos, que para hacer periodismo de datos no hace falta ser un científico espacial e insistió en que es “vital” para los periodistas el adquirir al menos ciertos conocimientos básicos. Según Pilhofer, todavía es difícil lograr que los periodistas piensen en utilizar datos como una fuente y que consideren diferentes formas y ángulos a la hora de contar una historia. Pero la verdadera barrera para las historias que se basan en datos es que, “en los niveles más altos”, la importancia del periodismo de base de datos no ha llegado lo suficientemente lejos. En los niveles más altos, es un conocimiento que se ha “infravalorado”, aseguró el editor del New York Times. De modo que no es simplemente un tema de “cuán importante son estas habilidades para uno como periodista” sino de “cuán importante cree que son tu jefe y el jefe de tu jefe”.

– Dadas las herramientas que tenemos ahora, ¿cuál piensa que es el principal desafío al que se enfrentan los periodistas cuando manejan datos? – Para mí, no es un problema de herramientas. Quiero decir, tenemos computadoras más potentes, contamos con más capacidad que nunca para hacer cosas. Con Amazon EC2, se puede básicamente acelerar una supercomputadora durante una tarde, si se quiere, y pagar 100 dólares o una cifra similar, si es necesario analizar grandes cantidades de datos. No es un problema de tecnología, es un problema de personas.

Seguir leyendo →

O’Reilly Strata Conference – Simon Rogers & Co.

Publicado el 28.02.12 por Florencia Coelho

Hace un par de horas se llevó a cabo en Santa Clara, California, una nueva edición de la Conferencia de O’Reilly “Strata”.

Estuve monitoreando el hashtag y los ponentes de The Guardian, Simon Rogers y Michael Brunton-Spall.

Con eso pude armar un mix de tweets apasionante. Demuestran que la dupla del diario inglés compartió mucha información con el auditorio.

A continuación, una selección de tweets traducidos al español. Sino pueden pasar directo al Storify completo (en inglés):

“Resultó que los soldados son buenos para ingresar datos #wikileaks” via @kinlane

“El enemigo de los Datos Abiertos es el PDF” via @clairedwillett

“El 80% del tiempo del staff de @datastore se pasa limpiando datos mal formateados” via @clairedwillett

“Ya nadie confía en los periodistas. El Data Blog es ahora más popular que el blog de noticias de The Guardian” via @jarib

“El material producido por @datastore es reutilizado por el Gobierno. Es trágico que un tercero le organice las bases de datos al gobierno.” via @David_R8.

“Los lectores del Data Blog incluyen personas comunes y desarrolladores” via @clairedwillett

“Cómo encontrar una aguja en un pajar: quemar el pajar” via @clairedwillett

“El trabajo de campo con la audiencia (Crowdsourcing) sirve para encontrar historias pero usualmente no se acompaña con información de soporte.” via @David_R8

“En suma, el compromiso de transparencia y acceso a la información de The Guardian es un modelo para todos nosotros (los estoy mirando a Uds.: gobierno y finanzas)” via @clairedwillett

Cuando consiga el video de la ponencia lo embebo.

Ahora sí, el jugoso compendio en Storify. 🙂

Seguir leyendo →

Conferencia IRE NICAR – Día 3

Publicado el 26.02.12 por Florencia Coelho

Momi Peralta Ramos con el equipo de PANDA

Tercer día de maratón de tweets, fotos y videos en el hashtag #nicar12 de Twitter.

En el Schedule de la Conferencia pueden encontrar el detalle de las sesiones del sábado 25/02.

Antes de recorrer el Storify completo, a continuación destaco algunos tweets traducidos al castellano:

“Chris Amico (NPR) usa Estadísticas de Búsqueda, Twitter y Facebook como rastreo policial.” Via @ultracasual

“Chris Amico (NPR): Acabamos de identificar a la víctima de un asesinato a través de Estadísticas de Búsqueda.” Via @digiphile

“Hicimos scraping de un sitio usando una sencilla extensión de Chrome con Michelle Minkoff de AP.” Via @ChrisLKeller

“Limpieza de Data – Lección N° 1: Si alguien te da un archivo con 65.536 datos, tenés un problema.” Via @JKeefe

“Brian Boyer (Chicago Tribune) Mi respuesta directa al que solicita poner data en un mapa: 1) No 2) Convenceme que el mapa es la mejor manera de presentar la data.” Via @richgor

“¿Por qué construir API’s? Pueden adelantar trabajo pero también porque otros lo pueden usar y aprovecharlo para otros usos” Via @ChrisLKeller

Y ahora sí, a perderse entre TANTOS disparadores de inquietudes en esta colección tan variada. ¡Qué los disfruten y aprovechen! >>>

Seguir leyendo →

Conferencia IRE NICAR – Día 2

Publicado el 24.02.12 por Florencia Coelho

Foto Gentileza: Instagram de @hbillings

Otra sesión maratónica que pude monitorear desde Buenos Aires. Ésto de internet, Twitter, etc. ¡es mágico!

Creo que la selección que compilé de tweets y fotos -levantados del hashtag #nicar12-, les va a servir como termómetro de la Conferencia y como estímulo inspirador para sus inquietudes en esta materia.

Había varias sesiones al mismo tiempo. Los tweets los puse en orden cronológico para seguir un criterio básico. Por eso pueden estar mezclados temáticamente.

Destaco algunas como muestra.

“Si el Excel es marihuana, entonces Access es la Heroína. ¿Drogas para Data Nerds? Matt Carroll, Boston Globe.” Via @alicitabrennan

“¿Cuánta Data se pone en una visualización de datos? La suficiente para decir la verdad, sin causar confusión innecesaria.” Via @hbillings

“Aron Pilhofer: Las redes sociales se han convertido en una segunda homepage para nosotros (NYT) y se traduce en aplicaciones más usables.” Via @richgor

“Aron Pilhofer: Primero Social suele significar -en mi mente-, primero el lector.” Via @lxbarth

“John Keefe resume lo que para muchos significa aprender de libros: No lo hagan. Empiecen por un proyecto que quieran hacer. Suéñenlo, háganlo”. Via @hbillings

Seguir leyendo →

THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra

Publicado el 20.02.12 por Florencia Coelho

Flickr/Ben Sutherland – CC Attribution

Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.

El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.

El 18 de junio el Parlamento inglés publicó en su sitio oficial un informe más detallado de los reclamos de gastos luego de una larga batalla de requerimientos de información en base a la Freedom of Information Act.

Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.

A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso (via “crowdsourcing”)

B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.

C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.

D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.

E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz

Seguir leyendo →

NACION Data

Cuando los datos se transforman surge la información

Categoría: Herramientas

#WJCHAT: Matemática para periodistas

LA NACION abre sus bases de datos de interés público

La película Moneyball, Yale y el Periodismo de Base de Datos

NY TIMES: Aron Pilhofer y el estado del periodismo de datos.

O’Reilly Strata Conference – Simon Rogers & Co.

Conferencia IRE NICAR – Día 3

Conferencia IRE NICAR – Día 2

THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra