La película Moneyball, Yale y el Periodismo de Base de Datos

 

 

El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.

 

Panel I: Formas y Prácticas de Periodismo de Base de Datos

Panel II: La Influencia de la Data en el Proceso de la Noticias

Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.

Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.

“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic

 

 

Otros tweets traducidos al castellano:

Seguir leyendo

NY TIMES: Aron Pilhofer y el estado del periodismo de datos.

Aron Pilhofer, editor de Interactive News en The New York Times

Periodismo de datos, por qué no se hace tanto como sería necesario según editor del New York Times

Por Teresa Bouza

NOTA DEL EDITOR: Teresa Bouza, Knight Fellow en la Universidad de Stanford, quien asistió a la Conferencia de Periodistas y Editores de Investigación 2012, en St. Louis, Missouri, entrevistó a Aron Pilhofer, editor de “Interactive News” (Noticias Interactivas) en The New York Times, antes de su charla del viernes (24 de febrero). Pilhofer, que está en la junta directiva del IRE (Organización de Periodistas y Editores de Investigación, en idioma español), lidera un equipo de reporteros y desarrolladores que diseña aplicaciones de bases de datos con el fin de mejorar la información online de The Times.

La expresión “periodismo de base de datos” se ha convertido de repente en popular. Pero Pilhofer destaca que hay un elevado “analfabetismo” en temas de datos entre los periodistas. El editor del Times subrayó, de todos modos, que para hacer periodismo de datos no hace falta ser un científico espacial e insistió en que es “vital” para los periodistas el adquirir al menos ciertos conocimientos básicos. Según Pilhofer, todavía es difícil lograr que los periodistas piensen en utilizar datos como una fuente y que consideren diferentes formas y ángulos a la hora de contar una historia. Pero la verdadera barrera para las historias que se basan en datos es que, “en los niveles más altos”, la importancia del periodismo de base de datos no ha llegado lo suficientemente lejos. En los niveles más altos, es un conocimiento que se ha “infravalorado”, aseguró el editor del New York Times. De modo que no es simplemente un tema de “cuán importante son estas habilidades para uno como periodista” sino de “cuán importante cree que son tu jefe y el jefe de tu jefe”.

– Dadas las herramientas que tenemos ahora, ¿cuál piensa que es el principal desafío al que se enfrentan los periodistas cuando manejan datos? – Para mí, no es un problema de herramientas. Quiero decir, tenemos computadoras más potentes, contamos con más capacidad que nunca para hacer cosas. Con Amazon EC2, se puede básicamente acelerar una supercomputadora durante una tarde, si se quiere, y pagar 100 dólares o una cifra similar, si es necesario analizar grandes cantidades de datos. No es un problema de tecnología, es un problema de personas.

Seguir leyendo

Klein de ProPublica: “Las aplicaciones de noticias son una nueva manera de contar historias periodísticas”

Producción del video: Momi Peralta Ramos e Inés Pujana

Scott Klein es Editor de una nueva especialidad llamada “News Applications” (Aplicaciones de Noticias). En ProPublica (uno de los medios de periodismo sin fines de lucro más prestigiosos del mundo) dirige un equipo de periodistas/programadores de software interactivo para grandes proyectos que cuentan historias periodísticas y que ayudan a los lectores a desentrañar problemáticas sociales, económicas y políticas de alcance local, regional y nacional.

Klein también es cofundador de DocumentCloud, un proyecto que ayuda a las organizaciones de noticias a gestionar, presentar y compartir los documentos “crudos” que utilizan para sus artículos e investigaciones. Antes de ProPublica, Scott trabajó en The Nation y The New York Times.

En una entrevista exclusiva para el blog NACION Data, Klein explica con nivel de detalle qué son las News Applications, cuenta cómo está conformado su equipo de trabajo e invita a reflexionar sobre una especialidad periodística en crecimiento.

– ¿Cómo es dirigir un equipo compuesto de periodistas y programadores?

– En cierto modo, se parece mucho a dirigir a periodistas. Mantengo a todos en su rumbo, los ayudo a resolver problemas, les consigo recursos cuando los necesitan y los mantengo enfocados en la “historia” para la cual están preparando el software que les ayudará a contarla. También edito lo que redactan, como por ejemplo en los posts relacionados con nuestro blog denominado ProPublica blog nerd. Pero, también, se parece mucho más a dirigir a desarrolladores de software. Siempre hay problemas técnicos en los que se debe ayudar pensar y a resolver. A diferencia de los periodistas clásicos, nosotros nos preocupamos por cosas como las bases de datos y también por mantener el rápido funcionamiento de nuestros servidores; y yo colaboro mucho con eso.

Seguir leyendo

O’Reilly Strata Conference – Simon Rogers & Co.

 

 

Hace un par de horas se llevó a cabo en Santa Clara, California, una nueva edición de la Conferencia de O’Reilly “Strata”.

Estuve monitoreando el hashtag y los ponentes de The Guardian, Simon Rogers y Michael Brunton-Spall.

Con eso pude armar un mix de tweets apasionante. Demuestran que la dupla del diario inglés compartió mucha información con el auditorio.

A continuación, una selección de tweets traducidos al español. Sino pueden pasar directo al Storify completo (en inglés):

“Resultó que los soldados son buenos para ingresar datos #wikileaks” via @kinlane

“El enemigo de los Datos Abiertos es el PDF” via @clairedwillett

“El 80% del tiempo del staff de @datastore se pasa limpiando datos mal formateados” via @clairedwillett

“Ya nadie confía en los periodistas. El Data Blog es ahora más popular que el blog de noticias de The Guardian” via @jarib

“El material producido por @datastore es reutilizado por el Gobierno. Es trágico que un tercero le organice las bases de datos al gobierno.via @David_R8.

“Los lectores del Data Blog incluyen personas comunes y desarrolladores” via @clairedwillett

“Cómo encontrar una aguja en un pajar: quemar el pajar” via @clairedwillett

“El trabajo de campo con la audiencia (Crowdsourcing) sirve para encontrar historias pero usualmente no se acompaña con información de soporte.” via @David_R8

“En suma, el compromiso de transparencia y acceso a la información de The Guardian es un modelo para todos nosotros (los estoy mirando a Uds.: gobierno y finanzas)” via @clairedwillett

Cuando consiga el video de la ponencia lo embebo.

Ahora sí, el jugoso compendio en Storify.  🙂

Seguir leyendo

Conferencia IRE NICAR – Día 3

 

Momi Peralta Ramos con el equipo de PANDA

Tercer día de maratón de tweets, fotos y videos en el hashtag #nicar12 de Twitter.

En el Schedule de la Conferencia pueden encontrar el detalle de las sesiones del sábado 25/02.

Antes de recorrer el Storify completo, a continuación destaco algunos tweets traducidos al castellano:

“Chris Amico (NPR) usa Estadísticas de Búsqueda, Twitter y Facebook como rastreo policial.” Via @ultracasual

“Chris Amico (NPR): Acabamos de identificar a la víctima de un asesinato a través de Estadísticas de Búsqueda.” Via @digiphile

“Hicimos scraping de un sitio usando una sencilla extensión de Chrome con Michelle Minkoff de AP.” Via @ChrisLKeller

“Limpieza de Data – Lección N° 1: Si alguien te da un archivo con 65.536 datos, tenés un problema.” Via @JKeefe

“Brian Boyer (Chicago Tribune) Mi respuesta directa al que solicita poner data en un mapa: 1) No 2) Convenceme que el mapa es la mejor manera de presentar la data.Via @richgor

“¿Por qué construir API’s? Pueden adelantar trabajo pero también porque otros lo pueden usar y aprovecharlo para otros usos” Via @ChrisLKeller

Y ahora sí, a perderse entre TANTOS disparadores de inquietudes en esta colección tan variada. ¡Qué los disfruten y aprovechen! >>>

 

Seguir leyendo

Conferencia IRE NICAR – Día 1

 

Armé una colección con los mejores tweets, fotos y videos del día 1 en el hashtag de Twitter  #nicar12 Destaco tres frases sueltas que traduzco del inglés:

“Data es la moneda de la democracia” via @AllisonPrang

“Quiero aprender a extraer información de audio y video” via @HilkeSchellmann

“Seguir el dinero es seguir el dinero (sin distinguir si son fondos públicos, privados, de asociaciones sin fines de lucro, …)” via @RobLeo

Y ahora sí, ¡a perderse entre tanta pre-selección! >>>

Seguir leyendo

LN Data en la NICAR Conference

LN Data estuvo representado por Momi Peralta Ramos en el NICAR Conference que se realizó en la ciudad norteamericana de St. Louis.

En el hashtag #nicar12 se puede recuperar todo lo que sucedió en el evento y en el blog de Chrys Wu (@MacDiva) se van a publicar algunas de las presentaciones.

Les compartimos de manera exclusiva el video que se presentó en la conferencia en el que se explica el desarrollo del proyecto de Periodismo de Base de Datos en LA NACION.

Las imágenes fueron producidas por el equipo de Realización Multimedia de lanacion.com y contó con la participación de muchos integrantes del staff comprometidos con el proyecto de datos abiertos.

THE GUARDIAN y Tony Hirst: El escándalo de gastos parlamentarios en Inglaterra

 

Flickr/Ben Sutherland – CC Attribution

Podríamos considerar como caso “histórico” de Periodismo de Base de Datos el de las “MP’s Expenses” de The Guardian.

El 8 de mayo de 2009, The Telegraph comenzó a publicar notas relativas a gastos presentados a reembolso por los ministros parlamentarios. La información la obtuvo de una fuente non sancta a la que pagaron £ 110.000.

El 18 de junio el Parlamento inglés publicó en su sitio oficial un informe más detallado de los reclamos de gastos luego de una larga batalla de requerimientos de información en base a la Freedom of Information Act.

Destacaremos cuestiones relacionadas con la gestión de información que realizó The Guardian a partir de dicha publicación oficial.

A) la construcción de una aplicación orientada a interactuar con la audiencia para recoger información relevante de los reclamos de reembolso  (via “crowdsourcing”)

B) la conformación de la base de datos principalmente a partir de los aportes de la audiencia.

C) la puesta a disposición de la base obtenida en planillas símil Excel (Google Spreadsheets) para que otros puedan trabajar con los datos.

D) las visualizaciones realizadas por Tony Hirst a partir de la combinación de herramientas de procesamiento como Yahoo Pipes y de visualización como Many Eyes y Google Maps.

E) los principios relacionados al Periodismo de Base de Datos: #OpenGov, #Crowdsourcing, #OpenData, #Scraping y #DataViz

Seguir leyendo

Casos: el círculo de Murdoch alrededor del escándalo News Corp.

Un trabajo presentado recientemente por el equipo de periodismo de base de datos de ProPublica muestra de una manera clara e interactiva el círculo que rodea a Rupert Murdoch -magnate australiano propietario de News Corporation– en el escándalo de las escuchas ilegales que lo involucra y que provocó ya la renuncia de los dos principales jefes de Scotland Yard y de algunos de los máximos responsables del multimedio.

El desarrollo permite navegar entre todos los protagonistas, aquellos personajes que fueron arrestados y los que tuvieron que dimitir. El despliegue visual permite distinguir cada persona de acuerdo a su proximidad con Rupert Murdoch, James Murdoch y otros altos funcionarios.

————————-

De qué hablamos cuando hablamos de visualizaciones

Datos, datos y más datos; esa es la materia prima de las visualizaciones. Sin datos, no podemos hacer nada. Pero bueno, el tema es que cuando se produce el “milagro” y aparecen los datos, nunca están presentados de una manera “digerible” para el usuario común. «¿A quién le puede servir un montón de planillas de Excel con múltiples columnas y miles de filas de números?», me pregunté varias veces. No cualquiera los entiende y, mucho menos, interpreta lo que esos datos quieren decir.

Cifras, fechas, lugares, personas, todos son datos; pero no todos son información relevante para aquello que queremos contar. «¿Y qué quiero contar?», se preguntarán. Bueno, en este punto es donde comienza para mí el proceso de visualización de datos. Un proceso que presenta múltiples aristas.

  • Periodística
    Hay que saber qué historia quiero contar y para ello es sumamente necesario comprometerse con la información. Entenderla de la “A” hasta la “Z”. Si no entiendo qué quiero contar, menos va a entender el lector que ve nuestras visualizaciones.
  • Visual
    Tenemos que diseñar la manera en que se va a ver nuestra visualización. Niveles de lectura, colores, formas, tipografías, etc.
  • Infográfica
    «¿Qué tomamos de este mundo?» La síntesis y su manera de graficar. Barras, tortas, fiebres, etc.
  • Interactiva
    Este punto se focaliza en la manera que el usuario va a navegarlas. Todas las opciones que le demos al lector deben haber sido pensadas previamente por nosotros y deben verse en forma clara. Para confundirlos, ya existen las eternas planillas de Excel con miles de datos. O no?

Seguir leyendo