#ISOJ12 – LA NACION presenta su experiencia

 

Momi Peralta Ramos participó del Panel de Periodismo de Base de Datos en el International Symposium of Online Journalism in Austin, Texas junto con Aron Pilhofer, Alistair Dant, Brian Boyer, Alberto Cairo y Ben Walsh.

En el siguiente video se muestra el procesamiento de los datos referidos a los subisidios para el transporte público de colectivos.

 

En este otro video, les mostramos los primeros pasos de nuestra Redacción para desarrollarse en el Periodismo de Base de Datos. ¡Incluye testimonios!

 

Algunos links incluidos en la presentación.

 

Open Data Dashboard de LA NACION

Video tutorial del dashboard de LA NACION Data

Transparency World Map

David Banisar FOIA Map (Tip de Dolores Lavalle Cobo)

Open Government Partnership

Open Data World Map

Gobierno Abierto del Poder Judicial

Open Data Sets del Gobierno de la Ciudad de Buenos Aires.

ADELCO PDFs Press Releases

The Economist: “Don’t lie to me Argentina”

LA NACION: ¿Multará el Gobierno a Google Earth?

TABLEAU: El Aumento de la Canasta Básica

TABLEAU: La Escalada de los Alimentos

TABLEAU: Yerba, variaciones de los precios.

TABLEAU: Inflación de marzo 2012 según INDEC y Consultoras

TABLEAU: El mapa regional de la inflación

TABLEAU: Cuánto cuesta subsidiar a los colectivos

 

Hackaton ShowTimeLine – Juicio Marita Verón

 

 

El sábado estuvimos reunidos en un nuevo Hackaton de Hacks/Hackers Buenos Aires.

El equipo de LA NACION fue representado por Momi Peralta Ramos, Ricardo Brom, Gabriela Bouret y  Florencia Coelho.

Dentro de las tres propuestas del Hackaton Mapa76, Malvinas30 y el Juicio de Marita Verón-, nos sumamos a la convocatoria de Sergio Sorín, junto con Florencia Bianco y Ariel Aizemberg para delinear el Timeline del  Juicio por Trata Sexual.

Esta era la consigna en el sitio del MeetUp.

Para hacks:

– Análisis de la cobertura del juicio de Marita Verón en los diarios nacionales y regionales. Visualización en línea de tiempo de la cobertura.
– Desarrollo estructurado de datos para contar el caso de Marita Verón

Para hackers: Implementación del scraping de datos de medios (con asesoramiento de periodistas).

Aquí puede ver el  resultado de un día de trabajo basándonos en el Timeline desarrollado por Zach Wise para Knight News Innovation Lab .

 

http://hhba.info/marita-veron/

 

Al final de la jornada, unificamos la experiencia en un “wiki resumen” del equipo armado por Sergio Sorín y Ariel Aizemberg. Seguir leyendo

Panel #DoingDataJ en el Tow Center de Columbia University

 

Watch live streaming video from columbiajournalism at livestream.com

 

En el Tow Center de Columbia University se llevó a cabo un panel auspiciado por ONA “Doing Data Journalism”. Los congregados fueron Julia Angwin (WSJ), Scott Klein (ProPublica), Jo Craven McGinty (NYT), Aron Pilhofer (NYT), Ashkan SoltaniMo Tamman (Reuters). Susan E. McGregor (CU) resultó una excelente anfitriona y moderadora.

¡Ví el video 3 veces! Realmente muy enriquecedor el debate. Todos ofrecieron agudas reflexiones y mucha información. Si pueden entenderlo en inglés no duden en verlo entero. Me resultó apasionante y diré que, en muchos momentos, ¡sin censura!

 

Jo Craven McGinty del New York Times, todo un hallazgo.

Descubrí varios personajes nuevos pero voy a concentrarme en ella.

En 1995, realizó una Maestría de Periodismo con Base de Datos en la Universidad de Missouri, cuna de varios data ninjas.

Revisando un dataset con registros de homicios del FBI, encontró que faltaba información sobre varios homicidios causados por policías, pero ahí quedó la cosa. Al terminar sus estudios, ingresó al Washington Post donde sugirió retomar la investigación e integró el team que ganó un Pulitzer Prize for Public Service en 1999 con esta historia de corrupción policial.

Jo mencionó otro caso donde la historia surgió a partir de la imposibilidad de armar un data set coherente. Fue en relación a facturas de agua impagas en la ciudad de Nueva York. Supusieron que muchos podían pagar y no lo hacían, aprovechándose de la inoperancia del gobierno. En efecto, las sumas adeudadas resultaron un agujero negro ante la desprolijidad en la gestión.

 

Con respecto a herramientas de visualización, las utiliza para “consumo personal”. Es decir, para analizar información. Destacó el uso de software de mapeo, charts de Excel, etc. que le facilitan detectar puntas de investigación.

Por último, concluye de su experiencia personal que, entre estar sentada en una sección específica (estuvo en Metro) o junto al Data Team, le resulta profesionalmente más enriquecedora esta última opción. Le permite continuar aprendiendo de las conversaciones diarias entre el equipo. Eso sí, su desafío es que las distintas secciones de la Redacción no se olviden de involucrarla en historias que podrían incluir bases de datos.

 

En la Redacción:  Números versus testimonios.

Lo que más me impresionó de todo el video fueron dos testimonios de Tamman y Pilhofer.

Ambos fueron consultados por sendos compañeros de redacción por una historia en desarrollo. Los dos hicieron una devolución negativa con fundamento en base de datos y al poco tiempo, la historia salió  publicada con los errores oportunamente advertidos por ellos.

La conclusión de ambos es que todavía en las redacciones suelen ser más valorados los testimonios, anécdotas o percepciones empíricas frente a la contundencia de las bases de datos.

Pilhofer lo comenta muy enojado a partir del minuto 42:00. ¡Creo que después se arrepintió de haberlo compartido! Seguir leyendo

#WJCHAT: Matemática para periodistas

 

Flickr/CC Atribution: FMCKINLAY

 

El 14 de marzo en Estados Unidos celebran el día del número π – símbolo Pi. (3/14) También la fecha coincide con el nacimiento de Albert Einstein.

El chat twittero en inglés #WJCHAT fue dedicado el miércoles pasado a Matemáticas para Periodistas y Visualización de Datos.

El invitado de honor fue  Len de Groot (@lendegroot), profesor del KDMC – Knight Digital Media Center de la Universidad de Berkeley en California.

Armé un Storify con las 10 preguntas de @wjchat, las respuestas de Len y frases mechadas de otros participantes.

También seleccioné algunos tweets que intento reflejar en español:

 

“Lo que más me gusta de trabajar con bases de datos es descubrir cosas. Todos esos momentos … ¡AJA!”

Vía @lendergroot

“¿Deberían las redacciones publicar las bases de datos junto con la historia que se basa en ellos o es un desperdicio de recursos? Via @wjchat

Seguir leyendo

La película Moneyball, Yale y el Periodismo de Base de Datos

 

 

El viernes 9 de marzo de 2012 se llevó a cabo en Yale Law School una Conferencia sobre Periodismo de Base de Datos, con acento en nuevas herramientas y desafíos para acceder a la información.

 

Panel I: Formas y Prácticas de Periodismo de Base de Datos

Panel II: La Influencia de la Data en el Proceso de la Noticias

Armé un Storify con todos los tweets que me parecieron más enriquecedores del hashtag #ispdjc.

Traduje algunos al castellano y destaco el primero porque cuando vi la película MoneyBall pensé justo lo mismo. Esto es lo que estamos encarando en LA NACION. Me sentí identificada y orgullosa de formar parte de un equipo profesional y visionario.

“Matt Stiles (NPR): El periodismo de datos es como lo que hace el “tipo” de Moneyball con las estadísticas del beisbol.” Via @skoknic

 

 

Otros tweets traducidos al castellano:

Seguir leyendo

NY TIMES: Aron Pilhofer y el estado del periodismo de datos.

Aron Pilhofer, editor de Interactive News en The New York Times

Periodismo de datos, por qué no se hace tanto como sería necesario según editor del New York Times

Por Teresa Bouza

NOTA DEL EDITOR: Teresa Bouza, Knight Fellow en la Universidad de Stanford, quien asistió a la Conferencia de Periodistas y Editores de Investigación 2012, en St. Louis, Missouri, entrevistó a Aron Pilhofer, editor de “Interactive News” (Noticias Interactivas) en The New York Times, antes de su charla del viernes (24 de febrero). Pilhofer, que está en la junta directiva del IRE (Organización de Periodistas y Editores de Investigación, en idioma español), lidera un equipo de reporteros y desarrolladores que diseña aplicaciones de bases de datos con el fin de mejorar la información online de The Times.

La expresión “periodismo de base de datos” se ha convertido de repente en popular. Pero Pilhofer destaca que hay un elevado “analfabetismo” en temas de datos entre los periodistas. El editor del Times subrayó, de todos modos, que para hacer periodismo de datos no hace falta ser un científico espacial e insistió en que es “vital” para los periodistas el adquirir al menos ciertos conocimientos básicos. Según Pilhofer, todavía es difícil lograr que los periodistas piensen en utilizar datos como una fuente y que consideren diferentes formas y ángulos a la hora de contar una historia. Pero la verdadera barrera para las historias que se basan en datos es que, “en los niveles más altos”, la importancia del periodismo de base de datos no ha llegado lo suficientemente lejos. En los niveles más altos, es un conocimiento que se ha “infravalorado”, aseguró el editor del New York Times. De modo que no es simplemente un tema de “cuán importante son estas habilidades para uno como periodista” sino de “cuán importante cree que son tu jefe y el jefe de tu jefe”.

– Dadas las herramientas que tenemos ahora, ¿cuál piensa que es el principal desafío al que se enfrentan los periodistas cuando manejan datos? – Para mí, no es un problema de herramientas. Quiero decir, tenemos computadoras más potentes, contamos con más capacidad que nunca para hacer cosas. Con Amazon EC2, se puede básicamente acelerar una supercomputadora durante una tarde, si se quiere, y pagar 100 dólares o una cifra similar, si es necesario analizar grandes cantidades de datos. No es un problema de tecnología, es un problema de personas.

Seguir leyendo

O’Reilly Strata Conference – Simon Rogers & Co.

 

 

Hace un par de horas se llevó a cabo en Santa Clara, California, una nueva edición de la Conferencia de O’Reilly “Strata”.

Estuve monitoreando el hashtag y los ponentes de The Guardian, Simon Rogers y Michael Brunton-Spall.

Con eso pude armar un mix de tweets apasionante. Demuestran que la dupla del diario inglés compartió mucha información con el auditorio.

A continuación, una selección de tweets traducidos al español. Sino pueden pasar directo al Storify completo (en inglés):

“Resultó que los soldados son buenos para ingresar datos #wikileaks” via @kinlane

“El enemigo de los Datos Abiertos es el PDF” via @clairedwillett

“El 80% del tiempo del staff de @datastore se pasa limpiando datos mal formateados” via @clairedwillett

“Ya nadie confía en los periodistas. El Data Blog es ahora más popular que el blog de noticias de The Guardian” via @jarib

“El material producido por @datastore es reutilizado por el Gobierno. Es trágico que un tercero le organice las bases de datos al gobierno.via @David_R8.

“Los lectores del Data Blog incluyen personas comunes y desarrolladores” via @clairedwillett

“Cómo encontrar una aguja en un pajar: quemar el pajar” via @clairedwillett

“El trabajo de campo con la audiencia (Crowdsourcing) sirve para encontrar historias pero usualmente no se acompaña con información de soporte.” via @David_R8

“En suma, el compromiso de transparencia y acceso a la información de The Guardian es un modelo para todos nosotros (los estoy mirando a Uds.: gobierno y finanzas)” via @clairedwillett

Cuando consiga el video de la ponencia lo embebo.

Ahora sí, el jugoso compendio en Storify.  🙂

Seguir leyendo

Conferencia IRE NICAR – Día 3

 

Momi Peralta Ramos con el equipo de PANDA

Tercer día de maratón de tweets, fotos y videos en el hashtag #nicar12 de Twitter.

En el Schedule de la Conferencia pueden encontrar el detalle de las sesiones del sábado 25/02.

Antes de recorrer el Storify completo, a continuación destaco algunos tweets traducidos al castellano:

“Chris Amico (NPR) usa Estadísticas de Búsqueda, Twitter y Facebook como rastreo policial.” Via @ultracasual

“Chris Amico (NPR): Acabamos de identificar a la víctima de un asesinato a través de Estadísticas de Búsqueda.” Via @digiphile

“Hicimos scraping de un sitio usando una sencilla extensión de Chrome con Michelle Minkoff de AP.” Via @ChrisLKeller

“Limpieza de Data – Lección N° 1: Si alguien te da un archivo con 65.536 datos, tenés un problema.” Via @JKeefe

“Brian Boyer (Chicago Tribune) Mi respuesta directa al que solicita poner data en un mapa: 1) No 2) Convenceme que el mapa es la mejor manera de presentar la data.Via @richgor

“¿Por qué construir API’s? Pueden adelantar trabajo pero también porque otros lo pueden usar y aprovecharlo para otros usos” Via @ChrisLKeller

Y ahora sí, a perderse entre TANTOS disparadores de inquietudes en esta colección tan variada. ¡Qué los disfruten y aprovechen! >>>

 

Seguir leyendo

Conferencia IRE NICAR – Día 2

 

Foto Gentileza: Instagram de @hbillings

 

Otra sesión maratónica que pude monitorear desde Buenos Aires. Ésto de internet, Twitter, etc. ¡es mágico!

Creo que la selección que compilé de tweets y fotos -levantados del hashtag #nicar12-, les va a servir como termómetro de la Conferencia y como estímulo inspirador para sus inquietudes en esta materia.

Había varias sesiones al mismo tiempo. Los tweets los puse en orden cronológico para seguir un criterio básico. Por eso pueden estar mezclados temáticamente.

Destaco algunas como muestra.

“Si el Excel es marihuana, entonces Access es la Heroína. ¿Drogas para Data Nerds? Matt Carroll, Boston Globe.” Via @alicitabrennan

“¿Cuánta Data se pone en una visualización de datos? La suficiente para decir la verdad, sin causar confusión innecesaria.” Via @hbillings

“Aron Pilhofer: Las redes sociales se han convertido en una segunda homepage para nosotros (NYT) y se traduce en aplicaciones más usables.” Via @richgor

“Aron Pilhofer: Primero Social suele significar -en mi mente-, primero el lector.” Via @lxbarth

“John Keefe resume lo que para muchos significa aprender de libros: No lo hagan. Empiecen por un proyecto que quieran hacer. Suéñenlo, háganlo”. Via @hbillings

Seguir leyendo

Conferencia IRE NICAR – Día 1

 

Armé una colección con los mejores tweets, fotos y videos del día 1 en el hashtag de Twitter  #nicar12 Destaco tres frases sueltas que traduzco del inglés:

“Data es la moneda de la democracia” via @AllisonPrang

“Quiero aprender a extraer información de audio y video” via @HilkeSchellmann

“Seguir el dinero es seguir el dinero (sin distinguir si son fondos públicos, privados, de asociaciones sin fines de lucro, …)” via @RobLeo

Y ahora sí, ¡a perderse entre tanta pre-selección! >>>

Seguir leyendo