Visualización de datos: pasado, presente y futuro

Etiquetas: Visualización

El fin de semana un amigo se topó con un una pieza de oro en forma del libro Graphic Presentation de Willard Cope Brinton, fechado en 1939, sobre la visualización de datos. Está disponible para leer online (en Internet Archive). Recomiendo encarecidamente emplear 10 minutos hojeando la gran cantidad de gráficos de ejemplo que contiene el libro. Debe de haber unas 1.000 variedades de cuadros y gráficos catalogados en las 500 páginas del libro y a pesar de tener más de 75 años, siguen siendo increí­blemente relevantes hoy en dí­a.

Me sentí­ particularmente impactado por la introducción titulada Magia en gráficos:

 

“Hay magia en los gráficos. El perfil de una curva revela de un vistazo toda la situación – la historia viva de una epidemia, un arrebato o una era de prosperidad. La curva informa a la mente, despierta la imaginación, convence.”

“Los gráficos nos traen un mensaje. Un lenguaje universal que transmite información directamente a la mente. Sin complejidad alguna, se traslada una magnitud a ser recordada en forma de imagen.”

“Las palabras tienen alas pero los gráficos interpretan.”

“Los gráficos son pura cantidad, desnudos de cualquier engaño verbal, intensos, reducidos a una simple dimensión, ineludibles.”

Henry Hubbard.

 

Si miras fijamente, puedes incluso encontrar ejemplos de argumentos que la blogosfera está aficionada a debatir hoy (¿puede un gráfico de líneas tener eje Y que no empiece en cero?), y versiones de cuadros que pensabas que se habí­an inventado ayer mismo. Hubbard termina la introducción con una mirada al futuro (elénfasis es mío):

 

“Dondequiera que haya datos que recoger, interferencias que dibujar o hechos que contar, los gráficos proporcionan un inigualable medio cuyo poder aún estamos empezando a comprender y aplicar.

 

Claramente, Hubbard estaba emocionado por el futuro de la representación gráfica. Seguramente traería múltiples innovaciones a la vez que se estableciese una gramática de datos y se imaginó cómo deberí­amos presentar los datos de la mejor forma para su consumo. Mientras habí­a 1.000 variedades de cuadros en la versión de 1939, ¿quién sabe cuántos habrí­a en una versión de 2000? Desafortunadamente, mi amigo Ed recibió malas noticias de Hubbard: después de leer Graphic Presentation exclamó “estoy decepcionado por la mí­nima innovación que hemos tenido en la visualización de datos 2D en los últimos 80 años”.

Siempre optimista, estoy aquí­ para aceptar el reto. ¿Qué hay de nuevo desde el libro de Brinton? En el mundo de la estadí­stica, la visualización de datos 2D; creo que Ed tiene razón en gran parte, con algunas excepciones. Eso no significa que no hayamos innovado; han habido tremendos progresos en y alrededor de las formas gráficas que estaban de algún modo establecidas en 1939.

Para entender mejor el progreso de los años desde que se publicó el libro de Brinton, primero tenemos que entender cómo llegamos hasta ahí­. ¿Cuándo se inventaron estos gráficos? ¿Es justo esperar un boom de nuevos tipos de cuadro cada década?

 

El pasado de la visualización de datos

Es fácil pensar en los cuadros y gráficos básicos de hoy como formas universalmente reconocidas que han existido siempre. Pero muchos de los tipos de cuadros que usamos a diario (ya sea por profesionales o estudiantes que usan el asistente gráfico de Excel por primera vez) son invenciones relativamente recientes.

Trabajando fuera de esta bonita taxonomí­a de tipos de cuadros, seguí­ el rastro de los primeros datos conocidos con la mayor cantidad de visualizaciones que pude. En esta lí­nea de tiempo, los cuadros reconocidos como modernos empezaron a usarse a mitad del siglo XVIII (William Playfair es famoso por inventar los gráficos de líneas, barras y tarta) y el ratio de innovación fue rápido en los siguientes 100 años. Entre los años 1812 y 1855 particularmente, se crearon las tres visualizaciones más famosas e influyentes de todos los tiempos: la marcha sobre Moscú de Minard (un diagrama de Sankey antes de que Sankey hubiese nacido), el mapa de cólera en Londres de Snow y el diagrama de la rosa de Nightengale sobre los muertos en la Guerra de Crimea.

 

Statistical Breviary

El precio del trigo de William Playfair (1821).

 

Después de esta frenética época, el ratio de innovación medido por la aparición de nuevas visualizaciones, se ralentizó sustancialmente. Hay notables excepciones (histogramas, cartogramas, mapas de calor, etc.) y estoy intentado atenerme a gráficos de propósito general; ya que ha habido algunas visualizaciones de datos de uso especí­fico que han sido muy populares, como los circulares de datos genómicos.

Dicho esto, más que enfocarnos en la ralentización de los tipos de cuadro estándar más usados, echaremos un vistazo a la última era de la visualización de datos con una perspectiva más amplia. Hemos hecho muchos más progresos que el puñado de nuevas tablas que puede ofrecer el asistente de Excel.

 

Los últimos 75 años de la visualización de datos

La historia de los últimos 75 años de la visualización de datos se desarrolla en paralelo de diversas industrias y campos, y está dominada sin sorpresas por los ordenadores. Mientras en el perí­odo anterior encontramos nuevos tipos de cuadro que aparecen por primera vez, las innovaciones principales no se han dado en cómo debe presentarse un análisis de datos, sino en cómo se crea y qué pueden hacer los lectores con el cuadro cuando lo ven.

Las computadoras han hecho que los datos sean astronómicamente más fáciles de recopilar, procesar, analizar y manipular, llevando a una capacidad extendida de visualización de los datos. Esto nos ha permitido hacer cuatro cosas (principalmente) que Brinton sólo podrí­a haber soñado:

 

Visualización de datos en tiempo real

Utilizada comúnmente en los omnipresentes dashboards de hoy en dí­a, el aná¡lisis y presentación de datos en tiempo real es un paso gigante desde el lento y cuidadoso trabajo requerido para generar un único buen cuadro de antes de la informática. La facilidad con la que puedes utilizar un cuadro de mando en tiempo real hoy choca con el tiempo que requerí­an los cuadros que Brinton explica a lo largo de capí­tulos enteros.

 

Muestra de muchos datos

Hoy podemos representar olas de 10 millones de relaciones en Facebook. Las conexiones translúcidas entre amigos se pueden solapar y adquieren brillo en áreas con alta densidad de relaciones en Facebook, produciendo un bonito mapa de pseudopoblación como resultado. Si tienes que pintar eso a mano… suerte.

 

Presentación de datos en movimiento

Unido a la habilidad de visualizar una gran cantidad de datos, los datos en series de tiempo ofrecen la posibilidad de reproducirlos como una animación. Por ejemplo, el siguiente vídeo visualiza 24 horas de vuelos en Norteamérica. El movimiento lleva la visualización a otro nivel: es mucho más completo que simplemente mostrar un conteo de cuántos vuelos despegan y aterrizan en cada localización.

 

 

El futuro de la representación gráfica de datos

Finalmente, veo una cuarta innovación reciente en torno a la visualización de datos como área fundamental que permite la evolución futura de la representación gráfica.

 

Permite a tu audiencia interactuar con los datos

Ha habido fantásticos desarrollos en años recientes para permitir a los lectores y consumidores de la visualización de datos la interacción con los datos de formas significativas. Mientras una simple representación de datos ofrece distintas perspectivas de su creador, las aplicaciones de datos interactivos no sólo permiten al lector ver tu historia, sino descubrir otras historias aguardándoles en el conjunto de datos. Un ejemplo excelente lo tenemos en el Gapminder de Hans Rosling. Probablemente has visto sus charlas TED, pero puede que no sepas que puedes coger y explorar infinidad de conjuntos de datos usando sus herramientas interactivas. Dale una oportunidad y descubre qué historia puedes encontrar.

Si los datos de Hans no te interesan, hay múltiples aplicaciones de datos y visualizaciones interactivas esperándote. Un ejemplo divertido: pongamos que eres fan de los artí­culos de Five Thirty Eight que desgranan y clasifican las películas de los actores por taquilla y calificación en Rotten Tomatoes. Usando el tipo de herramientas exploratorias que se han puesto recientemente a nuestra disposición, se puede crear fácilmente ese análisis para tu actor favorito o mirar agrupaciones de diferentes variables.

 

Habí­a magia en los gráficos de 1939. Ahora, gracias al poder de las computadoras, tenemos la habilidad de encuadrar más datos más rápido y podemos atraer a la audiencia con visualizaciones animadas e interactivas; hay más magia en los gráficos que nunca.

 


Adaptación realizada a partir de la traducción de un brillante estudio y artí­culo de Nick Brown en Medium.