Errores en visualización de datos que debemos evitar

Etiquetas: Visualización

Los datos, sobre todo en grandes cantidades, en ocasiones son difí­ciles de entender y analizar. Tanto contar con muchos datos como analizar cifras astronómicas puede inducir a error ya sea por el hecho de no ser realmente conscientes de las magnitudes o la mera imposibilidad de agrupar las cifras de tantas fuentes diferentes. He ahí­ uno de los grandes problemas que la visualización de datos atenúa gracias a la comparación, la agrupación, la relación; en definitiva el atractivo visual.

Pero a veces, ya sea por primar el atractivo visual o por no reflexionar lo suficiente, las ventajas que ofrece la visualización no se llegan a aprovechar del todo; lo cual puede inducir a error en el análisis de datos. Más graves son otros errores que se pueden cometer, fruto de la imperdonable no revisión y comprobación. Por ejemplo, y aunque pueda resultar increí­ble, es demasiado frecuente ver datos porcentuales que sumados suponen más del 100%. La gravedad de este hecho no es tanto la falsedad del dato, ni tan siquiera la confusión que puede generar; sino la falta de confianza en el análisis previo o posterior.

 

Los errores en visualización de datos más comunes

Además del mencionado ejemplo, podemos distinguir tres errores en visualización de datos bastante comunes que pueden evitarse y harán más productiva la representación.

 

Comparaciones difí­ciles

La sencillez muchas veces es un punto. Utilizar visualizaciones complejas por su atractivo visual puede ser contraproducente ya que nos distrae del objetivo de las mismas. Uno de los problemas que más se manifiesta en este sentido es la dificultad para hacer comparaciones. Es en la relación con los demás cuando muchos datos cobran sentido por lo que dejar de lado la posibilidad de hacer una comparación clara y visual nos aleja del objetivo principal. Los gráficos en tres dimensiones, por ejemplo, a veces dificultan esta comparación a medida que se aumentan las series a relacionar.

Del mismo modo, a la hora de representar visualizaciones, no hacerlo “a escala” puede suponer un problema. Teniendo en cuenta que el entendimiento a simple vista es una de las ventajas de la visualización de datos, hacer un gráfico en el que se representa el número pero se engorda la comparación puede ser engañoso. Si el 60% cubre un área gráfica que dobla el 40% restante, los números pasan a segundo plano y los usuarios identifican la relación como mayor de lo que realmente es.

 

Olvidar el origen

La foto de un momento concreto puede inducir a error. Si se quiere analizar un período concreto, lo habitual es representar los datos del mismo; pero es necesario reflexionar acerca de los datos que estamos volcando. Puede que el perí­odo anterior o posterior ayuden a explicar ese momento concreto objeto de análisis.

Por otro lado, existe una tendencia a olvidar el “suelo” de un gráfico. Si comparamos ventas, es habitual recortar el gráfico por debajo si éstas son altas, pero es recomendable representar siempre el valor 0 para dar una visión realista de la magnitud de las operaciones y sobre todo para evitar malas interpretaciones de las variaciones.

 

No explicar la situación

Por encima de todo, la visualización ha de ser una explicación corta, rápida y sencilla de la situación. Pero el acompañamiento es fundamental. Si por ejemplo se enví­a el gráfico por email, debemos ser conscientes de que se entiende perfectamente para que nada quede a la interpretación. Por ello, es necesario hacer anotaciones. Estas anotaciones pueden ser puntos en una línea que indiquen cifra exacta o bocadillos que inviten al análisis (por ejemplo, una variación pronunciada de producción se puede explicar por un fallo de máquina industrial).

 

Cómo acertar con el gráfico

Hemos dejado aparte el error de utilizar un gráfico poco adecuado para un tipo de visualización concreta. Utilizar la gráfica que no corresponde puede tergiversar el sentido del análisis en el peor de los casos, o mostrar datos poco claros en el mejor.

La forma más común de visualizar datos es la representación en gráficos. De una forma muy genérica, en los gráficos se representa la evolución (variación en el tiempo) y la distribución (segmentación del dato).

A modo de guí­a básica, en el siguiente cuadro podemos ver en qué ocasiones es recomendable usar uno u otro tipo de gráfico de entre los más comunes:

 

que-grafico-elegir

 

En cualquier caso no se debe olvidar que existen tantas posibilidades como la imaginación permita, sobre todo cuando los datos no son numéricos y que por tanto, dependiendo del objetivo, pueden verse mejor en mapas o lí­neas de tiempo (por ejemplo). Y esa es la palabra clave: el objetivo. No perder de vista el sentido de la representación, por qué y para qué se realiza la representación visual de datos. La creatividad puede jugar un papel clave en una buena visualización de datos.

 

Hasta ahora hemos visto la capacidad de la visualización de datos para explicar y comprender situaciones, pero en el dí­a a dí­a de la empresa puede servir para mucho más. Un ejemplo de ello es una visualización que utilizamos mucho en IGN con Qlik, que ayuda a conocer de forma rápida y sencilla la situación en la que nos encontramos en cada momento en distintas áreas. Se trata de los velocí­metros, cuya utilidad principal es la capacidad de “mostrar”, no de “explicar”. Con éstos, de un vistazo se puede ver si las ventas van bien o mal, si las incidencias son aceptables o demasiadas o controlar cualquier otra cuestión vital. ¿Las ventajas? Dos principalmente: el control milimétrico en todo momento de cuestiones fundamentales y un ahorro de tiempo, puesto que si la aguja está en verde significa que no debemos detenernos en esa cuestión ni tan siquiera para ver el dato si no se requiere (y viceversa). Se trata de un mero ejemplo del juego que puede dar la visualización de datos en la empresa en términos de productividad, ahorro de costes y toma de decisiones ágil.