17.2 Diagrama de área

Es de advertir que un diagrama de área no suele ser la mejor opción para este tipo de información9. El área no tiene significado alguno es esta visualización. El mensaje se centra en la evolución en el tiempo de las cifras. La pendiente de la línea es la que proporciona información acerca de esta evolución. El área no tiene nada que ver con ello. La opción natural es el diagrama de líneas.

En otro tipo de usos, se desea presentar la diferencia en las pendientes entre diferentes series de tiempo.

También es preferible presentar diferentes líneas en vez de diferentes áreas.

Además, las áreas se superponen y pueden ocultar información. Una alternativa para evitar la sobreposición es colocar cierto nivel de transparencia al color de relleno, no obstante la mezcla de colores genera nuevos colores, induciendo a confusiones.

Una segunda alternativa es apilar las áreas, pero para el apilamiento es preferible usualmente una visualización de barras apiladas (stacked bars) si la intención es ver las proporciones para cada fecha de corte. La acumulación de pendientes en una gráfica de áreas apiladas no transmite usualmente bien la información ya que se mezclan ángulos, para lo cual los humanos somos poco hábiles. Y cuando hay pendientes, solemos comparar la separación entre las dos pendientes (flecha a rayas) en vez de la separación vertical (flecha punteada), la cual es la que realmente se desea presentar.

Obsérvese que la información de las tres empresas presenta prácticamente los mismos datos, pero la percepción de las área apiladas no permite llegar a esa conclusión por que la vista se fija en las pendientes (línea con guiones), no en la distancia vertical (línea punteada).

Una visualización de barras comparadas cumple mejor ese objetivo.

La ventaja de la serie de tiempo es que, en el ejemplo, la separación entre años no es uniforme y el eje x tipo fecha, permite resaltar esa característica. El diagrama de barras no.

Entonces, ¿cuando se usaría un diagrama de área? En estadística el área bajo la curva de una función de distribución de probabilidad debe sumar uno. El área entre dos valores dados representa la probabilidad de que la variable aleatoria esté entre dicho par de valores. Como el área tienen sentido, su visualización como área también.

Función de distribución de una normal estándar

Figura 17.1: Función de distribución de una normal estándar

Superponer varias funciones de distribución de probabilidad también se desaconseja. Yuxtaponer es una mejor opción.


  1. Más adelante se presentará el streamgraph, que está basado en el diagrama de área apilado.↩︎