17.1 Gráficos de barras

Acudiendo a la tipificación de los datos de acuerdo a la estadística, hay dos: categóricas o cualitativas y cuantitativas. Esta última clasificación se puede subdividir en discretas y continuas.

Si se desea representar el conteo de veces que se presenta una categoría de una variable categórica mediante una marca de longitud, el estándar es utilizar barras separadas entre sí, para significar que no hay una relación numérica entre éstas. El ancho de la barra no es importante, siempre y cuando no se vea lineal para diferenciarlas de las que se presentan más adelante. El eje presenta las diferentes categorías.

Si se desea representar el conteo de veces que se presentan valores numéricos continuos mediante una marca de longitud, el estándar es primero agrupar los datos en rangos, luego sí contar cuántos datos hay dentro de cada uno y finalmente representarlo mediante un histograma, el cual se caracteriza por presentar las barras pegadas unas a otras para reflejar esa característica continua de los valores.

Y, por último, si se desea representar el conteo de veces que se presentan valores numéricos discretos mediante una marca de longitud, el estándar es presentar una línea a la altura del valor discreto específico. Puede terminarse la línea con una marca de punto para resaltar el valor:

Se presentan a continuación algunas malas prácticas relacionadas con este tipo de visualizaciones.

17.1.1 No ordenar diagramas de barras de datos categóricos

Se descarga de la pagina de Datos Abiertos Colombia, una base de datos: https://www.datos.gov.co/Trabajo/Disparidad-de-Horas-Trabajadas-Hombres-y-Mujeres/bee9-sdwx, donde se observa una serie de tiempo, desde 2008 hasta 2020, con datos ya calculados, acerca de la disparidad de horas trabajadas a la semana por parte de las mujeres respecto a los hombres, según departamento, proporcionada por el Ministerio de Trabajo. Se va a representa el último año disponible:

La presentación por orden alfabético del nombre del departamento impide la comparación fácil entre departamentos. Se obliga al analista a realizar un esfuerzo que hace perder efectividad. Se soluciona mediante un ordenamiento en función del valor:

Obsérvese en el ejemplo que se trata de valores categóricos nominales, es decir, los nombres de las entidades territoriales pueden ordenarse alfabéticamente, pero cualquier otro criterio es válido. No tienen un orden natural. Si las categorías fuesen los días de la semana, se denominan valores categóricos ordinales debido a que sí hay un orden implícito, por tanto, no se ordenarían por longitud, sino por el orden natural.

Obsérvese que la visualización presenta las barras horizontalmente. Esta es una buena práctica cuando el número de categorías es grande.

17.1.2 Corte de ejes

Se puede tener la sensación de que cortar el eje de un gráfico de barras es válido, pero puede engañar la percepción del público objetivo. En esta ocasión se hace referencia a diagrama de barras para variables numéricas discretas o contínuas, o para variables categóricas.

En el gráfico se han filtrado los departamentos del eje cafetero más el Valle del Cauca y se ha cortado el eje vertical (y) desde 6, ya que no hay valores menores.

El resultado pareciera indicar que la diferencia entre Risaralda y los restantes departamentos es muy significativa, pero no es cierto. Pareciera el \(50\)% que el Valle del Cauca, pero es el 86.2%

Una visualización sin el corte de ejes lo deja en evidencia:

Se vuelve un problema de falta de ética el cortar los ejes, ya que se falsea la información.

Claus Wilke opina que es válido cortar los ejes si se desea resaltar las diferencias entre diversas categorías, pero advierte que no se realice mediante un diagrama de barras. Promueve en dicho caso un diagrama de puntos:

17.1.3 La importancia de la estética

Como colofón, se utilizará un diagrama de barras para mencionar la importancia de lo estético.

La fealdad no tiene que ver con los gustos, sino con la percepción visual humana.

La siguiente es una visualización que un par de estudiantes presentaron para dar contexto a su trabajo final. Bien podría haber sido en un ambiente empresarial.

El ejemplo no es malo ni erróneo, es feo. Dos colores primarios completamente saturados que contrastan fuertemente desvían la atención de la concurrencia del mensaje que se quiere transmitir hacia el malestar físico y estético que produce: la sobreestimulación de los receptores visuales puede llevar a la fatiga ocular y al malestar, ya que el ojo tiene dificultades para procesar información visual intensa, y, por otra parte, si los colores no siguen principios basados en la teoría del color, el resultado puede parecer discordante y asociarse inconscientemente a los datos en vez de a la estética.