52.5 Coordenadas paralelas. (Parallel Coordinates)
Spence (Spence 2007) expone esta visualización. Relata que en ocasiones presentan las coordenadas paralelas como una alternativa para visualizar la asociación entre variables diversas. Propone suponer un diagrama de dispersión entre kilómetros por galón y número de cilindros en los automóviles. Son solo dos variables. Nos propone imaginar una variante. Sean colocados de manera paralela los dos ejes y como marcas puntos ubicados sobre éstos. Para hacer evidente la asociación, se utiliza como canal líneas que unen los puntos que se corresponden en cada modelo de automóvil. El diagrama de dispersión es mejor para el par de variables, pero para más de dos variables, la alternativa es válida. Eso es lo que se denomina un Diagrama de Coordenadas Paralelas. Esa misma idea se puede lograr por medio del Diagrama de Araña o Radar, de hecho, son un Diagrama de Coordenadas Paralelas sobre coordenadas polares, por tanto, aplican las mismas restricciones expuestas en el capítulo correspondiente: problemas de aglutinamiento de líneas y de diferentes interpretaciones según el orden de las coordinadas paralelas. Entonces, ¿por qué se usan los Diagramas de Coordenadas Paralelas? Para identificar conglomerados de objetos. Evidencia la asociación entre individuos.

Formalmente, la visualización de coordenadas paralelas es una técnica utilizada para visualizar relaciones multivariadas.
En las coordenadas paralelas:
Cada eje vertical representa una variable o característica del conjunto de datos.
Cada línea representa un objeto de datos y conecta los valores de las variables para ese objeto.
Las intersecciones entre las líneas y los ejes representan los valores específicos de las variables.
El objetivo principal de la visualización de Coordenadas paralelas es facilitar la identificación de patrones, tendencias y relaciones entre las variables. Al observar cómo las líneas se cruzan y cómo varían a lo largo de los ejes, los analistas de datos pueden obtener información sobre la correlación, la distribución y la importancia relativa de las variables, las existencia de conglomerados o detectar casos extraños.
El orden de los ejes es fundamental para encontrar características, y en un análisis de datos típico habrá que probar muchos ordenamientos.
El escalado es una alternativa que a veces revela vistas más informativas que la exposición en la escala natural de cada variable. Hay muchos métodos de escalado a tener en cuenta como parte del proceso de preparación de datos que pueden revelar dichas vistas informativas. Por ejemplo:
\(Minmax \equiv X' = \frac{X - min(X)}{max(X) - min(X)}\)
\(Normalización \equiv X' = \frac{X - \bar{X}}{max(X)- min(X)}\)
\(Estandarización \equiv X' = \frac{X - \bar{X}}{\sigma_{X}}\)
\(Unitaria \equiv X' = \frac{X}{\|X\|}\)
\(\text{Escalamiento robusto} \equiv X' = \frac{X - \tilde{X}}{p_{75}-p_{25}}\), el cual hace referencia a la mediana y el rango intercuartil (IRQ).
\(\text{Escalamiento respecto a la mediana} \equiv X' = \frac{X - \tilde{X}}{DMA}\), donde \(DMA = \text{desviación mediana absoluta} = mediana(\mid X - \tilde{X}\mid)\)
Cuando la mayoría de las líneas entre dos ejes paralelos son algo paralelas entre sí, sugiere una correlación positiva entre estas dos dimensiones. Cuando las líneas se cruzan en una especie de superposición de formas en X, se trata de una correlación negativa. Cuando las líneas se cruzan al azar, indica que no existe correlación.
Puede leerse el libro seminal Parallel Coordinates: Visual Multidimensional Geometry and Its Applications, 2009, de Alfred Inselberg si se desea profundizar.
Se puede incorporar un suavizado a las líneas para crear la sensación de una continuidad. El equivalente en coordinadas polares es suavizar un diagrama de radar. Si se eliminan las coordinadas paralelas de la visualización se obtiene algo semejante a la curva de Andrews.