Capítulo 2 Introduccion

Se puede definir la visualización como la labor, basada en computador, que provee representaciones visuales efectivas que mejoran la capacidad de tomar decisiones basadas en datos.

Si la pregunta que se desea realizar a los datos se conoce de antemano, la visualización no hace falta, se puede trabajar directamente la data. La visualización suele realizarse para identificar o descubrir patrones en los datos que no son conocidos de antemano y desde ese punto de vista es que la representación visual mejora la capacidad humana para tomar decisiones.

Se reitera que la visualización se realiza para humanos porque los sistemas de toma de decisiones automáticas no requieren de la creación de visualizaciones. La visualización es como una extensión “externa” de la memoria humana por cuanto se puede volver a recurrir a ella en diferentes ocasiones y, cuando es interactiva, como un sistema de inteligencia amplificada.

La definición incluye el hecho de que sean realizadas en computador por cuanto esta herramienta permite analizar una mayor cantidad de información y en una extensión mucho mayor a la que se podría realizar de manera manual por parte de un analista que realice a mano la representación gráfica.

Obsérvese que está orientado al sentido de la visión del ser humano. Es el sentido que tiene un ancho de banda más amplio de comunicación con el cerebro, que tiene mecanismos de atención inconscientes relacionados con el movimiento y ciertos colores como por ejemplo el rojo, y para el cual tenemos desarrollada la tecnología actualmente: las pantallas. No hay tecnología disponible para el sentido del tacto, el olfato o el gusto. Como especie somos hábiles en evaluar situaciones a partir de la vista.

«La visión no es solo el más rápido y matizado portal sensorial al mundo, es también el más intimamente conectado con la cognición. Ver y pensar colaboran estrechamente para darle sentido al mundo. No es accidental que tantas palabras usadas para describir el entendimiento son metáforas visuales, tales como “visión”, “iluminación”, y el familiar “veo”.» (Few 2009)

Se habla de “efectividad” por cuanto el propósito de las visualizaciones cubiertas por este curso están orientadas al apoyo a la toma de decisiones basadas en información, para tareas específicas. Se pretenden representaciones exactas, verdaderas y correctas. En esto se diferencia de un curso de diseño gráfico apoyado en computador, en el cual puede enseñarse la representación gráfica con propósitos publicitarios en donde en muchas ocasiones interesa suscitar una emoción que impulse a una decisión, muchas veces inconsciente, en los destinatarios del mensaje; o del diseño gráfico que realiza infogramas de los que observamos en los periódicos, que si bien basados en datos, añaden una capa de diseño; y de los cursos que enseñan técnicas cuyo propósito es puramente estético. Pero sí se busca el diseño que contribuye a la efectividad, el cual no debe confundirse con la decoración que suele distraer del mensaje (Wickham 2013).

El proceso de desarrollo de una visualización implica una multitud de decisiones que debe tomar el diseñador. Por ejemplo, ¿se requiere para un único uso? Es usual cuando se visualiza un prototipo de un diseño industrial de tal manera que permita evidenciar si hay algo que se pasó por alto a nivel funcional o de diseño. Por el contrario, ¿se utilizará recurrentemente durante un largo periodo de tiempo? La respuesta definirá el tipo de visualización que conviene desarrollar. ¿Es una visualización diseñada para supervisar si un proceso está desarrollándose conforme al estándar?. Ser diseñador de visualizaciones implica conocer un amplio portafolio de opciones de las cuales considerar la más adecuada para cada tarea que se va a apoyar. Pero también tiene restricciones muy específicas a considerar. Una de ellas es el medio por el cual se va a presentar la visualización: un objeto liso y rígido con un cierto nivel de resolución. Otra es la capacidad de computo y de memoria del computador. No sólo del diseñador, sino del usuario final. Probablemente el diseñador tenga un equipo con mayor calidad gráfica que el usuario final y tal vez con mejores especificaciones técnicas. Se debe tener en cuenta. Además el equipo del diseñador es de uso exclusivo para ese propósito, pero el usuario final seguramente corre otros procesos paralelamente. El hecho de que sea una memoria visual externa al ser humano tiene implicaciones relacionadas con la forma de almacenar la información, la forma de buscarla en medio de multitud de visualizaciones y la forma de tenerla disponible en el momento que se requiera, temas que están por fuera de este curso.

Few hace una distinción pertinente. Menciona que la visualización de datos comprende tanto la visualización de información (infovis), entes abstractos, como la visualización científica1 (scivis), de entes físicos (Few 2009). Este curso se centra en entes abstractos. No pretende adentrarse en la representación visual de órganos del cuerpo humano ni en prototipos de un automóvil de carreras.

Otros condicionantes del diseño de visualizaciones son las capacidades perceptuales y cognitivas humanas. Por ejemplo, nuestra limitada capacidad de recibir información en cantidad y en velocidad.

La estadística descriptiva tiene un amplio portafolio de visualizaciones estáticas enraizadas profundamente en la historia que se recorrerán en las primeras semanas del curso. La visualización estática proporciona las bases para el entendimiento de los elementos que componen una visualización y cómo cada tipo de datos tiene asociado cierto tipo de visualizaciones, por razones culturales y antropológicas, que llevan a que sean entendidas por los observadores. Pero el objetivo final de lo que se enseña en este curso no es la “descripción” de la información por medio de resúmenes estadísticos, sino presentar el “detalle” de la información de tal modo que se puedan encontrar esos “patrones” no evidentes en los resúmenes. Telea (Telea 2014) distingue entre Visualización de Información y Analítica Visual. La segunda entendida como la disciplina que ayuda a darle sentido a los datos en el proceso exploratorio e inferencial de la Minería de Datos mediante un proceso iterativo e interactivo. En este texto no hay fronteras entre una y otra.

Los patrones no evidentes (insights) se deben entender en dos vías: i. respuestas a preguntas dado un problema y ii. hechos que desconocíamos acerca de un problema (Telea 2014).

La cantidad de datos que se tienen requieren realizar visualizaciones interactivas cuyo objetivo no es “captar la atención” del observador como lo pretenden las series de televisión, sino apoyarlo en la tarea para la cual fue creada. La capacidad de cómputo actual permite tales desarrollos.

En los últimos 20 años se ha investigado el tema de la interactividad y se trabajará ésta tanto para las visualizaciones estáticas como para las dinámicas.

Validar la efectividad no es fácil. ¿He malentendido las necesidades? ¿Estoy mostrando lo incorrecto? ¿La forma en que lo presento es inadecuada? ¿La forma en que codifiqué el algoritmo es ineficiente? Cada visualización se debe validar con usuarios que ayuden a discernir que si lo que se desea comunicar es lo que el mensaje transmite, si hay correspondencia entre el lenguaje utilizado y la forma como la población objetivo entiende dicho lenguaje y si responde al objetivo establecido.

Referencias bibliográficas

Few, Stephen. 2009. Now You See It. Simple Visualization Techniques for Quantitative Analysis. Analytics Press. California.
Telea, Alexandru C. 2014. Data Visualization. Principles and Practice. CRC Press. Taylor & Francis Group.
Wickham, Hadley. 2013. “Graphical Criticism: Some Historical Notes.” Journal of Computational and Graphical Statistics 22 (1): 38–44.

  1. La visualización científica se centra en la presentación visual de datos espaciales asociados a procesos científicos. Se puede denominar scivis. La visualización de información suele denominarse infovis.↩︎