Su solución de análisis de datos

Gráfico ACP personalizado interpretación fácil

20/10/2017

Este tutorial muestra cómo personalizar un gráfico de  Análisis de Componentes Principales (Principal Component Analysis, PCA) para facilitar su legibilidad.

Datos para personalizar el gráfico

Puede descargar una hoja Excel con los datos y resultados usados en este tutorial haciendo clic aquí.An Excel sheet with both the data and results used in by clicking . Este tutorial se basa en los resultados obtenidos en el tutorial sobre PCA (Principal Components Analysis). Nuestro objetivo se centra en mejorar la legibilidad de la representación gráfica en los ejes F1 y F2.

Personalización de un gráfico

Hacemos en primer lugar una copia de la representación, y luego la aumentamos. Se puede observar que durante la expansión del gráfico, algunas etiquetas se alejan del punto al que corresponden. Para remediar esto, seleccionamos el gráfico y luego usamos las etiquetas herramienta Recolocar las etiquetas de la barra de herramientas Visualización de datos, y seleccionamos las siguientes opciones:

easy1.gif

Creamos entonces, a la derecha de la tabla de las puntuaciones de los factores, una columna que contiene la suma de cosenos cuadrados de los dos primeros ejes de cada observación.

Como recordatorio, para un eje dado y una observación dada, el coseno es el coseno del ángulo entre el eje y el vector que va desde el origen hasta el punto. Por lo tanto, mientras mayor sea el coseno, más cerca del eje estará el punto en el espacio multidimensional que resulta del análisis PCA. La suma de los cosenos de los dos primeros ejes factoriales F1 y F2 para cualquier observación concreta da una idea de la precisión del plano definido por la F1 y F2 para esa observación. Para una observación dada, la suma de cosenos cuadrados sobre todos los ejes es 1. Por lo tanto, para un punto dado, cuanto más cerca de 1 esté la suma, mayor será la interpretabilidad de la representación.

Con el fin de indicar el nivel de interpretabilidad de la representación bidimensional de los diversos puntos, queremos aumentar los tamaños de punto de acuerdo con el valor de la suma de los cosenos al cuadrado. Esto nos permitirá conocer qué puntos se pueden interpretar sin error.

Por otra parte, para diferenciar los cinco grupos de Estados determinados por la oficina de censo (Noreste, Sur, Medio Oeste, Oeste y Pacífico), utilizaremos diferentes formas.

Para modificar las formas, tenemos que utilizar los códigos tal como están definidos por XLSTAT, respetando el orden de las formas propuestas por Excel (ver el cuadro de diálogo abajo): 1 corresponde a un cuadrado, 2 a un diamante, 3 a un triángulo, 4 a un x, 5 a una estrella, 6 a un punto, 7 a a -, 8 a un + y 9 a un círculo. Como sólo cuatro formas son utilizables de manera efectiva, los estados de Hawaï y Alaska que pertenecen a la zona del Pacífico se representan con un círculo como los Estados occidentales, pero con un contorno negro.

easy3.gif

Creamos entonces una columna que contiene los códigos correspondientes a cada Estado.

Para facilitar la legibilidad del gráfico, vamos a colorear en rojo los puntos para los cuales la suma de cosenos al cuadrado es mayor que 0.8. Para cambiar el color de los puntos, debemos aplicar los colores a las celdas donde se definen las formas. Coloreamos en primer lugar toda la columna de los cosenos en azul. Luego usamos la herramienta DataFlagger disponible en la barra de herramientas "Herramientas" para colorear en rojo las celdas con una cantidad mayor que o igual a 0.8.

Para rodear con negro los puntos correspondientes a Hawai y Alaska, se ha añadido a las celdas un borde inferior negro. El formato de la celda se copia y se pega en la columna con las formas, y borramos los formatos en la columna de los cosenos cuadrados (Excel / Editar / Borrar formatos).

easy2.gif

A continuación, seleccionamos el gráfico, y luego lanzamos la herramienta EasyPoints que está disponible en la barra de herramientas "Visualización de datos". Se eligieron las siguientes opciones:

easy4.gif

Como resultados, hemos obtenido el gráfico siguiente:

easy5.gif

Fácil de interpretar, este gráfico nos permite identificar los estados que pueden interpretarse en términos de proximidad. Por ejemplo, se puede concluir que West Virginia y Pennsylvania son parecidos, mientras que Pennsylvania y Alaska son muy diferentes. Por otra parte, observamos que en la parte superior derecha e inferior derecha de la representación, encontramos principalmente los Estados Occidentales.

Contacto

Email ventas

Contactar con nuestro soporte técnico : support@xlstat.com

https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283