Su solución de análisis de datos

Filtrado de observaciones dentro de ACP

20/10/2017

Este tutorial muestra cómo mejorar la legibilidad de los gráficos de los Análisis de Componentes Principales (ACP) eliminando las variables u observaciones menos importantes.

Datos para ejecutar un análisis de componentes principales

Puede descargar una hoja Excel con los datos y resultados utilizados en este tutorial haciendo clic aquí.
Los datos provienen de la Oficina del Censo de los Estados Unidos (US Census Bureau) y describen los cambios en la población de 51 estados entre 2000 y 2001. La base de datos inicial ha sido transformada a tasas por 1000 habitantes, utilizando los datos de 2001 como foco para el análisis. Estamos interesados en estudiar los estados grandes (con una población mayor que el promedio). Se ha añadido una variable de tamaño (grande/pequeño).

Objetivo del análisis de componentes principales

Nuestro objetivo es analizar las correlaciones entre las variables, y encontrar si los cambios en población en algunos estados son muy diferentes de los encontrados en otros estados. Centramos nuestra atención en los estados grandes usando la opción de filtrado de XLSTAT.
La única diferencia entre este tutorial y el tutorial disponible aquí, es que decidimos estudiar únicamente los estados grandes

Configuración de un análisis de componentes principales

Una vez activado XLSTAT, seleccione el comando XLSTAT / Análisis de datos / Análisis de componentes principales, o bien haga clic en el botón correspondiente de la barra de herramientas Análisis de datos (véase más abajo).

XLSTAT Analyzing Data menu / PCA

Aparece el cuadro de diálogo del Análisis de Componentes Principales.

Seleccione los datos en la hoja de Excel. Se elige Observaciones/variables como Formato de datos, debido al formato de los datos de entrada.

El tipo de ACP que se usará durante los cálculos es la matriz de correlaciones de Pearson, que corresponde a los coeficientes de correlación clásicos.

XLSTAT principal component analysis dialog box general tab

En la pestaña Opciones de los datos, seleccionamos la opción Filtrar y seleccionamos la columna Tamaño en la base de datos.

XLSTAT Principal Component Analysis dialog box data options tab

En la pestaña Gráficos, deseamos que aparezcan todos los estados grandes y, por tanto, no activamos la opción de filatrado.

Principal Component Analysis XLSTAT dialog box Variables charts tab

Principal Component Analysis XLSTAT dialog box Observations charts tab

Principal Component Analysis XLSTAT dialog box Biplot charts tab

Haga clic en OK. Se muestra un nuevo cuadro de diálogo preguntando qué grupo desea incluir. Seleccione el grupo grande y haga clic en OK.

 group dialog box pca

Los cálculos comienzan tras hacer clic en OK. Se le pide que confirme el número de filas y columnas.

A continuación, debería confirmar los ejes en los que desea que se muestren los gráficos. En este ejemplo, el porcentaje de variabilidad representada por los dos primeros factores no es muy alta (72.09%); para evitar una interpretación errónea de los resultados, hemos decidido complementar los resultados con un segundo gráfico sobre los ejes 1 y 3.

Principal Component Analysis menu PC1 and PC2’’’’Principal Component Analysis menu PC1 and PC2

Interpretación de los resultados de un análisis de componentes principales aplicado a datos filtrados

Se muestran los resultados para los estados más grandes. La primera tabla proporciona pca filter descriptive statitics

A continuación de muestran los valores propios.

 pca filter eigenvalues

 We are interested in the maps for variables and observations. Regarding variables we have the following map:

 pca filter variables map

Podemos ver que en el primer eje los estados más antiguos se oponen a los estados más jóvenes. El segundo eje opone los estados con altas tasas de migración doméstica a los estados con tasas de migración doméstica más bajas.

En lo que atañe a las observaciones, tenemos el siguiente mapa.

 pca filter observations map

Esta sencilla herramienta le permite filtrar las observaciones directamente desde el cuadro de diálogo ACP y evitar una manipulación compleja de los datos.

 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283