Su solución de análisis de datos

Análisis Factorial de Correspondencias datos brutos 3D

02/03/2017

Este tutorial muestra cómo configurar e interpretar un Análisis Factorial de correspondencias (AFC) sobre datos en bruto en Excel usando el software XLSTAT.
¿No está seguro si este análisis multivariado de datos es la herramienta que necesita? Puede comprobarlo consultando esta guía.

Datos para ejecutar un Análisis de correspondencias a partir de una tabla de datos en bruto

Puede descargar una hoja Excel con los datos y resultados utilizados en este tutorial haciendo clic aquí.
Los datos corresponden a una lista de jugadores de fútbol extranjeros en la Premier League y su nacionalidad. Deseamos estudiar la distribución de jugadores extranjeros en los clubs de fútbol ingleses.

Configuración de un Análisis de correspondencias a partir de una tabla de datos en bruto

Una vez abierto XLSTAT, seleccione el comando Análisis de datos / Análisis Factorial de correspondencias, o haga clic en el botón correspondiente de la barra de herramientas Análisis de datos (véase abajo).

barca1.gifbarca2.gif

Tras hacer clic en el botón, aparece el cuadro de diálogo Análisis de correspondencias.

En el campo Tabla de observaciones/variables, selccione las columnas Club y Región en la hoja de Excel.

Los datos están en formato Observaciones/variables, de modo que marcamos la opción correspondiente.

Puesto que se incluyen los nombres de las columnas, deberíamos seleccionar la opción Etiquetas de las variables.

Seleccione la opción Hoja para los resultados.

ca2_1.png

En la pestaña Opciones marcamos Prueba de independencia y dejamos el % del nivel de significación en 5.

ca2_2.png

En la sección Resultados, seleccionamos las siguientes opciones:

  • Tabla de contingencia
  • Valores propios
  • Coordenadas principales
  • Coordenadas estándar
  • Contribuciones
  • Cosenos al cuadrado

ca2_3.png

Vamos a la pestaña Gráficos y seleccionamos:

  • Gráficos simétricos
  • Gráficos asimétricos
  • Etiquetas

ca2_4.png

Hacemos clic en OK.

Puesto que el modelo necesita más de dos factores, hacemos clic en Seleccionar para seleccionar el gráfico F1-F2. Luego cambiamos la Abscisa a Fw. Cambiará la Ordenada a F3. Pulsamos de nuevo en Seleccionar. De este modo tendremos dos gráficos: F1-F2 y F2-F3. Pulsamos en Hecho.

ca2_5.png

Interpretación de los resultados de un Análisis de correspondencias

El primer resultado es la tabla de contingencia y luego la prueba de independencia entre filas y columnas.

El valor p de 0.008 es inferior al 5%, por lo que deberíamos rechazar la hipótesis nula. Esto significa que la distribución de la nacionalidad no es aleatoria en los clubs del Reino Unido.

ca2_6.png

A continuación tenemos los gráficos simétricos. En el primer gráfico podemos ver que los clubs como el Aston Villa y el Stoke City tienen más jugadores norteamericanos que el resto de los equipos. Del mismo modo, el Burney tiene muchos jugadores del norte de Europa.

ca2_7.png

Creación de un gráfico 3-D para los resultados de un Análisis de correspondencias

Haremos ahora un gráfico en 3 dimensiones para conseguir una mejor representación de los puntos.

En primer lugar, haremos una tabla que contenga las 3 coordenadas principales de los clubs y las áreas geográficas, así como la suma de los cosenos de los 3 factores.

La suma de los cosenos al cuadrado de los 3 factores, obtenida de la tabla de cosenos al cuadrado, proporciona una idea de lo correcta que es la representación de la muestra en el espacio tridimensional.

Agregamos una última columna para tener información sobre las filas y las columnas. Las filas son los clubs y las columnas las regiones. Hacemos una variable categórica con filas (R) y columnas (C) para describir a cada muestra.

ca2_7b.png


Seleccionamos toda la tabla y vamos al menú Visualización de datos. Seleccionamos la opción XLSTAT-3DPlot.
Cuando se nos requiera, seleccionamos el formato de los datos como Tabla.

ca2_8.png

Necesitamos especificar los ejes. Lo hacemos con clic derecho y seleccionamos en la caja emergente la variable adecuada a utilizar. Para los 3 ejes utilizamos: F1 y F2 horizontalmente, y F3 verticalmente. Necesitaremos también ajustar el tamaño del eje de modo que tengamos un gráfico ortogonal. Por ejemplo, usamos para todos los ejes -1.5 y 1.5 como límites.

ca2_9.png

Para el color y el tamaño de los puntos podemos usar la suma de los cosenos. Vamos a la pestaña Objetos y modificamos las secciones de color y tamaño.

ca2_10.png

Finalmente, podemos agregar las etiquetas yendo a la pestaña Anotaciones y seleccionando “Columna1” como etiqueta.

ca2_11.png

Esta es la representación 3-D.

ca2_12.png

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283