Análisis Factorial Múltiple (MFA) en Excel
Este tutorial le mostrará cómo configurar e interpretar un Análisis Factorial Múltiple (Multiple Factor Analysis, MFA) en Excel usando el software estadístico XLSTAT.
¿Qué es el Análisis Factorial Múltiple?
El Análisis Factorial Múltiple (Multiple Factor Ahalysis, MFA) es útil para analizar de forma simultánea diversas tablas de variables, y para obtener resultados, especialmente gráficos, que permitan estudiar la relación entre las observaciones, las variables y las tablas. Dentro de una tabla, las variables deben ser del mismo tipo (cuantitativas o cualitativas), pero las tablas pueden ser de tipos diferentes. La medología del MFA se divide en dos fases: 1.Ejecutamos para cada tabla sucesivametne un PCA o un MCA de acuerdo con el tipo de las variables de la tabla. Almacenamos el valor del primer eigenvalue (valor propio) de cada análisis para más adelante ponderar las diferentes tablas en una segunda parte del análisis. 2.Llevamos a cabo un PCA ponderado sobre las columnas de todas las tablas, sabiendo que las tablas de variables cualitativas se transforman en una tabla disyuntiva completa, de modo que cada variable indicador tiene un peso que es una función de la frecuencia de la categoría correspondiente. La ponderación de las tablas hace posible prevenir que las tablas que incluyen más variables no influyan demasiado en el análisis.
Datos para ejecutar un Análisis Factorial Múltiple
Los datos usados en este tutorial han sido recopilados por Asselin C. and Morlat R. from INRA, Angers, France, and used in the following article: [ASSELIN C., PAGES J., and MORLAT R. (1992). Typologie sensorielle du Cabernet Franc et influence du terroir. Utilisation de méthodes statistiques multidimensionnelles. J. Int. Sci. Vigne Vin, 26, 3, 129-154]. Los datos corresponden a una degustación de 21 vinos de la región francesa del Loira por 36 expertos. La base de datos comprende 21 observaciones y 31 dimensiones. Las 31 dimensiones se agrupan en 6 categorías: - las 2 primeras variables cualitativas se refieren a la geografía (denominación y suelo);
- las siguientes 5 variables cuantitativas corresponden a olfato tras reposo;
- las siguientes 3 variables cuantitativas corresponden a criterios visuales;
- las siguientes 10 variables cuantitativas corresponden a olfato tras agitación;
- las siguientes 9 variables cuantitativas corresponden al gusto;
- las últimas 2 variables cuantitativas corresponden a calificaciones globales.
Objetivo del Análisis Factorial Múltiple
El objetivo principal del estudio es entender cómo los vinos se relacionan unos con otros, así como identificar qué criterios parecen coincidir o estar de acuerdo (¿son redundantes?) o en desacuerdo. Decidimos no usar las dos variables cualitativas ni las dos últimas cuantitativas en la primera parte del estudio, sino usarlas únicamente como variables suplementarias al final del estudio: no queremos que los análisis se basen en nada que no sea los criterios de degustación objetivos.
Configuración de un Análisis Factorial Múltiple
Para activar el cuadro de diálogo del Análisis Factorial Múltiple, active XLSTAT, y seleccione a continuación el comando XLSTAT-Sensory / Análisis Factorial Múltiple en el menú XLSTAT.
Una vez haya hecho clic en el botón, aparece el cuadro de diálogo. Seleccione los datos que coresponden a todas las variables de interés. Como antes vimos, las variables pueden ser agrupadas en 6 diferentes tablas.
Así, necesitamos especificar que el número de tablas es 6. Seleccionamos a continuación los nombres que hemos dado a las 6 variables (geog, rest, vis, shake, taste, glob).
Seguidamente, necesitamos definir el número de variables dentro de cada tabla. Puesto que el número no es el mismo para todas las tablas, necesitamos seleccionar un rango en la hoja de Excel que contenga el número de variables dentro de cada tabla.
Dado que las cabeceras de las columnas están disponibles en todas las selecciones, activamos la opción Etiquetas de las variables.
Hacemos clic a continuación en la pestaña Opciones para introducir información adicional.
Tenemos dos tipos de tablas: cuantitativa y cualitativa. Así, seleccionamos el tipo de datos Mixto, y seleccionamos la columna en la que están especificados los tipos (0 para cuantitativa, 1 para cualitativa).
Activamos también la opción Gráficos en dos ejes para evitar que se nos pregunte por los ejes en los mapas factoriales.
Por último, activamos la pestaña Datos suplementarios, con el fin de especificar qué tablas deberían tomarse en consideracíon durante los cálculos iniciales, y cuáles deberían usarse únicamente al final del análisis como tablas suplementarias. Por consiguiente, seleccionamos la columna que define qué tablas son activas (1) y suplementarias (0).
Uns vez hacemos clic en el botón OK, comienzan los cálculos y los resultados se muestran en una nueva hoja de Excel.
Interpretación de los resultados de un Análisis Factorial Múltiple
El primer conjunto de resultados corresponde a los estadísticos descriptivos de las diferentes variables. Los estadísticos que corresponden a las variables de las tablas suplementarias se muestran en color azul.
Después, se llevan a cabo análisis separados sobre cada tabla. Si la tabla incluye variables cuantitativas, se ejecuta un análisis de componentes principales (PCA, Principal Component Analysis). Para tablas con variables cualitativas, se ejecuta un análisis de correspondencias múltiples (MCA, Multiple Correspondence Analysis). Así, en nuestro caso, se realiza un MCA, seguido de 5 PCAs. Los resultados de estos análisis preliminares se usarán posteriormente en el análisis final, la segunda fase del análisis factorial múltiple (MFA, Multiple Factor Analysis), que de hecho es un PCA ponderado (los pesos se fijan sobre las columnas). Los resultados del MFA comienan con el análisis de los valores propios o eigenvalues del PCA ponderado.
Podemos ver aquí que con los dos primeros factores explicamos casi el 70% de la variabilidad.
Se muestran a continuación las coordenadas de las tablas, y se utilizan para crear el mapa de las variables. Podemos ver en el mapa que el primer factor está altamente relacionado con las cuatro tablas activas (elevadas coordenadas y elevadas contribuciones). El segundo factor está más relacionado con el olfato tras reposo y, en una extensión menor, con el olfato tras agitación.
Los coeficientes Lg de relación entre las tablas permiten medir hasta qué punto las tablas están relacionadas dos a dos. Los coeficientes RV (véase más abajo) de relación entre las tablas son otra medida derivada de los coeficientes Lg. El valor de los coeficientes RV varía entre 0 y 1, lo que los hace más fáciles de analizar. Podemos ver aquí que las dos tablas más próximas son el gusto y el olfato tras agitación. De forma más sorprendente, vemos que el coeficiente RV del gusto y de la visión es alto.
A continuación, analizamos el mapa de correlaciones de las variables. Este mapa muestra que las dos calificaciones generales (tipicidad y calidad global) están altamente relacionadas con unas cuantas variables (Shake3 o Taste5 por ejemplo), y están correlacionadas con el primer factor. Podemos asimismo confirmar el hecho de que las variables de visión están altamente correlacionadas con el primer eje. Vemos también que las diferentes variables de “olfato tras agitación” se dispersan en tres de los cuatro cuadrantes. Por último, el segundo factor está muy correlacionado con la variable Rest5.
El mapa de los ejes parciales permite ver cómo los factores generados por los análisis separados de la primera fase están relacionados con los factores del Análisis Factorial Múltiple. Podemos ver que existe una relación muy significativa entre los factores iniciales y los factores del MFA. Esto podría sin embargo no ser siempre el caso.
El siguiente gráfico muestra las observaciones con los centroides de las dos variables cualitativas. Podemos ver que los vinos T1 y T2 están muy próximos, y aislados de los demás vinos. Están muy relacionados con el segundo factor que, como antes vimos, está muy relacionado con Rest5. El vino 1DAM tiene la coordendada más elevada en el primer eje. Podemos ver también que el vino 2DAM está en la dirección de las dos variables de juicio global (tipicidad y calidad global). Estos son los dos vinos preferidos. Podemos ver que el suelo “Ref” es el suelo que está en la misma dirección. En la parte opuesta, el vino 1VAU ha recibido las peores calificaciones.
El último gráfico se basa en el anterior, pero a las observaciones se agregan los puntos proyectados, y se trazan líneas entre la observación y los puntos proyectados correspondientes. Los puntos proyectados corresponden a observaciones suplementarias para las que únicamente se considera la información proporcionada por una tabla, siendo las demás tablas transformadas a ceros. Esto permite ver cómo las diferentes tablas inflyen sobre la posición de un punto determinado. Por ejemplo, para el vino T2, vemos que el olfato tras reposo tiende a hacerlo incluso más diferente del resto de los vinos. Mirando a los otros vinos, podemos ver que el olfato tras reposo a menudo incrementa la distancia entre los vinos.
Conclusión
Como conclusión, el análisis factorial múltiple es un método rico e interesante, debido a que hace posible analizar conjuntos complejos de datos, y a que proporciona muchos resultados gráficos: podemos visualizar tablas (en las cuales están agrupadas las variables), las variables en sí mismas, y las observaciones. En este ejemplo particular, nos ha permitido posicionar rápidamente los vinos en un mapa, en tanto que hemos podido interpretar rápidamente su posición.
¿Ha sido útil este artículo?
- Sí
- No