Escalamiento Multidimensional (MDS) en Excel
Este tutorial muestra cómo configurar e interpretar un Escalamiento Multidimensional (MDS) en Excel usando el software XLSTAT.
¿No está seguro si este análisis multivariado de datos es la herramienta que necesita? Puede comprobarlo consultando esta guía.
¿Qué es el Escalamiento Multidimensional?
El Escalamiento Multidimensional (Multidimensional Scaling MDS) es un método de análisis de datos ampliamente utilizado en los campos del marketing y de la psicometràa, especialmente en los paàses anglosajones. El principio del método consiste en reconstruir un mapa de individuos a partir de una matriz de proximidades (similaridades o disimilaridades) entre los individuos. En el caso ideal en la que se dispone de una matriz que proporciona las distancias entre puntos en el plano (por ejemplo, las distancias entre las ciudades de una región), el MDS reconstruye el mapa de puntos, con poco más o menos una rotación / simetràa. Para proporcionar una configuración óptima, el método MDS minimiza un criterio llamado "STRESS". Mientras más se acerca a 0 mejor es la representación.
Datos para ejecutar un Escalamiento Multidimensional
Los datos corresponden a una encuesta realizada a 10 probadores a quienes se les pidió que calificaran (la puntuación va de 1 a 5) cinco barras de chocolate, donde solo el producto P1 ya está disponible en el mercado.
Objetivo del análisis de este Escalamiento Multidimensional
Se trata de mostrar como los productos se ordenan en un mapa, según las evaluaciones proporcionadas por los 10 consumidores.
Configuración de un Escalamiento Multidimensional
Creando una matriz de proximidad
Se necesita una matriz de proximidad para realizar un análisis de Escalamiento Multidimensional, pero aquí tenemos una tabla de individuos por productos. Por lo tanto, primero debemos calcular las disimilitudes entre productos, lo cual se puede hacer utilizando la herramienta Matrices de Similitud/Disimilitud de XLSTAT.
Una vez que XLSTAT esté activado, haz clic en el menú Describir datos y selecciona Matrices de Similitud/Disimilitud (ver abajo).
Aparecerá la ventana de diálogo. Luego, puedes seleccionar los datos en la hoja de Excel y elegir las opciones apropiadas como se muestra a continuación. Decidimos mostrar la matriz de proximidad justo debajo de los datos originales, en la misma hoja.
La matriz de proximidad se genera automáticamente por defecto y no requiere ser especificada como una salida específica. Los cálculos comienzan una vez que has hecho clic en Aceptar. Luego obtendrás la matriz de distancias euclidianas entre los productos, que será la base para el análisis de Escalamiento Multidimensional.
Configurando la ventana de diálogo de Escalamiento Multidimensional
Luego, haz clic en el menú Analizar datos y selecciona la opción Escalamiento Multidimensional (ver abajo).
Aparecerá la ventana de diálogo de Escalamiento Multidimensional.
Luego, puedes seleccionar la matriz de distancias en la hoja de Excel y elegir las opciones apropiadas como se muestra a continuación.
Se ha elegido el modelo absoluto; este modelo hace que las distancias en la representación final sean lo más cercanas posible a las distancias euclidianas iniciales.
Otras opciones pueden dar resultados similares, pero podrían introducir un efecto de escala, el cual queremos eliminar aquí.
Solicitamos que el análisis se realice de 4 a 2 dimensiones para evaluar la distorsión asociada a la disminución de dimensiones.
Nota: a menos que proporciones al algoritmo un punto de partida en la pestaña de Opciones, los puntos de partida se eligen de forma aleatoria. Por lo tanto, es probable que los resultados que obtengas sean ligeramente diferentes a los que ves en esta página. Sin embargo, esto no debería alterar la interpretación. Para asegurarte de que el algoritmo encuentre un óptimo real (en términos de estrés), puedes aumentar el número de repeticiones, el número máximo de iteraciones y la precisión.
Los cálculos comienzan una vez que has hecho clic en Aceptar. Después de aceptar trazar el mapa en las dos primeras dimensiones haciendo clic en Listo (Done), los resultados se muestran en la hoja de Escalamiento Multidimensional del libro de Excel.
Interpretando los resultados del Escalamiento Multidimensional
La primera tabla muestra la evolución del estrés cuando el número de dimensiones aumenta. Observamos una fuerte ruptura entre las representaciones de 2 y 3 dimensiones, y una estabilidad entre 3 y 4 dimensiones (matemáticamente es normal que una representación de 4 dimensiones para 5 puntos sea perfecta).
Se crea un mapa en el plano Dim1 x Dim2 para la configuración de 2 dimensiones.
También es posible crear mapas para otras combinaciones de ejes para las configuraciones de 3 o 4 dimensiones. Sin embargo, no se recomienda visualizar en dos dimensiones el mapa de una configuración que se haya construido para más dimensiones, ya que podría haber un efecto de proyección que invalide cualquier interpretación. El mapa de 2D debería usarse únicamente para la configuración de 2 dimensiones. Para ver en un mapa de 2D la configuración de 4D, se debe realizar primero un Análisis de Componentes Principales (PCA) en las coordenadas.
Con el fin de obtener una representación de mejor calidad, utilizamos XLSTAT-3DPlot para graficar los datos en tres dimensiones. Para hacerlo, necesitamos seleccionar los datos:
Y hacer clic en el botón XLSTAT-3DPlot en el menú Visualizar datos:
El resultado que obtenemos es el siguiente:
Es posible observar que los probadores han diferenciado bien entre sí los productos de manera colectiva. Sabemos que el producto P2 contiene más chocolate que P4, que es el que contiene menos chocolate: en el gráfico 3D, podemos ver que están diametralmente opuestos. Al observar el conjunto de datos inicial, podemos ver que los probadores han preferido significativamente el producto P2. También podemos notar que, aunque tienen puntuaciones promedio similares, los productos P3 y P5 no están cerca en el espacio de representación: las opiniones de los probadores a veces son opuestas. Esto puede explicarse por el hecho de que se han agregado cacahuetes al producto P3, lo cual es apreciado por algunos probadores y no por otros.
Conclusion sobre el Escalamiento Multidimensional
Como conclusión, el método de Escalamiento Multidimensional permite mapear los productos que han sido evaluados por los probadores. Ofrece una interpretación mucho más enriquecedora que las simples estadísticas.
Nota: no existe un método estadístico riguroso para evaluar la calidad y confiabilidad de una representación producida por un análisis de Escalamiento Multidimensional. Sin embargo, al observar el diagrama de Shepard, se puede tener una idea general de la calidad de la representación. El diagrama de Shepard corresponde a un gráfico de dispersión, donde las abscisas son las disimilitudes observadas y las ordenadas son las distancias en la configuración generada por el Escalamiento Multidimensional. Las disparidades también se muestran. Cuanto más dispersos estén los puntos, menos confiable será el mapa de Escalamiento Multidimensional. Si se respeta la clasificación de las abscisas en las ordenadas, entonces el gráfico es confiable. Si los puntos están en la misma línea, entonces la calidad es perfecta.
El gráfico de la izquierda corresponde, para los datos utilizados en este ejemplo, a la representación en un espacio de 4 dimensiones. El gráfico de la derecha corresponde a la representación en el espacio de 2 dimensiones. Se observa una fuerte diferencia en la dispersión de los puntos entre los dos gráficos.
Nota: para un modelo absoluto, las disparidades son iguales a las disimilitudes, razón por la cual se confunden con la línea para el espacio de 2 dimensiones y quedan ocultas detrás de las distancias en el diagrama de Shepard de 4 dimensiones.
El siguiente video aborda el tema del Escalamiento Multidimensional con una ilustración en XLSTAT.
¿Ha sido útil este artículo?
- Sí
- No