Su solución de análisis de datos

Comparar ≥ 2 muestras descritas por varias variables

03/03/2017

Este tutorial le mostrará cómo comparar las muestras descritas por varias variables utilizando la distancia de Mahalanobis en Excel con el software XLSTAT.

Datos para probar la diferencia entre muestras utilizando la distancia de Mahalanobis

Puede descargar una hoja de Excel con los datos y resultados de este tutorial haciendo clic aquí. Este tutorial se basa en datos artificiales que se han generado con la herramienta de muestreo de distribuciones de XLSTAT. Las tres primeras columnas se extraen de una distribución estándar normal N (0,1). Las siguientes tres columnas se han muestreado en una distribución normal N (2, 5) para G1, en una distribución normal N (2,2, 5,2) para G2 y en una distribución normal N (8, 7) para G3.

Comprobación de la diferencia entre las muestras utilizando la distancia de Mahalanobis

Con el fin de demostrar cómo utilizar la herramienta y la pertinencia de las pruebas, haremos en primer lugar una prueba multidimensional sobre las 3 primeras columnas, luego sobre las 3 siguientes, y por último sobre las 6 columnas conjuntamente.

1. Pruebas sobre las tres primeras columnas

Configuración de una prueba multidimensional
Una vez activado XLSTAT, seleccione el comando XLSTAT / Pruebas paramétricas / Pruebas multidimensionales, o bien haga clic en el botón correspondiente de la barra de herramientas Pruebas paramétricas (véase siguiente captura de pantalla).

barmaha.gif

Al hacer clic en el botón, aparece un cuadro de diálogo. Seleccione los datos correspondientes a las tres primeras columnas en la hoja de Excel y, a continuación, seleccionamos la columna B que contiene los identificadores de grupo.

maha1.gif

Haga clic en OK para iniciar los cálculos.

Resultados de la prueba multidimensional

Los resultados indican que tanto para las medias (prueba de Wilks) como para las matrices de covarianzas (pruebas de Box y Kullback), los tres grupos se pueden considerar como idénticos y extraidos de la misma población. Observamos con distancias de Fisher que la distancia entre G1, por un lado, y G2 o G3 por otro lado, es mayor que la distancia entre G2 y G3, pero esa diferencia no llega a ser significativa.

maha2.gifmaha3.gif

2. Pruebas sobre las últimas tres columnas

Esta vez elegimos sólo las últimas tres columnas. El resto de las opciones permanecen sin cambios.

maha4.gif

En este caso, las pruebas sobre las medias identifican la diferencia: la prueba Lambda de Wilks llega a la conclusión de que existe una diferencia significativa entre las medias de los grupos. Nos damos cuenta de que las distancias de Mahalanobis sólo son significativas cuando se refieren al grupo 3. No es de extrañar que la pequeña diferencia entre los 2 primeros grupos no se haya detectado como significativa, ya que el tamaño del grupo es demasiado reducido como para identificar una diferencia tan pequeña.

maha5.gif

En lo que atañe a las matrices de covarianza, las pruebas de Box están en el límite para encontrar una diferencia, obteniendo un valor de p de 0.06. Pero la prueba de Kullback no logra identificar la diferencia. Esto es debido que los tamaños de los grupos son demasiado pequeños para distinguir grupos en los cuales las varianzas son 5’² y 7’².

maha6.gif

3. Pruebas sobre las seis columnas

Esta vez seleccionamos todas las columnas. En la pestaña “Resultados” solicitamos las matrices de correlaciones y de covarianzas.

maha7.gif

Las pruebas sobre las medias rinden resultados muy similares al caso 2 (véase más arriba). La diferencia entre G1 y G2 basada en la distancia de Mahalanobis es ligeramente inferior.

maha8.gif

Sin embargo, las pruebas sobre las matrices de covarianza son sorprendentemente diferentes. Se acumulan las pequeñas diferencias observadas en las 3 primeras columnas, y las más grandes observadas en las últimas 3 columnas. Además hay covarianzas no despreciables entre RV1 y RV4, entre RV2 y RV5 y entre RV3 y RV6. Al final, esto arroja diferencias significativas cuando las pruebas se realizan sobre las 6 columnas.

maha9.gif

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283