Su solución de análisis de datos

Prueba de Chi-cuadrado y prueba exacta de Fisher en Excel

05/06/2017

Este tutorial le mostrará cómo ejecutar e interpretar la prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia en Excel usando el software XLSTAT.
¿No está seguro de si esta es la prueba estadística que está buscando? Consulte por favor esta guía.

Datos para el ejecutar prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia

Para este tutorial se utiliza una tabla de contingencia que contiene el recuento de unos plátanos recogidos en un puesto de mercado. La tabla cruza dos variables cualitativas: la variedad de plátano en las columnas (3 categorías: 1, 2 y 3) y la presencia de gusanos en el plátano en las filas (dos categorías: presencia, ausencia). Cada celda contiene el número de plátanos que tienen la combinación de las correspondientes categorías de fila y columna.

Contingency table

Puede descargar una hoja de Excel con los datos y resultados usados en este tutorial haciendo clic aquí

Objetivo de este tutorial sobre ejecución de la prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia

El objetivo de este tutorial es utilizar la Chi-cuadrado y la prueba exacta de Fisher para probar la asociación entre dos variables cualitativas medidas en una muestra de plátano: la variedad y la presencia/ausencia de gusanos. Puede ver más detalles en el párrafo siguiente.

¿Cuál es la diferencia entre la prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia?

Conceptualmente, la prueba de Chi-cuadrado y la prueba exacta de Fisher desafían la misma hipótesis nula hipótesis nula y, por lo tanto, pueden responder a la misma pregunta.
H0 (hipótesis nula): Las dos variables cualitativas son independientes. En nuestro ejemplo, esto significaría que la presencia / ausencia de los gusanos es independiente de la variedad de plátano. En otras palabras, la relación de los plátanos habitados es la misma en las tres variedades.
A continuación se muestra una proposición de una hipótesis alternativa (dos colas):
Ha (hipótesis alternativa): Las dos variables cualitativas dependen una de la otra. En nuestro ejemplo, esto significaría que la presencia / ausencia de larvas depende de la variedad de plátano. En otras palabras, al menos una de las tres variedades de plátano tiene una ratio de presencia de gusanos que es diferente de la ratio de las otras variedades.
La diferencia entre las dos pruebas radica en la forma en que se calcula el valor de p.
La prueba de Chi-cuadrado se basa en el cálculo de un estadístic chi-cuadrado que refleja la distancia entre los datos reales y los datos teóricos si la hipótesis nula fuera verdad (es decir, las frecuencias teóricas con las mismas ratios de plátanos habitados dentro de cada variedad). Este estadístico se utiliza en una distribución teórica Chi-cuadrado para generar un valor de p. Cuanto mayor sea el estadístico chi-cuadrado, menor será el valor de p. Observe que XLSTAT permite el cálculo de las frecuencias teóricas (véanse las secciones siguientes).
La prueba exacta de Fisher calcula la probabilidad de tener los datos observados (utilizando la distribución hipergeométrica), así como las probabilidades de conseguir todos los conjuntos de datos más extremos posibles bajo la hipótesis nula. Estas probabilidades se utilizan para calcular el valor p de la prueba exacta de Fisher.
Cuando las frecuencias teóricas incluyen frecuencias que son inferiores a 5, o cuando las sumas marginales del conjunto de datos (sumas por fila o por columna) son muy desiguales, es mejor confiar en la prueba exacta de Fisher.
La prueba de Chi-cuadrado es más potente (es decir, más capaz de rechazar la hipótesis nula cuando es falsa) que la prueba exacta de Fisher.

Configuración de la prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia en XLSTAT

Una vez abierto XLSTAT-Pro, vaya a XLSTAT / Pruebas de correlación/asociación / Pruebas para tablas de contingencia.

correlation association tests menu

En la pestaña General, asegúrese de que está seleccionado el formato de datos Tabla de contingencia, a continuación, seleccione los datos en el campo Tabla de contingencia. En el caso en que sus datos estén dispuestos en forma vertical (individuos en filas y variables en columnas), active la opción de formato de datos Variables cualitativas. Si desea transformar sus datos en un formato vertical a un formato de tabla de contingencia, este tutorial le guiará.

Contingency tests menu General tab

En la pestaña Opciones, active las opciones Prueba de Chi-cuadrado y Prueba exacta de Fisher.

Contingency tests menu Options tab

En la pestaña Resultados, active las opciones Frecuencias teóricas, así como Proporciones / Columna.

Contingency tests menu Outputs tab

Haga clic en el botón OK para iniciar los cálculos. Los resultados aparecen en una nueva hoja.

Interpretación de los resultados de de la prueba de Chi-cuadrado y la prueba exacta de Fisher sobre tablas de contingencia en XLSTAT

En primer lugar, XLSTAT muestra los resultados asociados a la prueba de Chi-cuadrado. El valor de p (0.033) es menor que el nivel de significación de 0.05. Por lo tanto, se rechaza la hipótesis nula de que la presencia de gusanos y la variedad de plátano son independientes, con un riesgo del 3.3% de equivocarse.

Chi square test result

A continuación, se muestran los resultados de la prueba exacta de Fisher. También en este caso, el valor de p (0.044) es menor que el nivel de significación de 0.05. La prueba exacta de Fisher también conduce a un rechazo de la hipótesis nula.

.

Fisher exact test result

Observe que el valor de p obtenido bajo la prueba de Chi-cuadrado es ligeramente inferior al que está asociado a la prueba exacta de Fisher. Este es el caso de la mayoría de las veces, puesto que la prueba de Chi-cuadrado es más potente que la prueba exacta de Fisher.

A continuación, la tabla de frecuencias teóricas muestra las frecuencias que se habrían obtenido si la hipótesis nula fuera verdad. Un simple cálculo muestra que la proporción de los plátanos con gusanos es la misma a través de las variedades (11.8%). Nos damos cuenta de que una de las frecuencias es inferior a 5. Por lo tanto, preferimos no confiar en el resultado de la prueba de Chi-cuadrado, y reportar exclusivamente la prueba exacta de Fisher.

Theoretical frequencies

La tabla Proporciones / columna muestra las proporciones de plátanos con gusanos-sí y gusanos-No hay plátanos en cada una de las tres variedades. De acuerdo con el resultado de las pruebas, podemos decir que al menos uno de las proporciones (0.121, 0.104 y 0.300) es significativamente diferente de las demás.

Proportions per column table

 
 
1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283