Pasar al contenido principal

ANOVA unifactorial y comparaciones múltiples en Excel

Este tutorial le mostrará cómo configurar e interpretar un Análisis de Varianza (ANOVA) unifactorial (One-way Analysis of Variance) seguido de comparaciones múltiples de Tukey & Dunnett en Excel usando el software XLSTAT.

¿No está seguro si esta característica de modelado es la que está buscando? Consulte por favor esta guía.

Datos para ejecutar un ANOVA unifactorial

Descargar los datos

Los datos corresponden a una experiencia en que 4 dentà­fricos fueron probados, cada uno, en 6 personas con el fin de medir su impacto sobre la blancura de los dientes. Todos los pacientes utilizaban antes el mismo dentà­frico.

Objetivo de este tutorial

En utilizar la herramienta del ANOVA function de XLSTAT, aquà­ buscamos a determinar si existe una diferencia significativa entre los diferentes dentà­fricos, y si es asà­, cual seria el más eficaz. Estamos en un caso de ANOVA de un factor (la clase de dentà­frico) equilibrado ya que el número de repeticiones es el mismo para los diferentes grupos.

Configuración de un ANOVA unifactorial

Una vez XLSTAT iniciado, elija el comando XLSTAT/Modelización/ANOVA.

XLSTAT Ribbon

Una vez el botón pulsado, aparece el cuadro de diálogo correspondiente al ANOVA.

Puede elegir entonces los datos en la hoja Excel.

La "Variable a modelizar" corresponde a la variable explicada, es decir en este caso preciso, a la blancura de los dientes de la que queremos explicar la variabilidad por la variable explicativa cualitativa "dentà­frico". La opción "Referencias presentes" se deja activada porque la primera là­nea de columnas incluye el nombre de las variables.

Dejamos seleccionada la opción "Residuos" ya que analizaremos los residuos para validar las hipótesis de normalidad del ANOVA, e identificar valores extremos. La opción comparación es activada con el fin que sea visualizado el cuadro de diálogo dedicado a las pruebas de comparaciones múltiples.

En XLSTAT, es posible seleccionar los datos de dos maneras diferentes para el ANOVA. La primera se presenta en forma de columnas, una columna para la variable dependiente y otra para la variable explicativa.

La segunda forma de seleccionar los datos es en forma de tabla, donde cada columna representa una modalidad de la variable explicativa.

Dejamos la restricción a "a1=0", lo que implica que el modelo se escribirá de manera a tener en cuenta que el dentà­frico T1 tendrá el efecto de base.

Aplicar una restricción en ANOVA es indispensable por razones teóricas, pero eso no cambia nada en los resultados ( previsiones, R’², etc.), ni la calidad del análisis.

anova options

En la pestaña Resultados / Medias se habilitan las opciones Comparaciones por pares y Comparaciones con un control.

La prueba de Tukey está preseleccionada ya que es seguro y simple de interpretar.

Añadimos el método REGWQ, muy seguro, y la prueba de Dunnett que permite comparar todas las modalidades con una modalidad de control (aquà­ el dentà­frico T1). Las pruebas de comparación múltiples son un campo complejo de las estadà­sticas.

Si quiere profundizar el sujeto, le aconsejamos el libro de Jason C. Hsu anotado en la página de los libros.

ANOVA outpus tab Una vez que haya pulsado el botón OK, los cálculos empiezan, luego se suspenden para pedirle a elegir un método de comparación múltiple.

anova dunnett

Una vez que el usuario a pulsado OK los cálculos prosiguen y la visualización de los resultados finaliza.

Interpretación de los resultados de un ANOVA unifactorial

El cuadro de análisis de la varianza es el primer resultado a analizar atentamente (ver a continuación). Es en este nivel que comprobamos si podemos considerar que la variable explicativa elegida (la clase de dentà­frico) origina una cantidad de información significativa al modelo (hipótesis nulo H0) o no.

anova-one-factor-5.gif

En otros términos, es una manera de probar si la media de Y bastarà­a con describir los resultados obtenidos o no.

anova-one-factor-6.gif

La prueba utilizada es la prueba del F de Fisher. Dado que la probabilidad asociada al F es, en este caso, de 0.001, significa que nos arriesgamos del 0.09% concluyendo que la variable explicativa origina una cantidad de información significativa al modelo.

El cuadro siguiente proporciona los detalles sobre el modelo y es esencial en cuanto que el modelo debe ser utilizado para proyectar previsiones o simulaciones. En nuestro caso particular no tiene mucho interés. Observaremos simplemente que el intervalo de confianza para el efecto del dentà­frico T2 incluye el valor 0, lo que indica que el dentà­frico T2 no es significativamente diferente de T1.

anova-one-factor-6.gifanova-one-factor-7.gif

El cuadro siguiente expone el análisis de los residuos. Los residuos centrados reducidos deben tener una atención particular, dado que las hipótesis vinculadas al ANOVA, deben ser distribuidos según una ley normal N(0,1). Eso significa que el 95% de los residuos deben encontrarse en el intervalo [-1.96, 1.96]. Dado que el escaso número de datos del que disponemos aquà­, cualquier valor fuera de este intervalo es revelador de un dato sospechoso. Podemos identificar aquà­ un valor sospechoso (decimotercera observación) el residuo siendo igual a -2.8279. Con el fin de explicar este valor, podremos verificar que el dentà­frico bueno fue entregado efectivamente a esa persona, o analizar la razón por la cual la reacción del paciente al dentà­frico fue más escasa que para otros.

anova-one-factor-8.gif

El histograma de los residuos centrados reducidos permite señalar rápidamente la presencia de valores fuera del intervalo [-1.96, 1.96].

anova-one-factor-9.gif

Por último, conseguiremos responder a nuestra pregunta inicial: ¿Existe una diferencia significativa entre los dentà­fricos?, y en caso afirmativo, ¿Cómo podemos clasificarlos?. Como está mostrado en el cuadro a continuación, la prueba de Tukey HSD (Honestly Significantly Different), fue aplicada al conjunto de las parejas de diferencias posible. El riesgo de 5% que hemos elegido es utilizado para determinar el valor critico q, que es comparado a la diferencia entre las medias normalizadas. Otros programas se basan sobre el valor d, también proporcionado por XLSTAT. Solamente dos pares parecen ser significativamente diferentes (T1, T3) y (T2,T3). Utilizando el resultado de las pruebas, los dentà­fricos son después clasificados. Apuntaremos que no hay transitividad ( significa no significativamente diferente, y significa significativamente diferente): T4 </> T3 T4 </> T2 but T2 <> T3

Tukey test after a one-way ANOVA

El procedimiento REQWQ proporciona un resultado diferente (ver más abajo), lo que demuestra que podemos ser prudente cuando utilizamos procedimientos de comparación múltiples.

Tres parejas de modalidades son aquà­ significativamente diferentes: T1 y T4 son aquà­ calificados significativamente diferentes. El cuadro de reagrupamientos destaca ahora tres grupos de modalidades.

REQWQ test after a one-way ANOVA

La prueba de Dunnett fue calculado para comparar cada modalidad con la modalidad T1. La prueba de Dunnett destaca también una diferencia significativa entre T1 y T4. Dunnett test after a one-way ANOVA

Conclusión de este ANOVA unifactorial

En conclusión, los diferentes dentà­fricos probados tienen un impacto significativamente diferente sobre la blancura de los dientes. Como el dentà­frico T1 ya está en el mercado, con el fin de promover el nuevo producto, los dentà­fricos T3 o T4 podrán ser elegidos para ser puesto en el mercado. Por favor, tenga en cuenta que ANOVA se fundamenta en una serie de asunciones paramétricas que deben ser verificadas para asegurarse de la fiabilidad del resultado.

¿Ha sido útil este artículo?

  • No