Su solución de análisis de datos

Regresión Monotónica / MONANOVA en Excel

03/03/2017

Este tutorial le mostrará cómo crear e interpretar una Regresión monótona (Monotone regression, MONANOVA) en Excel utilizando el software estadístico XLSTAT.

Regresión monotónica / Método MONANOVA

La regresión monotónica y el método MONANOVA sólo se diferencian en el hecho de que las variables explicativas son o cuantitativas o cualitativas. Estos métodos se basan en algoritmos iterativos basados en la algoritmo ALS (alternating least squares). Su principio es simple: consiste en alternar entre una regresión ordinaria lineal o ANOVA y una transformación monotónica de las variables dependientes (después de investigar el escalamiento óptimo).
El algoritmo MONANOVA fue introducido por Kruskal (1965). Los métodos de regresión monotónica y los trabajos sobre el algoritmo ALS se deben a Young et al. (1976).
Estos métodos se utilizan comúnmente como parte del análisis conjunto de perfil completo (full profile conjoint analysis). XLSTAT puede aplicarlos dentro de un análisis conjunto, pero también de forma independiente.
La herramienta de regresión monotónica (MONANOVA) combina una transformación monotónica de la variable de respuesta con una regresión lineal con el fin de mejorar los resultados de la regresión.

Datos para el método MONANOVA (regresión monotónica)

Puede descargar una hoja Excel que contiene los datos y los resultados para su uso en este tutorial haciendo clic aquí.
Los datos han sido obtenidos de Lewis T. and Taylor L.R. (1967). Introduction to Experimental Ecology, New York: Academic Press, Inc. Se refieren a 237 niños, descritos por su sexo, edad en meses, altura en pulgadas (1 pulgada = 2.54 cm), y peso en libras (1 libra = 0.45 kg) .

Objetivo de este análisis MONANOVA

Utilizando el método MONANOVA, queremos averiguar cómo el peso de los niños varía de acuerdo con su género (una variable cualitativa que toma el valor F y M), su altura y su edad, y para verificar si una transformación monotónica mejora la calidad del modelo.
A diferencia de un modelo lineal, combina una transformación monótona de la variable dependiente con una regresión por mínimos cuadrados ordinarios (ordinary least squares regression). Se basa en un algoritmo iterativo alterna entre un modelo lineal general (general linear model, GLM) y una transformación monotónica para mejorar la calidad de la predicción.

Configuración de un MONANOVA

Una vez XLSTAT iniciado, seleccione el comando de XLSTAT- Análisis conjunto / MONANOVA, o haga clic en el botón correspondiente de la barra de herramientas XLSTAT-CJT (véase más adelante).

menu-bar-monanova.gif

Una vez haya hecho clic en el botón, aparece el cuadro de diálogo MONANOVA. Seleccione los datos en la hoja de cálculo de Excel. La Variable dependiente (o variable a modelar) es aquí el peso (Weight).

Las variables cuantitativas explicativas son la altura (height) y la edad (age). La variable cualitativa es el género (gender). Puesto que hemos elegido el título de la columna para las variables, dejamos activada la opción Etiquetas de las variables. Las demás opciones se han dejado en sus valores predeterminados.

monanova-dialog-box-general.gif

Los cálculos empiezan una vez haya hecho clic en OK. A continuación, se muestran los resultados.

Interpretación de los resultados de un análisis MONANOVA

La primera tabla muestra los coeficientes de bondad del ajuste del modelo. El R² (coeficiente de determinación) indica el % de la variabilidad de la variable dependiente que es explicada por las variables explicativas. Cuanto más cerca de 1 esté dicho coeficiente, mejor será el ajuste.

monanova-results-goodness-of-fit.gif

En este caso particular, el 68% de la variabilidad del peso viene explicado por la altura (Height), la edad (Age) y el género (Gender). El resto de la variabilidad se debe a efectos (otras variables explicativas) que no han sido o que no pudieron ser medidas durante este experimento. Podemos suponer que están involucrados algunos efectos genéticos y nutritivos.

Como parte del método MONANOVA, se muestra una tabla de pruebas de ajuste adicionales. Estas pruebas permiten obtener los límites del valor p del modelo.

monanova-results-tests.gif

Es importante examinar los resultados de la tabla de análisis de varianza (ver más abajo). Los resultados nos permiten determinar si las variables explicativas aportan o no información significativa (hipótesis nula H0) al modelo. En otras palabras, es una manera de comprobar si es válido utilizar la media para describir a toda la población, o si la información presentada por las variables explicativas es de valor o no.

monanova-results-variance.gif

Se utiliza la prueba F de Fisher. Teniendo en cuenta el hecho de que la probabilidad asociada al valor de F es menor de 0.0001, ello significa que estaríamos asumiento un riesgo menor que 0.01% en el supuesto de que la hipótesis nula (esto es, ausencia de efecto de las dos variables explicativas) fuera errónea. Por lo tanto, podemos concluir con seguridad que las tres variables aportan una cantidad significativa de información.

La siguiente tabla aporta detalles sobre el modelo. Esta tabla es muy útil cuando se necesitan predicciones, o cuando es necesario comparar los coeficientes del modelo para una población dada con los obtenidos para otra población. Podemos ver que el valor p para el parámetro de género (Gender) es 0.69, y que el intervalo de confianza incluye el valor 0. Esto confirma el débil impacto del género en el modelo. Si nos fijamos en el parámetro asociado al sexo femenino (Gender-f), parece que para una edad y altura determinadas, ser niña significa un pequeño incremento del peso (Weight).

monanova-results-coefficients.gif

El gráfico siguiente proporciona un análisis de la transformación monotónica realizada.

monanova-chart-transformation.gif

Vemos que la transformación está cerca de la transformación lineal. Esto nos lleva a comparar estos resultados con los de un modelo lineal de análisis de covarianza (ANCOVA), los resultados asociados con este análisis están disponibles en la hoja ANCOVA. Vemos que el coeficiente R2 es 0.63. Es más bajo que para el modelo transformado, pero la diferencia no es muy importante.

En conclusión, la magnitud del efecto de la transformación monotónica no proporciona mucha información adicional sobre la calidad de la predicción del modelo. Las variables explicativas todavía tienen un impacto significativo, y podemos decir que existe una relación lineal en el modelo.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283