Su solución de análisis de datos

Regresión múltiple no lineal: tutorial en Excel

20/10/2017

Este tutorial le mostrará cómo configurar e interpretar un modelo no lineal en Excel usando el software XLSTAT.
¿No está seguro de que esta sea la función de modelado que está buscando? Consulte por favor esta guía.

Datos para la regresión no lineal

Una hoja Excel que contiene los datos y resultados de este ejemplo puede ser descargada haciendo clic aquà­. Los datos proceden de Ratkowsky D.A. (1983). Nonlinear Regression Modeling. New York, Marcel Dekker y fueron obtenidos en el sitio del NIST.

Objetivo de esta regresión no lineal

Utilizando la regresión no lineal, nuestro objetivo es estudiar como el Peso en seco de las cebollas varà­a en función del Tiempo. Si parece intuitivamente normal utilizar una regresión logà­stica de tres parámetros, el modelo propuesto por Ratkowsky es más complejo.

Regresión logà­sticade 2 parámetros eq1.gif

Regresión logà­sticade 3 parámetros eq2.gif

Modelo de Ratkowskyde 4 parámetros eq3.gif

Con el fin de demostrar la magnitud de las posibilidades de XLSTAT, y aunque el modelo logà­stica de tres parámetros sea directamente disponible bajo XLSTAT, demostraremos en este ejemplo como el usuario mismo puede crear y añadir su función a la lista de las funciones disponibles.

En un primer lugar, como la regresión no lineal de XLSTAT no ofrece entre las funciones preprogramadas el modelo de Ratkowsky, y como su estructura es compleja, debemos calcular las derivadas de la función con respecto a cada uno de los 4 parámetros. Se proporcionan, en el cuadro a continuación, las cuatros derivadas, y su transcripción con las convenciones impuestas por XLSTAT (sintaxis Excel, con "pri" para el parámetro i y "Xj" para la variable j). Comentario : si una derivada empieza por un "-", debe precederla de una cuota ' para evitar que Excel no detecte un error.

Escritura matemática deriv1.gif Sintaxis XLSTAT (pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Escritura matemática deriv2.gif Sintaxis XLSTAT (pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)

Escritura matemática deriv3.gif Sintaxis XLSTAT 1/(1+exp(-pr1-pr2*X1))^(1/pr4)

Escritura matemática deriv4.gif Sintaxis XLSTAT (pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)

Por último, cuando las funciones tienen una estructura compleja, se aconseja indicar a XLSTAT un punto de inicio. En nuestro caso, parece que [0, 0, 725, 1] sea razonable. 725 corresponde al máximo de la variable dependiente. El punto de inicio y las derivadas deben ser introducidos en columna en una hoja Excel. Luego se puede iniciar el análisis.
 

Configuración de una regresión no lineal

Una vez XLSTAT iniciado, elija el comando XLSTAT / Modelización de datos / Regresión no lineal o haga clic en el botón Regresión no lineal de la barra de herramientas Modelización de datos.

barnlin.gif

Una vez el botón presionado, aparece el cuadro de diálogo que corresponde a la regresión no lineal. Puede entonces seleccionar los datos en la hoja Excel. La "Variable dependiente" corresponde a la variable explicada (o variable a modelizar), es decir en este caso preciso, el Peso. La variable cuantitativa explicativa es aquà­ el tiempo. Queremos explicar aquà­ la variabilidad del Peso por la del Tiempo. La opción " Referencias presentes " se deja activada ya que la primera là­nea de columnas incluye el nombre de las variables. Dejamos seleccionada la opción "Residuos" ya que analizaremos las predicciones y residuos. Haciendo clic en el botón "Más", aparece la parte del cuadro de diálogo que corresponde a las opciones avanzadas. Es en este nivel que se especifica el punto de inicio.

nlin1.gif

Un segundo cuadro de diálogo aparece cuando se haga clic en el botón "Siguiente". Este cuadro corresponde a los modelos. Como la función de Ratkowsky no existe en la lista de las funciones preprogramadas (la logà­stica de 3 parámetros se encuentra en séptima posición), debemos en primer lugar introducir la función de Ratkowsky, haciendo clic en "Añadir", con la buena sintaxis, y luego seleccionar las derivadas en la hoja Excel. Con el fin de añadir esta función en la biblioteca de las funciones definidas por el usuario, y poder utilizarla de nuevo más tarde, hacemos clic en "Memorizar". Se añadirá entonces y automáticamente seleccionada.

nlin2.gif

Una vez que haga clic en el botón OK, los cálculos empiezan y luego aparecen los resultados.

Interpretación de los resultados de una regresión no lineal

El primer cuadro de resultados proporciona la ecuación del modelo antes y después el ajuste. El segundo cuadro (a continuación) proporciona los coeficientes de ajuste del modelo. El R’² (coeficiente de determinación) ofrece una idea del % de variabilidad de la variable a modelizar, explicada por la variable explicativa. Mientras más cerca está de 1 este coeficiente, mejor es el modelo. La suma de los cuadrados de los residuos es el criterio utilizado por XLSTAT para ajustar el modelo.

nlin3.gif

En nuestro caso, 99% de la variabilidad del Peso está explicado por el Tiempo, lo que constituye un excelente resultado.

El siguiente cuadro proporciona los detalles sobre los parámetros del modelo tras ajuste. Notamos que el parámetro pr3, cuyo valor de inicio era de 725 vale ahora 699.64 tras ajuste. La desviación tà­pica ofrece una idea de la fiabilidad del resultado obtenido. El parámetro pr4 siendo cerca de 1, se puede imaginar que el modelo logà­stico de 3 parámetros proporcionarà­a un resultado tan bueno, hipótesis que podrá fácilmente verificar utilizando la función preprogramada de XLSTAT.

nlin4.gif

El siguiente cuadro (ver hoja Excel) presenta el análisis de los residuos. Se nota que las observaciones por las cuales el modelo es el menos ajustado son las observaciones 11 y 14.

Le primer gráfico (ver a continuación) permite visualizar los datos y la curva del módulo ajustado. Los tres otros gráficos permiten analizar los residuos, y son en particular útiles cuando el número de datos es importante.

Este tutorial le mostrará cómo configurar e interpretar una regresión no lineal múltiple en Excel usando el software XLSTAT.
¿No está seguro de que esta sea la función de modelado que está buscando? Consulte por favor esta guía.

Datos para ejecutar una regresión no lineal múltiple

Puede descargar una hoja de Excel con los datos y los resultados haciendo clic aquí. Nuestro objetivo es estudiar el efecto de la concentración de dos componentes, C1 y C2, sobre la viscosidad de un yogurt. El modelo que queremos ajustar se formula del siguiente modo:
F(C1, C2) = pr5 / (1+Exp(-pr1-pr2*C1-pr3*C2-pr4*C1*C2))
pr1, ..., pr5 son los parámetros del modelo. Este modelo (similar al logístico) permite tener en cuenta tanto las concentraciones de los componentes como la interacción entre ellos.

Configuración de una una regresión no lineal múltiple

Tras abrir XLSTAT, seleccione el comando XLSTAT / Modelación de datos / Regresión no lineal, o bien haga clic en el botón correspondiente de la barra de herramientas Modelación de datos (ver más abajo).

barnlin.gif

Una vez que haya hecho clic en el botón, aparece el cuadro de diálogo de regresión no lineal. Seleccione los datos en la hoja de cálculo de Excel.

La variable dependiente (o variable de respuesta) es en nuestro caso la "viscosidad".

Las variables explicativas cuantitativas son la concentración de los dos componentes "C1" y "C2".

Puesto que se seleccionaron los encabezados de las columnas, dejamos activada la opción Etiquetas de las variables. Dejamos asimismo activada la opción Residuos, dado que queremos analizar las predicciones y los residuos.

nlin2-1.gif

En la pestaña Opciones, seleccionamos los valores iniciales de los cinco parámetros.

nlin2-2.gif

En la pestaña Funciones, se muestran las diferentes funciones. Puesto que la función que deseamos utilizar no aparece en las Funciones preprogramadas (en la lista podemos ver la versión univariada de la función), tendríamos que escribir el modelo: en primer lugar hacemos clic en Añadir, a continuación escribimos la función, después marcamos Derivadas, entonces las seleccionados en la hoja de cálculo de Excel. Con el fin de añadir esta función a la biblioteca de funciones de usuario, hacimos clic en Guardar. La función se añade a continuación y se selecciona automáticamente.

nlin2-3.gif

Los cálculos comienzan tras hacer clic en el botón OK. A continuación se muestran los resultados.

Interpretación de los resultados de una regresión no lineal múltiple

La primera tabla proporciona los estadísticos básicos de las variables seleccionadas.

La segunda tabla (ver más abajo) muestra los coeficientes de bondad del ajuste, incluyendo R2 (coeficiente de determinación), y SSE (suma de los errores al cuadrado), siendo este último el criterio usado para la optimización del modelo. El valor R2 corresponde al % de la variabilidad de la variable dependiente (viscosidad) explicado por las dos variables explicativas (los componentes). Mientras más próximo a 1 sea R2, mejor es el ajuste.

nlin2-4.gif

En nuestro caso, el 99% de la variabilidad es explicada por las dos variables y su interacción, lo que constituye un excelente resultado que confirma que el modelo seleccionado es adecuado.

La tabla siguiente muestra los resultados de los parámetros del modelo. Como podemos ver, las ratios (parámetro)/(desviación estándar) son mayores para pr5 y pr4. Puesto que la misma ratio es mayor para pr5, deducimos que la interacción entre los dos componentes tiene un efecto mayor sobre la viscosidad que las concentraciones por sí mismas.

nlin2-5.gif

El gráfico siguiente permite visualizar la calidad del ajuste comparando los valores predichos con los observados.

nlin2-6.gif

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283