Régression non linéaire multiple dans Excel
Ce tutoriel explique comment mettre en place et interpréter une régression non linéaire multiple dans Excel avec XLSTAT.
Jeu de données pour la régression non linéaire multiple
Le but de l'analyse est d'étudier l'effet de la concentration de deux composants sur la viscosité d'un yaourt. Le modèle que nous voulons ajuster est défini par :
Où β1, ..., β5 sont les paramètres du modèle.
Ce modèle, dont la forme est sigmoïde, (aussi appelée "courbe en S") permet de prendre en compte à la fois la concentration des composants et leur interaction.
Paramétrer une régression non linéaire multiple
-
Une fois XLSTAT lancé, cliquez sur le menu XLSTAT/Modélisation/Régression non linéaire.
-
La boîte de dialogue de la régression non linéaire apparaît.
-
La variable dépendante est ici la « viscosité ».
-
Les variables quantitatives explicatives correspondent aux concentrations « C1 » et « C2 ».
-
Comme les noms des variables ont été sélectionnés, il faut cocher l’option Libellés des variables.
-
Dans l’onglet Options sélectionnez les valeurs de départ des cinq paramètres.
-
Dans l’onglet Fonctions, nous avons deux possibilités. Nous pouvons soit choisir une de fonctions préprogrammées (voir ci-dessous), soit définir notre propre fonction.
Dans cet exemple, nous allons définir le modèle f(C1, C2) comme décrit au début du tutoriel.
Pour qu'Excel interprète correctement nos paramètres, nous les notons "pr" au lieu de "β", mais il s'agit bien des mêmes paramètres.
-
Cliquez sur Ajouter et entrez l’équation f(C1, C2) de notre modèle .
-
Cochez l’option Dérivées et sélectionnez les dérivées dans la feuille Excel.
-
Cliquez sur Sauvegarder pour ajouter le modèle à la librairie des fonctions définies par l’utilisateur.
-
Dans l’onglet Sorties sélectionnez l’option Prédictions et résidus.
-
Les calculs commencent dès que vous cliquez OK.
Interpréter les résultats de la régression non linéaire multiple
Le premier tableau de résultats fournit des statistiques simples sur les données sélectionnées. Le second tableau (ci-dessous) donne les coefficients d'ajustement du modèle parmi lesquels le R² (coefficient de détermination) qui donne une idée du % de variabilité de la variable dépendante, expliqué par les variables explicatives. Plus ce coefficient est proche de 1, meilleur est le modèle. La somme des carrés des résidus (SCE) est le critère utilisé par XLSTAT pour ajuster le modèle.
Dans notre cas, 99% de la variabilité est expliquée par les deux variables et leur interaction, ce qui constitue un excellent résultat. Le tableau suivant fournit les détails sur les paramètres du modèle après ajustement. Nous voyons que le paramètre pr5 (= β5) a une valeur plus élevée que pr4 (= β4). Nous pouvons conclure que l’interaction entre les deux composants a un effet plus important sur la viscosité que les concentrations elles-mêmes.
Le premier graphique (voir ci-dessous) permet de visualiser les données et la courbe du modèle ajusté. Les autres graphiques permettent d'analyser les résidus, et sont particulièrement utiles lorsque le nombre de données est important.
Cet article vous a t-il été utile ?
- Oui
- Non