Aller au contenu principal

Régression non linéaire dans Excel

Ce tutoriel explique comment mettre en place et interpréter une régression non linéaire dans Excel avec XLSTAT.

Jeu de données pour réaliser une régression non linéaire et but de ce tutoriel

La régression non linéaire permet de modéliser des phénomènes complexes n'entrant pas dans le cadre du modèle linéaire.

Les données sont fictives et ont été créées pour ce tutoriel.

En utilisant la régression non linéaire, notre but est d'étudier la relation entre la concentration en substrat d’une enzyme et sa vitesse maximale dans dans deux groupes différents. Pour ce faire, nous utiliserons le modèle de Michaelis-Menten.

Paramétrer une régression non linéaire

Une fois XLSTAT lancé, cliquez sur le menu XLSTAT / Modélisation / Régression non linéaire.

image.png

La boîte de dialogue correspondant à la régression non linéaire apparaît, vous pouvez alors sélectionner les données sur la feuille Excel.

La Variable dépendante correspond à la variable réponse (ou variable à modéliser), qui est dans ce cas précis la "Vitesse".

La variable quantitative explicative est la concentration en substrat : conc.

On veut expliquer la variabilité de la Vitesse par celle de la concentration en substrat conc.

La variable groupe permet de séparer les données pour chacun des groupes a et b. L'option Libellés des variables est laissée activée car la première ligne des colonnes comprend le nom des variables.

image.png
Dans l'onglet Fonctions, XLSTAT propose un choix large de fonctions prédéfinies dont les dérivées sont directement prisent en compte.

NB : XLSTAT laisse aussi le choix à l’utilisateur de rentrer une fonction définie par lui-même. L’utilisateur aura alors le choix de rentrer ses propres dérivées, ou de les laisser estimé par XLSTAT.

image.png
Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.

Interprétation des résultats de la régression non linéaire

Le premier tableau de résultats fournit des statistiques simples sur les données sélectionnées. Le second tableau (ci-dessous) donne les coefficients d'ajustement du modèle parmi lesquels le RMCE (racine de la moyenne des carrés des erreurs) qui donne une idée de la qualité d'un modèle. Un modèle ajustant mieux les données qu’un autre aura une RMCE plus faible. La somme des carrés des résidus (SCE) est le critère utilisé par XLSTAT pour ajuster le modèle.

image.png
Dans notre cas, la RMCE est 42,865 dans le 1er groupe, et 86.893 dans le second, ce qui montre que la variabilité de la vitesse est mieux expliquée dans le 1er groupe.

Le tableau suivant fournit les détails sur les paramètres du modèle après ajustement pour chacun des groupes. Nous voyons que les paramètres pr1, qui correspondent à la vitesse maximale du groupe a et du groupe b, sont assez proches.

image.png
Les équations des modèles ajustés sont fournies. La syntaxe est compatible avec Excel afin de rendre sa réutilisation aisée.

image.png
Le tableau suivant (voir feuille Excel) présente l'analyse des résidus. On remarque que les observations pour lesquelles le modèle est le moins bien ajusté sont les deux premières observations de chacun des groupes.

Le premier graphique (voir ci-dessous) permet de visualiser les données et les courbes des modèles ajustés, et confirme que la vitesse maximale de chacun des groupes est proche. Les autres graphiques permettent d'analyser les résidus, et sont particulièrement utiles lorsque le nombre de données est important.

image.png
Comme on a pu le voir auparavant, la vitesse maximale des deux groupes est très proche. Vous pouvez donc partager ce paramètre afin d’obtenir une valeur d’ajustement globale pour celui-ci.

Pour cela, relancez une analyse. Dans l’onglet options cochez « paramètres partagés » puis cliquez sur OK.

image.png
Une nouvelle fenêtre va apparaitre, dans laquelle vous choisissez de partager le paramètre « pr1 », correspondant à la vitesse maximale.

image.png
Vous pouvez maintenant voir, dans le tableau des paramètres du modèle, que les paramètres « pr1 » ont la même valeur pour les deux groupes.

image.png
image.png
Ceci nous permet d’avoir un modèle avec une vitesse globale entre les groupes.

En conclusion, dans le cadre de cette étude et du modèle choisi, la concentration en substrat permet de modéliser très efficacement sa vitesse.

Cet article vous a t-il été utile ?

  • Oui
  • Non