Transformation Box-Cox dans Excel
Jeu de données pour transformer les données avec la transformation Box-Cox
Les données correspondent à un échantillon de 47 lots qui ont été mesurés pour leur niveau de déchet (Level of waste, en anglais). Nous voulons faire une régression linéaire pour expliquer le niveau de déchet par d’autres variables du procédé, cependant la variable Niveau de déchet ne peut pas être considérée comme suivant une loi Normale comme le montre les résultats ci-dessous.
Dans ce tutoriel, nous allons vous montrer comment vous pouvez transformer les variables dans XLSTAT et prendre l’exemple de la transformation Box-Cox sur la variable Niveau de déchet.
Transformer les données avec XLSTAT
Il y a plusieurs façons de transformer les données dans XLSTAT.
Tout d’abord, vous pouvez prendre avantage de Microsoft Excel et utiliser les fonctions qui sont à votre disposition dans le menu Insérer une fonction. Vous pouvez accéder à ce menu en cliquant sur l’icône fx au-dessus de la feuille de calcul.
Ensuite, vous pouvez sélectionner une des fonctions listées sous Finance, Math & Trig, Statistiques, Base de données ou XLSTAT (dernière option).
Ceci vous donne accès à un grand nombre de transformations générales.
Paramétrer la transformation Box-Cox
-
Ouvrir XLSTAT.
-
Sélectionner Préparation des données / Transformation des variables.
-
Sélectionner la variable Niveau de déchets pour la transformer.
-
Cocher l’option Libellés des colonnes.
-
Cliquer sur l’option Libellé des échantillons et sélectionner la colonne A qui contient l’information sur les numéros des lots.
-
Cocher la case Autre.
-
Choisir l’option Transformation Box-Cox comme nous voulons tenter de rendre la variable "Niveau de déchet" proche d’une distribution Normale.
-
Sélectionner l’option Optimiser pour laisser XLSTAT déterminer la valeur optimale de Lambda.
-
Cliquer sur OK.
Interpréter les résultats de la transformation Box-Cox
Dans la feuille de résultat Transformation de variables, vous trouverez la variable transformée ainsi que la valeur de Lambda utilisée.
Une formule générale est affichée, ainsi que la formule utilisée pour transformer cette variable en particulier.
Vous pouvez faire un nouveau test de normalité sur les données transformées. Notez que maintenant l’hypothèse que la variable transformée Niveau de déchet suit une loi Normale n'est plus rejetée.
Cet article vous a t-il été utile ?
- Oui
- Non