Solution d'analyse de données

Transformation Box-Cox dans Excel

20/10/2017

Jeu de données pour transformer les données avec la transfomation Box-Cox

Une feuille Excel contenant un exemple de données et de résultats peut être téléchargée en cliquant ici.

Les données correspondent à un échantillon de 47 lots qui ont été mesurés pour leur niveau de déchet. Nous voulons faire une régression linéaire pour expliquer le niveau de déchet par d’autres variables du procédé, cependant la variable Niveau de déchet ne peut pas être considérée comme suivant une loi Normale comme le montre les résultats ci-dessous.

statistical software

Dans ce tutoriel nous allons vous montrer comment vous pouvez transformer les variables dans XLSTAT et prendre l’exemple de la transformation Box-Cox sur la variable Niveau de déchet.

Transformer les données avec XLSTAT

Il y a plusieurs façons de transformer les données dans XLSTAT.

Tout d’abord vous pouvez prendre avantage de Microsoft Excel et utiliser les fonctions qui sont à votre disposition dans le menu Insérer une fonction. Vous pouvez accéder à ce menu en cliquant sur l’icône fx au-dessus de la feuille de calcul.

data analysis software

Ensuite vous pouvez sélectionner une des fonctions listées sous Finance, Math & Trig, Statistiques, Base de données ou XLSTAT (dernière option).

principal component analysis software

Ceci vous donne accès à un grand nombre de transformations générales.

Paramétrer la transformation Box-Cox

De plus, XLSTAT vous offre la possibilité d’utiliser des fonctions spécifiques. Vous les trouverez sous le menu Préparation des données / Transformation des variables (ci-dessous).

partial least squares software

Dans la boîte de dialogue qui s’ouvre, commencez par sélectionner la ou les variables à transformer. Dans cet exemple, il s’agit de la variable "Niveau de déchet" dans la colonne B. Comme cette sélection comporte le nom de la variable, cochez l’option Libellés des colonnes.

On peut aussi ajouter le libellé des échantillons en cliquant sur l’option Libellé des échantillons puis sélectionnez la colonne A qui contient l’information sur les numéros des lots.

Les résultats seront présentés dans une nouvelle feuille comme l’option Feuille est sélectionnée. Cependant, vous pouvez changer cela en sélectionnant une des deux autres options.

La transformation la plus générale est une normalisation par l’écart-type non-biaisé. Cependant, il y a d’autres options disponibles si vous cochez la case Autre.

statistical software

Allez ensuite dans l’onglet Transformations qui contient les options suivantes :

  • Normaliser (n) : pour normaliser les variables en utilisant l'écart-type biaisé.
  • Centrer : pour centrer les données.
  • 1 / Ecart-type (n-1) : pour diviser les données par l'écart-type non biaisé.
  • 1 / Ecart-type (n) : pour diviser les données par l'écart-type biaisé.
  • Remettre à l'échelle de 0 à 1 : pour transformer les données de telle sorte qu'elles soient comprises entre 0 et 1.
  • Remettre à l'échelle de 0 à 100 : pour transformer les données de telle sorte qu'elles soient comprises entre 0 et 100.
  • Binariser (0/1) : pour transformer les données de telle sorte que les données égales à 0 soient égales à 0, et les données différentes de 0 soient égales à 1.
  • Signe (-1/0/1) : pour transformer les données de telle sorte que les données égales à 0 soient égales à 0, les données négatives soient égales à -1 et les données positives soient égales à 1.
  • Arcsin : pour calculer l'arc-sinus des données sélectionnées.
  • Transformation Box-Cox : pour augmenter la normalité des données. Vous pouvez soit imposer une valeur de Lambda, soit décider que XLSTAT doit l'optimiser.
  • Winsorize : pour éliminer les données ne correspondant pas à un intervalle donné par deux percentiles : soit p1 et p2 deux valeurs comprises entre 0 et 1, telles que p1<p2. Si une valeur x de l'échantillon est inférieure à q1, le quantile correspondant à p1 obtenu à partir de l'échantillon, ou supérieure à q2 le quantile correspondant à p2, alors la valeur est transformée en q1 dans le premier cas et en q2 dans le second cas.

Choisissez l’option Transformation Box-Cox comme nous voulons tenter de rendre la variable "Niveau de déchet" proche d’une distribution Normale. Aussi sélectionnez l’option Optimiser pour laisser XLSTAT déterminer la valeur optimale de Lambda.

statistical software

Le dernier onglet Données manquantes vous permet de décider comment traiter les données manquantes. Avec l’option choisie par défaut, vous obtiendrez un message d’erreur en cas de données manquantes. Nous allons garder cette option.

statistical analysis software

Cliquez sur le bouton OK pour lancer les calculs.

Interpréter les résultats de la transformation Box-Cox

Dans la feuille de résultat Transformation de variables vous trouverez la variable transformée ainsi que la valeur de Lambda utilisée.

statistical software

Vous pouvez faire un nouveau test de normalité sur les données transformées. Notez que maintenant l’hypothèse que la variable transformée Niveau de déchet suit une loi Normale n'est plus rejetée.

statistical software

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283