Solution d'analyse de données

Test de Shapiro-Wilk et d'autres tests de normalité dans Excel

09/11/2017

Ce tutoriel explique comment mettre en place et interpéter un test de Shapiro-Wilk ainsi que d'autres tests de normalité dans Excel avec XLSTAT. 

Jeu de données pour mettre en place un test de Shapiro-Wilk et d'autres tests de normalité

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :
Télécharger les données

Les données contiennent les notes moyennes de deux groups d'élèves en mathématiques. Chaque groupe inclut 1000 élèves et provient d'une école différente. Le but est d'utiliser les tests de normalité pour tester la normalité des deux échantillons.

Tests de normalité : quelle hypothèse nulle ?

Les tests de normalité impliquent l'hypothèse nulle que la variable ayant généré l'échantillon suit une distribution normale. Ainsi, une p-value faible indique un risque faible de se tromper en concluant que les données sont non-normales. En d'autres termes, si p-value < risque alpha, les données s'écartent significativement de la normalité.
La normalité des résidus est une hypothèse de base dans des méthodes de modélisation courantes. 

Paramétrer un test de Shapiro-Wilk et d'autres tests de normalité

Ensuite nous voulons tester la normalité des deux échantillons générés. Sélectionnez le menu XLSTAT / Description des données / Tests de normalité.
XLSTAT fonction pour effectuer des tests de normalité

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue des Tests de normalité est affichée.

Sélectionnez les deux échantillons dans le champ Données. L'option Q-Q plot est activée afin de nous permettre de visualiser l'écart à la normalité des échantillons.

XLSTAT boîte de dialogue des tests de normalité (onglet général)

XLSTAT boîte de dialogue des tests de normalité (onglet graphiques)

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués et les résultats sont affichés sur une nouvelle feuille.

Interpretation des résultats des tests de normalité

Les résultats sont d'abord fournis pour le premier échantillon, puis pour le second.

Le premier résultat affiché est le Q-Q plot pour le premier échantillon. Le Q-Q plot permet de comparer la fonction de répartition de l'échantillon (en abscisse) à celle qu'aurait une loi normale de même moyenne et même variance (en ordonnées). Dans le cas d'un échantillon issu d'une distribution normale, on doit observer un alignement presque parfait avec la première bissectrice du plan. Dans le cas contraire des écarts doivent être observés.


Nous voyons ici que la fonction de répartition empirique est très proche de la bissectrice.

Les tests de Shapiro-Wilk et de Jarque-Bera confirment que l'on ne peut pas rejeter l'hypthèse de normalité de l'échantillon. On notera qu'avec le test de Shapiro-Wilk, le risque de se tromper en rejetant l'hypothèse serait plus important qu'avec le test de Jarque-Bera.

Les résultats qui suivent concernent le second échantillon, avec dans un premier temps, le Q-Q plot.

Contrairement à ce que nous avons observé pour le premier échantillon, nous remarquons ici un fort écart à la normalité.

Cet écart est confirmé par les tests ci-dessous qui permettent d'affirmer sans hésitation que l'on doit rejeter l'hypothèse de normalité de l'échantillon.

Conclusion

En conclusion, dans ce tutoriel, nous avons appliqué les tests de Shapiro-Wilk et celui de Jarque-Bera pour tester la normalité de deux échantillons. Les tests n'ont pas rejeté l'hypothèse de normalité pour le premier échantillon, alors qu'ils l'ont infirmée pour le second échantillon.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283