Solution d'analyse de données

Echantillonner une distribution et tester la normalité dans Excel

20/06/2017

Jeu de données pour l'échantillonnage d'une distribution et test de normalité

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :
Télécharger les données

Dans ce tutoriel nous vous montrons comment générer un échantillon aléatoire tiré dans une loi Normale, puis dans une loi Uniforme , puis comment utiliser un test de normalité pour vérifier si les échantillons suivent une loi normale ou non. Rappelons que l'hypothèse de normalité est fréquente en statistique.

Dans un premier temps nous créons deux échantillons, le premier à partir d'une loi N(2,2) (de moyenne 2, et d'écart type (sigma) = 2), le second dans une loi Uniforme entre -1.5 et 5. Pour cela l'outil Echantillonnage d'une distribution de la section Préparation des données est utilisé.

Faire un échantillonage d'une distribution

Une fois XLSTAT-Pro lancé, sélectionnez le menu XLSTAT / Préparation des données / Echantillonnage d'une distribution, ou cliquez sur le bouton correspondant de le menu Préparation des données.

XLSTAT fonction pour effectuer un échantillonnage dans une distribution

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'outil Echantillonnage d'une distribution apparaît.

Sélectionnez alors la loi puis les paramètres de la loi, puis la taille de l'échantillon à générer. La boîte présentée ci-dessous correspond à la génération d'un échantillon de 1000 individus à partir d'une loi N(2,2).XLSTAT boîte de dialogue pour effectuer une échantillonnage dans une distribution normale

Une fois que vous avez cliqué sur le bouton OK, l'échantillon est affiché.

Un second échantillon est ensuite généré suivant une loi uniforme entre -1.5 et 5 et en utilisant la boîte de dialogue suivante. Pour afficher le second échantillon à côté du premier, veuillez désactiver l'option "Afficher l'en-tête du rapport" et sélectionner la plage à côté du haut de la colonne associée au premier échantillon.

XLSTAT boîte de dialogue pour effectuer une échantillonnage dans une distribution uniforme

Cliquez sur Ok et le second échantillon est alors affiché.

Test de la normalité

Ensuite nous voulons tester la normalité des deux échantillons générés. Sélectionnez le menu XLSTAT / Description des données / Tests de normalité.
XLSTAT fonction pour effectuer des tests de normalité

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue des Tests de normalité est affichée.

Sélectionnez les deux échantillons dans le champ Données. L'option Q-Q plot est activée afin de nous permettre de visualiser l'écart à la normalité des échantillons.

XLSTAT boîte de dialogue des tests de normalité (onglet général)

XLSTAT boîte de dialogue des tests de normalité (onglet graphiques)

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués et les résultats sont affichés sur une nouvelle feuille.

Interpretation des résultats des tests de normalité

Les résultats sont d'abord fournis pour le premier échantillon, puis pour le second.

Le premier résultat affiché est le Q-Q plot pour le premier échantillon. Le Q-Q plot permet de comparer la fonction de répartition de l'échantillon (en abscisse) à celle qu'aurait une loi normale de même moyenne et même variance (en ordonnées). Dans le cas d'un échantillon issu d'une distribution normale, on doit observer un alignement presque parfait avec la première bissectrice du plan. Dans le cas contraire des écarts doivent être observés.

Q-Q plot (distribution normale)

Nous voyons ici que la fonction de répartition empirique est très proche de la bissectrice.

Les tests de Shapiro-Wilk et de Jarque-Bera confirment que l'on ne peut pas rejeter l'hypthèse de normalité de l'échantillon. On notera qu'avec le test de Shapiro-Wilk, le risque de se tromper en rejetant l'hypothèse serait plus important qu'avec le test de Jarque-Bera.

Résultats des tests de normalité (distribution normale)

Les résultats qui suivent concernent le second échantillon, avec dans un premier temps, le Q-Q plot.

Contrairement à ce que nous avons observé pour le premier échantillon, nous remarquons ici un fort écart à la normalité.

Q-Q plot (distribution Uniforme)

Cet écart est confirmé par les tests ci-dessous qui permettent d'affirmer sans hésitation que l'on doit rejeter l'hypothèse de normalité de l'échantillon.

Résultats des tests de normalité (distribution uniforme)

Conclusion

En conclusion, dans ce tutoriel, nous avons vu comment générer deux échantillons, l'un suivant une loi normale, l'autre suivant une loi uniforme. Par la suite, nous avons appliqué les tests de Shapiro-Wilk et celui de Jarque-Bera sur les échantillons. Les tests n'ont pas rejeté l'hypothèse de normalité pour le premier échantillon, alors qu'ils l'ont infirmée pour le second échantillon.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283