Solution d'analyse de données

Test t de Student sur deux échantillons indépendants

20/10/2017

Jeu de données pour réaliser un test t de Student sur deux échantillons indépendants

Une feuille Excel contenant le jeu de données et les résultats est disponible en suivant ce lien.

Les données proviennent de l'étude de Fisher [Fisher M. (1936), The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, 179 -188]. Le jeu de données contient des informations descriptives sur 100 iris, à savoir la longueur et largeur des sépales et pétales. Le jeu de données d'origine contient les informations de 150 fleurs appartenant à 3 espèces différentes. Dans ce tutoriel nous n'utilisons que deux espèces : versicolor et virginica.

Le but de ce tutoriel est de tester pour les 4 variables descriptives s'il y a une différence significative entre les deux espèces. 

iris_versicolor.jpgiris_virginica.jpg

Iris versicolor et virginica.

Paramétrer un test t de Student sur deux échantillons indépendants

Une fois XLSTAT ouvert, sélectionnez la commande XLSTAT / Tests paramétriques / Tests t et z pour deux échantillons, ou cliquez sur le bouton correspondant dans la barre de menu.

Test t de Student sur deux échantillons indépendants : Menu

La boîte de dialogue Tests t et z pour deux échantillons apparaît.

Le format des données est une colonne par variable car les données pour les deux échantillons sont dans le même tableau. L'option une colonne par échantillon correspond au cas où les données sont dans des tableaux différents par échantillon. La troisième option correspond au cas où les échantillons sont appariés.

Nous allons faire un test t de Student et non pas un test z.

Test t de Student sur deux échantillons indépendants : Boîte de dialogue

Dans l'onglet Options, nous laissons les options par défaut, par contre dans l'onglet Graphiques, il faut activer l'option diagramme de dominance.

Test t de Student sur deux échantillons indépendants : Boîte de dialogue - Options

Lancez  les calculs en cliquant sur OK. Les résultats sont affichés dans une nouvelle feuille Excel.

Interpréter les résultats d'un test t de Student sur deux échantillons indépendants

Les premiers résultats affichés sont les statistiques descriptives pour chaque échantillon. Ensuite viennent les résultats du test pour chaque variable les uns après les autres.

Ci-dessous sont les résultats pour la première variable : Longueur Sépales. Le test présente une p-value inférieure au seuil de 5% on peut donc rejeter l'hypothèse nulle et conclure que la longueur des sépales est significativement différente entre les deux espèces.

Test t de Student sur deux échantillons indépendants : Résultats

Le diagramme de dominance permet de comparer visuellement les deux échantillons. Le premier échantillon est représenté sur l'axe des abscisses et le second sur l'axe des ordonnées. Ici l'on peut voir que la longueur des sépales est plus importante pour l'espèce Virginica.

Test t de Student sur deux échantillons indépendants : Diagramme de dominance

Le test permet de conclure que toutes les variables sont significativement différentes pour les deux espèces.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283