Solution d'analyse de données

Echantillonnage stratifié dans Excel

02/04/2019

Ce tutoriel explique comment générer un sous-échantillon d'observations à partir d'un jeu de données en utilisant la méthode d'échantillonage stratifié dans Excel avec le logiciel XLSTAT. 

Jeu de données pour un échantillonnage stratifié

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :

Télécharger les données

Le jeu de données utilisé dans ce tutoriel correspond à la liste des employés d'une compagnie ainsi que certaines données sur leur genre (homme/femme) et leur type de temps de travail (plein temps/temps partiel). L'équipe des ressources humaines veut conduire une enquête sur les conditions de travail dans l'entreprise qui sera représentative de l'opinion générale sans interroger la totalité des employés. Ils vont donc faire un échantillonnage stratifié.

Il y a 46% de femme et 54% d'homme dans l'entreprise. Les employés à temps partiel sont majoritairement des femmes 25 % du total contre 9% pour les hommes.

data-sampling-descriptive-statistique.png

Un classeur Excel contenant à la fois les données et les résultats peut être téléchargé ici.

Paramétrer un échantillonnage stratifié

Ouvrez la boîte de dialogue Echantillonnage de données qui est accessible via le menu Préparation des données.

Menu Préparation des données dans XLSTAT

Sélectionnez toutes les données disponibles en sélectionnant les quatre colonnes (employés, genre, temps de travail, strate).

Choisissez l'option Aléatoire stratifié (2). Cette option prend en compte les proportions dans chaque strate.

Nous voulons sélectionner seulement 20 employés pour répondre à l'enquête. Entrez la valeur "20" pour le Taille de l'échantillon.

Dans le champs Strates, vous pouvez soit sélectionner la colonne "Strate" du jeu de données soit les variables qui doivent définir les strates ici les deux variables "Genre" et "Temps de travail".

Le nom des variables est inclus dans le jeu de donnée il faut donc cocher la case Libellés des variables.

Par contre, il n'est pas nécessaire de changer l'ordre des résultats donc on ne sélectionne pas l'option Mélanger.

Quand vous avez fini de paramétrer la boîte de dialogue, cliquez sur OK.
Échantillonnage de données dans XLSTAT

Résultats d'un échantillonnage stratifié

Les résultats de l'échantillonnage stratifié apparaissent dans une nouvelle feuille Excel "Echantillonnage des données". Vous trouvez une table de 20 échantillons, vous n'aurez probablement pas les mêmes résultats car il y a un tirage au hasard des échantillons à inclure. Cependant vous devez avoir le même nombre d'échantillon par starter, soit :

  • 4 femmes employées à plein temps,
  • 5 femmes employées à temps partiel,
  • 9 hommes employés à temps plein,
  • 2 hommes employés à temps partiel.

data-sampling-result.png

Ci-dessous vous avez les statsitiques descriptives qui sont calculées sure l'échantillon stratifié. Celles-ci sont comparés aux statistiques de la population : 

  • un échantillon de 20% pour représenter les 22% de femme employées à temps plein de la population,
  • un échantillon de 25% pour représenter les 25% de femme employées à temps partiel de la population,
  • un échantillon de 45% pour représenter les 44% d'homme employés à temps plein de la population,
  • un échantillon de 10% pour représenter les 9% d'homme employés à temps partiel de la population.

data-sampling-result-2.png

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283