Quel outil de statistiques descriptives choisir ?
Guide de choix d’outil de statistiques descriptives en fonction de la situation
La description statistique est une partie essentielle d’une analyse statistique qui permet d’avoir un premier aperçu pertinent de vos données avant d’utiliser des méthodes plus avancées. Dans cet objectif, plusieurs outils numériques (ex : moyenne, mode, variance…) et graphiques (ex : histogramme, boîte à moustaches) existent qui permettent de résumer un ensemble de données et d’étudier ses caractéristiques comme la tendance centrale et la dispersion. Ces outils peuvent être également utilisés pour décrire l’association parmi plusieurs variables.
Le choix d’un outil de statistiques descriptives peut être lié aux caractéristiques des variables, comme leur type et leur nombre, ainsi qu’à l’objectif de l’étude. Nous avons préparé une grille qui vous aidera à choisir une méthode appropriée selon votre situation.
La première colonne de la grille ci-dessous concerne le type de données à étudier. Trois types de données sont présentés :
-
Quantitatives : il s'agit de variables qui décrivent une quantité. Elles s’expriment en valeurs numériques (ex : l’âge, la taille, le poids).
-
Qualitatives : réfèrent des variables qui décrivent une qualité non-quantifiable (ex: la couleur). Ces variables sont également appelées catégorielles ou nominales. Les valeurs d’une telle variable sont appelées modalités, catégories ou niveaux (ex : vert, rouge...).
-
Mixtes : incluent des variables quantitatives et qualitatives.
La deuxième colonne indique le nombre de variables. Les solutions proposées sont appropriées à la description d’une variable (analyse univariée) ou la description de l’association entre deux (analyse bivariée) ou plusieurs variables. La grille inclut également des exemples pour chaque situation.
La grille
Les solutions affichées sont les tests les plus courants en statistiques descriptives. Elles sont toutes disponibles dans XLSTAT. La liste n’est cependant pas exhaustive. D’autres situations / outils existent.
Description des données | Objectif | Exemple | Outil numérique | Outil graphique |
---|---|---|---|---|
Quantitatives | Une variable (analyse univariée) | Obtenir la distribution de fréquences | Combien d’individus par groupe d’âge ont assisté à cet évènement? (ici la variable étudiée est l’âge en tant que variable quantitative) | Tableau des fréquences |
Mesurer la tendance centrale d’un échantillon | Quelle est la note moyenne de cette classe ? | Moyenne, médiane, mode | Boîtes à moustache (box plots) Scattergram Strip plot | |
Mesurer la dispersion d’un échantillon | Comment les notes de cette classe sont dispersées autour de la note moyenne ? | Amplitude, écart-type, variance, coefficient de variation, quartiles | Boîtes à moustache Scattergram Strip plot | |
Etudier les caractéristiques de forme d’une distribution | Les salaires des employés dans cette société suivent-ils une distribution symétrique ? | Coefficients d’asymétrie et d’aplatissement | Histogramme | |
Contrôler visuellement si un échantillon suit une distribution donnée | identifier le pourcentage d'élèves théorique ayant des notes supérieures à un seuil | Diagrammes de probabilité | ||
Mesurer la position d’une valeur au sein d’un échantillon | Quelle valeur sépare les 5% supérieurs des données ? (95% centile) | Quantiles/centiles | Boîtes à moustache | |
Détecter des valeurs extrêmes | La hauteur de 184cm est-elle une valeur extrême pour cette équipe de basket ? | Boîtes à moustache | ||
Deux variables (analyse bivariée) | Décrire l’association entre deux variables quantitatives | La biomasse de plante change-t-elle avec la concentration de Pb ? | Coefficients de corrélation | Carte de corrélation Nuage de points |
Plusieurs variables | Décrire l’association entre plusieurs variables quantitatives | Quelle est l’évolution du taux de fertilité, de l’espérance de vie et de la population dans ce pays de 2010 à 2015 ? | Coefficients de corrélation | Motion charts (jusqu’à 3 variables + une variable temps) Nuage de points (jusqu’à 3 variables) |
Décrire l’association entre trois variables quantitatives sous des conditions spécifiques | Comment visualiser les proportions relatives de ces trois ingrédients mesurés sur 10 glaces ? | Diagramme ternaire | ||
Deux matrices avec plusieurs variables | Décrire l’association entre deux matrices de variables quantitatives | L’évaluation de 12 jus de canneberge varie-t-elle entre ces deux panels de juges ? | Coefficient RV | |
Qualitatives | Une variable (analyse univariée) | Obtenir la fréquence de différentes modalités | Combien de clients ont été satisfaits ou pas par le service ? | Tableau des fréquences (tri à plat) |
Détecter la modalité la plus fréquente | Quelle est la couleur des cheveux la plus courante dans ce pays ? | Mode | Diagramme en bâtons Diagramme en secteurs | |
Deux variables | Décrire l’association entre deux variables qualitatives | Comment un attribut change en fonction de la présence d’un autre attribut | Tableau de contingence (tri croisé) | Vue 3D du tableau de contingence Barres empilées Barres multiples |
Mixtes (quantitative & qualitative) | Deux variables | Décrire l’association entre une variable binaire et une variable continue | La concentration d’une molécule chez la souris change-t-elle en fonction du sexe de la souris (F/H) ? | Corrélation bisérielle |
Décrire l’association entre une variable qualitative et une variable continue | La longueur des sépales est-elle différente parmi trois espèces de fleurs ? | Statistiques descriptives univariées pour la variable quantitative par modalité de la variable qualitative | Boîtes à moustache | |
Trois variables | Décrire l’association entre une variable qualitative et deux variables quantitatives | Le montant d’argent dépensé sur un site commercial varie-t-il en fonction de l’âge et du revenu des clients ? | Nuage de points (avec la variable qualitative comme groupe) |
Source: Introductory Statistics: Exploring the World Through Data: Robert Gould and Collen Ryan
Cet article vous a t-il été utile ?
- Oui
- Non