Quelle-est la différence entre Moyennes Observées et Moyennes Estimées ?
Cet article souligne la différence entre les moyennes estimées à partir de modèles tels que l’ANOVA et les moyennes arithmétiques observées calculées à la main. Une illustration sur Excel et XLSTAT est également développée.
Quelques définitions : Moyennes Observées et Moyennes Estimées
Dans cet article, nous ferons souvent référence à deux types de moyennes définies comme suit :
-
Moyennes Observées : Moyennes arithmétiques calculées à la main directement sur les données sans recours à un modèle statistique.
-
Moyennes Estimées - LS Means en anglais : Moyennes calculées à partir de modèles linéaires tels que l’ANOVA.
Jeu de données pour illustrer la différence entre les moyennes observées et estimées
Les données correspondent à plusieurs notations de deux produits A et B par deux juges. Les données sont déséquilibrées parce que le nombre de notations pour chaque produit diffère en fonction du juge.
ANOVA à 1 facteur : moyennes observées et estimées ne changent pas
Imaginez une situation où les deux juges ne notent qu’un seul et même produit. Chaque juge note le produit à plusieurs reprises. Nous souhaitons comparer la notation moyenne par juge. Dans ce cas, la moyenne observée pour chaque juge sera exactement la même que la moyenne estimée par une ANOVA à un facteur.
Juge | Note |
---|---|
1 | 4 |
1 | 10 |
1 | 4 |
1 | 5 |
1 | 6 |
1 | 8 |
2 | 9 |
2 | 5 |
2 | 7 |
2 | 9 |
2 | 5 |
2 | 6 |
2 | 10 |
Le juge 1 a une note moyenne de 6,2 et le juge 2 une note moyenne de 7,3.
Les moyennes observées et estimées deviennent différentes lorsqu’il est question de modèles un peu plus complexes, tels que les ANOVA déséquilibrées à plusieurs facteurs impliquant des interactions.
ANOVA déséquilibrées à plusieurs facteurs : Moyennes observées et estimées diffèrent
Considérons le jeu de données initial où chaque juge note deux produits tel que :
-
Juge 1 x Produit A : 6 répétitions
-
Juge 1 x Produit B : 10 répétitions
-
Juge 2 x Produit A : 7 répétitions
-
Juge 2 x Produit B : 4 répétitions
Une manière typique d’analyser ce type de dispositif est d’utiliser une ANOVA à 2 facteurs avec un terme d’interaction (Juge x Produit dans ce cas). Il s’agit d’un dispositif déséquilibré puisque le nombre de répétitions n’est pas le même pour toutes les combinaisons de catégories Juge x Produit.
Calculons à présent les moyennes observées et estimées de notation par juge.
Moyennes observées :
La moyenne du Juge 1 est la moyenne des 16 notations exécutées par le Juge 1 (6 pour le produit A et 10 pour le produit B).
La moyenne du Juge 2 est la moyenne des 11 notations exécutées par le Juge 2 (7 pour le produit A et 4 pour le produit B).
Moyennes estimées :
La moyenne du Juge 1 est la moyenne de deux chiffres :
-
La moyenne des 6 notes pour le produit A testé par ce Juge.
-
La moyenne des 10 notes pour le produit B testé par ce Juge.
La moyenne du Juge 2 est la moyenne de deux chiffres :
-
La moyenne des 7 notes pour le produit A testé par ce Juge.
-
La moyenne des 4 notes pour le produit B testé par ce Juge.
Les valeurs
Voici les valeurs obtenues pour les deux types de moyennes :
Pourquoi privilégier les moyennes estimées par rapport aux moyennes observées ?
Dans les dispositifs déséquilibrés à plusieurs facteurs, on considère souvent que les moyennes estimées se rapprochent plus de la réalité en comparaison aux moyennes observées. Elles corrigent en quelque sorte le déséquilibre se trouvant dans les données. Les moyennes estimées donnent le même poids à chacun des produits pour estimer la moyenne de notation de chaque juge. En guise de comparaison, si on considère le juge 1, la moyenne observée incorpore un poids de 6 pour le produit A et un poids de 10 pour le produit B, ce qui donne une estimation biaisée en faveur du produit B.
Pour les dispositifs équilibrés, ou pour les ANOVAs à un facteur déséquilibrées, les moyennes observées et estimées sont les mêmes.
Comment obtenir les moyennes estimées dans Excel avec XLSTAT ?
Lorsque vous exécutez une ANOVA avec les paramètres par défaut dans XLSTAT, le logiciel calcule les moyennes estimées.
Après l’ouverture de XLSTAT, allez dans Modélisation des données / ANOVA.
Dans l’onglet Général, sélectionnez les notes en tant que variable dépendante quantitative. Sélectionnez les juges et les produits dans les variables explicatives qualitatives.
Dans l’onglet Options, activez l’option Interactions / Niveau, et paramétrez le niveau d’interactions à 2.
Dans l’onglet Sorties / Moyennes, activez l’option Moyennes Estimées.
Cliquez OK.
Activez tous les facteurs et interactions, puis cliquez sur OK.
Les moyennes estimées pour chaque effet apparaissent à la fin du rapport de résultats :
Cet article vous a t-il été utile ?
- Oui
- Non