Solution d'analyse de données

Quelle-est la différence entre Moyennes Observées et Moyennes Estimées ?

20/10/2017

Cet article souligne la différence entre les moyennes estimées à partir de modèles tels que l’ANOVA et les moyennes arithmétiques observées calculées à la main. Une illustration sur Excel et XLSTAT est également développée.

Quelques définitions : Moyennes Observées et Moyennes Estimées

Dans cet article, nous ferons souvent référence à deux types de moyennes définies comme suit :
  • Moyennes Observées : Moyennes arithmétiques calculées à la main directement sur les données sans recours à un modèle statistique.
  • Moyennes Estimées - LS Means en anglais : Moyennes calculées à partir de modèles linéaires tels que l’ANOVA.  

Jeu de données pour illustrer la différence entre les moyennes observées et estimées

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant sur le bouton ci-dessous :

Téléchargez les Données
Les données correspondent à plusieurs notations de deux produits A et B par deux juges. Les données sont déséquilibrées parce que le nombre de notations pour chaque produit diffère en fonction du juge.

ANOVA à 1 facteur : moyennes observées et estimées ne changent pas

Imaginez une situation où les deux juges ne notent qu’un seul et même produit. Chaque juge note le produit à plusieurs reprises. Nous souhaitons comparer la notation moyenne par juge. Dans ce cas, la moyenne observée pour chaque juge sera exactement la même que la moyenne estimée par une ANOVA à un facteur.
Juge Note
1 4
1 10
1 4
1 5
1 6
1 8
2 9
2 5
2 7
2 9
2 5
2 6
2 10
Le juge 1 a une note moyenne de 6,2 et le juge 2 une note moyenne de 7,3.
Les moyennes observées et estimées deviennent différentes lorsqu’il est question de modèles un peu plus complexes, tels que les ANOVA déséquilibrées à plusieurs facteurs impliquant des interactions.

ANOVA déséquilibrées à plusieurs facteurs : Moyennes observées et estimées diffèrent

Considérons le jeu de données initial où chaque juge note deux produits tel que :
  • Juge 1 x Produit A : 6 répétitions
  • Juge 1 x Produit B : 10 répétitions
  • Juge 2 x Produit A : 7 répétitions
  • Juge 2 x Produit B : 4 répétitions
Une manière typique d’analyser ce type de dispositif est d’utiliser une ANOVA à 2 facteurs avec un terme d’interaction (Juge x Produit dans ce cas). Il s’agit d’un dispositif déséquilibré puisque le nombre de répétitions n’est pas le même pour toutes les combinaisons de catégories Juge x Produit.
Calculons à présent les moyennes observées et estimées de notation par juge.

Moyennes observées :

La moyenne du Juge 1 est la moyenne des 16 notations exécutées par le Juge 1 (6 pour le produit A et 10 pour le produit B).

La moyenne du Juge 2 est la moyenne des 11 notations exécutées par le Juge 2 (7 pour le produit A et 4 pour le produit B).

Moyennes estimées :

La moyenne du Juge 1 est la moyenne de deux chiffres :
1) La moyenne des 6 notes pour le produit A testé par ce Juge.
2) La moyenne des 10 notes pour le produit B testé par ce Juge.
La moyenne du Juge 2 est la moyenne de deux chiffres :
1) La moyenne des 7 notes pour le produit A testé par ce Juge.
2) La moyenne des 4 notes pour le produit B testé par ce Juge.

Les valeurs

Voici les valeurs obtenues pour les deux types de moyennes :

XLSTAT Moyennes Estimées VS Observées

Pourquoi privilégier les moyennes estimées par rapport aux moyennes observées ?

Dans les dispositifs déséquilibrés à plusieurs facteurs, on considère souvent que les moyennes estimées se rapprochent plus de la réalité en comparaison aux moyennes observées. Elles corrigent en quelque sorte le déséquilibre se trouvant dans les données. Les moyennes estimées donnent le même poids à chacun des produits pour estimer la moyenne de notation de chaque juge. En guise de comparaison, si on considère le juge 1, la moyenne observée incorpore un poids de 6 pour le produit A et un poids de 10 pour le produit B, ce qui donne une estimation biaisée en faveur du produit B.

Pour les dispositifs équilibrés, ou pour les ANOVAs à un facteur déséquilibrées, les moyennes observées et estimées sont les mêmes.

Comment obtenir les moyennes estimées dans Excel avec XLSTAT ?

Lorsque vous exécutez une ANOVA avec les paramètres par défaut dans XLSTAT, le logiciel calcule les moyennes estimées.

Après l’ouverture de XLSTAT, allez dans Modélisation des données / ANOVA.


XLSTAT Menu Modélisation des Données, ANOVA

Dans l’onglet Général, sélectionnez les notes en tant que variable dépendante quantitative. Sélectionnez les juges et les produits dans les variables explicatives qualitatives.

XLSTAT ANOVA boite de dialogue, onglet Général

Dans l’onglet Options, activez l’option Interactions / Niveau, et paramétrez le niveau d’interactions à 2. 

XLSTAT ANOVA boite de dialogue, onglet Options

Dans l’onglet Sorties / Moyennes, activez l’option Moyennes Estimées.

XLSTAT ANOVA boite de dialogue, onglet Sorties / Moyennes

Cliquez OK.

XLSTAT ANOVA Boîte de Dialogue Facteurs & Interactions

Activez tous les facteurs et interactions, puis cliquez sur OK.

Les moyennes estimées pour chaque effet apparaissent à la fin du rapport de résultats :

XLSTAT ANOVA sorties LS Means dans Excel

Nous contacter

Envoyer un email au service commercial

Contacter notre équipe de support technique : support@xlstat.com

https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283