Modèle de Bradley-Terry généralisé dans Excel
Jeu de données pour appliquer un modèle de Bradley-Terry
Les données correspondent à celles utilisées dans le livre d’Agresti [Agresti, A. (1990). Categorical Data Analysis. Wiley]. Il s’agit des résultats des matchs de baseball de la ligue américaine de l’année 1987.
Le but est d’ajuster un modèle de Bradley-Terry en tenant compte de l’avantage à domicile.
Format des données pour appliquer un modèle de Bradley Terry sur des comparaisons multiples
Le format classique utilisé est le suivant :
Chaque paire d'équipes est comparé et le nombre de victoires associées à chacune est reporté dans les deux colonnes suivantes. Si la notion d'égalité est utilisée, il faut une colonne supplémentaire avec le nombre d'égalités. Si la notion d'avantage à domicile est utilisée alors c'est l'équipe de la première colonne qui est considérée comme à domicile.
Paramétrer un modèle de Bradley-Terry avec avantage à domicile
Une fois XLSTAT ouvert, sélectionnez la commande XLSTAT / Analyse de données sensorielles / Modèle de Bradley-Terry généralisé, ou cliquez sur le bouton correspondant dans la barre de menu.
La boîte de dialogue Modèle de Bradley-Terry généralisé apparaît.
Le format des données est tableau Paires/Variables car les données sont représentées sous forme de 2 tableaux. Le premier correspond au tableau des rencontres entre les équipes. Le second tableau est celui des résultats : la première colonne correspond au nombre de victoires de la première équipe et la seconde au nombre de défaites. L’option Tableau croisé correspond au cas où les données sont représentées sous forme d’une table de contingence.
Dans l’onglet Options, on trouve plusieurs méthodes d’inférence avec différentes options associées (Domicile, Egalités, Conditions d’arrêt de l’algorithme, Choix des hyperparamètres). On trouve également la possibilité de régler le niveau de l’intervalle de confiance des paramètres du modèle. Nous choisissons ici une inférence via un algorithme EM bayésien avec l’option Domicile et nous laissons l’ensemble des autres paramètres aux valeurs par défaut.
Lancez les calculs en cliquant sur OK. Les résultats sont affichés dans une nouvelle feuille Excel.
Interpréter les résultats d'un modèle de Bradley-Terry
Les premiers résultats affichés sont les statistiques descriptives pour chaque équipe.
Ci-dessous sont présentés les résultats obtenus pour les données disponibles. On peut remarquer ici que le paramètre correspond à l’avantage à domicile est estimé à 1,76, ce qui signifie que le fait d’être à domicile augmente les chances de victoire sur une autre équipe.
Les probabilités de victoire sont ensuite affichées, suivies d’un graphique permettant de comparer rapidement ces probabilités. Par exemple, sachant que l’équipe de Détroit est à domicile, la probabilité qu’elle batte l’équipe de Cleveland est de 0,776. Nous voyons grâce au graphique que c’est la probabilité la plus élevée, toutes paires d’équipes confondues.
D'autres applications sont possibles comme par exemple la comparaison de produits.
Cet article vous a t-il été utile ?
- Oui
- Non