Solution d'analyse de données

Analyse de données CATA (check-all-that-apply) dans Excel

20/10/2017

Jeu de données pour l’analyse de données CATA avec XLSTAT

Pour ce tutoriel, nous utiliserons des données fournies par Ares et al. (2014). Elles correspondent au jugement de 6 produits (5 produits réels et un idéal) par 119 consommateurs et sur 15 attributs. Les données sont enregistrées avec un format binaire (0 : attribut non coché ; 1 : attribut coché). Puis chaque consommateur donne une note d’appréciation (0-10) à chaque produit, à l’exception du produit idéal.

Les données sont disposées  avec un format vertical, ce qui signifie qu’il y a une ligne par combinaison de consommateur et de produit.

Une feuille Excel contenant les données et les résultats peut être téléchargée en cliquant ici.

But de ce tutoriel sur l’analyse de données CATA avec XLSTAT

L’objectif de ce tutoriel est d’effectuer une analyse CATA (check-all-that-apply) afin de caractériser des produits testés par des consommateurs.

Mise en place d’une analyse CATA avec XLSTAT

Afin d’effectuer une analyse CATA, cliquer sur XLSTAT- Analyse de données sensorielles / analyse de données CATA

XLSTAT menu Analyse de données sensorielles CATA FR

Dans l’onglet Général, sélectionner un format vertical des données. Sélectionner le tableau des attributs dans le champ Données CATA. Ensuite, sélectionner les colonnes Consommateur, Produit et appréciation dans les champs JugesProduits et Données de préférence, respectivement. Saisir l’identifiant du produit idéal dans le champ correspondant.

cata general

Dans l’onglet Options(1), sélectionnez la distance du Khi² pour l’Analyse Factorielle des Correspondances.

Options(1) cata

Cliquer sur le bouton OK. Une boîte de dialogue apparaît et permet à l’utilisateur de sélectionner et valider les axes affichés sur le graphique de l’analyse factorielle des correspondances. Les résultats s’affichent par la suite.

Interpréter les résultats d’une analyse CATA avec XLSTAT - première partie

Le premier tableau ne prend en compte que les données des attributs portant sur les produits réels. La première colonne contient les p-values associées aux tests Q de Cochran qui comparent les produits indépendamment pour chaque attribut. Les autres colonnes contiennent les proportions de 1 parmi les juges pour chaque combinaison de produit et d’attribut.

Une proportion élevée signifie que l’attribut est souvent coché par les consommateurs pour le produit considéré. 

cata cochran

Pour un attribut donné, le test Q de Cochran permet de tester l’effet d’une variable explicative (Produits) sur la validation ou la non-validation de l’attribut par les consommateurs. Une p-value se trouvant en dessous du seuil de significativité indique que les produits sont significativement différents les uns des autres. Si tel est le cas, nous pouvons nous intéresser aux comparaisons multiples par paires représentées par les petites lettres à l’intérieur des cellules du tableau : deux produits partageant la (les) même(s) lettre(s) ne sont pas significativement différents. Deux produits n’ayant aucune lettre en commun sont significativement différents.

A l’exception des attributs relatifs à l’odorat (sans odeur et odeur intense), tous les attributs sont associés à des p-values significatives au seuil 0.05. Par exemple, si on considère l’attribut croustillant, le produit 257 est le plus croustillant. Cependant, il n’est pas significativement plus croustillant que le 548 (cf. lettres). Les produits 992 et 366 sont les moins croustillants et ne sont pas significativement différents l’un de l’autre.

La table de contingence qui suit correspond à une somme des tableaux d’attributs, juge par juge. Elle est utilisée pour effectuer une analyse factorielle des correspondances (AFC).

Le test d’indépendance entre les lignes et les colonnes (résultat disponible pour l’AFC classique uniquement (utilisant la distance du Khi²)). La p-value étant inférieure au niveau de signification (0.05), nous pouvons conclure qu’il y a une forte probabilité pour que de vraies différences existent entre les produits. 

La table des valeurs propres et le graphique correspondant permettent de vérifier la qualité de l’analyse. La qualité de l’analyse est bonne (90.39% d’inertie expliquée sur les deux premières dimensions). 

 

cata ca

Selon le plan de projection, un produit idéal doit être relativement goûteux, juteux, croustillant, ferme et sucré et doit avoir une odeur intense et un goût de pomme. Par ailleurs, il ne devrait pas être trop aigre, amer, astringent, granuleux, doux, farineux, sans goût et sans odeur. Le produit 548 semble se rapprocher le plus du produit idéal, alors que le produit 106 en est loin à cause de son amertume, son aigreur et son astringence. Les produits 366 et 992 sont également relativement éloignés du produit idéal.

Pour plus d’information sur l’analyse factorielle des correspondances, cliquez ici.

Le résultat qui suit est une matrice des corrélations contenant attributs (corrélations tétrachoriques) et données de préférence (corrélations bisérielles, dernière ligne). La matrice contient quelques corrélations fortes. La corrélation négative entre aigre et sucré indique que lorsque les juges cochent l'attribut sucré, ils cochent rarement l'attribut aigre, et vice-versa. Les scores d'appréciation semblent positivement (même si légèrement) corrélés aux attributs liés au produit idéal dans l'analyse des correspondances (juteux, goûteux, goût de pomme).

cata correlation matrix

Les corrélations sont analysées par Analyse en Coordonnées Principale (PCoA) et les résultats sont représentés sur un plan de projection. Les deux premières dimensions expliquent 40.78% des variations et le Scree plot montre que les deux premières dimensions sont suffisantes pour interpréter les relations entre attributs. On retrouve ici l’appréciation liée aux attributs juteux, goûteux et goût de pomme. 

cata coordinate analysis

Pour plus d’information sur l’Analyse en Coordonnées Principales, veuillez cliquer ici

 

Interpréter les résultats d’une analyse CATA avec XLSTAT - deuxième partie

Lorsque des données d’appréciation sont disponibles, les résultats suivent sont ceux de la penalty analysis.

Une première analyse basée sur les incongruences pour lesquelles l’attribut est coché pour le produit idéal mais pas pour le produit réel permet d’identifier les attributs nécessaires. Un tableau de comparaison contient les fréquences d’apparition de P(Non)|(Oui) et P¨(Oui)|(Oui) pour chaque attribut. Le graphique qui suit permet de visualiser ces fréquences ainsi que les pourcentages d’occurrence de ces deux situations. 

cata penalty 1

Les différences de moyenne d’appréciation entre les deux situations sont présentées pour chaque attribut et leur significativité est testée. Par exemple, l’attribut ferme implique une augmentation de 1.5 points d’appréciation entre les produits réels et le produit idéal. Cette augmentation est significative à 0.05 (p < 0.0001).

Remarque : si aucun produit idéal n’a pas été évalué, cette analyse est remplacée par l’analyse de présence et absence des attributs. 

cata penalty 1

Le graphique des effets sur la moyenne contient les attributs avec un effet sur la moyenne significatif. Les augmentations de moyenne sont représentées en bleues et correspondent aux attributs nécessaires, les chutes de moyennes sont représentées en rouge. 

cata penalty 1

Le graphique Effets sur la moyenne vs % permet d’identifier clairement les attributs nécessaires. L’axe des Y correspond aux différences entre cellule [1,1] (coché pour idéal et produit) et cellule [0,1] (coché uniquement pour idéal). L’axe des X représente le pourcentage d’entrées incluant une coche du produit idéal sans que le produit réel ne soit coché, ce qui correspond à une situation où l’attribut décrit bien le produit idéal mais est relativement peu ressenti dans les produits réels. Ainsi, les attributs associés à des coordonnées élevées sur les deux axes (goûteux, sucré, juteux, goût de pomme, croquant, ferme, odeur intense) apparaissent là encore en tant que nécessaires.

cata penalty 1

Une deuxième analyse, similaire à la première mais basée sur les incongruences pour lesquelles l’attribut est coché pour le produit réel mais pas pour le produit idéal permet d’identifier les attributs intéressants.

Remarque : cette analyse n’est effectuée que quand un produit idéal a été évalué.

Le graphique des effets sur la moyenne contient les attributs avec un effet sur la moyenne significatif. Les augmentations de moyenne sont représentées en bleues et correspondent aux attributs intéressants, les chutes de moyennes sont représentées en rouge et correspondent aux attributs négatifs

cata penalty 1

Le graphique Effets sur la moyenne permet d’identifier clairement les attributs négatifs et les attributs intéressants. L’axe des Y correspond aux différences entre cellule [0,0] (pas coché pour idéal et produit) et cellule [1,0] (coché uniquement pour produit). L’axe des X représente le pourcentage d’entrées incluant une coche du produit réel sans que le produit idéal ne soit coché, ce qui correspond à une situation où l’attribut décrit bien les produits réels mais est relativement peu coché pour le produit idéal. Ainsi, les attributs associés à une coordonnée basse sur l’axe des Y (acide, amer, mou, farineux, granuleux, sans goût et sans odeur) apparaissent là encore en tant que négatifs. Les attributs associés à une coordonnée forte sur l’axes des Y sont intéressants.

cata penalty 1

Les deux analyses présentées ci-dessus sont ensuite résumées sur un plan de projection. Ici encore, goûteux, sucré, goût de pomme, ferme, craquant et odeur intense apparaissent comme nécessaires, et acide, amer, astringent, mou, farineux, granuleux, sans goût et sans odeur apparaissent comme négatifs. 

cata penalty 1

Ensuite, une série de tableaux 2x2 (un tableau par attribut) est affichée. En lignes, les valeurs enregistrées pour le produit idéal ; en colonnes, les valeurs obtenues pour les produits testés. Les cellules du tableau contiennent les préférences moyennes (moyennées sur les juges et les produits) et le % de tous les cas associés à la combinaison correspondante de 0s et/ou de 1s.

Pour un attribut donné, si l'attribut est coché pour le produit idéal (seconde ligne), et si la préférence pour les produits cochés (cellule [1,1]) est supérieure à la préférence pour les produits non cochés (cellule [1,0]), alors l'attribut est « nécessaire ». Symétriquement, si l'attribut n'est pas coché pour le produit idéal (première ligne) et si la préférence pour les produits non cochés (cellule [0,0]) est supérieure à la préférence pour les produits cochés (cellule [0,1]), alors l'attribut est « négatif ». Si l'attribut n'est pas coché pour le produit idéal (première ligne) et si la préférence pour les produits cochés (cellule [0,1]) est comparable à celle pour les produits non cochés (cellule [0,0]) alors l'attribut est « indifférent ». Si (cellule [0,1]) > (cellule [0,0]), alors l'attribut est « intéressant ». 

Par exemple, pour l’attribut « goûteux », 28% des entrées relatives aux produits excepté le produit idéal sont cochées pour le produit en question et pour le produit idéal à la fois. La moyenne de l’appréciation pour ces entrées est de 7.8.

 

xlstat penalty table

Dans le tableau final de synthèse, nous remarquons que 6 attributs parmi les 15 sont nécessaires et 7 attributs sont négatifs. Les 2 autres attributs sont indifférents.

xlstat penalty table

 

Bibliographie

Ares G, Daubera C, Fernándeza E, Giméneza A, Varelab P (2014). Penalty analysis based on CATA questions to identify drivers of liking and directions for product reformulation. Food Quality and Preference, 32A, 65-76.

Meyners M., Castura J. C., Carr B. T. (2013). Existing and new approaches for the analysis of CATA data. Food Quality and Preference, 30(2), 309-319.

 

 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Chargement
il y a quelques secondes
il y a une minute
il y a quelques minutes
il y a une heure
il y a quelques heures
il y a un jour
il y a quelques jours
à propos de
false
Caractères non valides trouvés
/customer/portal/articles/autocomplete
9283