メインコンテンツに移動
XLSTATはLumiveroグループに参加しています。詳しくはこちら

ExcelでのCATA Check-All-That-Apply分析チュートリアル

このチュートリアルは、XLSTATを用いてExcel内でCATA 分析をセットアップして解釈することを支援します。

XLSTATで利用可能なCATAデータセットを分析するもう1つの方法はこちらです: CATATIS 。 CATAデータで消費者を分類するには、CLUSCATA 法を使用してください。

XLSTATでCATA分析を実行するデータセット

このチュートリアルでは、Ares ら (2014)が提供するデータを使用します。それらは119人の消費者が15個の属性で6個の製品(5個の通常と1個の理想)を評価しています。データはバイナリ形式(0:チェックされていない属性; 1:チェックされた属性)で記録されています。さらに、すべての製品(理想のを除く)が各消費者により全体的に評価 (0-10) されています。

データは垂直形式で、消費者と製品の組み合わせごとに1行となっていることを意味します。

このチュートリアルの目的

このチュートリアルの目的は、消費者が味見する製品を評価するために、CATA (Check-All-That-Apply) 分析を実施することです。

XLSTATでのCATA分析のセットアップ

CATA分析を実施するには、XLSTAT-官能データ分析 / CATAデータ分析をクリックしてください。

一般タブで、まず垂直データ形式を選択していることを確認してください。CATA データ・フィールドで、属性表を選択してください。そして、消費者、製品、選好データ・フィールドで、それぞれ関連している列を選択してください。理想製品フィールドで、理想製品の識別子を取り込んでください。

データセットは釣り合っていなければなりません(各製品で1人の審査員)。

オプション(1) タブで、コレスポンデンス分析のカイ2乗距離、CATAデータ検証属性の独立性を選択します。

OK ボタンをクリックします。ダイアログ・ボックスが現れて、コレスポンデンス分析のグラフィカル表現で表示する軸を選択して確認します。

XLSTATでのCATA分析の結果の解釈- 第1部

最初の2つの表とグラフは、CATAデータの検証に関係します。まず最初に、他よりも多くまたは少なくチェックする審査員の検出が実行されます。我々の事例では、ほとんどの審査員が、全体の20%から35%をチェックしましたが、一部では特別な振る舞いがありました。たとえば、審査員27は、全体の7%だけチェックしました! そして、過度に多く使われる属性または使われない属性を検出するために、類似属性分析が実行されます。

そして、前の2つを組わせた分析が実行されます。これは、審査員あたり、および属性あたりのチェックのパーセンテージを示します。この分析は、その属性が合意的にチェックされているか否かを判断することができます。Juicy属性は、 一部の審査員が全体の80%以上チェックしているのに対して、その他は20%以下と対照的です。

任意の属性について、CochranのQ検定は、消費者がその属性を感じるか否かについて、説明変数(製品)の効果を検定することができます。有意しきい値よりも低いp値は、その製品が他とは有意に異なることを示します。p値が有意であれば、多重対比較を検討するとよいので、表のセル内で小文字で表されます:

  • 同じ文字を共有する2つの製品は、有意に異ならない。
  • 共通の文字を持たない2つの製品は、有意に異なる。

匂いに関する2つ (odourless と intense odour) を除くすべての属性が、0.05で有意なp値に関連づけられていることがわかります。たとえば、crispy 属性については、製品257 が最もよくチェックされています。しかながら、それは 548 よりも有意にもっとパリパリしている(crispier)ということはありません(文字を確認)。製品 992 と 366 は、あまりパリパリしておらず、お互いに有意に異なりません。

各製品で、これらの属性が冗長であるか否かを判断するために、属性独立性検定が実行されます。したがって、 製品 106では、属性 Juicy と Firm が冗長であることがわかります。

続く分割表は、全審査員での属性表の合計です。これはコレスポンデンス分析 (CA)を構築するのに使用されます。

行と列の間の独立が検定されます(この結果は(カイ2乗距離を用いる)伝統的なCAでのみ利用可能です)。p値が有意水準(0.05)よりも低いので、官能プロファイルの観点から製品間に実際の差が存在することが、かなり確からしいと結論づけられます。

固有値lの表と対応するプロットは、分析の品質を検証することができます。分析の品質は良好です(最初の2次元で合計イナーシャの92.17%を説明)。

分析のマップによると、理想製品は相対的にtastyで、juicyで、crispyで、firmで、sweetで、apple flavour(リンゴの香り)を持ちます。

一方、相対的にあまりsourではなく、bitterではなく、astringentではなく、grainyではなく、softではなく、mealyではなく、tastelessではありません。製品548が理想製品に最も近いようで、一方、製品106 は、その相対的にbitterness、sourness、astringencyからより遠いです。製品366 と992 も相対的に理想製品から遠いです。

コレスポンデンス分析に関するより詳細な情報が、こちら にあります。

そして、属性(四分相関)と嗜好(liking)スコア(双列相関相、最後の行)を含む相関行列が表示されます。いくつか強い相関が見られます。sweet とsourの間の負の相関は、人々がsourをチェックするとき、彼らはsweetをチェックしないことを示しています。また逆も真なりです。 嗜好スコアはコレスポンデンス分析で理想製品に関連づけられた属性(juicy, tasty, apple flavour)に-弱いものの-正に相関するようです。

主座標分析(PCoA) が相関係数に適用され、結果が2次元のマップで可視化されます。スクリープロットは、最初の2次元が属性間の関係性を解釈するのに十分であることを示しています。ここで再び、嗜好(liking)が属性juicy、tasty、apple flavourに関連してていることがわかります。

主座標分析に関するより詳細は、こちら にあります。

XLSTATでのCATA分析の結果の解釈- 第2部

嗜好データがあるとき、次の結果はペナルティ分析に関係します。

その属性が実際には欠損しているが、理想製品では欠損していないという不一致に基づく最初の分析は、must have(なければならない)属性を識別することが可能です。要約表は、各属性でP(No)|(Yes) および P(Yes)|(Yes)が発生する度数を示します。 続くグラフィカル表現は、これらの度数およびこれらの発生の記録のパーセンテージを示します。

そして、2つの状況の間での嗜好の平均降下(mean drops)が 、各属性で表現され、それらの有意度が検定されます。たとえば、firm 属性は、テストされた製品と理想製品の間で1.5 嗜好ポイントの増加を意味します。この増加は、0.05 (p < 0.0001)で有意です。

注意: 理想製品がない場合、この分析は属性の有無の分析に置き換えられます。

平均影響度チャートは、有意な平均影響度を持つ属性を示します。平均増加が青で表示され、“must have”として識別され、平均減少は赤で表示されます。

平均降下 vs % チャートも**“must have”** 属性を明らかに識別することができす。

  • Y軸は、消費者が製品と理想製品の両方をチェックする場合("属性分析"表のセル[1,1])と、理想製品のみをチェックする場合(セル[0,1])の商品評価の差に対応する。
  • X軸は、実際の製品がチェックされていない理想製品のチェックを含むエントリのパーセンテージを表す。 これは、その属性が理想製品をよく記述しているが、実際の製品では比較的少ししか感じられない状況に対応する。

したがって、X軸とY軸の両方で高い座標に関連づけられた属性 (tasty, sweet, juicy, apple flavour, crispy, firm) が、ここでも **“must have”**として現れます。

2番目の分析は、“nice to have” (あるとよい)属性を識別することができます。これは最初の分析に似ていますが、属性が理想製品で欠損しているが、実際の製品では欠損していないという不一致に基づきます。

注意: この分析は、理想製品があるときのみ利用可能です。

平均影響度チャートは、有意な平均影響度を持つ属性を示します。平均増加が青で表示され“nice to have”として識別され、平均減少が赤で表示され must not have(あってはならない)として識別されます。 ここで、属性 Sour のみが分析できました。

平均降下 vs % チャートも明らかに**“must not have” および “nice to have” attributes属性を識別することができます。

  • Y軸は、消費者が理想製品と製品のどちらもチェックしなかった場合("属性分析"表のセル[0.0])と商品をチェックした場合(セル[1.0])の製品評価の差に対応する。
  • X軸は、理想製品がチェックされていない実際の製品でのチェックを含む入力のパーセンテージを表す。これは、その属性が実際の製品をよく記述しているが、理想製品では比較的チェックされていない状況に対応する。

したがって、Y軸で低い座標に関連づけられている属性(astringent, bitter, grainy, tasteless, soft, mealy, sour)が、ここでも“**must not have”**として現れます。Y軸で高い座標に関連づけられた属性は、“nice to have”です。

前の2つの分析は、最終的に1つのマップに要約されます。ここで再び、tasty、sweet、apple flavour、firm、crispy、juicyが “must have“として現れ、sourは “must not have”として現れます。

そして、属性ごとに1個の 2x2 表が表示されます。各表の左側に理想製品で記録された値があり、上部に調査された製品で得られた値があります。表のセル内に、平均選好(全審査員と全製品での平均)があり、0と1のこの組み合わせに対応するすべての記録の%があります。

任意の属性について、それが理想製品でチェックされ(表の2行目)、かつチェックされた製品 (セル [1,1])の選好が、チェックされていない製品 (セル [1,0])の選好よりも有意に高ければ、その属性は, must haveです。

一方、理想製品で属性がチェックされておらず(表の1行目)、チェックされていない製品 (セル [0,0]) の選好が、チェックされた製品 (セル [0,1])の選好よりも有意に高いなら、その属性は must not have.です。

もし有意に (セル [0,1]) > (セル [0,0]) ならば、その属性はnice to haveです。 理想製品で属性がチェックされておらず(表の1行目)、つまり、それは must not have でも nice to haveでもなく、チェックされた製品(セル [0,1]) の選好がチェックされていない製品 (セル [0,0])の選好と同等であれば、その属性はdoes not harmです。

2つの製品の差の絶対値が1より低いなら、XLSTATはそれらを同等であるとみなします。最後に、ある属性が must have ではなく、チェックされた製品 (セル [1,1])の選好がチェックされていない製品 (セル [1,0])の選好と同等であれば、その属性はdoes not influence(影響しない)です。 いくつかの表が、3つの状況に対応し得ます。

XLSTATは、この順序で上記のルールの1つにリンクさせて、各2x2 表を単一の状況に関連付けようとします。

属性について決定をするために、XLSTATは母集団サイズについて選ばれたしきい値 (ダイアログ・ボックスのオプション 2 タブ)が尊重されていることをチェックすることに注意してください。たとえば、Firm 属性について、調査された(理想でない)製品の記録の 41% が、調査された製品と理想製品の両方でチェックされています。これらの記録の平均嗜好は 7.1です。

最後の要約表で、15個の属性中 6 個が “must have”であり、 1個が does not harm (害がない)であり、 1個の属性が must not have.であることがわかります。 残りの属性は、どのカテゴリにも関係づけできませんでした。

最後に、 理想と比較した各製品の誘発差のグラフィカル表現があります。各属性で、その製品が理想製品と類似しているか異なっているかがわかります。差の大きい属性ほど、より問題があり、グラフの左側に置かれます。逆に、特定の属性で、 製品が理想製品に類似しているほど、線が0に近づきます。差が負であれば、その属性は十分に存在しておらず、正であれば、存在しすぎていることになります。

理想製品との差が有意であるか否かを決定するために、信頼区間が使用されます。

チュートリアルの事例では、'製品 106 vs 理想製品' のグラフの最初のバーが表現する値は、次のように計算できます: (6/119) – 92/119) = 0,0504 – 0,7731 = -0,7227.

参考文献

Ares G., Dauber C., Fernández E., Giménez A., & Varela P. (2014). Penalty analysis based on CATA questions to identify drivers of liking and directions for product reformulation. Food Quality and Preference, 32A, 65-76.

Meyners M., Castura J. C., Carr B. T. (2013). Existing and new approaches for the analysis of CATA data. Food Quality and Preference, 30(2), 309-319.

この記事は役に立ちましたか?

  • ウイ
  • いいえ