メインコンテンツに移動

Excelでの官能パネル分析チュートリアル

官能パネル分析のためのデータセット

このチュートリアルで使用するデータは、衣料業界の官能テストでの経験を持つ15人のスキーヤー(以降、審査員という)による14種類のスキー・シューズの評価です。シューズを評価するために、6 個のディスクリプタが、15人の審査員によって使用されました。

パネル分析のセットアップ

XLSTAT を起動して、XLSTAT-官能データ分析 / パネル分析 コマンド(下図)を選択するか、XLSTAT-官能データ分析 ツールバーの対応するボタンをクリックしてください。

ボタンをクリックすると、ダイアログ・ボックスが現れます。

Excel シートでデータを選択してください。ここではセッション因子があるので、そのオプションを有効にして、対応する列を選択します。

セッションを選択するかどうか、因子間の交互作用あり、または交互作用なしのモデルを使用したいか、そして、審査員やセッション(反復)をランダム効果または固定効果とみなすかどうかで、複数のモデルが可能です。ランダム因子は、平均0と任意の分散を持つランダム(確率)変数とみなされます。これは、製品効果が考慮に入れられると、他の効果は純粋にランダム化に起因するとみなすことを意味します。審査員間またはセッション間で構造的差異がないとみなせる場合のみ、これが有効です。これらの仮定は、続く分析で確認されます。

官能パネル分析の結果の解釈

OKボタンをクリックすると、計算が始まります。たくさんのグラフが作成されるので、結果のシートに移動するまでに時間がかかることがあります。矢印カーソルが戻るまでExcel 内でクリックしないことを推奨します。

最初の表は、さまざまな入力変数での基本要約統計量です。ディスクリプタに異常値がないことを確認するには、最小と最大の情報を使用するのがよいです。

分析の最初にステップは、製品効果のないディスクリプタを識別するために、各ディスクプタごとにデータセット全体のANOVAを次々と実行することからなります。各ディスクリプタごとに、選択されたモデルでのANOVAのType III SS (タイプ III 平方和)の表が表示されます。ダイアログ・ボックスのオプション・タブで対応するオプションがチェックされている限り、あるディスクリプタで製品効果がない場合、p値が任意のしきい値よりも高いならば、そのディスクリプタは分析から除外されることを意味します。下記の表は、平滑度Smoothness)の表です。

そして、要約表は、異なるディスクリプタで製品効果のp値を比較することができます。製品を判別できるディスクリプタについてのみ以下の分析が実施されます。ダイアログ・ボックスでしきい値を入力したので、それはp値が0.05よりも低いすべてのディスクリプタを意味します。我々の事例では、すべてのディスクリプタで製品効果があるので、すべてのディスクリプタが次のステップに残ります。

そして、CAP (Control of Assessor Performances: 審査員パフォーマンスの制御) の表が来ます。左の部分は、ディスクリプタの要約です。それらは、彼らの製品の区別に応じて並べ替えられます。p値が0.1よりも小さければ、色が黄色になります。0.05よりも小さければ緑色です。それ以外は赤色です。有意な交互作用を持つことはポジティブなことではないので、product*assessor 交互作用では全くの逆になっています。属性の平均と誤差の平方根が列3 および 4にあります。

表の右側は審査員を参照します。警告:フィルタが適用された場合、この部分は以前のそれの下に表示されます。審査員は、すべてのディスクリプタで個別に生成された効果の平均 順位平均に応じて並べ替えられます。任意のディスクリプタで、審査員が製品を判別しない場合、彼または彼女は、"="を持ちます。彼/彼女が製品を判別し、パネルと同意する (subject*product 交互作用に対する彼の寄与度に関する検定)場合、, 彼/彼女は"+"を持ちます。それ以外は "-" が表示されます。最後に、審査員が対応するディスクリプタでセッション効果を持つ場合 (drift-mood)、または彼/彼女が1つのセッションから別のセッションで、他の審査員よりももう著しく信頼性が低い場合、彼/彼女は再現性がないとみなされ、"!"がつけられます。

2番目のステップは、グラフィカル分析からなります。6 個のディスクリプタについて、箱ひげ図、ストリップ図が表示されます。そして、各ディスクリプタについて、異なる審査員が異なる製品を評価するために評価スケールをどのように使用しているかがわかります。平滑度の箱ひげ図では、審査員9 と 15が同じような平均を持ちながら評価スケールを異なるように使用していることがわかります。また、審査員 3,4,5,6,7はは、同じような評価の範囲を使用しながら、場所の観点で異なる評価をする傾向があることがわかります。もちろん、このようなプロットは、審査員間の同意について何も示しません:箱ひげ図がまったく同じように見えながら、ある審査員の最小に対応する製品(最小値と最大値は、箱ひげ図で青の点で表示)が、他の審査員の最大に一致するようなケースもあるかもしれません。

result panel box plot

我々は、審査員が異なるディスクリプタについて同意するかどうか、そして、ディスクリプタがどのように異なる評価の可能性をもたらすか(それらは相関しているかどうか)を確認したいのです。第3のステップは、データ表が製品ごとに1行で、審査員とディスクリプタの対ごとに1列からなるように-複数のセッションがある場合は、表が平均を格納する-、データ表の再構成から始まり、続いて、この同じ表でPCAが実行されます。PCAは、標準化データで実行されます

下記のグラフは、各ディスクリプタについて複製された同じPCA相関プロットで、タイトルのディスクリプタに対応する15個の対(審査員、ディスクリプタ)を赤色の点で強調しています。これは、位置およびスケールの効果が除去されると(PCAが標準化データで実行されているので)、どの審査員への評価が、すべてのディスクリプタで一致しているかを確認できます。

下記のグラフは、各対(審査員、ディスクリプタ)について、PCAプロットが負う分散の%を示します。濃い灰色のところは、第1軸が負う分散の%で、薄い灰色のところは第2軸が負う分散の%です。 smoothnessでは、2番目の軸により関係しているが、悪く表現されている審査員(8,9,10)と は異なる審査員のグループがあることがわかります。また、Elasticity と Closing は似ていて、第2軸に負荷があることを確認できます。

ディスクリプタ間の関係性をより正確に調査するために、ディスクリプタのMFA (multiple factor analysis:多因子分析) プロットが表示されます。MFA は、ディスクリプタの数だけ副表がある表に基づきます。各副表は、各審査員(列)ごとに各製品(行)の平均を格納しています。

result panel proximity descriptors plot

第4ステップでは、製品効果があるかないかを確認するため、各審査員が利用可能なディスクリプタを用いて製品を区別することができるかを検証するために、審査員ごとに別々に、かつ6個のディスクリプタについてANOVA が実行されます。さまざまなディスクリプタで、製品効果があるかないかを示すために、審査員ごとに表が表示されます。ダイアログ・ボックスのオプション・タブで定義したしきい値よりもp値が低い場合は、p値が太字で表示されます。 太字で表示されるp値は、審査員が製品を区別できたディスクリプタに対応します。下記の表は、審査員1の表です。この審査員は、Feet feeling と Elasticity を用いて製品を区別することができたことがわかります。

そして、審査員が製品を区別できたディスクリプタの数を各審査委員ごとにカウントするために、要約表が使用されます。対応するパーセンテージが表示されます。このパーセンテージは、審査員の判別力の単純な測度です。そして、棒グラフにパーセンテージが表示されます。

result panel discriminating power plot

第5ステップでは、最初に全体表が各審査員の評価(可能であればセッション間の平均)を行に、各対(製品、ディスクリプタ)を列に表現します。製品ごとに、ディスクリプタの集合での審査員(可能な反復での平均)を比較するために、一連の表やグラフが続きます。これらのグラフは、 何人かの審査員での強い傾向や可能な特殊な評価を識別するために使用できます。赤い線は興味の製品でのすべての審査員での平均値で、青い線はグラフの左上のリストで選択された審査員です。下記の事例で、審査員10は製品7を Smoothness と Touchで平均よりも低く評価して、他のディスクリプタでは平均に近く評価したことがわかります。

result panel comparison assesors plot

第6ステップでは、すべてのディスクリプタの空間でのすべての審査員の平均への各審査員のユークリッド距離の各製品での測定を通して、特殊な審査員を識別できます。各製品でのこれらの距離と、すべての審査員での最小および最大を示す表は、コンセンサスに近い、または遠い審査員を識別することができます。下記のグラフは、これらの距離を可視化できます。距離が小さいほど、審査員はコンセンサス(セントロイド)により近くなります。値 0 は、すべての審査員での平均です。もし任意の製品で、すべての審査員がすべてのディスクリプタで同じ評価を与えるようなら、その製品での最小と最大は0でしょう。ある審査員が他のディスクリプタで得られた平均に厳密に一致する値を与えるなら、その製品ではゼロに等しい最小になるでしょう。下記の事例では、審査員4は、彼の評価が平均に近い製品10を除いては、他の審査員と同意していないことがわかります。 result panel distance to consensus plot

“セッション” 変数が選択されたので、第7ステップは何人かの審査員でセッション効果、通常、順序効果があるかどうかを確認します。セッションが2つだけなのでの Wilcoxonの符号順位検定を用いて評価されます(3つ以上の場合、 Friedman 検定が使用されます)。検定はディスクリプタごとにすべての製品で行われます。下記の表では、ノンパラメトリック検定に基づいて、6個中4個のディスクリプタで、審査員1でセッション効果があることがわかります。また、 Feet feeling では、15人中9人の審査員でセッション効果があることがわかります。

そして、各審査員および各ディスクリプタで、製品をまたいだセッション間でどれが最大の観察範囲であるかを計算します。各セルに表示されている赤い三角にマウスを持っていくと最大範囲に対応する製品がわかります。あとえば、 Smoothness での審査員15で高い範囲があり、それは製品8に対応することがわかります。我々の事例では、ここで、(審査員、ディスクリプタ)のほとんどの対で高い範囲があることがわかります。これは、この調査の有効性が疑わしいことを示します。

各3個の組(審査員、製品、ディスクリプタ)で少なくとも1つの評価があるので、第8ステップは審査員の分類からなります。分類は、まず生データで行われ、そして、スケールと位置の効果を除去するために、標準化データで行われます。

最後に、一般化プロクラステス分析(GPA:Generalized Procrustean Analysis )を実行したい場合は、GPA用に整形済みの表が表示されます。

この記事は役に立ちましたか?

  • ウイ
  • いいえ