あなたの分析ソリューション

XLSTATでの多因子分析(MFA)

19/11/2018

多因子分析

多因子分析(MFA)は、変数の表を数個同時に分析したり、結果を得たり(特にチャート。オブザベーション、変数、表間の関連を研究できる)するのに役立つものです。表内の変数は同タイプ(量的か質的か)でなくてはなりませんが、表は形式が異なることもあります。

MFAの方法論は以下の2フェーズに分けられます

  1. 表中の変数タイプによって、PCAやMCAを各表に対して連続で実行します。分析の第2部分で表が重みづけされるまで、各分析の第1固有値を格納します。
  2. 質的変数の表が分離表(ダミー変数)に変換されていて、各指標変数は対応するカテゴリの度数の関数である重みを持つことがわかっている、すべての表の列で重みつきPCAを実行します。表の重み付けにより、より多くの変数を含む表が、分析においてあまり重みづけされなくなるのを防ぐことができます。

多因子分析を実行するデータセット

データと結果のExcelシートはこちらからダウンロードできます。

このチュートリアルで用いられるデータはAsselin C. and Morlat R. from INRA, Angers, Franceにより収集されたもので、 論文 [ASSELIN C., PAGES J., and MORLAT R. (1992) Typologie sensorielle du Cabernet Franc et influence du terroir. Utilisation de methodes statistiques multidimensionnelles. J. Int. Sci. Vigne Vin, 26, 3, 129-154]に用いられています。

データは、専門家36人によって、フランスのロワール(Loire)地方産のワイン21本をテイスティングしたものです。データ集合は、21のオブザベーションと31の次元で構成されています。31の次元は、以下の6カテゴリーに分かれています:

  • 最初の2つの質的変数は、地理(名称と土壌)に関するものです;
  • 次の5つの量的変数は、アフターレストの香りに対応するものです;
  • 次の3つの量的変数は、外見的基準に対応するものです;
  • 次の10の量的変数は、アフターシェイキングの香りに対応するものです;
  • 次の9つの量的変数は、味に対応するものです;
  • 最後の2つの量的変数は、全体的な評価に対応するものです。

この多因子分析の目的

研究の主な目的は、ワインがお互いどのように関連しているのかを理解することと、基準が適している(冗長である?)かそれとも不適なのかを確認することです。研究の最初の部分では、2つの質的変数と最後の2つの量的変数は用いないことにしますが、研究の最後で、補助変数としてそれらを用いることにします:客観的なテイスティング基準以外にのものに基づいた分析をしたくないからです。

多因子分析のセットアップ

XLSTATを起動すると、XLSTAT / 官能データ分析 / 多因子分析 コマンドを選択するか
XLSTAT sensory data analysis menu MFA EN

ボタンをクリックすると、ダイアログボックスが現れます。そして、興味のある変数のすべてに対応するデータを選択します。上記のとおり、変数は6つの異なる表にグループ化されているでしょう。

したがって、表の数は6であると指定する必要があります。そして、6つの表に与えている名前(geog, rest, vis, shake, taste, glob)を選択します。

そして、各表内の変数の数を定義する必要があります。その数は、すべての表で等しいわけではないので、各表内の変数の値を含むExcelシートの範囲を選択する必要があります。

すべての選択において、列のヘッダーがありますから、変数ラベルオプションをチェックしてください

mfa1.gif

そして、追加情報を入力するため、オプションタブをクリックしてください。

ここでは質的と量的の2タイプの表があります。したがって、データ・タイプ混合を選択し、タイプを指定する(量的は0、質的は1)列を選択します。

因子マップの軸をたくさんの軸から選択することを避けるため、オプション2軸上にグラフを表示もチェックします。

mfa2.gif

最後に、初期の計算でどの表を考慮に入れるか、どの表が分析の最後のみに補表として使用されるか、を指定するために追加変数データタブを有効にします。したがって、どの表が有効 (1)で、補表(0)であるかを定義する列を選択します。

mfa3.gif

OK ボタンをクリックすると、計算が始まり、結果が新規のExcelシートに表示されます。

多因子分析の結果の解釈

最初の結果は、さまざまな変数の記述統計に対応します。補表の変数に対応した統計は、青字で表示されています。

その後、各表で個別分析が実行されます。表が量的変数を含む場合、実行される分析はPCA(主成分分析)になります。質的変数がある表に関しては、MCA(多重コレスポンデンス分析)が実行されます。我々のケースでは、MCAが1回、PCAが5回実行されます。これら予備分析の結果は、最終的な分析、つまり、実際には重みつきPCA(列に重みを設定)であるMFAの第2フェーズ、で用いられます。MFAの結果は、重みつきPCAの固有値の分析から始まります。

ここでは、最初の2因子で、ほぼ70%の変動を持つことがわかります。

mfa4.gif

そして、表の座標が表示され、表のマップ生成に用いられます。第1因子が4つの有効表に、強く関係していることが、マップから見て取れます(座標が高く、したがって寄与度が高い)。第2因子は、アフターレストの香りにだいたい関係しており、アフターシェイクの香りにやや関係しています。

mfa5.gif

表間の関係のLg係数により、2個ずつの表がどの程度関係しているのかを測定できます。表間の関係のRV係数(下図)は、Lg係数から派生するもう1つの測度です。RV係数の値は、0から1で、分析を容易できるようになっています。ここでは、2つの近接した表は、味とアフターシェイキングの香りであることがわかります。さらに驚くべきは、味と外見のRV係数が高いことがわかりました。

mfa6.gif

次に、変数の相関マップを分析します。このマップは、2つの一般的な評価(typicityとglobal quality)が、いくつか3の変数(たとえばShake3、Taste5)と関連性が高く、それらは、第1因子と相関があることを示しています。外見(vision)変数は、第1軸と相関が高いという事実も確認できます。様々な"olfaction after shaking"変数が、4象限のうちの3象限に広がっていることもわかります。最後に、第2因子は、Rest5変数と高い相関があります。

mfa7.gif

prtial axe(部分軸)のマップにより、第1フェーズの個別分析によって生成された因子がMFA因子とどのように関係しているかを見ることができます。最初の因子とMFAの因子との間に非常に有意な関係があることがわかります。しかし、これは、常にそうだとは限らないのかもしれません。

mfa8.gif

次のチャートは、2つの質的変数の重心でオブザベーションを示しています。T1とT2のワインは、非常に近接しており、その他のワインとは離れています。それらは第2因子と強い関係があり、上で見たように、Rest5と強い関係があります。1DAMのワインは、第1軸上で、最も高い座標にあります。2DAMのワインは、2つの全体評価変数(typicityとglobal quality)の方向にあるのがわかります。これらは、好まれるワインの2つです。"Ref" SOILは、同じ方向にある土壌であることがわかります。これに反して、1VAUのワインは最低評価です。

mfa9.gif

最後のチャートは前述のものに基づいていますが、オブザベーションに投影点が追加されており、オブザベーションと対応する投影点との間に線が引かれています。投影点は、考慮される表だけに1をつけ、その他の表は0に変換される追加オブザベーションに対応しています。これにより、さまざまな表がどのように与えられた点の位置に影響しているのかをみることができます。たとえば、T2のワインについては、レストでの香りが、その他のワインと一段と差別化する傾向にあります。その他のワインを見てみると、レストでの香りが、しばしばワイン間の距離を増加させることがわかります。

mfa10.gif

結論

結論として、MFAは、複雑なデータ集合の分析を可能にし、多くのグラフィカルな結果を生み出すので、興味深く、上等な方法です。我々は、表(変数がグループ化された表)や、変数自身、そしてオブザベーションを可視化できます。この事例では、マップ上にワインをすばやくポジショニングでき、それらのポジションをすばやく解釈できるようになりました。

お問合わせは、マインドウエア総研へ。

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283