あなたの分析ソリューション

Excelでの度数表での多因子分析(MFA)

20/01/2019

このチュートリアルは、XLSTAT統計解析ソフトウェアを用いてExcel内で度数表での多因子分析 (MFA)をセットアップして解釈する方法を支援します。


多因子分析(MFA: Multiple Factor Analysis)は、複数の変数の表を同時に分析して、結果、とくにオブザベーション、変数および表の間の関係性を調査できるチャートを得るのに便利です。
ここで我々は、度数表でのMFAの特別なケースに焦点を当てます。 MFAのより一般的な説明、および他のタイプの表で使用については、こちらのチュートリアルを参照してください。
度数表での多重因子分析の方法論は、2つのフェーズに分かれています:

  • 各表でコレスポンデンス分析(Ca: Correspondence Analysis)を連続して実行する。そして、 各分析の第1固有値の値を格納し、分析の2番目の部分で、さまざまな表を重みづけするための準備をする。
 
  • すべての表の列で重みつきPCAを実行する。表の重みづけは、よい多くの変数を含む表が分析でより多く重みづけされるのを防ぐことを可能にする。 

 
度数表での多因子分析を実行するデータセット

データと結果のExcel シートは、こちらをクリックしてダウンロードできます:
このチュートリアルで使用するデータは、LAURIE E. FRIDAY.によって収集され、次の論文で使用されました: [Friday, L.E. (1987) The diversity of macroinvertebrate and macrophyte communities in ponds, Freshwater Biology, 18, 87–104.]。
これらのデータは、さまざまな地点で異なるグループ(表)に分類された種をカウントしたものです。我々は 62 種を5 グループに分割し、12 地点でカウントの測定が行われ、種は以下の方法で分割されています:

  • 表 1 はグループOligochaetaに属する6種を格納する。
  • 表 2 はグループColeopteraに属する13種を格納する。
  • 表 3 はグループTrichopteraに属する13種を格納する。
  • 表 4 はグループMolluscaに属する8種を格納する。
  • 表 5 はグループDiptera.に属する22種を格納する。

XLSTATでの多因子分析のセットアップ

XLSTATを開くと、XLSTATメニューの高度な機能 / マルチブロック・データ分析 / 多因子分析 (MFA) コマンドを選択してください。官能データ分析メニューの下にもMFA があることに注意してください。



ボタンをクリックすると、MFAダイアログ・ボックスが現れます。



デモ・ファイルで、興味のあるすべての変数に対応するデータを選択してください。上で見たように、変数は5つの表んいグループ分けできます。
我々は、表の数を6と指定する必要があります。そして、5つの表に与えた名前を選択します  (Oligochaeta, Coleoptera, Trichoptera, Mollusca et Diptera)。
最後に、各表内の変数の数を定義します。すべての表でその数は同じではないので、各表内で変数の数が格納されているExcelシートの範囲を選択します。
すべての選択で列ヘッダがあるので、オプション変数ラベルを有効にします。
オプションタブでは、我々は種のカウント・データに対応する度数表を使用しているので、度数データ・タイプを選択します。



OK ボタンをクリックすると、計算が始まって、そして、結果が新しいExcelシートに表示されます。

度数表での多因子分析の結果の解釈

結果の最初は、さまざまな変数の記述統計量で、続いて各表で別々の分析が実行されるます。どの表も度数表なので、それらのそれぞれでコレスポンデンス分析(CA: Correspondence Analysis)が実行されます。そして、これらの予備的な分析の結果は、最終の分析で使用されます。多因子分析の2番目のフェーズ、じつのところ、それは重みつきPCA (重みは列に設定される)です。 MFA の結果は、重みつきPCAの仔有意の分析で始まります。



最初の結果は、伝統的なPCAと同様に、変数(それらのグループによって色づけ)とオブザベーションに関してです。





そして、MFAに特有の結果が表示されます。まず、表の座標が表示され、表のグラフを作成するのに使用されます。第1軸が表 Trichoptera と Oligochaerta に強く関連していて、一方、第2軸は表 Mollusca と Coleopterasに関連していることが、グラフでわかります。



表間の関係性のLg 係数は、表がどの程度2個ずつ関係しているかを定量化します。 表間の関係性の RV 係数(下図)は、Lg 係数から派生したもう1つの測度です。RV 係数は 0 から 1の間の値をとり、分析をより簡単にします。ここで、我々は、最も近い2つの表が、 taste と olfaction であることがわかります。もっと驚くべきことに、Diptera と Coleoptera の間のRV係数が最も高いことがわかります。



MFAでと特有の続く結果は、部分軸(partial axes)の分析です。部分軸のグラフは、別々の分析ごとのどの軸(因子)がMFAで生成される軸に相関しているかを知ることを可能にします。たとえば、表 Oligochaeta のCAの軸1と表TrichopteraのCAの軸1 が、MFAの軸1と強く負に相関していることがわかります。




別々の結果、とくに表 Trichoptera のCAの変数座標(結果シートの行517)をより詳細にみると、こおCAの第1軸での負値が、 種T1、T2、T3、T4、T5の重要な度数に対応していることに気づきます。


 
MFAに特有な最後のチャートは、オブザベーションに追加されている射影ポイント、およびオブザベーション間に引かれた線と対応する射影ポイントを伴うオブザベーション・チャートに基づきます。射影ポイントは、1つの表により提供される情報のみを考慮して、他の表を0に変換する補足オブザベーションに対応します。これは、さまざまな表が与えられたポイントの位置にどのように影響するかを知ることを可能にします。たとえば、地点14では、表Mollusca は自分の地点をさらに他の地点と違うものにする傾向があることがわかります。これはチャートの下部の 地点11 と表Mollusca についても言えます。




結論として、多因子分析は、複雑なデータセットを分析できるようにしてくれて、たくさんのグラフィカルな結果を提供してくれるので興味深く、リッチな(情報の豊富な)手法です: 我々は、(変数がグループされている)表、変数それ自身、およびオブザベーションを可視化できます。この事例では、マップに地点を素早く位置付けて、それらの位置を素早く解釈することができました。

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283