あなたの分析ソリューション

どの多変量解析手法を選ぶべきか?

22/01/2019

適切な多変量解析テクニックの選択


ここで我々は、多変量(あるいは多次元)データセットを通常、行でに格納される2つより多い統計的単位(固体、患者、サイトなど)で測定された2つより多い変数(通常、列に格納される)を含むデータ表として定義まします。多次元データ分析は、生の形式では読み取るのが難しい大規模データセット内の興味深い情報を抽出するために使用されます。それらのツールは、しばしばデータマイニング・ツールとも呼ばれます。

下記のグリッドは、データを用いて調査したい課題のタイプ(探索または判断)およびデータの構造によって、適切なデータマイニング手法の選択をガイドします。このリストを網羅的ではありませんが、一般的によく使用される手法を含み、それらはすべてXLSTATで利用可能です。


我々は、課題を2つのタイプに分割します:

探索的課題は、検証すべきどのような特定の仮説もなしに多変量データセットの調査を可能にします。探索的多変量データ解析ツールは、しばしば大規模データセットの次元を削減して、データの探索をより便利にすることを含意します。


判断的課題は、変数の2集合間の関係性(相関)を検定、または変数または変数の集合を他の変数の集合で説明すること(因果関係)を含意します。 
 

グリッド

課題 表の数 データ記述 ツール 注釈
探索的 1 量的変数のみ 主成分分析 (PCA) データ内のすべての分散を考慮; 成分は実際の現象を反映するとは限らない
探索的 1 量的変数のみ 因子分析 (FA) 変数間の共分散のみを考慮; 潜在因子が実際の現象を反映
探索的 1 近接行列 多次元尺度法 (MDS)主座標分析(PCoA)  
探索的 1 分割表 (2個の質的変数) コレスポンデンス分析 (CA)  
探索的 1 質的変数のみ 多重コレスポンデンス分析 (MCA)  
探索的 ≥2 質的変数の表や量的変数の表 多因子分析 (MFA)  
探索的 ≥2 量的変数の表 一般化プロクラステス分析 (GPA) 推論部分を含む場合がある: コンセンサス・テスト
探索的 (クラスタリング) 1 量的変数のみ クラスタリング・ツール (AHC, k-means...) 多重コレスポンデンス分析の次元上の行スコアを用いて、伝統的なクラスタリング手法が間接的に質的変数に適用できる
判断的 (因果関係) 1 1個の従属変数と複数の量的説明変数や質的説明変数 統計的モデリング・ツール (回帰, ANCOVA…)  
判断的 (相関) 2 2個の量的変数の表 正準相関分析 2つの表の間の線形関係
判断的 (因果関係) 2 1個の分割表 Y (しばしば、サイト-種のデータ行列)と1個の量的説明変数や質的変数の表 (X) 正準コレスポンデンス分析 X と Yの間のユニモーダル(単一モード)関係性; 環境傾度に沿って種のニッチを描くことに使用できる
判断的 (因果関係) 2 1個の量的従属変数の表(Y) と1個の量的説明変数や質的説明変数の表 (X) 冗長性分析 (RDA) X と Yの間の線形関係
判断的 (因果関係) 2 1個の量的従属変数の表 (Y) と1個の量的説明変数や質的説明変数の表 (X) 偏最小2乗回帰 (PLS) とくに予測用に使用
判断的 (因果関係) ≥2 複数の顕在変数の表、各票が1個の潜在変数を表現 偏最小2乗構造方程式モデリング(PLS-PM)  
 

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283