あなたの分析ソリューション

XLSTATでの適切なクラスタリング手法の選択

18/07/2016

このチュートリアルの目的

このチュートリアルの目的は、XLSTATユーザーがデータを分析するために、適切なクラスタ分析ツールを選ぶことを助けることです。

 

クラスタ分析に関する要約

クラスタ分析手法は、同じクラスに属するオブジェクト(オブザベーションまたは固体)が他のクラスに属するオブジェクトよりも類似しているように、オブジェクトをクラス(クラスタ)に集めることができます。オブジェクト間の近接度は、すべてのオブジェクトで計測された変数の集合に基づきます。クラスタ分析手法は、探索的データマイニング・テクニックで広く使用されます:

発現(トランスクリプトミクス、プロテオミクス、メタボロミクスなど)データでは、それらの手法で類似する発現プロファイルを持つ個体または類似する発現パターンを持つ特徴を検出することができます。

マーケット・リサーチでは、調査データからクラスタリング手法でさまざまな消費者プロファイルを検出することができます。

生態学では、類似したコミュニティを持つサイトのグループを識別することを助けます。

 

XLSTATで利用可能な手法

XLSTATは,データ解析ボタンに格納されている4種類のクラスタリング手法を提案します:

k-means クラスタリング

凝集型階層クラスタリング (AHC)

ガウス混合モデル

単変量クラスタリング

これらの手法は、量的変数でのみ動作します。 AHCでは、バイナリ変数も使用できます。質的変数でオブジェクトをクラスタする必要がある場合は,我々は、最初に 多重コレスポンデンス分析 を実行して、クラスタリング用のデータセットとして、第1・第2軸(因子)のオブザベーション・スコアを使用することを推奨します。

同じ考え方で、主成分分析コレスポンデンス分析などのあらゆる探索分析で提供されるオブザベーション・スコアを使用することもできます。

 

どの手法を選択するか

それぞれの手法には、下記の表にまとめるように独特な特徴があります。

 Cluster analysis comparison of methods

*計算の後、クラスタリング手法によって異なる方法で、それぞれのオブザベーションのクラス・メンバーシップが提供されます。決定論的方法は、それぞれのオブジェクトが単一のクラスに振り分けますが、それに反して、確率的方法は、1つのオブザベーションの各クラスへのメンバーシップを確率的に表示します。

 

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283