ExcelでのCLUSTATISによる表のクラスタリング
このチュートリアルは、XLSTATソフトウェアを用いてExcel内でCLUSTATISの方法により表のクラスタリングを計算して解釈する方法を説明します。
CLUSTATIS法を実行するデータセット method
データと結果のExcelシートは、このチュートリアルの最初にあるリンクをクリックしてダウンロードできます。
データは、フランスのレンヌでAGROCAMPUS OUESTが実施したプロジェクティブ・マッピング/ナッピングです。8種類のスムージィが24人の被験者(パネリスト)によってテーストされて、テーブル・クロスに配置されました。STATIS 分析のために、その座標が収集されました。パネリストが2個の製品を類似しているとみなすなら、後者がテーブル・クロス上で近くに置かれ、したがって、それらは類似した座標を持ちます。オリジナルのファイルは、R SensoMineR パッケージで得られます。
このデータセットは、被験者のクラスタリングなしでスムージィを直接分析するために、STATISに関する弊社のチュートリアルでも使用されています。
このチュートリアルの目的
ここでの目的は、3ステップのデータ分析を実行することです: 1. データ、すなわちここでは被験者の表(ここではコンフィギュレーションと呼びます)を製品の被験者らの認知によってセグメントする。できるだけ均質なクラスを作成するために CLUSTATIS 法を使用する。 2. クラス間のスムージィの認知での差を決定するために、STATIS 法を用いて被験者の各クラスを分析する。 3. クラスタリング品質指標を決定する。
XLSTATでのCLUSTATIS分析のセットアップ
XLSTAT / 高度な機能/ 官能データ分析/ CLUSTATIS コマンド(下図)を選択してください。
CLUSTATIS ダイアログ・ボックスが現れます。
一般 タブで、デモのExcel シート上でコンフィギュレーションのデータを選択してください(ここではコンフィギュレーションは、被験者ごとに与えられた座標の集合)。そして、コンフィギュレーションの数を入れてください。ここでは、24人の被験者に対応する24個 隣接した表があります。
各コンフィギュレーションで2個の変数がるので、我々は等しいオプションを選択してXLSTATに変数の数が一定であることを知らせることができます。変数の数が少なくとも1個のコンフィギュレーションで異なる場合、各コンフィギュレーションでの変数の数を格納した列を選択する必要があります。
最後に、変数ラベル とオブジェクト・ラベル (我々の事例ではsmoothies).オプションを有効にしてください。
出力タブでは、変数を縮尺しないことを選びます。各コンフィギュレーション内で、すべての変数が同じ尺度になっているからです。 より正確なクラスタ分析を得るために、我々は、クラスの数の選択を自動のままにしておき、階層アルゴリズムで得られるクラスに再配置(consolidation)を適用するようにしました。
チャート タブで、2軸でチャートを表示ボックスを選択する場合、 さまざまなマップでの最初の2因子軸での表現が自動で得られます。このチェックをはずすと、ウィンドウが開いて、軸を選ぶことができます。
XLSTATを用いてExcel内でCLUSTATIS分析の結果を解釈
下記のチャートはデンドログラムです。これはアルゴリズムがどのようにコンフィギュレーションをグループ分けし、そしてさらにコンフィギュレーションのグループをグループ分けしているかを表します。ご覧のとおり、アルゴリズムはすべてのコンフィギュレーションをうまくグループ分けしました。点線は自動の打ち切りを表しており、3つのグループを導いています。
続く表は、再配置の前と後のさまざまなコンフィギュレーションのクラスを示します。 再配置によって subject 10 だけがクラスを変更したようです。
そして、構築されたクラスのそれぞれの分析に移ります。各クラス内のオブジェクト(ここではスムージィ)の表現は、とくにスムージィCarrefour_SBに関して、被験者のクラス間の認知の差を示しています。 スムージィCarrefour_SBは、クラス1ではスムージィ Innocent_SBとともに、クラス2では Innocent_PBC および Casino_PBC とともに、クラス3では Carrefour_MP とともに配置されています。
以下のグラフは、コンフィギュレーションの近接度の指標と被験者が置かれたクラスのコンセンサスを与えます。これらの近接度は、 RV 係数で表現され、0 から 1の間の類似度の指標です。class 2では、subject 2 が他よりもコンセンサスからかなり遠いことを観察できます。これは彼がクラスにあまり上手く適合しないことを意味します。彼の認知は、すべてのクラスと異なります (彼はアルゴリズムによって最も対応するクラスに置かれるので)。この種の問題は、オプション・タブで"K+1" クラスを追加することで解決できます。それは非典型的なコンフィギュレーションを脇に置くことを目的とした追加のクラスです。
最後に、各クラスの均質度指標がクラスタ分析の品質の評価を可能にします。これらの指標が1に近いほど、そのクラスはより均質です。ここでクラス1の均質度が他よりも少し低いことがわかります。各クラスの均質度の重み付き平均である全体の均質度はかなり正確です。ただし、これは "K+1" クラスの追加によって改善されます。
この記事は役に立ちましたか?
- ウイ
- いいえ