Excelでの多次元尺度法(MDS)チュートリアル
このチュートリアルは、XLSTATソフトウェアを用いてExcel内で多次元尺度 (MDS) 分析をセットアップして解釈することを支援します。 これが必要とされる正しい多変量データ解析ツールであるかどうか確かでない場合は、こちらのガイドを確認してください。
多次元尺度法
多次元尺度法(MDS)は、マーケティングと心理学において広く使われているデータ解析手法です。
この手法の目的は、個体間の類似度行列(類似性ま たは比類似性)から個体の一連のマッピングを構築することです。(たとえば国の都市のように)平面状のいくつかの点の間の距離を与える行列を持つことが理 想ですが、MDSは(対称または回転の)正確なマップを再構築することができます。
最適な表現を構築するために、MDSアルゴリズムは、"ストレス”と呼 ばれる基準を最小化します。ストレスがゼロに近づくと、表現がよりよくなります。
多次元尺度法のためのデータセット
データと結果のExcelシートは、下記のボタンをクリックしてダウンロードできます: データをダウンロード
データ は、10人の被験者に5つの製品を(1から5の範囲のスコアで)評価するように依頼した調査のものです。P1の製品だけがすでに市販されています。これら の製品はさまざまなタイプのチョコレート・バーです。
この多次元尺度分析の目的
我々の目的は、これらの製品のポジションが、被験者の意見が与えられたマップ上でどのようなるかを示すことです。
多次元尺度分析のセットアップ
親近度行列の作成
MDS分析を行うには親近度行列が必要ですが、我々は個別の製品xの表を持っています。したがって、我々はまず製品間の非類似度を計算する必要があ ります。それはXLSTATの 類似度 / 非類似度行列 ツールを使って計算できます。
XLSTAT-Proを起動して、XLSTAT|データ記述| 類似度/類似度行列 コマンドを選択するか、データ記述 ツールバー(下図)の対応するボタンをクリックしてください。
ダイアログ・ボックスが現れます。そして、Excelシート上のデータを選択して、下記の適切なオプションを選択できます。我々は、同じシート上の元データの下側に親近度行列を表示させることにしました。
出力タブでは、近接行列(親近度行列)のみを有効にします。
OKをクリックすると計算が始まります。そして多次元尺度分析の基礎となる製品間のユークリッド距離の行列が得られます。
多次元尺度法のダイアログ・ボックスのセットアップ
XLSTAT|データ解析|多次元尺度法 コマンドをクリックするか、データ解析 ツールバー(下図)の対応するボタンをクリックしてください。
多次元尺度法ダイアログ・ボックスが現れます。そして、 Excelシート上の距離行列を選択して、下記の適切なオプションを選ぶことができます。
絶対モデルが選ばれました;このモデルは、最終の表現での距離が、できるだけ最初のユークリッド距離に近くなるようになります。
他のオプションでも同様な結果が得られますが、尺度効果が出るかもしれません。ここでは我々はそれを消去したいわけです。
我々は次元削減に関連した歪みを評価するために、この分析が4から2次元で実行されるようにします。
注意: もしアルゴリズムに開始点を与えなければ、開始点はランダムに選択されます。したがって、 あなたが得る結果は、このページとは少し違うかも知れません。しかしながら、それは解釈が変わるほどではないはずです。アルゴリズムが(ストレスの意味 で)真の最適を見つけることを確認するために、repetition(反復)の数、iterations(繰り返し)の最大数、そしてaccuracy (正確さ)を増やすことができます。
OKをクリックすると計算が始まります。完了をクリックして、最初の2次元上のマップをプロットすることを採用すると、 Excel ワークブックの多次元尺度法シートに結果が表示されます。
多次元尺度法の結果の解釈
1番目の表は、次元数を増やしたときのストレスの進展を示します。我々は2次元と3次元の表現の間が強く食い違っており、3次元と4次元の間では安定していることに気づきます(5点についての4次元表現が完全であることは、数学的に正常です)。
Dim1 x Dim2 平面上に2次元配置でのマップが作成されます。
3または4D配置での他の数個の軸について、マップを構築することもできます。しかしながら、どのような解釈も失敗させる投影効果があるかも知れないので、より多次元で構築された配置のマップを2次元で見ることは推奨しません。2Dマップは、2次元配置についてだけ用いられるべきです。4D配置を2Dマップで 見るためには、まず座標上でPCA(主成分分析)をするべきです。
よりよい表現品質を得るために、3次元でデータをプロットするために、我々はXLSTAT-3DPlot を使用しました。これを行うには、データを選択して(下図)、データ可視化ツールバーのXLSTAT-3DPlot ボタン をクリックするだけです。
以下のような結果が得られます:
被験者がお互いに集団的によく区別された製品を持つことがわかります。製品 P2 はチョコレートを微量に含むP4よりもチョコレートを多く含むことがわかっています。3Dグラフの上でそれらは正反対にあります。 最初のデータ集合に注目すると、被験者は製品P2をかなり好んでいることがわかります。さらに、製品P3 と P5 は同じような平均スコアを持ちますが、表現空間では近くないこともわかります。 被験者の意見はときどき対立します。それは、いくらかのピーナッツが製品 P3に追加されたことを、何人かの被験者は喜んでいますが、何人かは喜ばないということで説明されます。
多次元尺度法に関する結論
結論として、多次元尺度法は、複数の被験者によって評価された製品をマップすることができます。それは単純は統計よりも芳醇な解釈を可能にします。
注意: 多次元尺度分析によって産出される表現の品質や信頼性を評価する厳格な統計手法はありません。しかしながら、シェパード・ダイアグラムを見ることによって、表現の品質の全体t的な知見を得ることができます。シェパード・ダイアグラムは、横軸が観察された非類似度で、縦軸が多次元尺度法が生成した配置上での距離となっている散布図です。ディスパリティ(差異)も表示されます。ポイントが散らばっているほど、その多次元尺度マップは信頼性が低いです。横軸の順位が縦軸で区別できるなら、そのグラフは信頼できます。ポイントが同じ線上にあるなら、品質は完全です。
左側のグラフは、4D空間での表現に対してこの事例で使用されたデータに関するものです。右側のグラフは、2D 空間での表現です。2つのグラフの間でポイントの散らばりが大きく異なることに気付きます。
注意: 絶対モデルでは、ディスパリティは非類似度に等しくなります。それは、それらが2D空間での線と混同され、4D シェパード・ダイアグラム上での距離を隠すことの理由です。
この記事は役に立ちましたか?
- ウイ
- いいえ