あなたの分析ソリューション

複数の変数で記述された2つ以上の標本が有意に異なるかどうかの検定

20/10/2017

マハラノビスの距離を用いて標本間の差を検定するデータセット

このチュートリアルで使用するデータと結果のExcelシートはこちらからダウンロードできます。このチュートリアルは、 XLSTATの分布サンプリング・ツールで生成された人工データに基づきます。最初の3列は、標準正規分布 N(0,1)で抽出されています。 次の3列のG1は正規 N(2, 5) 分布、G2は正規 N(2.2, 5.2) 分布、G3 は正規 N(8, 7) 分布でサンプリングされました。

マハラノビスの距離を用いて標本間の差を検定

ツールの使用法と検定の関連性を説明するために、まず最初の3列での多次元検定を行い、そして、次の3列を行い、そして6列一緒に行います。

1. 最初の3列の検定

多次元検定のセットアップ

XLSTAT を起動して、XLSTAT/ パラメトリック検定 / 多次元検定 コマンドを選択するか、パラメトリック検定ツールバーの対応するボタン(下図)をクリックします。

barmaha.gif

ボタンをクリックすると、ダイアログ・ボックスが現れます。 Excel シート上で最初の3列に対応するデータを選択し、そして、グループ識別子を格納した列Bを選択します。

maha1.gif

OK をクリックすると計算が始まります。

多次元検定の結果

結果は、平均値 (Wilks 検定) と共分散行列 (Box-Kullback検定)の両方に関して、3つのグループは同一であり、同じ比率からなるとみなされることを示しています。G1とG2 またはG1とG3 の間の距離が、G2とG3の間の距離よりも大きいけれど、それほど有意ではない、ということがFisherの距離でわかります。

maha2.gifmaha3.gif

2. 最後の3列の検定

今度は、最後の3列だけを選択します。ほかのオプションは変更ありません。

maha4.gif

この場合、平均の検定が差を識別します: ウィルクスのラムダの検定は、グループの平均の間に有意な差があることを結論づけます。グループ3に注目したときだけ、マハラノビスの距離が意味を持つことに気づきます。最初の2つのグループの間の小さな差に有意性が見つからないことは、驚くべきことではありません。このような小さな差を識別するには、グループのサイズが小さすぎるためです。

maha5.gif

共分散行列については、境界線上のBox 検定は差を検出しておりp-値が 0.06です。しかし、クルバックの検定は、差を識別するのに失敗しました。これは、グループのサイズが、分散が5’²と 7’²のグループを識別するには、グループのサイズが小さすぎるためです。

maha6.gif

3. 6列の検定

今度はすべての列を選択します。"出力"タブで、相関行列の共分散行列をリクエストします。

maha7.gif

平均での検定は、ケース 2 (上記参照)にとても近い結果を出しました。マハラノビス距離に基づく G1 と G2 の間の距離がわずかにより低いです。

maha8.gif

しかしながら、共分散での検定は、とても異なります。最初の3列で観察された小さな差と、最後の3列で観察されたより大きな差が、累積されます。さらに、 RV1 と RV4の間、RV2 と RV5 の間、およびRV3 と RV6の間に無視できない共分散があります。最終的に、これは、6列で検定が行われた場合に、有意な差を与えます。

maha9.gif

お問合わせは、マインドウエア総研へ。

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283