複数の変数で記述された2つ以上の標本が有意に異なるかどうかの検定
マハラノビスの距離を用いて標本間の差を検定するデータセット
このチュートリアルで使用するデータと結果のExcelシートはこちらからダウンロードできます。このチュートリアルは、 XLSTATの分布サンプリング・ツールで生成された人工データに基づきます。最初の3列は、標準正規分布 N(0,1)で抽出されています。 次の3列のG1は正規 N(2, 5) 分布、G2は正規 N(2.2, 5.2) 分布、G3 は正規 N(8, 7) 分布でサンプリングされました。
マハラノビスの距離を用いて標本間の差を検定
ツールの使用法と検定の関連性を説明するために、まず最初の3列での多次元検定を行い、そして、次の3列を行い、そして6列一緒に行います。
1. 最初の3列の検定
多次元検定のセットアップ
XLSTAT を起動して、XLSTAT/ パラメトリック検定 / 多次元検定 コマンドを選択するか、パラメトリック検定ツールバーの対応するボタン(下図)をクリックします。
ボタンをクリックすると、ダイアログ・ボックスが現れます。 Excel シート上で最初の3列に対応するデータを選択し、そして、グループ識別子を格納した列Bを選択します。
OK をクリックすると計算が始まります。
多次元検定の結果
結果は、平均値 (Wilks 検定) と共分散行列 (Box-Kullback検定)の両方に関して、3つのグループは同一であり、同じ比率からなるとみなされることを示しています。G1とG2 またはG1とG3 の間の距離が、G2とG3の間の距離よりも大きいけれど、それほど有意ではない、ということがFisherの距離でわかります。
2. 最後の3列の検定
今度は、最後の3列だけを選択します。ほかのオプションは変更ありません。
この場合、平均の検定が差を識別します: ウィルクスのラムダの検定は、グループの平均の間に有意な差があることを結論づけます。グループ3に注目したときだけ、マハラノビスの距離が意味を持つことに気づきます。最初の2つのグループの間の小さな差に有意性が見つからないことは、驚くべきことではありません。このような小さな差を識別するには、グループのサイズが小さすぎるためです。
共分散行列については、境界線上のBox 検定は差を検出しておりp-値が 0.06です。しかし、クルバックの検定は、差を識別するのに失敗しました。これは、グループのサイズが、分散が5’²と 7’²のグループを識別するには、グループのサイズが小さすぎるためです。
3. 6列の検定
今度はすべての列を選択します。"出力"タブで、相関行列の共分散行列をリクエストします。
平均での検定は、ケース 2 (上記参照)にとても近い結果を出しました。マハラノビス距離に基づく G1 と G2 の間の距離がわずかにより低いです。
しかしながら、共分散での検定は、とても異なります。最初の3列で観察された小さな差と、最後の3列で観察されたより大きな差が、累積されます。さらに、 RV1 と RV4の間、RV2 と RV5 の間、およびRV3 と RV6の間に無視できない共分散があります。最終的に、これは、6列で検定が行われた場合に、有意な差を与えます。
お問合わせは、マインドウエア総研へ。
この記事は役に立ちましたか?
- ウイ
- いいえ