メインコンテンツに移動

Excelでの正準相関分析チュートリアル

正準相関分析のデータ

データと結果のExcelシートは、こちらをクリックしてダウンロードできます。

このチュートリアルで使用するデータは、ヘルス・フィットネス・クラブの中年男性で行われた測定です(Dr. A. C. Linnerud, NC State University)。

男性に関して2つのデータの集合があります:

    1. 生理学的データ:
    • Weight(体重)
    • Waist(ウエスト)
    • Pulse(脈拍)
  1. 男性が行ったエクササイズ: - Chins(懸垂) - Situps(腹筋) - Jumps(跳躍)

正準相関分析のセットアップ

メニューマルチブロック・データ分析に行って、関数正準相関分析を選択してください。

XLSTAT Multiblock Menu Canonical Correlation Analysis

一般タブで、2つのデータ集合を決定します。Y1は、列BからDに格納されている生理学的データです。Y2は、列EからGに格納されているエクササイズ・データです。

列がラベルを持つので、列ラベルオプションをチェックしたままにしておきます。オブザベーション・ラベルオプションをチェックして、列Aを選択して、オブザベーション・ラベルを追加できます。

canonical correlation analysis software

オプションタブで、両データ集合が、中心化および削減されることを点検してください。

canonical correlation software package

出力では、すべてを選択してください。

canonical correlation package

チャートタブにあるユニークなプロットの表示も選んでください。

canonical correlation in excel

選択を完了すると、OKを押してください。

準備ができると、因子1 と因子2によるプロットの表示を選んでください。

説明される分散は99.22%であることがわかります。

canonical correlation software

正準相関分析の結果

記述統計量の後の最初の結果は、相関行列です。

最初の表で、weightとwaist(0.870)、2番目の表でsit-up’sとjumps (0.669) およびsit-up’sとchins (0.696)の間の強い相関 に注意してください。2つの表の間の相関、Waist とsit-up’s (-0.646) およびWaist とchins (-0.552)を除いては、むしろ小さいです。

canonical correlation

固有値は、最初の因子だけで、変動の93% を説明していることを示しています。

canonical correlation eigenvalues

正準相関が0であるという仮説を検定するWilksのラムダ検定は、 因子2と因子3ではp値が0.05のしきい値よりかなり上なので、疑いなく採択されるべきです。 因子1ではp値が0.06で、あまり精密な結論を与えません。

canonical correlation wilks lambda

因子1 の正準相関は、2つの表 Y1 とY2 が相関していることを示しています。この値は、2つの表の相関よりも大きいことに注意してください。

冗長度係数は、小さな割合の入力変数が、正準変数によって予測されることを示しています。

canonical correlation redundancy

入力変数と正準変数の相関(構造相関係数または正準因子負荷量ともいう)は、正準変数が入力変数にどのように関係しているかを理解することを可能にします。

変数 waist と weight は相関しており、因子1 および因子2と負に相関していることがわかります。これらは、また、エクササイズ sit-ups やchinsと反対に相関しています。これは、体重が重く、ウエストが大きい人々は、他の人々ほど sit-up’s や chins をたくさん行わないことを意味しています。

canonical correlation plot

お問合わせは、マインドウエア総研へ。

この記事は役に立ちましたか?

  • ウイ
  • いいえ