生データからのコレスポンデンス分析 (CA)を3Dチャートで表示
このチュートリアルは、XLSTATソフトウェアを用いてExcel内の生データで**コレスポンデンス分析** (CA) をセットアップして解釈するすることを支援します。 これが必要とされる多変量データ解析ツールであるかどうか確かでない場合は、こちらのガイドを確認してください。
生のデータ表からコレスポンデンス分析を実行するデータセット
データと結果のExcelシートは、下記のボタンをクリックしてダウンロードできます: <データをダウンロード>をクリックしてダウンロードできます。データは。プレミア・リーグの外国サッカー選手と彼らの国籍のリストです。我々は、英国クラブでの外国選手の分布を調査しようとしています。
生のデータ表からコレスポンデンス分析をセットアップ
XLSTATを開くと、データ解析 / コレスポンデンス分析 コマンドを選択するか、データ解析ツールバー(下図)の対応するボタンをクリックしてください。
ボタンをクリックすると、コレスポンデンス分析ダイアログが現れます。
オブザベーション/変数の表フィールドでは、 Excel シート上で列 Club とRegion を選択してください。
データは、オブザベーション/変数の形式ですので、対応するオプションをチェックしてください。
列の名前が含まれるので、変数ラベルオプションも選択されるべきです。
出力については、シートオプションを選んでください。
オプションタブで、独立性の検定をチェックし、有意水準は 5 のままにしておきます。.
出力タブでは、以下のオプションを選択します:
- 分割表
- 固有値
- 主座標
- 標準座標
- 寄与率
- cos2乗
チャートタブに行って、以下を有効にします:
- 対称プロット
- 非対称プロット
- ラベル
OKをクリックしてください。
モデルは、2つより多い因子が必要なので、次のようにします。まず、プロット F1-F2を選択するために、選択をクリックします。そして、横軸を F2に変更します。 すると、縦軸 が F3に変わります。再び、選択をクリックします。この方法は、F1-F2 と F2-F3の2つのプロットを指定します。 完了をクリックしてください。
コレスポンデンス分析の結果の解釈
最初の結果は、分割表で、それから行と列の間の独立性の検定です。
0.008のp値は5%より低いので、帰無仮説は棄却されるべきです。これは、英国のクラブでの国籍の分布は、ランダムではないことを意味します。
そして対称プロットがあります。最初のプロットから、Aston Villa や Stoke City のようなクラブは、他のチームよりも北アメリカの選手が多いことがわかります。同じようにして、Burney には北欧の選手がたくさんいます。
コレスポンデンス分析の結果の3-D プロットを作成
我々は、ポイントのより良い表現を得るために、3次元でのプロットを行います。
まず、クラブと地理的領域に関する最初の3つの主座標と、それらの3つの因子のcosの合計を格納する表を作成します。
3つの因子のcosの合計は、3次元空間で標本がどれだけよく表現されているかの知見を与えます。
行と列に関する情報を入れるために、最後の列を加えます。行はクラブ、列は地域です。各標本を説明するために、R と C のカテゴリ変数を作成します。
完全な表を選択して、データ可視化に行って、XLSTAT-3DPlotオプションを選択します。
準備ができると、データの形式をテーブルとして選択します。
軸を指定する必要があります。右クリックして、ドロップボックス内で使用する適切な変数を選択します。 我々が使う3つの軸は、 F1, F2 水平、F3 垂直です。また、正規直交プロットを得るために、軸のサイズを設定する必要もあります。たとえば、すべての軸の限界に-1.5 から 1.5 を使用します。
ドットの色とサイズに、cosの合計を使用することができます。オブジェクトタブに行って、選択の色とサイズを修正します。
最後に、注記タブに行って、"Column1" をラベルとして選択して、ラベルを追加することができます。
これが、その3次元表現です。
お問合わせは、マインドウエア総研へ。
この記事は役に立ちましたか?
- ウイ
- いいえ