メインコンテンツに移動

PCAチャートでオブザベーションと変数をフィルタリング

主成分分析を実行するデータセット

このデータ は、 米国国勢調査局からのもので、2000年と2001年の間の51州の人口の変化を記述しています。元のデータ集合は、分析の焦点である2001年のデータとの1000人の住民ごとの比率に変形されています。

このチュートリアルの目的

我々の目的は、変数間の相関を分析することと、いくつかの州で他の州よりとても異なる変化があるかどうかを発見することです。XLSTATによる主成分分析の実行方法に関する一般チュートリアルがこちらになります。

我々は、PCAで表示されるグラフに注目します。XLSTATは、 cos²に関して表示されるオブザベーションと変数をフィルタするオプションを提供します。この測度は、得られたマップでのオブザベーションの表現の品質測度です。

主成分分析のセットアップ

XLSTAT-Pro を起動すると、XLSTAT / データ解析 / 主成分分析 コマンドを選択するか、データ解析 ツールバーの対応するボタン(下図)をクリックしてください。

XLSTAT Analyzing Data menu / PCA

主成分分析ダイアログ・ボックスが現れます。

Excel シート上でデータを選択してください。選ばれたデータ形式は、入力データの形式から、オブザベーション/変数 です。

計算の際に使用するPCAタイプ は、伝統的な相関係数であるPearsonの相関行列です。

XLSTAT principal component analysis dialog box general tab

チャート タブで、我々は、0.5より大きいCos2乗の合計でオブザベーションと変数をフィルタしようとしています。そのために、フィルタ・オプションを有効にして、 >cos² を選択し、値 0.5を投入します。

XLSTAT Principal Component Analysis dialog box variables charts tab

XLSTAT Principal Component Analysis dialog box observations charts tab

XLSTAT Principal Component Analysis dialog box biplots charts tab

OKをクリックすると、計算が始まります。行と列の数を確認するメッセージが現れます。

そして、プロットを表示したい軸を確認します。この事例では、最初の2つの因子で表現される変動のパーセンテージがあまり高くありません(67.72%); 結果の誤解釈を避けるために、我々は、 軸 1 と軸 3に関する2つめのグラフで結果を完成させるようにしなければなりません。

XLSTAT Principal Component Analysis axis selection PC1 and PC2’’’’XLSTAT Principal Component Analysis axis selection PC1 and PC3

フィルタされた主成分分析のグラフ

すべての従来の結果が表示されています。これらの結果の解釈する関する詳細なチュートリアルは、こちらを参照してください。

我々は、Cos2乗の表とPCAグラフに興味があります。

変数に関しては、我々は最初の2つ因子で、2つの変数(Federal/Civilian mode... / Net Int Migration)が0.5より小さいCos2乗であることがわかります。. これらの変数は、PCAによってよく表現されません。 それらはPCA の相関グラフには現れないようになります。

squared cosines table

得えられたPCA相関プロットは、以下のとおりです。

squared cosines chart

オブザベーションに関しては、いくつかの州がよく表現されていないことがわかります。

squared cosines table

たとえば、Columbia や Hawaii の地域は、最初の2つの因子でCos2乗が0.5よりも小さいので、オブザベーション・グラフには現れないようになります。

squared cosines plot

この簡単なツールは、より信頼できるグラフを得るために、PCAグラフのオブザベーションをフィルタすることができます。

この記事は役に立ちましたか?

  • ウイ
  • いいえ