PCAグラフを読みやすくカスタマイズする
このチュートリアルは、主成分分析 (PCA) のチャートをより読みやすくするために、どのようにカスタマイズできるかを示します。
プロットをカスタマイズするデータセット
このチュートリアルで使用するデータと結果のファイルは、主成分分析のチュートリアル(Principal Components Analysis)で得られた結果に基づいています。我々の狙いは軸 F1 とF2のグラフィカル表現の読みやすさを改善することです。
プロットのカスタマイズ
まず、グラフをコピーして拡大します。グラフの拡大の際中、いくつかのラベルが対応するポイントからずれるのが見えます。これを修復するには、グラフを選択して、それから”データ可視化”ツールバーの”ラベル再配置”ツールを使用して、下記のオプションを選びます:
因子得点の表の右側に、各オブザベーションの最初の2軸上のcos2乗の総和を格納する列を作成します。
ちなみに、任意の軸と任意のオブザベーションで、cosineとは、軸と原点からそのポイントへのベクトルの間の角度のcosineです。 したがって、 cosineが大きいほど、そのポイントは、主成分分析から得られた多次元空間内で、軸により近くなります。あらゆるオブザベーションで、最初の2つの因子軸 F1 と F2 上のcosineの総和は、そのオブザベーションでの、F1 とF2で定義される平面の精度の知見を与えます。任意のオブザべ-ションで、すべての軸でのcos2乗の総和は 1になります。したがって、あるポイントについて、総和が1に近いほど、グラフの 解釈可能性が大きくなります。
さまざまなポイントについての2次元グラフの解釈可能性のレベルを示すために、我々は、cos乗の総和の値によって、ポイントのサイズを増やしたいわけです。これは、どのポイントが誤差なく解釈できるのかを知ることを可能にするでしょう。.
さらに、 国勢調査局が決定した州の5つのグループ(North East, South, Midwest, West およびPacific)を区別するために、異なる形状を使用します。
形状を変更するために、Excel が提供する形状の順序にしたがってXLSTATで定義されたコードを使用する必要があります(下図のダイアログ・ボックスを参照): 1が正方形、 2がひし形、3が三角形、 4が x、5が星型、6 が点、7 が -、 8 が+ 、9が円です。4つの形状だけが効果的に使用できるので、Pacific 地域に属するHawaï と Alaskaは、western の州と同じ円に黒の輪郭をつけて表示されます。
そして、各州に対応するコードを格納する列を作成します。
チャートの読みやすさを増すために、2乗cosの総和が0.8より大きいポイントを赤に色づけしようとしています。 ポイントの色を変更するために、形状が定義されたセルに、その色を適用しなければなりません。まず、cosinesの全部の列を青に色づけします。そして、 "ツール"のツールバー中にあるデータフラッガー・ツールを用いて、 総和が0.8以上のセルを赤に色づけします。
Hawaii と Alaskaに対応するポイントを黒で囲うために、 そのセルに黒い下側の境界線が追加されました。それから、セルのフォーマットがコピーして、形状の列に貼り付けて、 2乗cosの列のフォーマットをクリア (Excel / 編集 / クリア)します。
そして、グラフィックを選択して、"データ可視化" ツールバーにある EasyPoints ツールを立ち上げます。 下記のオプションが選択されました:
結果として、下図のグラフが得られました:
より簡単な解釈では、このグラフは、近似的に解釈できる州を識別することを可能にします。たとえば、 West Virginia と Pennsylvania は近いですが、一方、Pennsylvania とAlaska は、とても異なっていると結論づけることができます。さらに、グラフの右上と右下には、ほとんど Westernの諸州があることに気付きます。
お問合わせは、マインドウエア総研へ。
この記事は役に立ちましたか?
- ウイ
- いいえ