あなたの分析ソリューション

Excelでの混合データの因子分析(PCAmix)

25/06/2018

このチュートリアルは、XLSTATソフトウェアを用いてExcel内で、混合データの因子分析をセットアップして解釈することを支援します。

混合データの因子分析(PCAmix)を実行するデータセット

データと結果のExcelシートは、下のボタンをクリックしてダウンロードできます:

データをダウンロード

このデータセットは、Centre de recherche INRA d’Angers, Franceによって収集されたデータの抜粋です。さまざまな官能記述子(14個の量的変数)によって21種類のワインを評価するように専門家に質問しました。ワインの産地と地質に関する2つの質的変数もあります。

PCAmix法とは何か?

オブザベーションが量的変数と質的変数の両方で記述されているデータ・テーブルを分析するには、混合データの因子分析 (PCAmix) を使用します。この手法は、下記のために使用されます:

  • 変数間の相関を調査し可視化する.
  • 初期変数の線形結合である非相関因子を得る。
  • 2または 3次元空間でオブザベーションを可視化する。

混合データの因子分析は、Hill and Smith (1972)によって最初に開発された手法です。そして、この手法のいくつかの亜種が開発されてきました (Escofier 1979, Pagès 2004)。Xlstatで使用される手法は、PCAmix と呼ばれ、Chavent et al (2014)によって開発されました。この手法は、因子分析のよく知られた2つの手法を融合したものとみなすことができます: オブザベーション/量的変数の表を分析できる主成分分析 (PCA) とオブザベーション/質的変数を分析できる多重コレスポンデンス分析 (MCA)。

PCAmix法は、これらの2つの手法の混合として見ることができ、n個のオブザベーションが量的変数と質的変数の両方で記述されている表の分析を可能にします。他の因子分析法と同様、PCAmix法はデータの次元を削減すること、および、変数間の近さを識別しながらオブザベーション間の近接も識別することを意図します。

XLSTATによる多重コレスポンデンス分析のセットアップ

XLSTATを開ていて、XLSTAT / データ分析 / PCAmix コマンド(下図)を選択してください。

ボタンをクリックすると、PCAmix dダイアログ・ボックスが現れます。

オブザベーション/量的変数フィールで列D-P を、オブザベーション/質的変数フィールドで列 B-C を選びます。最初の行に変数名が入っているので変数ラベルオプションを有効のままにしておきます。そして、オブザベーション・ラベルフィールドで列Aを選択します。

変数とオブザベーションで利用可能なすべての結果を表示することを選びます。

チャート/オブザベーションタブでは、量的変数 “Global quality”を単純に再コード化するグループ変数によってオブザベーションを色づけする事を選びます。この色づけは、オブザベーションのグループを識別することを可能にします。他のすべてのオプションは、デフォルトのままにします。

タブは、結果の表示に使用する色を定義できます。

PCAmixの結果の解釈

最初に表示される結果は、選択された変数の記述統計量です。
下記の表では、非ヌル固有値と対応するイナーシャのパーセンテージが表示されています:

そして因子軸での量的変数と質的変数のカテゴリの座標が表示され、COS2乗、寄与度および2乗負荷量が続きます。オブザベーションについて同じ結果が表示されます。2つの変数間やオブザベーション間の近接度を解釈する前に、それらの寄与度やCOS2乗が考慮されている軸上で高いことを確認するべきです。
下記のチャートは、変数間、オブザベーション間および因子軸間の関係性を解釈するのに、
とても便利です:

最初の3つのチャートは、変数と因子軸との間のリンクを可視化します。これらのチャートは、因子軸の観点からの解釈を我々に与えます。たとえば:
  • 軸 1 は、次の変数ととてもネガティブに相関します: Fruity、Flower、 Aroma/intensity、Aroma/persistency、Aroma/quality、Balance、Smooth、Intensity、Harmony、Overall quality。これは、第1軸で負の値を持つワインが、これらの変数で高い値を持つことを意味します。
  • 軸 2 は、変数 Odor/Intensity および Spice と正に相関し、Flower 変数と負に相関します。これは、第2軸で高い値を持つワインが、Odor/intensity と Spice で高いランクを持ちますが、Flowerでは低い値を持つことを意味します。質的変数 Soil が第2軸とリンクしていることもわかります。たとえば、カテゴリ Env4 を持つワインは第2軸で高い値を持ちます。
最後のチャートでの軸の解釈とワインの位置に基づいて、ワインの特性を検出できます。さらに、オブザベーションの色は、global qualityによるワインの3つのグループを識別することを可能にします。最良のワイン(青)は第1軸で負の値を持ち第2軸で低い値を持つワインであることがわかります。中間のワインはチャートの中心に近く、あまり高く評価されないワイン(緑)は、第1軸 (T1, T2) または第2位軸 (1VAU,2ING)で高い値を持つワインです。たとえば、spicy(ピリッとした匂いのきつい)ワインはあまり高く評価されません。 

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283