CXLSTAT-PLSPMでの一般化構造成分分析(GSCA:Generalized Structured Component Analysis )の生成と実行
一般化構造成分分析(GSCA:Generalized Structurel Components)の原理
偏最小2乗パス・モデリング(PLS-PM:Partial Least Squares Path Modeling )は、観察変数と潜在変数の間の複雑な多変量の関係性(構造方程式モデル)をモデルする統計的アプローチです。数年前から、このアプローチは、複数の科学分野で一般的になってきました (Esposito Vinzi et al., 2007)。構造方程式モデルは、潜在する複雑な概念と多数の観察可能な指標での各測定値をリンクして関係性の理論的因果ネットワークの推定を可能にするたくさんの統計的方法論を含んでいます。
潜在変数を含むパス・モデリングへの最終的なPLSアプローチの最初のプレゼンテーションは、1979年にWoldによって公開され、したがって、PLSアルゴリズムに関する主要な文献はWold (1982 and 1985)です。
Herman Wold は LISREL (Jöreskog, 1970) "ハード・モデリング" (重い分布の仮定、数100のケースを必要とする)から、PLS "ソフト・アプローチ" (とてもわずかな分布の仮定、わずかなケースで十分)に転じました。構造方程式モデルへのこれらの2つのアプローチが、Jöreskog and Wold (1982)で比較されました。
構造方程式モデリングの立場から、PLS-PM は、線形条件付き期待値の観点で因果関係の概念が形成される成分ベース・アプローチです。PLS-PM は原因メカニズムよりむしろ最適な線形予測関係を求めておりり、したがって、予測関連指向の発見プロセスを原因仮説の統計的検定に役立てています。構造方程式モデリングへのPLSアプローチに関する2つの重要な解説論文は、 Chin (1998, よりアプリケーション寄り) と Tenenhaus et al. (2005, より理論寄り)です。
さらに、PLSパス・モデリングは、複数表(マルチ・テーブル)の分析に使用でき、この分野で使用されているより古典的なデータ分析手法に直接関係しています。実際、PLS-PM は、階層 PLS パス・モデルおよび検証的PLSパス・モデル (Tenenhaus and Hanafi, 2007)の両方の意味でマルチブロック(またはマルチ・テーブル)分析へのとても柔軟なアプローチとしてみなすこともできます。このアプローチは、複数表の分析の "データ駆動型 "の流儀を、構造方程式モデリングの "理論駆動型 "の流儀に何とかして統合し、表間の概念的な関係に関する現在の知識に照らして、マルチブロック・データの分析を実行できるようにする方法を明確に示しています 。
このチュートリアルでは、プロジェクトの作成、モデルの定義、パラメータの推定、および結果の分析の方法をステップ・バイ・ステップで示してガイドします。このチュートリアルは、次の論文に基づいています: [Tenenhaus M., Esposito Vinzi V., Chatelin Y.-M. and Lauro C. (2005). PLS Path Modeling. Computational Statistics & Data Analysis, 48(1), 159-205].
XLSTATによるGSCA
GSCA分析のためのデータセット
このアプリケーションは、携帯電話会社の250人の顧客が、彼らのロイヤルティをモデルするために7つの質問に答えている実際のデータに基づきます。GSCAモデルは、ヨーロッパ顧客満足度指標(ECSI: European Consumer Satisfaction Index)に基づきます。ECSIモデルでは、下図のように潜在変数 (直接測定できない概念) 相互に関係しています。
各潜在変数は、測定されている1つまたは複数の顕在変数に関係しています。このアプリケーションでは、顕在変数の質問は0-100 尺度です。たとえば、Image の潜在変数では、5個の顕在変数は:
- その会社の言動が信用されているか
- その会社の安定性やファミリーの確立
- その会社の社会貢献
- その会社が持つ顧客への関心度
- その会社の革新性、先進性
このチュートリアルで使用しているデータと結果を格納したXLSTAT-PLSPMプロジェクト・シートは、 こちらをクリックしてダウンロードできます。
XLSTAT-PLSPM プロジェクトは、特別なExcelワークブック・テンプレートです。新規のプロジェクトを作成する際、そのデフォルト名はPLSPMBookで始まります。
自由な名前でプロジェクトを保存できますが、PLSPM プロジェクト専用のフォルダに拡張子 *.ppmx を用いて保存するには、XLSTAT-PLSPMメニューの"保存" または"名前をつけて保存" コマンドを使用するようにしてください。xtension.
注意: GSCA_ECSI.ppmx ファイルを開く際、グラフィック表示がよくないかもしれません。 これは表示がパソコンの画面設定に依存するためです。表示を改善するには、 "PLSパス・モデリング"ツールバーの "表示の最適化"ボタン(下図)をクリックしてください。
未使用のXLSTAT-PLSPMプロジェクトは、消去できない2つのシートを含みます:
- D1: このシートは空白で、ワークシート中で使用したいすべての入力データを追加する必要があります。
- PLSPMGraph: このシートは空白で、モデルを設計するために使用します。このシートを選択すると、"パス・モデリング"ツールバーが表示されます。このシートから離れると、そのツールバーが非表示になります。
GSCA分析のセットアップ
このチュートリアルで使用するプロジェクトを作成するために、我々はXLSTAT-PLSPM メニューを用いて新規プロジェクトを生成しました:
そして、同じメニューの名前をつけて保存コマンドを用いて、それをPLSPM_ECSI.ppmx として保存しました。
そして、Excelファイル中で利用可能なデータをコピーして、プロジェクトの D1 シートにそれらをコピーしました。これを行うと、モデルの作成を開始する準備が完了です。PLSPMGraph シートに移動します。そのシートの左上隅にツールバーが表示されています。各簿他の機能に関する詳細はヘルプで説明しています。
複数の潜在変数を連続して作成するには、変数を追加している間、楕円のボタンが押されている状態になるように、それをダブル・クリックします:
そして、潜在変数がどのように関連しているかを示す矢印を追加することができます。矢印を追加するには、始点となる潜在変数をクリックして、Ctrlを押し終点となる潜在変数をクリックします。そして、矢印ボタンをクリックするか、ショートカットキーCtrl+Lを使用します。
すべての矢印が追加されると、各潜在変数に関係する顕在変数を定義できます(これは潜在変数を追加した後にも行えます)。潜在変数に顕在変数を追加するには、潜在変数を選択して、ツールバーでMVボタンをクリックします:
これはD1シートを活性させて、 潜在変数に適切な名前を与え、D1上の顕在変数を選択し、いくつかの設定を定義するためのダイアログ・ボックスを表示します。
モードを定義しなければなりません。reflective モードでは潜在変数は顕在変数で測定されたものに関与し、formativeモードでは、顕在変数が潜在変数を構成します。たとえば、これは潜在変数Expectationが入力されたときに、ダイアログ・ボックスがどうなるかを示しています:
得られるモデルは以下のような形になります:
各潜在変数について顕在変数が定義されて、潜在変数がリンクされると、モデルの計算を開始できます。モデルを実行するには、プレイ・ボタンをクリックしてください。
たくさんのオプションがある実行ダイアログ・ボックスが表示されます。このチュートリアルでは以下のオプションを使用しました:
GSCAの場合、標準化または生の顕在変数を選ぶことができます。我々は標準化された顕在変数を選びました。
ブートストラップ再標本化を用いて信頼区間が得られます。
我々の簡単な事例では、データセット内に欠損値がありません。したがって、我々は、欠損値を採用しまません。
PLS-PM プロジェクトの結果と解釈
結果では、まず顕在変数、定量モデルおよび構造モデルに関する情報が要約されます。
GSCA 分析の数値的結果
最初の重要な要素は、合成信頼指標(composite reliability indexes)です:
このアプリケーションでは、潜在変数は reflective(反映的)です。ブロックは1次元でなければなりません。We can see that Dillon-Goldstein’のrhoが0.7より高く、第1固有値が第2固有値よりも常にはるかに大きいことがわかります。期待値とロイヤルティは、Cronbachのアルファで悪い値を持ち、2番目の次元が有意になる可能性があります。このチュートリアルでは、我々は1次元の場合に注目します。さらなる次元に興味がある場合は、顕在変数と顕在変数の各ブロックで適用される主成分分析での因子の間の相関を調査することができます。我々はその観点には注目せず、1次元のみを考慮します。 PLS パス・モデリングの適用は、GoF 指標を伴う表を提供します:
絶対 GoF が0.465で、ブートストラップ推定にとても近いことがわかります。この値は、解釈がしにいくいです; それは、2つのオブザベーションのグループ、または2種類のモデルの全体的品質を比較するのに有用かもしれません。相対 GoF がとても高いです。内部および外部モデルGoFもそうです。そして、考査負荷量(cross-loadings)を確認します。:
我々のデータセットの場合、顕在変数とそれらが持つ潜在変数の間の負荷量が最も高いです。そして、外部重みと相関係数が2つの大きな表に収集されます。顕在変数と潜在変数の間の相関を調べると次のようになります:
たとえば、顕在変数 CUSA3 と CUSA2 が、CUSA1よりもsatisfactionでより大きな効果を持つことがわかります。これらの表は、各顕在変数の関連する潜在変数での影響を見ることができます。構造モデルに関する結果が続きます。各潜在変数では、構造モデルに関する情報が収集されます。satisfactionの場合、次のようになっています:
R’² の 0.672 は、良い結果と考えられます。perceived quality は、satisfactionで最大の効果を持ち、expectation の影響は有意でないことがわかります。最後の表は、結果を要約し、 perceived value が satisfactionのR’²の64% に寄与することを示します。グラフは、これらの結果を説明します:
次の表は、各潜在変数の外部モデルと内部モデルに関連するさまざまな予測品質指標を示します。これらの指標の平均値が、全体の品質値となります。すべての R’² の平均は0.378 で、satisfactionの R’² が最も高いことがわかります。PLSPM は、その推定手順において、定量モデルを支持するので、Communalities(共通性) はredundancies(冗長性)よりも常に大きいです。
PLSPMの最大の利点の1つは、潜在変数スコアです。それらは、 XLSTATでの他の統計的処理のために与えられ使用できます。これは、実データのケースでのXLSTAT-PLSPM モジュールの使用方法で示されています。モデルが描画されると、その手順は簡単です。モデルが検証されると、結果の解釈が、パス係数と相関係数の表を読むことによってできます。
GSCA 分析のグラフィカル出力
XLSTAT-PLSPMによって、パス・モデルでのたくさんのタイプの結果を表示できます。"表示する結果を選択"ボタンをクリックすると得られる可能なすべての指標を選択します:
結果ダイアログ・ボックスが現れます。そこには3つのページがあります:最初のは、潜在変数での指標の表示に関して:2番目は、潜在変数間の矢印での係数と指標の表示に関して:3番目は、顕在変数と潜在変数の間の矢印での係数と指標の表示に関して:結果を表示ボタンを押すと、PLSPMgraph ワークシートのパス・モデルに結果が現れます。
ダイアグラム全体を選択して、それを他のドキュメントにコピーすることができます。
この記事は役に立ちましたか?
- ウイ
- いいえ