基本のPLSパス・モデリング・プロジェクトの作成と実行
PLS パス・モデリングの原理
PLSパス・モデリング(Partial Least Squares Path Modeling :PLS-PM)は、観測された変数と潜在変数の間の複雑な多変量関係(構造方程式モデル)をモデルするための統計的アプローチです。つい数年前から、このアプローチはいくつかの科学分野で一般的になってきました (Esposito Vinzi et al., 2007)。構造方程式モデルは、 いくつかの観測される指標によって定量化される潜在する複雑な概念をつないだ理論的因果ネットワークを推定することを可能にするもので、いくつもの統計手法を含みます。
潜在変数を伴うパス・モデリングへの完成されたPLSアプローチの最初の提案は、 1979年にWoldによって出版され、したがってPLSアルゴリズムの主要な文献は、 Wold (1982年と1985年)です。 Herman Woldは、LISREL (Jöreskog, 1970) の"ハード・モデリング"(厳しい分布の仮定、数100件のケースが必要)に反して、 PLS の"ソフト・モデリング" (ごくわずかの分布の仮定、わずかのケースで十分)を提案しました。これらの2つの構造方程式モデルのアプローチは、 Jöreskog と Wold (1982)で比較されました。
構造方程式モデルとしてのPLS-PMは、因果の概念が線形条件つき期待値の観点から定式化されるコンポーネント・ベースのアプローチです。 PLS-PMは、因果のメカニズムよりもむしろ最適な線形予測関係性を探索するので、因果仮説の統計的検定への予測-関連性指向の発見プロセスの恩恵に浴します。構造方程式モデリングへのPLSアプローチに関する2つのたいへんに重要な解説論文は Chin (1998, より応用指向) とTenenhaus など. (2005, より理論指向)です。
さらに、PLSパス・モデリングは、マルチプル・テーブルを分析することに使用でき、この分野で使用されている伝統的なデータ分析手法により直接的に関係しています。事実、 PLS-PMは、階層PLSパス・モデルと 確証PLSモデルの両方を用いたマルチ・ブロック(またはマルチプル・テーブル)分析へのとても柔軟なアプローチとみなすこともできます(Tenenhaus および Hanafi, 2007)。このアプローチは、マルチプル・テーブル分析の"データ駆動"様式が、構造方程式の"理論駆動" 様式の中に融合されて、テーブル間の概念的関係性についての現在の知識を考慮してマルチ・ブロック・データの分析を実行することをどのように可能にするかを示します。
このチュートリアルでは、予測値の作成、モデルの定義、パラメータの推定、結果の分析の方法をステップ・バイ・ステップで説明します。このチュートリアルは、次の論文に基づいています:: [Tenenhaus M., Esposito Vinzi V., Chatelin Y.-M. and Lauro C. (2005). PLS Path Modeling. Computational Statistics & Data Analysis, 48(1), 159-205].
XLSTAT-PLSPMによるPLSパス・モデリング
PLS パス・モデリング分析のためのデータセット
この応用は、顧客ロイヤルティをモデルするために、携帯電話会社の250人の顧客に複数の質問をした実データに基づいています。PLSPMモデルは、ヨーロッパ顧客満足度指数 (ECSI:European Consumer Satisfaction Index)に基づいています。.ECSIモデルでは、潜在変数(直接には計測されない概念)が、下図のように相互連関しています。
各潜在変数は、1つかそれ以上の計測された顕在変数に関連しています。この応用例では、顕在変数は、0-100 尺度の質問です、たとえば、Imageの潜在変数に関する5つの顕在変数は:
- その会社の言動が信用されているか
- その会社の安定性やファミリーの確立
- その会社の社会貢献
- その会社が持つ顧客への関心度
- その会社の革新性、先進性
このチュートリアルで使用するデータと結果を格納したXLSTAT-PLSPMのプロジェクト・シートは、こちらからダウンロードできます。
XLSTAT-PLSPMプロジェクトは、特別な Excelワークブック・テンプレートです。新規のプロジェクトを作成すると、そのデフォルトの名前はPLSPMBookで始まります。
自由な名前でプロジェクトを保存できますが、PLSPMプロジェクト用のフォルダに拡張子*.ppmで保存するために、XLSTAT-PLSPMのツールバーの"保存" または"名前をつけて保存" コマンドを使用するようにしてください。
注意:PLSPathModeling_ECSI.ppmファイルを開くと、グラフィカルな表示がよくないかもしれません。これは表示がパソコンの画面設定に依存するためです。表示を改善するには、 "PLSパス・モデリング"ツールバーの "表示の最適化"ボタン(下図)をクリックしてください。
未使用のXLSTAT-PLSPMプロジェクトは、消去できない2つのシートを含みます:
- D1: このシートは空欄で、ワークシート中で使用したいすべての入力データを追加する必要があります。
- PLSPMGraph: このシートは空白で、モデルを設計するために使用します。このシートを選択すると、"パス・モデリング"ツールバーが表示されます。このシートから離れると、そのツールバーが非表示になります。
PLS パス・モデリング分析のセットアップ
このチュートリアルで使用するプロジェクトを作成するために、まず XLSTAT-PLSPMメニューを用いて新規プロジェクトを生成します。
PLSパス・モデリングは、複雑な手法であり、XLSTATのPLSPMモジュールには、たくさんのオプションと指定があります。簡単なモデルのアプリケーションを単純化するために、2つの表示が利用できます。
デフォルトの表示は“クラシック”といい、PLSパス・モデリングを適用するのに必要な主要機能を表示し、より洗練された表示は “エキスパート”といい、マルチグループ・テスティング、モデレーティング効果推定、スーパーブロック手順などの新しいオプションを表示します。このオプションを変更するには、XLSTAT-PLSPMツールバー上のXLSTAT-PLPM オプションをクリックします。
そして、同じメニューの名前をつけて保存コマンドを用いて PLSPM_ECSI.ppmx を保存します。
そして、Excelファイル中にあるデータをコピーして、プロジェクトのD1シートに貼り付けます。これが完了すると、モデル作成を開始する準備ができます。PLSPMGraphシートに移ります。ツーバーがそのシートの左上隅に表示されます。ヘルプで各ボタンの機能についての詳細説明があります。
複数の潜在変数を連続して作成するには、変数を追加している間、円のボタンが押されている状態になるように、それをダブル・クリックします。
そして、潜在変数がどのように関連しているかを示す矢印を追加することができます。矢印を追加するには、始点となる潜在変数をクリックして、Ctrlを押し終点となる潜在変数をクリックします。そして、矢印ボタンをクリックするか、ショートカットキーCtrl+Lを使用します。
すべての矢印が追加されると、各潜在変数に関係する顕在変数を定義できます(これは潜在変数を追加した後にも行えます)。潜在変数に顕在変数を追加するには、潜在変数を選択して、ツールバーでMVボタンをクリックします:
これはD1シートを活性させて、 潜在変数に適切な名前を与え、D1上の顕在変数を選択し、いくつかの設定を定義するためのダイアログ・ボックスを表示します。
モードを定義しなければなりません。モード A (reflective モード)では潜在変数は顕在変数で測定されたものに関与し、モードB(formativeモード)では、顕在変数が潜在変数を構成します。たとえば、これは潜在変数Expectationが入力されたときに、ダイアログ・ボックスがどうなるかを示しています:
得られるモデルは以下のような形になります:
各潜在変数について顕在変数が定義されて、潜在変数がリンクされると、モデルの計算を開始できます。モデルを実行うするには、このボタンをクリックしてください。
たくさんのオプションがある実行ダイアログ・ボックスが表示されます。このチュートリアルでは以下のオプションを使用しました:
PLSパス・モデリングは、繰り返しアルゴリズムに基づいており、したがって初期化が必要です。このアプリケーションでは、顕在変数(観測変数)は、すべて同じ尺度なので、事前変換なし(4つの設定があります)で取り扱われます。 外部重みの初期値は、潜在変数に関係する潜在変数で主成分分析を実行したときの第1固有ベクトルの値です(2種類の設定があります)。
我々は内部重み推定にセントロイド(重心)スキームを使用します。信頼区間が、ブートストラップ再標本を用いて得られます。
我々の簡単な例では、データ集合中に欠損値がありません。したがって、我々は、欠損値を採用しません。
最後に、出力について、(相関係数)を除くすべてのボックスをチェックします。以下は、各出力の説明です。
PLS-PM プロジェクトの結果と解釈
結果では、顕在変数に関係する情報、定量モデルおよび構造モデルがまず要約されます。
PLS パス・モデリング分析の数値的結果
最初の重要な要素は、合成信頼指標(composite reliability indexes)です。:
このアプリケーションでは、潜在変数がreflective(モードA)です。ブロックは1次元でなければなりません。Dillon-Goldstein’s rhoが0.7より高く、第1固有値が常に第2固有値よりもかなり大きいことがわかります。Expectation と loyalty で Cronbachのアルファが悪い値で、第2次元が有意なようです。このチュートリアルでは、1次元の場合に注目します。より多くの次元数に興味のある場合は、顕在変数と顕在変数の各ブロックに適用された主成分分析の因子の間の相関を調べることができます。我々は、その点には注目せず、1次元のみを考慮します。PLS パス・モデリングの適用は、GoF 指標の表を提供します:
絶対GoFが0.465で, ブートストラップ推定にとても近いことがわかります。この値は解釈しにくいです; オブザベーションの2つのグループまたは2つの異なるモデルの全体品質を比較するときに、これは便利かもしれません。相対 GoF はとても高いです。内部および外部モデルGoFもそうです。そして、考査負荷量(cross-loadings)を確認します:
我々のデータセットのケースでは、顕在変数とそれらの潜在変数との間の負荷量が最も高いです。そして、外部重みと相関係数が2つの大きな表に収集されます。顕在変数と潜在変数の間の相関係数を調べると次のようになります:
たとえば、顕在変数 CUSA3 と CUSA2 が、CUSA1よりもsatisfactionでより大きな効果を持つことがわかります。これらの表は、各顕在変数の関連する潜在変数での影響を見ることができます。構造モデルに関する結果が続きます。各潜在変数では、構造モデルに関する情報が収集されます。satisfactionの場合、次のようになっています:
R’² の 0.672 は、良い結果と考えられます。perceived quality は、satisfactionで最大の効果を持ち、expectation の影響は有意でないことがわかります。最後の表は、結果を要約し、 perceived value が satisfactionのR’²の64% に寄与することを示します。グラフは、これらの結果を説明します:
次の表は、各潜在変数の外部モデルと内部モデルに関連するさまざまな予測品質指標を示します。これらの指標の平均値が、全体の品質値となります。すべての R’² の平均は0.378 で、satisfactionの R’² が最も高いことがわかります。PLSPM は、その推定手順において、定量モデルを支持するので、Communalities(共通性) はredundancies(冗長性)よりも常に大きいです。
PLSPMの最大の利点の1つは、潜在変数スコアです。それらは、 XLSTATでの他の統計的処理のために与えられ使用できます。これは、実データのケースでのXLSTAT-PLSPM モジュールの使用方法で示されています。モデルが描画されると、その手順は簡単です。モデルが検証されると、結果の解釈が、パス係数と相関係数の表を読むことによってできます。
PLS パス・モデリング分析のグラフィカル出力
XLSTAT-PLSPMによって、パス・モデルでのたくさんのタイプの結果を表示できます。表示する結果を選択ボタンをクリックすると得られる可能なすべての指標を選択します:
結果ダイアログ・ボックスが現れます。そこには3つのページがあります:最初のは、潜在変数での指標の表示に関して:2番目は、潜在変数間の矢印での係数と指標の表示に関して:3番目は、顕在変数と潜在変数の間の矢印での係数と指標の表示に関して:結果を表示ボタンを押すと、PLSPMgraph ワークシートのパス・モデルに結果が現れます。
ダイアグラム全体を選択して、それを他のドキュメントにコピーすることができます。
この記事は役に立ちましたか?
- ウイ
- いいえ