あなたの分析ソリューション

XLSTAT-LatentClassでの潜在クラス回帰モデルの推定

17/05/2016

潜在クラス回帰モデル: 概観

このチュートリアルは、潜在クラス回帰モデルの構築法を説明します。以下の方法を学ぶことができます:

  • 従属変数の選択とその尺度タイプの指定
  • 潜在クラス数の決定(すなわち、セグメント)
  • R2 とモデル予測に関するさまざまな情報の検討

さらに、この事例は、潜在クラス回帰モデルでの複数の高度なオプションを説明します。以下のことを学ぶことができます:

  • 反復オブザベーションを指定するためにオプションのケースID 変数を使用
  • パラメータ出力の探索
  • ケースを潜在セグメントに分類

 

潜在クラス回帰モデルを推定するためのデータセット

このチュートリアルで使用するデータを含むExcel シートは、こちらをクリックしてダウンロードできます。

この事例のデータは、回答者が複数の異なるシナリオのもとで購買レーティングを回答するように求められる反復測定を含む仮説的コンジョイント・マーケティング調査から得られました。データの一部を図 1に示します。

latent class regression data

図 1:  コンジョイント・データの一部
 
図 1で,ケースごとに8 レコード(合計で400ケース)が存在することが示唆されるので、製品の購買に関する異なるシナリオの2x2x2 完全な要因計画の各セルごとに1レコード です:

  • FASHION (1 = Traditional; 2 = Modern)
  • QUALITY (1 = Low; 2 = High)
  • PRICE (1 = Lower; 2 = Higher)

従属変数 (RATING) は、5点尺度での購買意向のレーティングです。上記の3つの属性が、モデル中の予測変数として使用されます。

 

潜在クラス回帰モデルに関するこのチュートリアルの目的

個人の購買決定に影響する3つの属性のそれぞれに取り付けられる重要度の推定値に対して異なっている潜在セグメントを識別するために、XLSTAT-LatentClass 潜在クラス回帰を使用します。潜在クラス回帰モデルは、これらの推定値がセグメントごとに異なるという事実をもたらします。つまり、1つのセグメントでは price とpriceだけが決定に影響し、2番目のセグメントは quality と modern (現代的外観)に影響sれますが、価格はあまり気にされません。我々は、RATING を順序従属変数として取扱い、セグメントの数を決定するために複数のモデルを比較します。

 

XLSTAT-LatentClassでの潜在クラス回帰モデルのセットアップ

XLSTAT-LatentClass 回帰ダイアログ・ボックスを開くには、ExcelメニューからXLSTAT / XLSTAT-LatentClass / 潜在クラス回帰 コマンド(図2)を選択してください。
 
lg menu

図 2: XLSTAT-LatentClass 回帰を開く

 

ボタンをクリックすると、XLSTAT-LatentClass 回帰 ダイアログ・ボックスが表示されます。

5つのタブからなる潜在クラス回帰分析ダイアログ・ボックスが開きます(図3)。
lg regression dialog box empty

図 3: LC 回帰モデルのための分析ダイアログ・ボックス
 
 
 
 
この分析では、RATING が従属変数になります。

Y / 従属変数フィールドで、変数 RATINGを選択してください。

従属変数の尺度タイプを指定することも必要です。たとえば、購買意向の5水準の間の自然な順序を考慮する尺度タイプ(順序固定)を使用します。 デフォルトで、データ上で固定されたスコア(1, 2, 3, 4, 5)が使用され、水準が並んで、隣り合う水準間で等しい距離が構築されます。

応答タイプ・ドロップダウン・メニューから‘順序’を選択します。

上記で説明したとおり、データは各応答(ケース)ごとに反復オブザベーションを格納しています。したがって、我々は、そのレコードがどのケースに属するかを指定する必要があります。これは、各ケースごとに固有の識別数を格納しているケース ID 変数を用いて達成されます。同じケースに属するすべてのレコードが、同じ固有のIDを割り当てられます。

オブザベーション・ラベル’ のボックスを確認して、対応するフィールドで、変数 IDを選択します。

次に我々は予測変数を選択します。予測変数は、回帰モデルで独立変数として使用されます。現在の事例では、我々は、製品属性FASHION, QUALITY, PRICE を予測変数として使用します。

‘名義l’ のボックスをチェックして、対応するフィールドで、変数 'FASHION', 'QUALITY' , 'PRICE'を選択します。

潜在クラス回帰モデルが、各クラスごとの回帰モデルをいっせいに計算します。 1-クラス・モデルは、単一の回帰モデルのみを計算します。これは、単一の回帰モデルがすべてのケースで真を保持するという標準の等質性仮定をなします。現在の事例では、1-クラス・モデルの計算から開始して、ベースとして使用する対数尤度統計量を得ます。そして、1個ずつクラスの数を増大させる追加モデルを計算して、各追加クラスの有意度を評価します。 
 
1つの評価は、連続するモデルの各対での対数尤度の変化が、BIC統計量で決定される有意度の量だけ減少できないかどうかのチェックからなります。(したがって、より低いBICを持つモデルが選択されます。)2番目の評価は、 L2 適合度統計量に関するp値を活用することです。 
 
4 種類の LC 回帰モデルの計算をリクエストします – 1-クラス・モデル, 2-クラス・モデル, 3-クラス・モデル, 4-クラス・モデル:

クラス数の下で  ‘下限:’ のボックスで ‘1’ をタイプして、 ‘上限’ のボックスで ‘4’をタイプします。

分析ダイアログ・ボックスは、今、このようになっているはずです: 

lg regression dialog box filled

図 4: 初期設定による回帰分析ダイアログ・ボックス

OKをクリックすると高速な計算が始まります。


XLSTAT-LatentClassでの潜在クラス回帰モデルの出力の解釈

XLSTAT-LatentClass が計算を完了すると、 5つのスプレッドシートが生成されます – 回帰要約シート (潜在クラス回帰), および計算された潜在クラス・モデルのそれぞれに関するシート(1-クラス・モデル (LCR-1 Class), 2-クラス・モデル (LCR-2 Classes), 3-クラス・モデル (LCR-3 Classes), 4-クラス・モデル(LCR-4 Classes))。

lg regression summary statistics

図 5: 計算されたモデルの要約


この出力は、正しいクラス数を決定することをアシストする統計量をレポートします。 -- 対数尤度(LL) 値、BIC 値、計算されたモデルでのパラメータ数。少なすぎるクラス数を指定するとクラスの差が無視され、多すぎるとモデルが不安定になる原因になり得るので、正しいクラス数を決定することが重要です。 一方、対数尤度が増大するたびにクラス数が増加し、最小BIC値はModel3 (BIC=8312.057)で出現しており、3-クラス解が計算された4つのモデルのうちのベストであることを示唆しています。

たまに、ローカル(準最適)解を得ることがあります。このデータでは、4-クラス・モデルinstead of . If this occurs, re-estimate the 4-クラス・モデルを再計算します。
 
注意: 我々はスパースなデータを取り扱っているので、モデル L2 とレポートされた自由度(df) に基づくp値は、適合を評価するには有効ではないことに留意してください。 
 
我々はっこで、3-クラス解での詳細な出力を検討します。

シート ‘LCR-3 Classes’ をクリックして、3-クラス・モデルのモデル出力を表示させます。

要約統計出力に続いて、その出力が提示されます。

 

パラメータ出力

まず、パラメータ出力を表示させます。

パラメータ出力(図 6)にスクロールダウンしてください。
 
lg regression output

図 6: 3-クラス・モデルでのパラメータ出力


各予測変数のベータ・パラメータは、 RATINGにおけるその予測変数の影響度の測度です。The beta effect estimates under the column labeled ‘Class 1’とラベルづけされた列の下で計算されたベータ効果は、セグメント 1 が FASHION = 2 (beta = 0.967)の製品で正に影響し、より高い PRICE (beta = -0.509)で負に影響し、より高い QUALITY ではまったく影響しない(ベータが近似的に 0)ことを示唆しています。また、セグメント2 (‘Class 2’) は、3 つの属性すべてで影響しており、現代的で (beta = 0.585)、より高い品質 (beta = 0.461)の製品選好を持ちますが、セグメント 1と同様、彼らの選好も 価格の関数として下降する (beta = -0.525)ことがわかります。セグメント 3 のメンバーは、より品質の高い製品を好みます (beta = 1.031)が、彼らの選好も価格の関数として下降し(beta = -0.461)、そして彼らは, FASHION.に影響されません。
 
 PRICE は、3つのすべてのセグメントで多少の差はあっても同じような影響を持つことに注意してください。Wald (=) 統計量は、クラス間でのこれらのベータ効果に有意な差がない(p値= .67 で統計的有意度を評価する標準のレベルである.05よりかなり高い)ことを示しています。これは、3つのセグメントすべてが、、同じ度合いに価格感度を示すことを意味します。これは、この効果がクラス独立(次のセクションを参照)であると指定されるモデルを計算するときに確認されます。PRICEに関するWald 統計量のp値は、.000 から小数第3 位までです。 この値をクリックすると、より正確な p-値が2.4x10-106 で、価格感度の量がとても有意であることを示していることがわかります。 
 
 他の2つの属性の効果に関しては、我々は大きなセグメント間の差を発見します。予測変数 FASHION は、セグメント1で強い効果を持ち、セグメント 2でやや強い効果を持ち、セグメント 3では実質的に効果がありません。QUALITY は、セグメント 3で強い効果を持ち、,セグメント2,はやや強い効果を持ち、 セグメント 1では実質的に効果がありません。FASHION と QUALITY の影響が3 つのセグメントの間で有意に異なるという事実が、これらの属性についてのWald(=) 統計量に関する有意度p値によって確かめられます。たとえば、FASHIONでは、 p値 = 6.2x10-38 です。
 
要約すると、セグメント 1  “Fashion-Oriented Segment(ファッション指向セグメント)”、セグメント 3 は“Quality-Oriented Segment(品質指向セグメント)”とラベルづけされ、セグメント 2 は、購買決定で3つすべての属性を考慮するセグメントです。

 

Copyright ©2015 Statistical Innovations Inc. All rights reserved.

 

 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283