あなたの分析ソリューション

XLSTATでのロジスティック回帰

30/01/2018

ロジスティック回帰

ロジスティック回帰やProbit法などの関連する手法は、バイナリの反応変数(response variable:たとえば0/1やYes/Noのような2値をとる変数)の系列の効果を理解したり予測したいときにとても役立ちます。ロジスティック回帰は、医薬や農業などの投与効果をモデルすることや、ダイレクトメールへの顧客レスポンスの可能性を予測すること、銀行で顧客がローンの返済をしないリス クを評価することなどに役立つかもしれません。

XLSTATによって、生データ(0と1として与えられた反応)、もしくは集計されたデータ(反応が"成功"の合計か、またはいくつかあり、そして 繰り返しの数が利用可能であるはず)でロジスティック回帰を実行することができます。

log1.gif 生データの例 - (抵抗素子の温度効果) 

log2.gif 集計データの例 - (特定の昆虫の種における殺虫剤の効果)

Addinsoftが投与効果分析用の特別なモジュールを開発していることに留意してください。このモジュールは、XLSTAT-Dose と呼ばれ、別途注文ができます。

ロジスティック回帰の方法論は、カテゴリカルまたは量的な変数である説明変数の値によって、成功の確率をモデリングすることを目的とします。

ロジスティック回帰のデータセット

データと結果のExcelシートは、下記のボタンをクリックしてダウンロードできます:
<データをダウンロード>

データは、60人のユーザのサンプルを示しており、彼らの年齢のカテゴリ、週あたりの平均閲覧ページ数、そして先週の閲覧ページ数からなっていま す。これらのユーザは、2週間後に期限が切れる定期購読の更新の確率を提供されました。我々のゴールは、なぜある人は更新して、他の人は更新しなかったのかを理解することです。

ロジスティック回帰の目的

ロジスティック回帰を用いて、我々が得た結果を説明し、そして定期購読を更新しないであろうユーザを識別するために、母集団の上でこのモデルを用い たいのです。これらのユーザは、ターゲットであり、更新のためのインセンティブ(たとえば、追加サービス)が提供されます。

ロジスティック回帰のセットアップ

ロジスティック回帰ダイアログ・ボックスを有効にするために、XLSTATを起動し、そして、 XLSTATデータ・モデリングロジスティック回帰 コマンドを選択するか、データ・モデリング ツールバー(下図)の対応するボタンをクリックしてください。

XLSTAT Menu

ボタンをクリックすると、ロジスティック回帰ダイアログ・ボックスが現れます。Excelシート上でデータを選択してください。

応答変数は、バイナリ変数または正の ケースのカウントが格納された列に対応します(注意:集計データを用いる場合、重みが選択されるはずです)。この事例では、我々は3 つの説明変数を持ちます。1つのカテゴリカル変数 - 年齢グループ -、および2つの量的変数:ページのカウントです。すべての変数の列タイトルを選択したので、列ラベルを含むオプションを選択します。

XLSTAT dialog box for logistic regression

OK ボタンをクリックすると、計算が始まります。

ロジスティック回帰の解釈

下記の表は、モデルの詳細です。この表は、さまざまな変数の影響度と年齢カテゴリの相対的影響度を理解することに役立ちます。

log4.gif

この表で、更新に最も影響する変数は、前月の閲覧ページ数であることが、カイ2乗の確率を見ることからわかります。切片(intercept)は有意であり、40-49歳の顧客は、定期購読の更新に強い正の影響を持つ事実もわかります。この最後の点は、 この特定の集団に正しいアクションをとるようにマーケティング担当者が解釈するために必要です。

 次の表は、モデルの品質(または適合の良さ)の複数の指標を与えます。これらの結果は、線形回帰やANOVAでのR2と分散分析表に相当します。見るべき最も重要な値は、log比でのカイ2乗検定の確率です。これはFisherのF検定に相当します。:一定の変数のみを持つよ りシンプルなモデルで定義されるので、モデルを比較することにより、変数が有意な情報をもたらすかどうかを評価しようとします。 この事例では、確率は0.0001よりも低いので、有意な情報が変数によってもたらされていると結論づけることができます。

log5.gif

最後のステップは、母集団でのモデルの適用です。この事例ではモデルは次のように書きます。:Y = Exp( L(x) ) / [ 1 + Exp( L(x) ], ここで、L(x) = -2.3567 + 0.0235.AvPage/Week + 0.0893.Page/Week + Factor そして、Factorは顧客が属する年齢グループに対応するパラメータの値をとります。

 来月に定期購読の更新を必要とする600人の顧客にモデルを適用するとき、我々はたった40%だけが更新するであろうことを知りました。正しいマー ケティング・アクションをとることにより、結果を85%に押し上げることができました!

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283