Excelでの一般化加法モデル(GAM: Generalized Additive Model)
このチュートリアルは、Excel内でXLSTAT-Rエンジンを用いて、**一般化加法モデル(GAM:**Generalized Additive Model)****をセットアップして解釈することを支援します。
一般化加法モデル(GAM)とは何か?
一般化加法モデル(Generalized Additive Models または GAMs )は、予測変数の非線形平滑化関数によって、アウトカムをモデリングできます。この文脈で一般的に使用される非線形関数の中に3次スプラインがあります。 XLSTAT-Rで開発されたGAM 関数は、Rのmgcvパッケージのgam関数(Simon Wood)をコールします。
XLSTAT-Rで一般化加法モデルを立ち上げるためのデータセット
データと結果のExcel シートは、下のボタンをクリックしてダウンロードできます: データをダウンロード データはWine Quality dataset (P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis. Modeling wine preferences by data mining from physicochemical properties. In Decision Support Systems, Elsevier, 47(4):547-553, 200)からの部分集合です。データセットは、0(非常に悪い)から10(非常に優れている)までの品質スコアによるワインのサンプルの物理化学特性を含みます。赤ワインのサンプルのみで、濃度、pH、硫酸塩添加物、アルコールおよび品質スコア変数が、このチュートリアル用に保持されています。
ここでの目的は、GAMsを用いてワインの品質の関する4つの物理化学特性の非線形効果を調査することです。
XLSTAT-Rでの一般化加法モデル(GAM)のセットアップ
**XLSTAT-R / gam / Generalized additive models(gam)**を開いてください。
一般タブでは、従属変数としてQuality scoreを選択してください。スコアは数値なので、 Gaussian ファミリを選択してください。
量的説明変数フィールドで、すべての物理化学データを選択してください。
オプションタブでは、Cubic Spline (3次スプライン)スムーザーを選択してください。XLSTAT-R は、一般的なデフォルトの設定を用いて、GAMモデルを自動生成します。GAM関数はちょっと複雑なので、XLSTAT-Rは、 gam 関数仕様に準じてRシンタックスで書かれた独自のGAMモデルをオプションで入れることができます。そうする場合は、正確な変数名を指定して、ケース (lowercase/uppercase)にマッチしていることを確かめてください。こちらが我々のデータにマッチしている事例です: quality~s(pH,alcohol,k=3)+s(density)+s(sulphates)
self-defined functionを設定する場合、上記のChoose Smoother (スムーザー)の選択は無視されます。いくつかの係数がゼロに正則化されるように、特別なぺナルティを追加することが可能です。
予測タブでどのような予測集合も設定しなかったので、予測値を除くすべての出力を選択してください。
OK をクリックして計算を立ち上げます。
一般化加法モデルGAM 分析の解釈
AIC とモデルの R2乗が最初に表示されます:
そして、パラメトリックと平滑化項および関連するp値を調査できます:
すべての物理化学変数がスコアに対して有意な非線形効果を持つようです。
これは、レポートの下部の成分チャートで探索できます:
各成分プロット内で、黒い線は対応する説明変数の非線形関数で、灰色の帯は信頼域です。高レベルの硫酸塩で低下する前に、低レベルから中レベルの硫酸塩にかけて急激に品質スコアが上昇することがわかります。
いくつかの外れ値 (すなわち、sulfates>1.5 または alcohol >14のサンプル) を除去して、分析を再度立ち上げ、したがって、データの大部分により注目することが興味深いかもしれません。
この記事は役に立ちましたか?
- ウイ
- いいえ