メインコンテンツに移動
XLSTATはLumiveroグループに参加しています。詳しくはこちら

ExcelでのRIDGE回帰

このチュートリアルは、XLSTATソフトウェアを用いてExcel内でRidge回帰をセットアップして解釈する方法を支援します。

Ridge回帰のためのデータセット

元データは Osborne and al. (1984)のものです。 データセットは、30個のクッキーについての近赤外線スペクトルの離散化を格納しています。スペクトルは、1100~2460ナノメートルのすべての波長で観測され、各波長の間隔は40ナノメートルで、データセットの説明変数は35個になります。 また、データ表には、各クッキーの水分組成が記載されています。

このチュートリアルの目的

このチュートリアルの目的は、さまざまなクッキーの水分組成を予測するために、Ridge回帰をセットアップして解釈することです。

XLSTATでのRidge回帰のセットアップ

  • XLSTATを開くと、データ・モデリング / Ridge回帰.をクリックする。

  • Excelシートでデータを選択する。ここで従属変数(またはモデルする変数)は、クッキーの水分組成(water composition of the cookies).

  • 量的説明変数は L1 から L35の場暗号のすべての列。ここで我々は、クッキー内の水分 含有量の変動をスペクトルの関数として説明したい。

  • データセットの最初の 20 個のクッキー を選択してモデル構築に使用し、残りは予測に使用する。

  • 各変数の名前が表の上部に表示されているので、変数ラベル・チェックボックスをチェックする。

  • オブザベーション・ラベル・ボックスをチェックし、さまざまなクッキーの名前を選択する。

Setting up the general tab for Ridge regression

  • オプション・タブで、最適なラムダ正則化パラメータを見つけるために、クロス・バリデーションを使用する。我々はクロス・バリデーションに5フォルドを選び、100個のラムダの値をテストするように選ぶ。

  • 予測タブで、予測値を得たいデータを選択する。ここで、我々はデータセットの最後の10個のクッキーを選択する。.

  • チャート・タブで、正則化パラメータに伴うMSE(平均2乗誤差)の推移を可視化するために、MSEの推移 (クロス・バリデーション) オプションを有効にする。

Ridge回帰の解釈

表 “モデル・パラメータ”は、モデルの詳細を提供します。この表は、予測が必要であるか、モデル内の変数の重要度を分析する場合に役立ちます 。35 個の変数すべてが、値が低く比較的均一な係数でモデリングに保持されていることがわかります。
Model parameters table for Ridge regression続くチャートは、ラムダ正則化パラメータに伴うMSEの推移 を示します。XLSTAによって選択されるラムダの値は、MSEを最小化するそれで、つまり、ここでは約 0.133です。
MSE evolution graph for Ridge regressionモデルの推定に続く最後の表は、予測データセットを用いた10個のクッキーの水分組成の予測です。
Predictions table for the new observations for Ridge regression

Ridge回帰に関する結論

最後に、LASSO回帰とは異なり、Ridge回帰は利用可能は35個の変数すべてを使用して、さまざまなクッキーの水分組成をモデルしました。 同時に、LASSO 回帰とは異なり、Ridge 回帰によって構築されるモデリングでは、係数が大きく目立つ変数はありません。

この記事は役に立ちましたか?

  • ウイ
  • いいえ