メインコンテンツに移動

Excelでの回帰用サポートベクター・マシン(SVR)のトレーニング

このチュートリアルは、XLSTATソフトウェアを用いてExcel内で**サポートベクター回帰(SVR)**を実行し解釈する方法を示します。

SVRのためのデータセット

abalone と名付けられ名付けられたデータセットは、海洋腹足類軟体動物であるアワビの特徴を含みます。アワビの年齢を予測するために、リングに色を付け、顕微鏡で数える必要があります。これは時間のかかる作業です。そのため、より簡単に実現できる方法でアワビの年齢を予測したいと考えます。

このチュートリアルの目的

このチュートリアルの目的は、Abalone データセットでSVRをセットアップして、訓練して、検証集合で回帰がどれだけよく実行されるかを確認する方法を学ぶことです。

XLSTATでSVRをセットアップ

XLSTATを開くと、下図のようにサポートベクター・マシンをクリックしてください: ボタンをクリックすると、SVMダイアログ・ボックスが現れます。Excel シートでデータを選択してください。

応答変数フィールドで、予測したい量的変数を選択してください。我々の事例では、リングの数を提供する列です。

回帰を適合するために、応答タイプとして量的を選択します。

我々はまた、量的 および 質的説明変数の両方のチェックボックスを下図のようにチェックして選択します。

量的変数フィールドで、次のフィールドに対応する列を選択します : - Length,

  • Diameter,
  • Height.

質的変数フィールドでは、質的情報の列を選択します:Sex.

各変数の名前が表の上部にあるので、変数ラベルのチェックボックスにチェックを入れてください。 オプションタブで、リグリッサ・パラメータをセットアップします。 SMO パラメータについては、デフォルトのままにしておきます。 C フィールドは、正則化パラメータに対応します。これは ε より大きい偏差が許容されるところまでの量に変換します。我々の事例では、我々は1での C の値に設定します。ただし、 C は正でなければなりません。

許容度パラメータは、サポートベクトルを比較するときの最適化アルゴリズムの精度を示します。計算をスピードアップさせたい場合は、許容度パラメータを増やしてください。我々は、許容度をデフォルト値のままにしておきます。

イプシロン フィールドは、イプシロンチューブを指定し、選択したサポートベクトルの数に影響を与えるパラメーターです。我々は、またしてもイプシロンをデフォルト値のままにしておきます。ただし、正でなければなりません。

我々は、下図のように、前処理フィールドで標準化を選び、線形カーネルを使用します。 我々は回帰モデルがどれだけよく実行されるかを確認したいので、トレーニング標本から検証標本を作成します。この目的のために、検証タブで、下図に示すように、検証チェックボックスにチェックを入れ、 トレーニング標本からランダムに10個のオブザベーションを抽出するように選択します。 最後に、出力タブで、下図のように我々が得たいアウトプットを選択します:

SVM リグリッサの結果の解釈

最初の表は、パフォーマンス測度を表示し、回帰を評価します。ここで、我々は、平均2乗誤差と決定係数を使用します。我々は低い平均2乗誤差と1に近い決定係数を望みます。

検証集合での決定係数は、71%の正しいスコアを有します。 2番目の表は、最適化されたSVRの要約を提供します。リグレッサーの訓練に使用された70個のオブザベーションのうち、59個のサポートベクトルが一致しました。最後に、超平面の原点であるバイアスが、検証標本の予測の際に使用されます。 次の表は、アルファ-アルファ* 係数値、応答変数の値、選択された説明変数および質的変数の分離表に関連づいた59個のサポートベクトルの完全なリストを提供します。 最後に、各オブザベーションでの回帰で得られた予測値が表示されます。

この記事は役に立ちましたか?

  • ウイ
  • いいえ