Easy fit - Select the best fitting model in Excel
このチュートリアルは、XLSTATを用いてExcel内で。複数のモデルを素早く適合させて、予測を行う方法を説明します。
Easy Fit 関数の目的
同じデータセットで複数の予測モデルをテストして比較するには、Easy Fit 関数を使用します。予測される変数のタイプ(量的または質的)に応じて、複数の予測モデルが提案されています。そして、Easy Predict 関数は、前もって生成されたモデルで新しいオブザベーションの値を予測することを可能にします。
このチュートリアルは、複数のクラス分類モデル(予測する変数Yが質的変数)を生成して選択する方法を説明します。Easy Fit 関数は、同様に回帰モデル(予測する変数Yが量的変数)を取り扱うこともできます。
下の表は、予測する変数Yの性質と説明変数Xの性質に応じて、Easy Fit 関数で現在利用可能な複数の予測モデルを示します:
クラス分類モデルを選択するためのデータセット
データはTitanic: Machine Learning from Disaster on Kaggle, the data science platformという機械学習コンペからのものです。それは1912年のタイタニック号の沈没を指します。この悲劇の際、救命ボートの不足により、2224人の乗客のうち1,500人以上が死亡しました。
データセットは、1309 人の乗客の一覧を彼らの特徴からなります:
予測する質的変数 Y :
-
SURVIVED: 0 = No; 1 = Yes
3 個の質的説明変数:
-
PCLASS: 客室の等級 (1 = 1st; 2 = 2nd; 3 = 3rd)
-
SEX: 性別 (male; female)
-
EMBARKED: 乗船港 (C = Cherbourg; Q = Queenstown; S = Southampton)
4 個の量的説明変数:
-
AGE = 乗客の年齢
-
SIBS: 乗船の兄弟/配偶者の数
-
PARCH: 乗船の親/子の数
-
FARE: 旅客運賃
このチュートリアルの目的
ここでの目的は、Yの質的変数 SURVIVEDを予測することです。我々は、複数のクラス分類モデルを生成して、最適合モデルを選択するためにEasy Fit 関数を使用します。そして、新しい標本に選択されたモデルを適用して予測を行います。
XLSTATでの Easy Fit 関数のセットアップ
XLSTATを開いたら、下図のようにXLSTAT/ XLSTAT.ai / Easy Fit コマンドを選択します:
Easy Fit ダイアログ・ボックスが現れます。
予測するY変数のタイプを選びます: この事例では、Yは質的で、SURVIVED変数を格納している列Aを選択します。
説明変数を選択します。ここで、我々は、量的説明変数 (列 E, F, G, H) および質的説明変数 (列 B, C, D)を選択します。
Easy Fit 関数が自動的にロジスティック回帰モデルとランダム・フォレスト・モデルを適合することを提案します。両方のモデルを選びます。
OK ボタンをクリックすると、計算が始まり、結果が表示されます。
Easy Fit の結果の解釈
データは、常に2個の標本に分割されます。オブザベーションの80%は、モデルの訓練に使用され、 20%はモデルに検証に使用されます。
生成されたモデルの品質測度を含む要約表が表示されます。
このデータセットでのベスト・モデルは、ロジスティック回帰のようです。最後に、生成されたモデルの合成結果が表示されます。
各モデルの結果の最初に、2個のボタンがあります:
最初のボタンは、完全な方法で事前記入されたダイアログボックスを自動で再開することを可能にします。これは、Easy Fitで生成された合成結果よりも多くの結果を得たい場合にとても有用でしょう。
2個目のボタンは、モデルの訓練または検証では使用されなかった新しいオブザベーションで、選択されたモデルによって予測を行うことを可能にします。このボタンをクリックすると、次のダイアログ・ボックスが現れます。
新しい乗客が生き残るかどうかを予測するために、新しい標本で同じ説明変数を選択します。
OKボタンをクリックすると、計算が始まり、結果が表示されます。
Easy Predict による予測結果が以下のように表示されます:
結論
我々はこのチュートリアルで、同じデータセットで複数の予測クラス分類モデルを生成するために、Easy Fit 関数を使用する方法を見てきました。
得られた合成結果は、モデルの品質を判断することを可能にします。交互作用の追加ボタンは、完全なモデルを再起動して、さらに進むことを可能にします。それらは、選ばれたモデルを新しい予測標本に適用することも可能にします。
このチュートリアルは、クラス分類(予測するY変数が質的変数)の場合について行われましたが、この機能は、回帰(予測するY変数が量的変数)の場合にも使用できます。
この記事は役に立ちましたか?
- ウイ
- いいえ