回帰分析での適合度統計の解釈の仕方は?
この記事は、Excelでの線形単回帰チュートリアルの事例のモデルでXLSTATが計算する適合度統計の解釈の仕方を説明します。
XLSTATでは, たくさんの統計解析で出力シートに適合度統計が返されます。通常、R2、MSE、AIC、SBCなど13個の同じ指標が提示されます。
それらの解釈は時々難しいかもしれませんが、これ以上疑問を残さないようにするために、この記事ではそれらを1つずつ分解していきます. 実用的な例から始めましょう。
アヤメの花に関する線形回帰分析
このデータセットは、100個の花に関する情報を含みます。 各花で4つの測定が行われました: sepal length、sepal width、petal length、petal width。品種も指定されています: Setosa、Virginica、 Versicolor。
この分析では、sepal length と sepal widthに基づいてpetal lengthを予測できるかどうかを確認しようとしています。Exceでの線形重回帰チュートリアルを用いて線形モデルを構築して、適合度統計のおかげで、その正確さを素早く評価できます。
この事例を再現するために、トライアル・バージョンとページの右上のデータセットをダウンロードしてください。
各統計量は何を意味するのか?
このモデルの適合度統計を以下のとおりです:
オブザベーション: 最初の行は、データセットのオブザベーションの数を示します。
この事例では、我々が測定した100個の花があります。
重みの合計: オブザベーションは、それらのいくつかにより重要度を与えるために、均等には重みづけされない場合があります。この行は、データセット内のすべてのオブザベーションの重みの合計を示します。
ここでは、すべてのオブザベーションが同じ重み (1)を持つので、重みの合計は100になります。
DF: この略語は自由度(Degrees of Freedom)の略です。それらは計算に使用された独立した値の数の推定値です。通常、この数はオブザベーションの数マイナス推定するパラメータの数に等しいです。
ここで、我々は2個の説明変数で線形回帰を実行しているので、2個の係数と切片を推定する必要があり、推定するのは3個のパラメータとなります。したがって、ここでの自由度は、100-3=97となります。.
R2: R2 統計量は、モデルによって説明される変動の合計と応答変数の実際の変動との比を表します。
ここで、0.870のR2は、データに含まれる変動の87%がこのモデルによって説明されたことを意味します。
調整済み R2: R2と同様、調整済み R2 は、説明された変動の合計と実際のそれとの比を表しますが、今度は、有意でないそれをユーザーが選択しないように、説明変数の数を考慮に入れます。したがって、これは変数の数が多いときに、モデルの品質を推定するのに役立ちます。
ここでは、2個の変数だけなので、調整済みR2は適切でなく、R2とそれほど違いがありません。
MSE: この略語は、平均2乗誤差(Mean Squared Error)の略です。これは各オブザベーションの予測値と実際の値との間の差の2乗の平均です。
ここで、それは約42です。これはpetal lengthが15から70mmの間で変化するので大きく見え、ゆえに、次の統計量がある。
RMSE: これは2乗平均平方根誤差( Root Mean Squared Error)の略です。これはMSEを元のデータの尺度に戻すことを可能にします。
ここで、それは約6.5で、petal lengthでとった値と比較すると、予測の精度が低いことがわかります。
MAPE: この略語は、平均絶対パーセント誤差(Mean Absolute Percentage Error)の略です。これは実際の値と予測値との間の平均誤差のパーセンテージです。
ここで、それは約17.8%です。これは、平均で、各予測値が実際の値よりも 17.8% 大きいか、または小さいかであることを意味します。
DW: この略語は、Durbin Watsonの略で、この統計量は、変数間の自己相関を調査することを目的としていています。その値は、0から4の値をとります。それが2なら、変数間に自己相関がないということになります。2より低いなら正の自己相関があり、2より高いなら負の自己相関があることを意味します。
ここで、 2に近い値であるため、変数間の自己相関がほとんどないことを示唆しています。
Cp: MallowsのCpはMSE、標本サイズ Nおよび予測変数の数Pに依存します。これは説明される変数に対する最良の予測変数の数を見つけることを可能にします。その値は、できるだけ低く、Pを超えないことが必要です。
ここで、説明変数 P=2 で、Cpは3であり、変数の1個は多くの情報を提供しないので、モデルの品質がよくないことがわかります。
AIC: 赤池情報量基準は、推定されたパラメータの数と最大尤度に基づいて計算されます。これは、最小値を選んで2個のモデルを比較することを可能にする。
ここで、AICは377です。我々は最良のモデルを選択するために、比較可能な他のモデルを必要とするので、実際のところ、どのような結論も成し得ない。
SBC (or BIC): Schwarzのベイジアン基準の背後にあるアイデアは、AICの背後にあるアイデアに似ていますが、これは標本サイズを考慮に入れることもできます。
AICと同様、ここでは比較するモデルがないので、実際に結果を解釈することはできません。
PC: この略語は雨宮予測基準(Amemiya Prediction Criterion)の略です。これは、R2 統計の調整の別の方法で、さらに言えば 1-R2 の値で、したがって、できるだけ低いのが望ましいです。調整済み R2と同様、これは予測変数の数に応じて, R2を調整します。
ここで、それは 0.138で、我々のモデルがもっと良ければ、もっと低くなる可能性があります。 すでに調整済みR2で見たように、ある変数が絶対不可欠ではないことを示しています。
結論:
これで、XLSTATが返す適合度統計を解釈する準備ができました!
要約すると、Cp、AIC、SBCのように、いくつかの基準は、我々のモデルを比較するために、他のモデルを必要とします。R2 や MAPE などの他のものは、応答変数の説明力を評価することを可能にします。さらに、調整済みR2やPCは、いくつかの変数が削除できるかどうかを見るために、モデルの品質を判断することができます。それぞれの基準には、それぞれの解釈と使い方があります。
この記事は役に立ちましたか?
- ウイ
- いいえ