メインコンテンツに移動
XLSTATはLumiveroグループに参加しています。詳しくはこちら

Excelでの線形回帰の影響診断チュートリアル

このチュートリアルは、XLSTATソフトウェアを用いてExcel内で線形回帰 の影響診断を計算して解釈する方法を説明します。

影響診断つきの線形回帰のためのデータセット

データと結果のExcelシートは、下のボタンをクリックしてダウンロードできます:

データをダウンロードデータは、Lewis T. and Taylor L.R. (1967). Introduction to Experimental Ecology, New York: Academic Press, Inc.で得られました。彼らは237人の児童を、彼らの性別、月数による年齢、インチでの身長 (1 inch = 2.54 cm)、本での体重 (1 pound = 0.45 kg)で記述しています。

このチュートリアルの目的

統計的モデルに進む前に、さまざまな変数の極値(外れ値)を表すオブザベーションを分析から除外するために、それらを識別しようとするしょう。っしかしながら、この手順は、そのようなオブザベーションがどれだけモデルのパラメータの計算に影響を与えるかの指標を提供しません。これを評価するために、それらのオブザベーションの影響診断を計算することが提案されています。

影響診断つきの線形下記のセットアップ

XLSTATを開いて、XLSTAT / データ・モデリング / 回帰機能を選択します。

ボタンをクリックすると、線形回帰ダイアログ・ボックスが現れます。

Excelシートでデータを選択してください。 従属変数 (またはモデルする変数)は、ここでは"Weight"です。

量的説明変数は、"Height" と "Age"です。

変数の列タイトルを選択しているので、変数ラベルオプションを有効にします。

注意: XLSTATを用いてExcel内で線形回帰をセットアップする方法の詳細については、チュートリアルExcelでの線形重回帰を参照してください。

出力タブでは、予測値影響診断を選択します。

線形回帰の影響診断の解釈

複数の指標が計算されます。影響診断の中に、てこ比、マハラノビス 距離、CookのD、CovRatio、標準化 DFFits、標準化DFBetasがあります。 これらの指標の大部分は、 i 番目のオブザベーションありのモデルとなしのモデルの間の差(予測値、パラメータ推定、分散-共分散行列…での差)を定量化します。

ここで、我々は標準化 DFFits および DFBetasの解釈に注目します。

我々は、パラメータの推定と予測値に関して、179番目のオブザベーションの強い影響を観察します。次のオブザベーションでも(より弱い)効果があります: 8, 24, 38, 50, 60, 69, 77, 100, 108, 122, 010, 168, 169, 205, 207, 208, 218, 224 , 234。個体179 は、171.5 ポンド (77kg)で 67.5 インチを測定します。もし我々がこの個体の特徴で、より詳細を見るならば、彼は 20 歳であり、それに反して、インタビューされた他の児童は13歳から14歳の間です。彼の体重/身長の比は2.5で、一方標本全体の平均は 1.65 です。

すべてのパラメータの中で、彼はAgeの推定で強い影響を持ちます。実際、彼の年齢は、その身長よりもはずれています。 上記の観察に基づいて、この個体をモデルから除外することを提案します。

この記事は役に立ちましたか?

  • ウイ
  • いいえ