あなたの分析ソリューション

XLSTATによる分位点回帰の実行

20/07/2018

分位点回帰を実行するデータセット

このチュートリアルで使用するデータと結果のExcel シートは、 こちらをクリックしてダウンロードできます。

データはLewis T. および Taylor L.R. (1967), Introduction to Experimental Ecology, New York: Academic Press, Inc.で得られました。彼らは、237人の児童の性別、年齢(月数)、身長(インチ、1 inch = 2.54 cm)、体重(ポンド、1 pound = 0.45 kg)に関するデータを使用しています。

分位点回帰に関するこのチュートリアルの目的

分位点回帰を用いて、我々は児童の体重が、性別(fかmを値をとる質的変数)、身長、年齢によってどのゆおに変動するかを知り、線形モデルが有効かどうかを検証しようとしています。分位点回帰法は、線形回帰ANOVA および ANCOVAと同様、GML (一般化線形モデル)というモデルの種類に大分類されます。

これらの他の手法に対する分位点回帰の特異性は、従属変数の条件付き平均ではなく、条件付き分位点の推定を提供することです。これにより、分位点解禁は、分位点解析に基づくより正確な品質アセスメントを可能にします。  

QR 線形モデルでのパラメータ推定は、他の線形モデルと同様に変化の比率として解釈できます。したがって、最小2乗(OLS)モデルと類似した方法で、QRモデルの係数は、リグリッサの値の単位変化に対する従属変数分布の分位点の変化の比率として解釈できます。.

さらに、ANCOVAと同様、質的説明変数と量的説明変数を混在させることができます。線形回帰に関する他の3つのチュートリアルでも、このデータが使用されており、Height が線形回帰で、Height およびAge がANOVAで 、そしてHeight、Age、GenderがANCOVA)で、説明変数として使用されています。

分位点回帰のセットアップ

XLSTATを起動して、XLSTAT / データ・モデリング / 分位点回帰コマンド(下図)を選択してください。

 Menu

ボタンをクリックすると、分位点回帰ダイアログ・ボックスが現れます。Excel シートでデータを選択してください。ここでは従属変数(モデルする変数)は、 Weightです。

量的説明変数は、height と ageです、質的変数は、genderです。変数の列タイトルを選択したので、変数ラベルオプションを有効のままにしておきます。他のオプションはデフォルトのままにしておきます。

 Menu

 OKをクリックすると計算が始まります。そして結果が表示されます。

この調査では、分位点回帰のどの係数での分位点に関する分析がANCOVA.のそれと異なるかに注目します。

下記の事例では、目的の分位点を与える事前情報が仮定されていないので、2段階のデータ分析が好ましく、それが生成されます。

最初に、探索ステップとして、概観を得るために分位点プロセスを選択でき、次に注目する目的のいくつかの分位点が検出されます。

開始する前に、このデータセットにANCOVA を適用した主要な結果を振り返ります:

 Menu

 

分位点回帰の第1ステップの結果の解釈 : 分位点プロセスの計算

この予備ステップでは、一般的な結果のみが提供されます(第2ステップではより多くのオプションがあります)。

まず、中央値に関して、結果がANCOVAの(平均に関する)それと同じ順序であることに気づきます:

 Mean result

ここで、Age とHeightに注目すると、 最も大きな自動の体重でのそれらの寄与度がより強いことがわかります (alpha>0.9):

 Mean result

 対して、他の分位点回帰の結果は、Genderが最も痩せた児童の体重でより強い効果を持ちます (alpha<0.1):

 Mean result

明らかに、我々が興味を持っている部に点は、区間[0.9 , 1] および [0, 0.1]に属します。  

また、この分析の最後に表示されるチャートにより、これらの解釈を簡単かつ素早く確認できます:

 results

results

results

そして、第2ステップでは、分位点のセレクション: 0.95 と 0.05 がExcel シートでなされます。

分位点回帰の第2ステップの結果の解釈:分位点セレクションの計算

この最初の表は、特定の分位点に関するモデルの適合度を表示します。R² (決定係数)は、説明変数によって説明された従属変数の変動の % を示します。 R² が1に近いほど、よりよい適合です。

 results

このケースでは、Weight  の変動の91.6 % が0.05分位点でHeight、Age、Genderによって説明され、99.5 %が0.95分位点で説明されています。変動の残りの部分は、この「実験に際して測定あれなかったか、測定できなかったいくつかの効果(他の説明変数)によるものです。我々は、いくつかの遺伝的および栄養的な効果が関与していると推測できますが、利用可能な変数を単純に変換することで、より良い結果を得ることができそうです。

モデル有意度の表(下図)の結果を検討することが重要です。この結果は、説明変数がモデルに有意な情報量をもたらす(帰無仮説H0)かどうかの決定を可能にします。言い換えると、母集団を記述するのにこの分位点を使用することが有効であるかどうか、あるいは、説明変数によってもたらされる情報に価値があるかどうかを問ための1つの方法です。

 results

3つの検定が使用されます:最大尤度、ラグランジュ乗数、Wald。 Chi² 値に対応する確率が0.000より低いとしたら、帰無仮説(2つの説明変数に効果がない)が間違いであるリスクが,0.01% よりも低いことを意味します。したがって、我々は3つの変数が有意な情報をもたらすと確信を持って結論づけることができます。

続く表は、モデルの詳細を提供します。この表は、予測が必要な場合、または任意の集団でのモデルの係数と、もう1つの集団で得られたそれを比較することが必要な場合に役立ちます。

 results

次の表は、予測と残差の一部を示します。これは、標準化残差のそれぞれに注目することを可能にします。

 results

 下記のグラフは、予測値対観察値を示します:

 results

この分位点回帰の結論

結論として、Height、Age、Genderは、 Weightの変動の90%以上を説明できます。 我々が使用した分位点回帰によって、有意な情報量が説明されています。

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283