あなたの分析ソリューション

XLSTATでのANCOVAの実行

01/11/2017

ANCOVAを実行するデータセット

データと結果のExcelシートは、下記のボタンをクリックしてダウンロードできます:
<データをダウンロード>

データはLewis T. and Taylor L.R. (1967). Introduction to Experimental Ecology, New York: Academic Press, Inc.. の中で得られたものです。彼らは、237人の子供について、性別、年齢(月)、身長(インチ:1 inch = 2.54 cm)、 体重(ポンド:1 pound = 0.45 kg)を記述しました。

この共分散分析 (ANCOVA)の目的

共分散分析(ANCOVA)を用いて、我々は子供たちの体重が、性別(fまたはmの値をとる質的変数)、身長、年齢とどう関係しているか、そして線形モデルが有効であることを検証したいわけです。ANCOVA法は、 線形回帰ANOVAと同様、一般化線形モデル(GLM: Generalized Linear Models)と呼ばれるモデルの大分類に属します。

ANCOVAの特長は、量的説明変数と質的説明変数を混合していることです。線形回帰のほかの2つの チュートリアルでも、身長を含むデータ集合が使われています。そのとき身長と年齢は説明変数として使われました。

ANCOVAのセットアップ

XLSTATを開くと、XLSTAT / データ・モデリング / ANCOVA コマンドを選択するか、データ・モデリング ツールバー(下記)の対応するボタンをクリックしてください。

XLSTAT menu

ボタンをクリックうすると、ANCOVAダイアログる・ボックスが現れます。Excelシート上でデータを選択してください。 従属変数 (またはモデルする変数)は、ここではWeight(体重)です。

量的説明変数は、height(身長)とage(年齢)です。質的変数はgender(性別)です。変数の列タイトルを選択したので、 変数ラベル オプションを有効のままにしておきます。他のオプションは、デフォルトのままにしました。

XLSTAT dialog box for ANCOVA analysis

OKをクリックすると計算が始まります。 そして、結果が表示されます。

ANCOVAの結果の解釈

最初の表は、モデルlの係数の適合度を表示します。 R’² (決定係数)は、説明変数によって説明された従属変数の変動の % を示します。 R’² が 1 に近いほど、よりよく適合しています。

ancova-dialog-box-2.gif

このケースでは、重みの変動の63 %が身長、年齢、性別によって説明されます。変動の残りは、この実験で測定されなかったいくつかの効果(他の説明変数)によるものです。我々はいくつ かの遺伝的効果や栄養的効果が含まれることを推測できますが、単に利用可能な変数の変換だけでより良い結果が得られることもあります。

分散分析表(下図)を検討することは重要です。その結果は、説明変数がモデルに有意な情報(帰無仮説H0)をもたらすかどうかを決定することができ ます。言い換えると、母集団を記述するのに平均を使うことが有効であるかどうか、または説明変数によってもたらされる情報に価値があるかどうかを検討する方法です。

ancova-dialog-box-3.gif

フィッシャーのF検定を用います。F値に対応する確率が0.0001よりも低いということは、帰無仮説(2つの説明変数に効果がない)が正しくない という仮定が0.01%よりも低いリスクであることを意味します。したがって、3つの変数が有意な情報量をもたらすと確信を持って結論づけることができます。

我々はまた3つの変数が同じ情報量を提供するかどうかを確認したいのです。これを行うために、我々はType I SS と Type III SS の表(下図)を検討しました。Type I SSの表は、変数を1つずつモデルに追加して行き、モデル平方和(Model SS)でそれぞれのインパクトを評価することによって構築されます。 ちなみに、Type I SSでは、変数が選択される順番が結果に影響します。ある変数に対応するFの確率がより低いと、その変数のインパクトがより強いことになります。身長と年齢を追加すると、性別がモデルにほんのわずかの情報しかもたらさないことがわかります。

Type III SSの表は、モデルの品質における変数のインパクトを評価するために、モデルの変数を1つずつ削除して計算されます。これはType III SSでは変数が選択される順番が、値にどのような影響も与えないことを意味します。Type III SSは通常、モデルの一部に交互作用がある場合に、結果を解釈するために用いる最も良い方法です。ある変数に対応するFの確率がより低いと、モデル でのその変数のインパクトがより強いことになります。性別はモデルにわずかの情報しかもたらさないことがわかります。

analysis of covariance software

以下の表はモデルの詳細です。この表は、予測が必要な場合、または任意の母集団でのモデルと他の母集団で得られるそれとを比較する ことが必要な場合に役立ちます。Gender(性別)パラメータのp値が0.83ということ、対応する信頼区間が0を含むことがわかります。これによって モデルにおける性別のインパクトが弱いことが確認できます。Gender-fに対応するパラメータを見ると、任意の年齢と身長について、女子であるこ とは体重がわずかに少ないであろうことを意味します。

ancova package

つぎの表は、残差を示します。これは標準化残差のそれぞれについて詳細に見ることができます。これらの残差は正規に分布しているはずだという線形回帰モデルの仮定が与えられており、区間 [-1.96, 1.96]内に残差の95%が入っているはずだということを意味します。この区間の外側のすべての値は、潜在的なはずれ値であるか、もしくは正規性の仮定 が間違いであるかもしれないことを示唆します。 XLSTATの DataFlagger(データ・フラッガー)を使って、 [-1.96, 1.96]区間の中にない残差を抽出することできます。

237個のうちから16個の疑わしい残差が識別でき、それは5%ではなく6%です。つまり、分析は正規性の仮説を棄却することを導きます。残差のよ り深い分析は、 分布のフィッティングのチュートリアルで行います。

下図は、予測値 対 観測値を示します。信頼区間は、潜在的なはずれ値を識別することを可能にします。

Ancova: chart of predicted vs observed values

残差棒グラフ(下図)は、標準化残差 対 体重の可視化を可能にします。これは体重に伴う残差の増加を示します。残差のヒストグラムは、 [-2, 2]の範囲の外側にある残差を素早く可視化することができます。

Ancova: standardized residuals versus Weight variable

このANCOVAの結論

結論として、身長と年齢、性別は、体重のばらつきの63%を説明します。我々が使用したANCOVAモデルでは、有意な情報量が説明されませんでした。さらなる分析が必要です。

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283