Excelでの多項適合度検定チュートリアル
多項適合度検定
XLSTATの多項適合度検定は、質的変数(または離散化された量的変数)のカテゴリ水準で、期待度数と観察度数を比較することを可能にします。これは多項分布に基づくので、多項適合度検定と呼ばれます。
質的変数のカテゴリの理論度数が既知の場合、観察データを用いて、「分布が期待される分布と異ならない」という帰無仮説を検定できます。
多項適合度検定を実行するデータ集合
我々は、フランスでの職業の分布に基づく簡単な事例を用います。
職業は、8つのカテゴリ(Farmers(農業) / Self-employed professionals(自営) / Professionals, managers, and intellectual professions(専門職、管理職、知的労働) / Office worker (事務職)/ Clerks(店員) / Workers(作業員) / Inactive having worked(休職・失業) / Other not working(その他無職)) に分割されています。
我々は、560人のオブザベーションの調査で得られた度数と国レベルの統計とを比較しようとしています。
データと結果のExcelシートは、こちらをクリックしてダウンロードできます。
多項適合度検定のセットアップ
XLSTAT-Pro を起動して、XLSTAT / パラメトリック検定 / 多項適合度検定 コマンドを選択するか、パラメトリック検定 メニュー(下図)の対応するボタンをクリックしてください。
ボタンをクリックすると、ダイアログ・ボックスが現れます。Excelシート上でデータを選択してください:調査で得られた度数に対応するデータの列を度数ボックスで選択したください。
そして、期待比率ボックスにフランスの母集団での比率を選択してください。
選択の最初の行に変数名が含まれるので、列ラベルオプションをチェックされたままにしておきます。そして、カイ2乗検定とモンテカルロ法を有効にします。
統計的手法の詳細は、XLSTATのマニュアルを参照してください。
OK ボタンをクリックすると、結果が新しいExcel シートに表示されます(出力にシート・オプションを選択)。
多項適合度検定の結果の解釈
最初の表は、カイ2乗の臨界値、自由度の数、および対応するp値を表示します。
p値は、帰無仮説が正しいにもかかわらずそれを棄却する確率で、0.0001より低いことを示しています。この場合、我々は、観察度数を理論度数の間に差がないという帰無仮説を安全に棄却できます。
我々の標本は母集団の比率に合致しないと結論づけられます。標本を母集団に近づけるには、 レーキングなどの手法を適用することができます。
次の表は、モンテカルロ法の結果を示します。これは、標準の手法と同じ結論に至るようです。
このチュートリアルで、我々は、XLSTATを用いて、質的変数のカテゴリの期待度数と観察度数を簡単に比較できることを示しました。
お問合わせは、マインドウエア総研へ。
この記事は役に立ちましたか?
- ウイ
- いいえ