あなたの分析ソリューション

分割表でのカイ2乗検定と Fisherの正確検定の実行

20/10/2017
このチュートリアルは、XLSTATソフトウェアを用いてExcelの分割表で、カイ2乗検定およびFisherの正確検定 をセットアップして解釈することを支援します。
これがお探しの統計的検定かどうか不確かですか? こちらのガイドを確認してください。

分割表でのカイ2乗検定とFisherの正確検定を実行するためのデータセット

このチュートリアルでは、マーケット・スタンドで収集されたバナナの数量を格納した分割表を用います。この表は、2つの量的変数をクロス集計しています:列にバナナの種類(3 カテゴリ: 1, 2, 3) と行にバナナの中の寄生虫の有無(2カテゴリ: presence(あり), absence(なし))。各セルは、行と列のカテゴリに対応する組み合わせでのバナナの数量を格納しています。

Contingency table

データと結果、追加の情報を含む Excel シートは、 こちらをクリックしてダウンロードできます。 

分割表でのカイ2乗検定とFisherの正確検定の実行に関するこのチュートリアルの目的

このチュートリアルの目的は、バナナの標本で測定された2つの質的変数(バナナの種類と寄生虫の有無)の間の関係を検定するために、カイ2乗検定とFisher正確 検定を使用することです。

 

分割表でのカイ2乗検定とFisher’の正確検定の違いは何か?

概念的には、カイ2乗検定とFisherの正確検定は、同じ 帰無仮説 を検討し、したがって、同じ質問に答えます。

H0 (帰無仮説): 2つの質的変数は独立である。我々の事例では、これは、寄生虫の有無はバナナの種類とは独立であることを意味します。言い換えると、存在するバナナの比率は、3つの種類ですべて等しいということです。

下記は、対立仮説(両側)の命題です:

Ha (対立仮説): 2つの変数はもう一方に従属する。我々の事例では、これは、寄生虫の有無がバナナの種類に従属することを意味ます。言い換えると、3つのバナナの種類の少なくとも1つが、他の種類とは異なる寄生虫の比率を持つことになります。

2つの検定の違いは、p値を計算する方法にあります。

カイ2乗検定は、帰無仮説が真である場合、実データと理論データの間の距離を反映するカイ2乗統計の計算に基づきます(すなわち、バナナの種類間で同じバナナの存在比率を持つ理論度数)。この統計量は、p値を生成するためのカイ2乗理論分布で使用されます。カイ2乗統計量が高いほど、p値が低くなります。XLSTATは理論度数の計算ができることに注意してください(下記参照)。

Fisherの正確検定は、(超幾何分布を用いて)観察データを持つ確率、および帰無仮説のもとで、より極端な可能なデータセットのすべてを得る確率を計算します。これらの確率は、Fisherの正確検定 p値を計算するために使用されます。

理論度数が、5よりも低い度数を含む場合、または、データセットの周辺度数(行ごとの合計または列ごとの合計)がとても異なっている場合、Fisher’の正確検定に頼るのがよい方法です。

カイ2乗検定はFisherの正確検定よりも強力(帰無仮説が偽である場合、それをより棄却しやすい)です。

 

 XLSTATでの分割表でのカイ2乗検定とFisherの正確検定のセットアップ

XLSTAT-Pro を起動すると、XLSTAT / 相関 – 属性相関の検定 / 分割表での検定を選択します。

correlation association tests menu

一般タブでは、分割表データ形式が選択されていることを確認して、分割表フィールドでデータを選択してください。データが垂直形式(行に個体、列の変数)で構成されている場合、質的変数データ形式のオプションを有効にしてください。データを垂直形式から分割表に変換したい場合は、こちらのチュートリアル を参照してください。will guide you.

Contingency tests menu General tab

 

オプションタブでは、カイ2乗検定とFisherの正確検定 オプションを有効にしてください。

Contingency tests menu Options tab

出力タブでは、理論度数比率 / 列オプションを有効にしてください。

Contingency tests menu Outputs tab

OK ボタンをクリックすうると計算が始まります。結果が新しいシートに現れます。

 

XLSTATにおける分割表でのカイ2乗検定とFisherの正確検定の出力の解釈

まず、XLSTATはカイ2乗検定に関係する結果を表示します。p値 (0.033) が0.05の有意水準よりも低いです。したがって、我々は、寄生虫の有無とバナナの種類が独立であるという帰無仮説を 3.3% の過誤リスクで棄却します。

Chi square test result

次に、Fisherの正確検定の結果が表示されます。ここでまた、p値(0.044)が0.05の有意水準よりも低いです。Fisherの正確検定も帰無仮説の棄却を導きます。

Fisher exact test result

カイ2乗検定でえら得たp値の方が、Fisherの正確検定に関するそれよりもわずかに低いことに注意してください。これはよくあることで、カイ2乗検定がFisherの正確検定よりも強力だからです。

そして、理論度数の表が、帰無仮説が真であった場合に得られたであろう度数を表示します。 簡単な計算で、寄生虫を持つバナナの比率がどの種類でも等しいこと(11.8%)がわかります。我々は、度数の1つが5よりも低いことに気づきます。したがって、我々は、カイ2乗検定の結果に頼らず、専らFisherの正確検定をレポートすることを選びます。

Theoretical frequencies

比率 / 列の表は、3種類のバナナのそれぞれでのMaggots-Yes (寄生虫あり)と Maggots-No (寄生虫なし)の比率を示します。この検定の結果によれば、少なくとも比率(0.121, 0.104, 0.300) のうちの1つが他よりも有意に異なると言えます。

Proportions per column table

 

お問い合わせ

販売部門にEメール

当社の技術サポートチームに連絡してください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283