あなたの分析ソリューション

XLSTATでのヒストグラムの作成と分布の適合

20/10/2017

このチュートリアルですること

まず、XLSTATツールを使用することによりヒストグラムの作成が可能となり、そして分布適合ツールを使用することにより、標本が(統計学的意味で)負の2項分布に従うか否かを検定します。通常、負の2項分布は、水生環境でのバクテリアの凝集/拡散現象をよく表現します。

ヒストグラムの作成と分布の適合のためのデータ

データと結果のExcel シートは、 こちらをクリックしてダウンロードできます。

データは、大腸菌によるバクテリア汚染の有無を決定するために、溶媒上で培養された200標本の河川水での実験データです。 72時間保育した後、コロニーの数をカウントしました。  Bact-Data の列に200個の標本があります。

ヒストグラムを作成するためのダイアログ・ボックスのセットアップ

XLSTATを起動すると、XLSTAT / データ記述 / ヒストグラムコマンドを選択するか、データ記述・ツールバー(下図)の対応するボタンをクリックしてください。

XLSTAT visualizing data menu, histograms

ボタンをクリックすると、ダイアログ・ボックスが現れます。Excelシートでデータを選択してください。

B列にデータがあります。 カウントは離散値なので、離散オプションを有効にしてください。データ選択の最初の行が標本の名前を含むので、標本ラベルオプションを有効のままにしておきます。

XLSTAT histograms dialog box, general tabXLSTAT histograms dialog box, options tabXLSTAT histograms dialog box, charts tab

OKボタンをクリックすると、計算が始まります。そして、結果が表示されます。

ヒストグラムの作成

いくつかの要約統計の後、ヒストグラムシートにヒストグラムが表示され、ヒストグラムの統計量が利用可能な表が続きます。

histo4.gif

ヒストグラム上で、最も度数の高い値が0であり、それはデータの20%を超えていることがわかります。 つまり、標本の5個に1個以上の割合で、バクテリアなしが見つかっています。また度数は急速に減少しています。1個の標本で36個以上のコロニーがカ ウントされました。

下のビデオは、その方法を示しています。

区間の境界を指定してヒストグラムを作成

負の2項分布関数とサンプルの間の適合を検定したいので(カイ2乗検定はクラス中に最少で5個のデータがあることを必要とします)、またバクテリアの正確な数がわからないので、 カウントをより大きなクラスにグループ分けすることが必要でしょう。その理由により、我々の問題に合致しているであろう境界の一覧を作成しました: 0,1,2,3,4,5,10,15,20,40. 

新しいクラスの度数が5より大きくて、恒常的に減少していることを検証するために、今回は、クラスの境界を指定して、新しいヒストグラムを作成します。

このツールを起動するには、XLSTAT / データ準備 / 離散化 コマンドを選択するか、離散化ツールバー(下図)の対応するボタンをクリックしてください。

XLSTAT histograms dialog box, user defined intervals

OK ボタンをクリックすると、計算が始まり、ヒストグラムが現れます("Histogram1"の中を見てください)。

histo6.gif

下のビデオは、それらの結果を再現する方法を示します。

我々は、この結果に満足しているので、今度は、標本が負の二項分布に従っているかどうかを検定するために、分布の適合ツールを使用します。

分布を適合するためのダイアログ・ボックスのセットアップ

このツールを起動するには、XLSTAT / データ・モデリング / 分布の適合コマンドを選択するか、データ・モデリング ツールバー(下図)の対応するボタンをクリックしてください。

XLSTAT statistical software for Excel modeling data menu distribution fitting

ボタンをクリックすると、ダイアログ・ボックスが現れます。Excelシートでデータを選択してください。データはB列にあります。 我々は、XLSTATに負の2項分布のパラメータを推定させます。

XLSTATは、負の2項分布の2種類の公式を提供します。我々のケースに適応するのは、2番目のものです。

XLSTAT distribution fitting general tab

我々は、我々の仮定を検定するのに必要な Kolmogorov-Smirnov検定およびカイ2乗の適合度検定のオプションを有効にします。カイ2乗検定については、上記で定義された境界を使用します。

XLSTAT distribution fitting options tab

下のチャート・オプションが選択されました。

XLSTAT distribution fitting charts tab

分布の適合分析の結果を解釈する

我々が興味のある第1の結果は、(最尤法を用いて適合させた)負の2項分布のkとpのパラメータの値、そして標本および理論上の平均、分散、歪度、尖度の推定です。データから得られるこれらの統計量が、パラメータが得られる値に近いほど、よりよく適合していることになります。 ここでは、 適合がとてもよいです。注意: 理論平均は kp、理論分散は kp(p+1)で与えられます。

histo10.gifhisto11.gif

カイ2乗適合度検定は、経験分布と理論分布関数の間のカイ2乗距離が臨界値より高いか否かを検定できます。観察度数と理論度数の間の視覚的な比較が、次の図にあります。

histo12.gif

クラス 1、6、7では、わずかな差があるようです。 この小さな差にもかかわらず、検定のために計算されたp値 (0.767)は、我々が選んだ有意水準 (0.05)よりも有意に高いです。したがって、カイ2乗検定は、データが負の2項分布に従うという我々の仮説を確認します。結果として、標本が収集された河川での目的のバクテリアの存在は、平均が4.8、分散が32.7の負の2項分布(k=0.839, p=5.763)に従います。下のビデオは、分布の適合の方法を示します。
 

お問合わせは、マインドウエア総研へ。

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283