Excelでの歪度と尖度チュートリアル
このチュートリアルは、XLSTATソフトウェアを用いてExcel 内で歪度と尖度を計算して解釈する方法を示します。
歪度と尖度を計算するデータセット
データと結果のExcelシートは、下記のボタンをクリックしてダウンロードできます: データをダウンロード
データは、3つの異なる学校の生徒が、2つのオンライン試験(1つは数学、もう1つは論理的推論)を終えるのにかかる時間を表しています。時間は分で計測されています。行は生徒で、列は2つの試験のそれぞれにかかる時間と彼らが所属する学校です。
ここでの我々の目的は、任意の分布の2種類の特徴を調査することです: 1. 歪度、分布の非対称を反映 2. 尖度、分布の裾とピークの特徴を反映。
この目的のために、我々はXLSTAT 記述統計ツールを使用します。我々は3校のそれぞれの時間データで、歪度と尖度を計算して解釈します。
歪度と尖度を計算するためのダイアログ・ボックスのセットアップ
1. XLSTATを開くと、下記に示すように、XLSTAT / データ記述 / 記述統計 コマンドを選択してください。
2. 記述統計 ダイアログ・ボックスが現れます。
-
一般 タブでは、量的データ・フィールドで、それぞの試験にかかる時間に対応する列を選択してください。 そして、副標本フィールドで、学校名に対応する列を選択してください。 我々は出力に変数-カテゴリ・ラベルも表示させたいです。これらは、変数名を接頭、カテゴリ名を接尾として含みます。 最後に、結果を新しいシートに表示させるためにシートオプション、データ表の最初の行をラベルとみなすために標本ラベルを選択してください。
-
オプションタブでは、以下のオプションを有効にしてください。
-
出力タブでは、量的データのすべての統計量を選択するために、すべてボタンをクリックしてください。あるいは、統計量を1つずつ選択することもできます。
歪度と尖度の解釈の仕方
結果はDescという名前の.新しいシートに表示されています。記述統計量のフルセットが学校ごとに(列 C-H)に表示されています。XLSTATは、歪度と尖度の複数の係数を提案します。この事例では、データが正規に分布しているという仮定に基づかないFisher 係数を参照することになります。
数式は、XLSTAT ヘルプ メニューにあります(このダイアログ・ボックスでヘルプボタンをクリック)。
a. 歪度の解釈
歪度は分布の非対称を測定します。一方の裾(テール)がもう一方よりも長いとき、分布は非対称であると言います。歪度が正であれば、分布は右側に歪んでおり、負の歪度は左側に歪んだ分布を示唆します。ゼロの歪度は、完全対称の分布を示唆します。
このパートでは、我々は数学の試験の結果を解釈します(下図参照)。
3つの標本は、対照的な歪度係数を持つようです:
- 標本 A は強い正の歪度 (1.42)を持ちます。これは、右側の長い分布の裾を反映します。
- 標本 B は強い負の歪度 (-1.63)を持ちます。これは、左側の長い分布の裾を反映します。
- 標本 Cではゼロ歪度が推定されています。実際、標本Cの中央値 (49.8) は、平均値 (49.6)とほぼ一致しています。
ヒストグラムは、上記のオブザベーションを確認することを可能にします。一番上のヒストグラム (標本 A) は右側に歪んだ分布、2番目(標本 B) は左側に歪んだ分布、そして3番目(標本 C)は対称の分布を示します。
b. 尖度の解釈
尖度は分布の裾(極値または、外れ値)に関する情報を提供します。尖度を解釈するとき、正規分布が参照として使用されます。正の尖度は、通常の正規分布と比較して、より多くのデータ可能極値を持つ分布を示唆し、したがってより厚い裾となります(Leptokurtic distributions)。負の尖度は、正規分布のピークよりも、より少ないデータ可能極値を持つ分布を示唆し、したがってより薄い裾となります(Platykurtic distributions)。最後にゼロ尖度の分布は、 正規分布とほぼ同じ外れ値の性質を持ちます (Mesokurtic distributions)。
この節では2番目の試験の結果を解釈しましょう(下図参照)。 上記の係数に基づいて、尖度の観点から3つの分布の形が異なります:
- 学校Aについては正の尖度が推定されます (5.40)
- 学校Bについては負の尖度が推定されます (-1.32)
- 学校Cについてはゼロ尖度が検出されました。
ヒストグラムはこれらのオブザベーションを確認します。一番上のヒストグラム(標本A) はleptokurtic 分布を示し、一方、2番目(標本B)は platykurtic 分布を示します。3番目 (標本C)は正規分布の形により近い形の分布を表示しています。
次にするべきこと: 歪度と尖度を可視化する方法
ヒストグラムは数値データの分布を検討するのによく使用されます。これは1つのチャートで度数分布の裾とピークを観察することを可能にします。まず、これは中心傾向、データのバラツキ、そして外れ値の存在に関する情報を提供します。XLSTATでのヒストグラムを生成する方法はこちら。
この記事は役に立ちましたか?
- ウイ
- いいえ