あなたの分析ソリューション

Excelでの度数、最頻値および棒グラフ

20/10/2017

このチュートリアルは、XLSTATソフトウェアを用いてExcelでの質的データ(カテゴリ・データまたは名義データともいう)の度数および最頻値、棒グラフを説明します。 

質的データを記述するためのデータセット

データと結果のExcelシートは、下のボタンをクリックしてダウンロードできます:
データをダウンロード

データは、2つの異なる都市に住む人々の通勤方法に関する調査の結果を表します。行が回答者で、列が交通手段と彼らが住んでいる都市です。

ここで都市と交通手段は質的変数で、名義変数またはカテゴリカル変数とも呼ばれます。質的変数がとり得る値 (交通手段の場合、Bicycle, Bus, Carなど)は、カテゴリまたは水準と呼ばれます。

ここでの々の目的は、以下を用いて都市ごとに通勤時の交通の好みを記述することです:

  1. 一般的な記述統計量:
    • 最頻値、最も頻度の高い通勤手段(最も頻度の高いカテゴリ)を反映。
    • 度数、各通勤手段が何回、回答として現れているかを反映。
    • 相対度数、回答の合計数で割った度数。 
  2. 棒グラフ および積み上げ棒グラフ、カテゴリごとに相対度数をグラフィカルに説明。
これは調査のキーとなる数字を抽出して、2つの都市での人びとの通勤方法の潜在的違いを検出することを可能にします。 

記述統計のためのダイアログ・ボックスのセットアップ

1. XLSTATを開くと、下図のようにXLSTAT / データ記述 / 記述統計 コマンドを選択してください。
XLSTAT toolbar for Describing data
2. 記述統計 ダイアログ・ボックスが現れます。
XLSTAT Dialog Box for Descriptive Statistics - General tab
3. 一般タブでは、質的データフィールドで交通手段に対応する列を選択してください。目的は都市ごとに交通の好みを記述することなので、我々は副標本フィールドで都市に対応する列を選択します。

我々は、また出力に変数-カテゴリ・レベルを表示させたいです。これらは変数名を接頭、カテゴリ名を接尾として含みます。最後に、新しいシートに結果を表示させるためにシートオプションを、データの最初の行をラベルとしてみなすために標本ラベルを選択します。  

4. オプションタブでは、以下のオプションを有効にしてください:
XLSTAT Dialog Box for Descriptive Statistics - Options tab
5. 出力タブでは、以下の統計量を選択します:オブザベーションの数、カテゴリの数、最頻値、最頻度数、カテゴリ、カテゴリごとの度数およびカテゴリごとの相対度数 (%)。  
XLSTAT Dialog Box for Descriptive Statistics - Outputs tab
6. チャート(2) タブでは、以下のオプションを有効にしてください。
XLSTAT Dialog Box for Descriptive Statistics - Charts tab
棒グラフは、さまざまなカテゴリの度数または相対度数をバーで可視化することを可能にします。ここで、我々は相対度数を使用することを選びます。また我々は各標本内のカテゴリ間の相対的な違いを示すために積み上げ棒グラフを表示したいです。 

結果の解釈 

質的データの記述統計の解釈

結果がDesc という名前の新しいシートに表示されています(下図)。 

XLSTAT Output for Descriptive Statistics

表は、2つの副標本について下記の情報を提供します:
  • オブザベーションの数: 100人の人々が各都市で50人ずつ調査に参加。
  • カテゴリの数: 5種類の交通手段が回答ととして現れた。
  • 最頻値 および最頻度数: 都市Aに住む人びとは自転車(Bicycle)を好み (最頻度数=21)、一方、 都市B に住む人々で最も人気のある通勤手段は地下鉄(metro)である(最頻度数=26)。
  • カテゴリごとの度数: 都市 B からの3人の回答者は、徒歩で(on foot)通勤していると答え、一方 12 人はバスでi行くと答えた。
  • カテゴリごとの相対度数 (%): 都市Aに住む回答者の42%が 自転車で働きに行き、一方、3% だけが自動車を使う。

棒グラフと積み上げ棒グラフの解釈

  • 棒グラフ
次の図は、各副標本でのさまざまなカテゴリの比較を提供します。バーは特定のカテゴリの相対度数を表します。最も高いバーが最頻値で、それは最も大きい相対度数を持つカテゴリです。  
XLSTAT Bar Chart City AXLSTAT Bar Chart City B

最初の図から、bicycle が都市Aの最頻カテゴリで、回答者の少なくともi40%がこの通勤手段を選んでいることが簡単にわかります。都市B の個人はmetro と bus のバーが合計で70%を超える相対度数なので、公共交通機関を好むようです。

したがって、我々は、都市 A は都市Bよりも自転車に親しんでいる、または都市Bに住む人々は、相対的に自宅から遠いところで働いていて、自転車や徒歩は彼らにとってベストな選択ではないということが言えます。 

積み上げ棒グラフ

​積み上げ棒グラフの利点は、各標本を構成するカテゴリにブレークダウンして分析でいることです。ここで、積み上げ棒グラフは、各都市に対するさまざまな通勤手段のパーセンテージ寄与度を示します。 
XLSTAT Stacked Bar Chart
たとえば、我々は、都市 B の個人の約半分が地下鉄で働きに行き(2番目のバーの灰色の部分)、一方、徒歩はわずかな選択肢でしかない(2番目のバーの黄色の部分)ことを観察します。 都市 A内では、自転車で仕事に行くこと(最初のバーのオレンジの部分)が目立ち、一方、バスと自動車(最初のバーの緑と青の部分)は他の交通手段に対して相対的にあまり使われません。

次にするべきゆこと: 2つの質的変数の間のリンクを調査するためにクロス表を用いる

分割表(クロス表ともいう)は、2つのカテゴリカル変数の間の関係性を要約する有効な方法です。 XLSTAT は、3D表示による分割表の生成と、2つの変数の間の関係性を定量化する複数の統計量を計算するツールを提供します。こちらのチュートリアルをチェックしてください。
以下の動画は、ExcelとXLSTATを用いた質的変数の記述統計です。 

お問い合わせ

弊社の営業チームにご連絡ください。ここをクリック

弊社のテクニカル・サポート・チームにご連絡ください:support@xlstat.com

https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283