どの記述統計ツールを選ぶべきか?
シチュエーションに応じて記述統計ツールを選ぶためのガイド
データを記述することは、高度な手法に移る前に、データの完全なイメージを提供することを目的とする統計解析の不可欠な部分です。この目的で使用される統計手法の種類は、記述統計と呼ばれます。それらは数値的ツール(たとえば、平均、最頻値、分散・・・)および、グラフィカル・ツール(たとえば、ヒストグラム、箱ひげ図…)の両方を含み、データの集合を要約し、中心的傾向やバラツキなどの重要な情報を抽出することを可能にします。さらに、複数の変数の間の関連性を記述するためにも、それらを使用できます。
正しい記述統計ツールを選ぶために、我々が持っている変数の種類と数、そして分析の目的を考慮する必要があります。これらの3つの基準に基づいて、あなたのシチュエーションに応じて、どのツールを使用するかを決定することを助けるグリッドを生成しました。
グリッドの最初の列は、データ・タイプと呼びます:
-
量的: 興味の目的の数量を記述する変数を含む。値は数。幼児の体重は、量的変数の例である。
-
質的: 興味の目的の特徴を記述する変数を含む。これらの値はカテゴリと呼ばれ、水準またはモダリティとも呼ばれる。性別は質的変数の例である。可能な値は、カテゴリ男性または女性である。
-
混合: 両方のタイプの変数を含む。
2番目の列は、変数の数を示します。提案されるツールは、1つの記述(単変量解析)または2つ(二変量解析)または複数の変数間の関係性の記述を扱うことができます。グリッドは、各シチュエーションの事例の列も含みます。
グリッド
下記のリストは網羅的でないことに注意してください。ただし、記述統計で最もよく使用されるものを含んでおり、すべてXLSTATで利用可能です。
データの説明 | 目的 | 例 | 数値的ツール | グラフィカル・ツール |
---|---|---|---|---|
量的 | 1変数 (単変量解析) | 度数分布の推定 | 年齢クラスごとに何人このイベントに参加しているか? (ここで調査される変数は、量的な形式での年齢) | 度数表 |
1標本の中心的傾向を測定 | クラスルームでの平均評価は? | 平均、中央値、最頻値 | 箱ひげ図 散布図 ストリップ・プロット | |
1標本のバラツキを測定 | クラスルームでの平均評価の周りで評価がどれぐらい広くまたは狭くばらついているか? | 範囲、標準偏差、分散、変動係数、 四分位 | 箱ひげ図 散布図 ストリップ・プロット | |
分布の形を評価 | 会社の従業員の賃金分布は対称か? | 尖度および歪度係数 | ヒストグラム | |
標本が特定の分布に従うかどうかを視覚的に制御 | 所与のしきい値よりも良い成績を得た学生の理論的パーセンテージは? | 確率プロット | ||
標本内の値の位置を測定 | 標本を95%の低い値と5%の高い値に分割するのにどのデータ・ポイントが使えるか? | 四分位またはパーセンタイル | 箱ひげ図 | |
極値を検出 | 最高の184cmはこのグループの学生の極値であるかどうか? | 箱ひげ図 | ||
2変数 (二変量解析) | 2つの変数間の関連性を記述 | 植物バイオマスは土壌の鉛含有量に伴って増加するか減少するか? | 相関係数 | 相関マップ 散布図 |
複数の変数 | 複数の変数間の関連性を記述 | この10年間で、過去10年間の平均余命、出生率、人口の大きさの変化は? | 相関係数 | モーション・チャート (3変数までを時間とともに記述) 散布図 または 3D 散布図 (3変数までを記述) |
特定の条件での3つの変数の間の関連性を記述 | 複数のアイスクリームのサンプルで3つのアイスクリーム成分の比率を可視化する方法は? | 三角ダイアグラム | ||
複数の変数の2つの行列 | 2つの行列間の関連性を記述 | 一連の製品の評価がパネルごとに異なるのか? | RV係数 | |
質的 | 1変数 (単変量解析) | さまざまなカテゴリの度数を計算 | 何人の顧客がサービスに満足していると言っていて、何人が満足していないと言っているのか? | 度数表 |
度数が最も多いカテゴリを検出 | この国では何色の髪色が最も多いのか? | 最頻値 | 棒グラフ 円グラフ | |
2変数 (二変量解析) | 2つの変数の間の関連性を測定 | 微量元素の存在は、他の微量元素の存在によって変わるか? | 分割表 (またはクロス表) | 分割表の3次元グラフ 積み上げまたはクラスタ化棒グラフ |
混合 (量的&質的) | 2変数 (二変量解析) | バイナリ変数と連続値変数の間の関係性を記述 | ネズミの体内でのある分子の濃度は、ネズミの性別 (M/F)に関係があるか? | 双列相関 |
カテゴリ変数と連続値変数の間の関係性を記述 | D3つの花の種の間でがく片の長さは異なるか? | 質的変数の各カテゴリ内での量的変数の単変量記述統計 | 箱ひげ図 | |
複数の変数 | 1つのカテゴリ変数と2つの量的変数の間の関係性の記述 | この商用ウェブサイトで費やす金額は、顧客のクラスおよび給料によって変わるか? | 散布図 (グループによる) |
出典: Introductory Statistics: Exploring the World Through Data: Robert Gould and Collen Ryan
この記事は役に立ちましたか?
- ウイ
- いいえ