あなたの分析ソリューション

ExcelでのJohnson変換チュートリアル

28/09/2018

このチュートリアルは、XLSTAT統計解析ソフトウェアを用いてExcel内でデータにJohnson 変換 を適用する方法を示します。

このチュートリアルの目的

多くの統計手法は、元データまたはいくつかのアウトプットのいずれかが、正規分布に従っていることを仮定しています。いくつかの現象は正規分布に従いますが、これはほとんどの場合に当てはまりません。正規性の条件が緩いか、それほど重要な意思決定ではない場合には、これが常に意思決定の問題であるわけではありませんが、意思決定が大きな影響を持つ場合には、これが現実の問題になってきます。そのような場合、変換が必要になります。この事例では、我々は、  Johnson 変換を用います。

変数変換のためのデータセット

データと結果のExcelシートは、下のボタンをクリックしてダウンロードできます:
データをダウンロード

データセットは、47回のバッチ製造での不良品の測定を格納しています。我々は、複数のプロセス変数で回帰を実行したいのですが、変数 Level of waste が正規性仮説に違反しています。これは、正規性検定とヒストグラムのXLSTAT 関数を用いて簡単に検証できます。その結果は以下です。

したがって、我々は、線形回帰を当てはめる前に、この変数の変換を行う必要があります。 

XLSTAT内でのJohnson変換の設定

XLSTATを起動すると、XLSTAT / データ準備 / 変数変換コマンドを選択してください。

変数変換ダイアログ・ボックスが開きます。一般タブで、変換したい変数をデータ・フィールドで選択してください。たとえば、我々は列Bの変数 Level of waste を選択します。 

最も一般的な変換は、不偏標準化(標準化(n-1))です。ただし、その他オプションを有効にすると、より多くの変換があります。

変換タブでは、Johnson 変換オプションを選択してください。 アルファを 0.05 に設定して、Shapiro-Wilk 検定を選択してください。 

Johnson 変換では、パーセンタイルに基づく Chou et al. (1998) によって説明されたアルゴリズムがXLSTATでは実装されました。この手法は、3とおりのJohnson 分布の最も良い形を見つけて、パラメータの良い値を推定することの両方ができます。著者は正規性を評価するのにShapiro Wilk 検定を使用していますが、XLSTAT は。これと同じ検定、またはAnderson-Darling 検定も使用できます。

OK をクリックすると計算が始まります。

Johnson 変換の結果

変数変換という結果のシートに、変換データの表があります。 

ここで正規性検定と変換されたデータのヒストグラムを確認しましょう。4つのすべての正規性検定のp値が0.05よりも高く、我々は標本が抽出された変数が正規分布に従うという帰無仮説を棄却することができません。ヒストグラムも変換された変数Level of waste が正規分布に従うことを示しています。 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9201