メインコンテンツに移動

Excelでのデータ変換 - Box-Cox 変換チュートリアル

このチュートリアルは、XLSTAT統計解析ソフトウェアを用いてExcel内のデータで Box-Cox 変換 を実行する方法を示します。

変数変換のためのデータセット

データと結果のExcelシートは、こちらをクリックしてダウンロードできます。このチュートリアルでは、正規分布により近くなるような変数の変換をどのように作成するかを説明します。

このデータ集合は、47バッチの生産での廃棄物の測定値を含みます。我々は、複数のプロセス変数で回帰を作成したいのですが、変数Level of waste(廃棄物の水準)の正規性の仮説が許容されません。 重回帰を試みる前に、この変数の変換を作成する必要があります。データを変換するためのさまざまなオプションを示した後で、我々はXLSTATの Box-Cox 変換を使用します。

正規性検定の結果を下に表示ます。

statistical software

XLSTATでの変数変換

XLSTATではデータを変換するための複数の方法があります。

Microsoft Excel ツールによる変数変換

まずは、Microsoft Excelの利点を活用して、ソフトウェアで利用可能な関数を使用できます。最初に、結果を表示させたい場所にカーソルを置きます。スプレッドシートの上部の fx アイコンをクリックして、関数挿入メニューにアクセスします。

data analysis software

そして、下に一覧される財務、数学/三角、統計、データベース、またはXLSTAT(最後のエントリー)のいずれかの関数の1つを選択できます。

principal component analysis software

幅広い一般的な変換にアクセスできます。

XLSTAT ツールによる変数変換

XLSTATでは、いくつかのより多くの特殊な関数を用意しております。データ準備 / 変数変換 オプションにそれらがあります。

partial least squares software

Box-Cox 変換のセットアップ

最初に開くダイアログボックスでは、変換したい変数を選択します。たとえば、列Bの変数 Level of waste を選択します。また、列がラベルを含むので、列ラベルオプションをチェックします。

また、ボックスをチェックしてオブザベーション・ラベル・オプションを選択し、バッチの記述子を含む列Aを選択できます。

結果を新しいシートに表示させたいので、シートオプションを選択します。それらを特定の場所に置きたい場合は、範囲オプションを選択します。

通常、母集団全体ではなく標本で作業するので、最も一般的な変換は、非バイアス標準化 (Standardize (n-1)) です。 しかしながら、その他オプションをチェックすると、より多くの変換が利用できます。

statistical software

そして、以下のオプションを含む次の変換タブに行ってください:

  • 標準化 (n): バイアス標準偏差を用いて変数を標準化。
  • 中心化: 変数を中心化、結果の変数の平均が 0になる。
  • 1 / 標準偏差 (n-1): 非バイアス標準偏差で変数を割る。
  • 1 / 標準偏差 (n): バイアス標準偏差で変数を割る。
  • 0 から 1に尺度変更: 0 から 1にデータを再尺度化。
  • から 100にデータを尺度変更: 0 から100にデータを再尺度化。
  • バイナリ (0/1): 0 でないすべての値を 1に変換し、0はそのままで変更しない。
  • 符号 (-1/0/1): すべての負値を -1に、すべての正値を1に変換し、0はそのまま変更しない。
  • Arcsin: データをそのアークサインに変換する。
  • Box-Cox 変換: 標本の正規性を改善する。XLSTATは、lの固定値を受け入れるか、 変換された標本が正規分布に従うと仮定して、標本の尤度を最大化する値を見つけることができます。
  • Winsorize: 2つのパーセンタイルで定義される区間内にないデータを除去: p1 と p2 が、p1 < p2 であるような0と1の間に含まれる2つの値であるとします。

我々は正規分布のより近い変数 “Level of waste”を得ようとしているので、Box-Cox 変換 オプションを選択します。 また、XLSTATが最良のラムダを見つけるように、最適化オプションを選択します。

statistical software

最後のタブ欠損値は、欠損値がの場合にどうするかを決定することを助けます。デフォルトで選択されているオプション欠損値を採用しないは、欠損値の場合に警告を与えます。このオプションを選択したままにしておきます。

statistical analysis software

計算を開始するには、OK をクリックします。

Box-Cox 変換の結果

変数変換という結果シートでは、変換されたデータと使用されたラムダの値があります。

statistical software

ここで、それらの変換されたデータでの正規性検定を計算できます。下図からわかるように、変換された変数 Level of waste は、正規分布に従います。

statistical software

お問合わせは、マインドウエア総研へ。

この記事は役に立ちましたか?

  • ウイ
  • いいえ