メインコンテンツに移動

ExcelでのNIPALS法を用いた欠損値の補完

このチュートリアルは、XLSTATソフトウェアでNIPALSアルゴリズムを用いてExcel内で簡単に 欠損データを補完する方法を示します。

このチュートリアルの目的

このチュートリアルの目的は、NIPALSアルゴリズムを用いてデータセット内の欠損値を補完することです。

欠損値を補完するためのNIPALSアプローチの原理

NIPALS法は、欠損値があっても主成分分析ができるように、H. Wold (1973) が提案した手法です。NIPALSアルゴリズムがデータセットに適用されて、得られたPCAモデルが欠損値を予測するために使用されます。

欠損値を補完するためのデータセット

このチュートリアルでは、欠損値を補完する方法を示します。データセットは、6個の変数と6個のオブザベーションからなり、6個の欠損値があります。

欠損値の補完

XLSTATを開いて、XLSTAT / データ準備 / 欠損値 コマンドを選択するか、データ準備メニューの対応するボタン(下図)をクリックしてください。

関連するボタンをクリックすると、ダイアログが現れます。データ・フィールドで補完したいデータを選択します(我々の事例では、欠損値のある表)。データのタイプは、量的データです。手法を選択します、。我々は、NIPALSを使用します。

オブザベーション・ラベルのオプションう有効にして、自動車の名前を選択します。

OK ボタンをクリックすると、新しいシートに結果が表示されます。

補完プロセスの結果

記述統計の表が表示されます(補完前の表と補完後の表)。

そして、補完されたデータが表示されます。

補完された値を太字で表示しています。我々は、これらの値をこのデータセット中の利用可能な実際の値と比較できまます:

完された欠損値が実際の値にとても近いことがわかります。たとえば、Honda Civicの置換では、実際の値は 1396 で補完値は 1365.236です。もし平均の補完法を使用した場合、その補完値は 1781.4 にんるでしょう。それはNIPALSで得られる値とはかなり異なります。

この記事は役に立ちましたか?

  • ウイ
  • いいえ