Pasar al contenido principal
XLSTAT se integra a la familia Lumivero. Conoce más

Imputación de datos perdidos en Excel usando NIPALS

Este tutorial le mostrará cómo imputar datos perdidos con facilidad en Excel usando el algoritmo NIPALS con el software XLSTAT.

Objetivo de este tutorial

El objetivo de este tutorial es imputar valores perdidos en un conjunto de datos usando el algoritmo NIPALS.

Principio de la aproximación NIPALS para imputar datos perdidos

El método NIPALS fue presentado por H. Wold (1973) para posibilitar el análisis de componentes principales con datos perdidos. El algoritmo NIPALS se aplica sobre el conjunto de datos y el modelo PCA obtenido se utiliza para predecir los valores ausentes.

En este tutorial mostraremos cómo imputar valores perdidos. El fichero de datos contiene seis variables y seis observaciones con seis valores perdidos.

Imputación de un valor perdido

Una vez abierto XLSTAT, seleccione el comando XLSTAT / Preparación de datos / Datos perdidos, o haga clic en el botón correspondiente del menú Preparación de datos (ver más abajo).

Después de hacer clic en el botón correspondiente, aparece el cuadro de diálogo. Seleccione los datos que desea completar en el campo Datos (en nuestro caso, la tabla con valores perdidos). El tipo de datos es Cuantitativos. Seleccione el método de imputación: aquí usamos NIPALS.

Active la opción Etiquetas de las observaciones y seleccione el nombre de los coches.

Tras hacer clic en el botón OK, se muestran los resultados en una nueva hoja.

Resultados del proceso de imputación

Se muestran tablas con los estadísticos descriptivos (una tabla antes y otra después de la imputación).

A continuación se muestran los datos completados.

Vemos en negrita los valores completados. Podemos comparar esos valores con el valor real disponible en este conjunto de datos:

Podemos ver que los valores perdidos imputados son muy cercanos a los valores reales. Por ejemplo, para el desplazamiento de Honda Civic, el valor real es 1396 y el valor imputado es 1365.236. Si se hubiera utilizado un método de sustitución por la media, el valor imputado habría sido 1781.4 que está muy alejado del valor obtenido con NIPALS.

¿Ha sido útil este artículo?

  • No