Su solución de análisis de datos

Imputación de datos perdidos en Excel usando NIPALS

13/03/2018

Este tutorial le mostrará cómo imputar datos perdidos con facilidad en Excel usando el algoritmo NIPALS con el software XLSTAT.

Objetivo de este tutorial

El objetivo de este tutorial es imputar valores perdidos en un conjunto de datos usando el algoritmo NIPALS.

Principio de la aproximación NIPALS para imputar datos perdidos

El método NIPALS fue presentado por H. Wold (1973) para posibilitar el análisis de componentes principales con datos perdidos. El algoritmo NIPALS se aplica sobre el conjunto de datos y el modelo PCA obtenido se utiliza para predecir los valores ausentes.

Datos para completar los valores perdidos

Puede descargar una hoja de Excel con los datos y los resultados haciendo clic en el botón de abajo:
Descargar los datos

En este tutorial mostraremos cómo imputar valores perdidos. El fichero de datos contiene seis variables y seis observaciones con seis valores perdidos.

Imputación de un valor perdido

Una vez abierto XLSTAT, seleccione el comando XLSTAT / Preparación de datos / Datos perdidos, o haga clic en el botón correspondiente del menú Preparación de datos (ver más abajo).

menu missing 

Después de hacer clic en el botón correspondiente, aparece el cuadro de diálogo. Seleccione los datos que desea completar en el campo Datos (en nuestro caso, la tabla con valores perdidos). El tipo de datos es Cuantitativos. Seleccione el método de imputación: aquí usamos NIPALS.

Active la opción Etiquetas de las observaciones y seleccione el nombre de los coches.

 dialog box missing

Tras hacer clic en el botón OK, se muestran los resultados en una nueva hoja.

Resultados del proceso de imputación

Se muestran tablas con los estadísticos descriptivos (una tabla antes y otra después de la imputación).

 

 A continuación se muestran los datos completados.

 

Vemos en negrita los valores completados. Podemos comparar esos valores con el valor real disponible en este conjunto de datos:

real data

Podemos ver que los valores perdidos imputados son muy cercanos a los valores reales. Por ejemplo, para el desplazamiento de Honda Civic, el valor real es 1396 y el valor imputado es 1365.236. Si se hubiera utilizado un método de sustitución por la media, el valor imputado habría sido 1781.4 que está muy alejado del valor obtenido con NIPALS.

Contacto

Email ventas

Contactar con nuestro soporte técnico : support@xlstat.com

https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283