Su solución de análisis de datos

Transformación Box-Cox en Excel

03/03/2017

Este tutorial enseña cómo realizar una transformación de Box-Cox sobre tus datos en Excel utilizando el software estadístico XLSTAT .

Datos para la transformación de variables

Puede descargar aquí una hoja de cálculo Excel con los datos y resultados. En este tutorial mostramos cómo transformar una variable de modo que su distribución se acerque lo más posible a la distribución normal.
El fichero contiene las mediciones de los residuos en la producción de 47 lotes. Nos gustaría hacer una regresión con varias variables del proceso, pero la hipótesis de normalidad de la variable Nivel de residuos no es aceptable. Tenemos que hacer una transformación de esta variable antes de intentar una regresión multilineal. Después de mostrar diferentes opciones para transformar los datos, utilizaremos la transformación de Box-Cox, de XLSTAT.
Abajo se muestran los resultados de la prueba de normalidad.

statistical software

Transformación de variables en XLSTAT

Disponemos de distintas vías para transformar datos en XLSTAT.

Transformación de variables con las herramientas de Microsoft Excel

En primer lugar usted puede aprovechar Microsoft Excel y utilizar las funciones disponibles en el software. Coloque el cursor en el lugar que le gustaría que aparecieran los resultados. Acceda a Insertar función, haciendo clic en el icono fx en la parte superior de la hoja de cálculo.

data analysis software

A continuación, puede seleccionar una de las funciones enumeradas en Financieras, Matemáticas y trigonométricas, Estadísticas, Base de datos o XLSTAT (última entrada).

principal component analysis software

Esto le da acceso a una amplia gama de transformación general.

Transformación de variables con las herramientas XLSTAT

En XLSTAT le ofrecemos utilizar algunas funciones más específicas. Puedes encontrarlas en la opción Preparación de datos / Transformación de variables.

partial least squares software

Ajustes de una transformación Box-Cox

En el cuadro de diálogo que se abre, primero debe seleccionar las variables que desea transformar. En este ejemplo seleccionamos la variable Nivel de residuos en la columna B. Además, puesto que la columna tiene una etiqueta, marcamos la opción Etiquetas de las columnas.

También podemos seleccionar la opción Etiquetas de las observaciones, marcando la casilla y seleccionando la columna A, que contiene las identificaciones de los lotes.

Los resultados se mostrarán en una nueva hoja, ya que se ha seleccionado dicha opción. Si desea tenerlos en un lugar específico, seleccione la opción Rango.

La transformación más general es una normalización no sesgada (Estandarizar (n-1)) ya que normalmente la gente trabaja sobre una muestra y no sobre la población completa. Sin embargo, hay más transformaciones disponibles cuando se marca la opción Otra.

statistical software

Vaya a continuación a la pestaña siguiente (Transformaciones) que contiene las opciones siguientes:

  • Estandarizar (n): para estandarizar las variables utilizando la desviación estándar sesgada.
  • Centrar: para centrar las variables, de modo que el promedio de las variables resultantes será 0.
  • 1 / Desviación típica (n-1): dividir las variables por su desviación estándar no sesgada.
  • 1 / desviación típica (n): dividir las variables por su desviación estándar sesgada.
  • Reescalar de 0 a 1: para cambiar la escala de los datos de 0 a 1.
  • Reescalar de 0 a 100: para cambiar la escala de los datos de 0 a 100.
  • Binarizar (0/1): para convertir todos los valores que no son de 0 a 1, y dejar los 0s sin cambios.
  • Signo (-1/0/1): para convertir todos los valores que son negativos a -1, todos los valores positivos a 1, y dejar los 0s sin cambios.
  • Arcsin: para transformar los datos a su arco seno.
  • Transformación Box-Cox: para mejorar la normalidad de la muestra. XLSTAT acepta un valor fijo de l, o puede encontrar el valor que maximiza la probabilidad de la muestra, suponiendo que la muestra transformada sigue una distribución normal.
  • Winsorize: para eliminar los datos que no están dentro de un intervalo definido por dos percentiles: permite que p1 y p2 sean dos valores comprendidos entre 0 y 1, de forma que p1 < p2

Seleccione la opción Transformación de Box-Cox, puesto que estamos intentando conseguir que la variable “Nivel de desechos” se aproxime a una distribución normal. Seleccione asimismo la opción Optimizar para permitir que XLSTAT encuentre el mejor valor posible de Lambda.

statistical software

La última pestaña (Datos perdidos) ayuda a decidir qué hacer en el caso de tener datos perdidos. La opción seleccionada por defecto (No aceptar datos perdidos) mostrará una advertencia en el caso de detectar valores ausentes. Deje esa opción seleccionada.

statistical analysis software

Haga clic en OK para comenzar los cálculos.

Resultados de la transformación de Box-Cox

En la hoja de resultados denominada Transformación de variables encontrará los datos transformados junto con el valor Lambda utilizado.

statistical software

Puede ahora calcular la prueba de Normalidad sobre esos datos transformados. Como puede ver, abora la variable transformada Nivel de desechos sigue una distribución normal.

statistical software

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283