Su solución de análisis de datos

Estadísticos con bootstrapping: tutorial Excel

06/05/2016

XLSTAT dispone de una caja de herramientas de remuestreo que se puede utilizar para obtener nuevas muestras mediante bootstrap, con desviación estándar e intervalos de confianza. Permite construir gráficos basados en la distribución bootstrap.

Datos para generar estadísticos Bootstrap usando Remuestreo

Puede descargar una hoja Excel que contiene los datos y los resultados haciendo clic aquí.
Los datos corresponden a una muestra de 150 flores de iris en las que se midieron 4 variables. Las flores pertenecen a 3 especies diferentes. Fisher utilizó este conjunto de datos, ahora famoso, cuando desarrolló su teoría de análisis discriminante. En este ejemplo en particular, se decidió analizar la variable longitud del sépalo de las flores.

Objetivo de este tutorial

Al usar de la caja de herramientas remuestreo de XLSTAT, queremos obtener medias bootstrap, desviaciones estándar bootstrap e intervalos de confianza bootstrap para algunas medidas estadísticas. Estas estadísticas bootstrap se obtienen sin ningún supuesto de distribución. Vamos a estudiar la media y la desviación estándar de la variable longitud del sépalo.

Configuración de un remuestreo

Una vez abierto XLSTAT, seleccione el comando XLSTAT / Descripción de datos / Estadísticos de remuestreo, o haga clic en el botón correspondiente de la barra de herramientas Descripción de datos (véase más adelante).

boot0.gifboot1.gif

Tras hacer clic en el botón, aparece el cuadro de diálogo Estadísticos de remuestreo. Se seleccionaron los datos correspondientes a la variable “Longitud del sépalo” en la hoja de cálculo Excel.
Tenga en cuenta que el remuestreo exige que los datos sean numéricos.
Puesto que se incluyó el nombre de la variable en la selección, se ha seleccionado la opción Etiquetas de las muestras.
Se seleccionó la opción Hoja porque queremos que los resultados que se muestren en una nueva hoja del libro de trabajo. El método de remuestreo elegido es bootstrap con 200 re-muestras.

boot2.gif

En la pestaña Resultados, seleccionamos los estadísticos a estudiar. Seleccionamos la media y ambas desviaciones típicas (Desviación típica (n) y Desviación típica (n-1)).

Seleccionamos el Intervalo estándar bootstrap 95%. Se pueden visualizar todos los estadísticos de las 200 muestras y re-muestras utilizando las opciones Re-muestras y Estadísticos de re-muestras.

boot3.gif

En la pestaña Gráficos, seleccionamos Histogramas.

boot4.gif

Hacemos clic en OK para comenzar el análisis.

Interpretación de los resultados de los estadísticos de remuestreo

Los resultados se muestran en la nueva hoja llamada "Remuestreos".

La siguiente tabla recoge los estadísticos bootstrap obtenidos para la media y las desviaciones estándar de la muestra. Podemos ver que las estimaciones bootstrap están muy cerca de las estimaciones originales, incluso con solo 200 remuestreos. En el caso de la media, el intervalo de confianza bootstrap estándar al 95% es muy estrecho. En el caso de las las desviaciones estándar, podemos ver que las desviaciones basadas en la muestra y las basadas en la población están muy cerca, y que las estimaciones bootstrap son muy similares a las estimaciones originales. Los intervalos de confianza son asimismo muy estrechos, incluso con 200 remuestreos.

boot5.gif

Podemos utilizar histogramas para visualizar la distribución bootstrap de la media y las desviaciones estándar. En el caso de la media, vemos que 56 de los 200 valores están en el intervalo [58.2, 58.64], intervalo que también incluye la media de la muestra original. Se proporciona también la tabla de intervalos con el fin de entender mejor la distribución. La herramienta de remuestreo decide automáticamente el número de intervalos. Si desea adaptar esto a su análisis, basta con utilizar la función “histogramas” de XLSTAT en los estadísticos de remuestreo obtenidos cuando hemos seleccionado “Estadísticos de remuestreo” en la pestaña “Resultados”.

boot6.gif

Esta herramienta le permite calcular diferentes tipos de intervalos de confianza en un gran número de estadísticos descriptivos. Es asimimismo posible la adición de peso y el tratamiento de varias variables simultáneamente.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283