Su solución de análisis de datos

Histogramas y ajuste de distribuciones Excel

29/08/2016

En este tutorial crearemos un histograma y usaremos la herramienta de XLSTAT ajuste de distribuciones para comprobar si una muestra sigue una distribución binomial negativa en Excel. Esta distribución se usa con frecuencia para representar el fenómeno de agregación / dispersión de bacterias en ambientes acuáticos.

Datos para crear un histograma y ajustar una distribución

Una hoja Excel que contiene los datos y resultados de este ejemplo puede ser descargada haciendo clic aquà­. Los datos corresponden a una experiencia donde 200 muestras de agua, tomadas en un rà­o, fueron puestas en cultivo en un medio nutritivo, con el fin de determinar la presencia o no de bacterias tipo E.coli. El número de colonias ha sido contado después de tres dà­as de incubación. El resultado de los cálculos se encuentra en la columna "Bact-Data" por cada una de las 200 muestras.

Utilizando en primer lugar las herramientas de XLSTAT que permite crear histogramas, luego utilizando la herramienta de ajuste de una ley de distribución, deseamos comprobar si la muestra (en sentido estadà­stico) de los 200 recuentos sigue una ley binomial negativa o no. La ley binomial negativa representa muy a menudo el fenómeno de agregación/dispersión de las bacterias en los medios acuáticos.
 

Configuración del cuadro de diálogo para crear un histograma

Una vez XLSTAT iniciado, elija el comando XLSTAT/Descripción de los datos/Histogramas o haga clic en el botón "Histogramas" de la barra de herramientas "Descripción de los datos".

bardesc1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede elegir entonces los datos en la hoja Excel. La opción "discretos" está activada ya que los datos de recuento son efectivamente datos discretos. La opción "Etiqueta de columna" se deja activada ya que la primera là­nea de las columnas de datos incluye el nombre de la variable.

histo1.gifhisto2.gif

Una vez que haga clic en el botón "OK ", los cálculos son efectuados, y luego el histograma aparece.

Interpretación de un histograma

El primer resultado visualizado es el cuadro que sirve para la construcción del histograma. Más abajo de este cuadro está representado el histograma. Observamos que la clase 0 es la más numerosa, y que representa más del 20% de los datos. Es decir, en más de una muestra de agua sobre cinco, ninguna bacteria pudo ser resaltada. Después, se observa una disminución rápida y suficientemente regular de las frecuencias relativas. En una muestra, se han encontrado hasta 36 colonias.

Como deseamos hacer a continuación una prueba de ajuste a la ley binomial negativa (la prueba del Khi’² necesita que incluya al menos 5 datos por clase), y dado la imprecisión de los recuentos de bacterias, parece necesario agrupar los recuentos en clases más importantes. Para eso, se crea una lista de là­mites que parece coherente (0,1,2,3,4,5,10,15,20,40) con la problemática. Con el fin de comprobar que las nuevas clases resultantes responden bien a las exigencias de la prueba de ajuste del Khi’², hacemos un nuevo histograma utilizando la herramienta de "Discretización" de datos, que permite libremente crear clases.

Se puede elegir el comando XLSTAT/Preparación de los datos/Discretización del menú XLSTAT o hacer clic en el botón "Discretización" de la barra de herramientas "Preparación de los datos".

bardisc1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede entonces seleccionar los datos en la hoja Excel. La opción "Lista de là­mites" es activada, y luego la lista de là­mites es seleccionada. Se hace clic a continuación en "Importar", y los là­mites y las frecuencias aparecen en la parte inferior del cuadro. Es aquà­ el momento de realizar eventuales modificaciones de los là­mites con el fin de corregir los efectivos de las clases. En nuestro caso, no vale la pena, ya que el más pequeño efectivo es 6, lo que es suficiente.

histo3.gif

Se puede entonces hacer clic en el botón OK para que aparezcan los resultados. Se observa a continuación el nuevo histograma obtenido.

histo4.gif

Satisfechos de estos resultados, podemos entonces utilizar la herramienta de ajuste de una ley de distribución para comprobar si la muestra sigue bien una ley binomial negativa.
 

Configuración del cuadro de diálogo para ajustar una distribución

Elija el comando XLSTAT/Modelización/Ajuste de una ley de probabilidad o haga clic en el botón "Ajuste de una ley de probabilidad" de la barra de herramientas "Modelización".

bardfit1.gif

Una vez el botón presionado, aparece el cuadro de diálogo. Puede elegir entonces los datos en la hoja Excel. Dejamos XLSTAT libre de "estimar" los parámetros de la ley binomial negativa. XLSTAT propone dos formulaciones de la ley binomial negativa. La segunda es la más adaptada a este tipo de datos. Activamos las opciones de prueba de Kolmogorov-Smirnov y de prueba de conformidad del Khi’², necesarias para comprobar nuestra hipótesis. Para la prueba del khi’², decidimos que será realizada con las clases anteriormente creadas.

histo5.gif

El primer resultado que nos interesa es el valor de los parámetros k y p de la ley binomial negativa (ajustado mediante el método del máximo de verosimilitud), asà­ como los cálculos de la esperanza y de la varianza teórica.

histo6.gif

Interpretación de los resultados de un análisis de ajuste de distribuciones

Se nota aquà­ que las esperanzas y las varianzas no son demasiado diferentes, lo que se justifica por el tamaño de la muestra y la buena adecuación a la ley. (NB: la esperanza teórica vale kp, y la varianza teórica vale kp(p+1)).

La prueba de Kolmogorov Smirnov permite comprobar si la distancia más grande entre las funciones de repartición empà­ricas y teóricas está más allá de un valor critico o no. Según los resultados obtenidos aquà­ (p-value=0.129), al nivel de significación de 5%, se concluye que no se puede rechazar la hipótesis que los recuentos siguen una binomial negativa de parámetros k=0.839, p=5.763. La prueba Kolmogorov Smirnov es reputada más adaptada que la prueba de conformidad del Khi’² en el caso de las leyes de probabilidades (o distribuciones) continuas, lo que no es el caso con la ley binomial negativa. Parece entonces oportuno realizar una prueba de ajuste del Khi’².

La prueba de conformidad del Khi’² permite comprobar si la distancia del Khi’² entre la distribución empà­rica y la distribución teórica, calculada sobre las clases, no está más allá de un valor critico. Es posible comparar la visualización de los histogramas teóricos y observados en la siguiente figura. Para la clase 1 y la clase 6, parece haber una ligera inadecuación (se ha encontrado más muestras sin bacteria, que lo sugiere la ley teórica, y menos muestras en la clase 6).

histo7.gif

A pesar de estas leves desviaciones, el p-value asociado a la prueba (0.360) es claramente superior al nivel de significación que se ha determinado (0.05). La prueba del Khi’² conforta entonces ampliamente lo que sugerà­a la prueba de Kolmogorov Smirnov.

En conclusión, la presencia de la bacteria estudiada en el rà­o donde obtuvieron las muestras, sigue una ley binomial negativa de parámetros (k=0.839, p=5.763), con una esperanza de 4.8 y una varianza de 32.7.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283