Pasar al contenido principal

Modelo Weibull: tutorial en Excel

Este tutorial muestra cómo configurar e interpretar una modelo Weibull -Regresión de Supervivencia Paramétrico- en Excel usando el software estadístico XLSTAT.

Datos para ejecutar un modelo Weibull, o regresión de supervivencia paramétrico

Los datos se han obtenido en Kalbfleisch & Prentice (The Statistical Analysis of Failure Time Data, Wiley, 2002, p. 119) y representan un ensayo clínico que investiga el efecto de las covariables sobre el tiempo de supervivencia de pacientes con cáncer de pulmón. Nuestro objetivo es determinar qué covariable influye en el tiempo de supervivencia.

Modelo de supervivencia paramétrico (Modelo Weibull)

El modelo de supervivencia paramétrico se basa en el esquema de la regresión clásica con una función de distribución subyacente. La estimación del modelo se lleva a cabo mediante máxima verosimilitud. En el conjunto de datos, la variable daysurv corresponde a los datos de tiempo; la variable de censura es la variable estado (1 para muerte, 0 para censurado). Las covariables son el estado funcional del paciente al comienzo del estudio (perfstatus), la edad del paciente al comenzar el estudio (age), el número de meses desde el diagnóstico del cáncer de pulmón hasta el comienzo del estudio (month) y la presencia de un tratamiento anterior. Suponemos que la función de supervivencia sigue una distribucioón Weibull y deseamos ajustar ese modelo.

Configuración de un modelo Weibull

Tras abrir XLSTAT, seleccione el comando XLSTAT / Análisis de supervivencia / Regresión paramétrica de supervivencia.

Weibull model menu

Tras hacer clic en el botón, aparece el cuadro de diálogo de la Regresión paramétrica de supervivencia. Seleccione los datos en la hoja de Excel. Los Datos de tiempo corresponden a las duraciones hasta que los pacientes murieron o fueron censurados. El “Indicador de estado” describe si el paciente murió (código de evento = 1) o si fue censurado (código de evento = 0) en un momento dado.

Las covariables son todas cuantitativas y deben seleccionarse en el campo Cuantitativas. La distribución elegida es la Distribución de Weibull.

Parametric regression dialog box

Pueden seleccionarse otras opciones en el resto de pestañas del cuadro de diálogo tales como cálculo de residuos individuales, selección de modelo, etc.

Los cálculos comienan tras pulsar en OK. Los resultados se muestran en una nueva hoja de Excel.

Interpretación de los resultados de un modelo de supervivencia paramétrico

La primera tabla muestra un resumen de los datos. Podemos ver que el número de veces observadas (pasos de tiempo) es diferente al número de observaciones.

stat table weibull

La siguiente tabla proporciona algunos indicadores sobre la calidad del modelo (o bondad del ajuste). Estos resultados son equivalentes a R2 y a la tabla de análisis de varianza en la regresión lineal. El valor más importante a consultar es la probabilidad de la prueba chi-cuadrado sobre la log ratio. Esto equivale a la prueba F de Fisher: intentamos evaluar si las variables contienen información significativa comparando el modelo tal como está definido con un modelo más simple que no contenga el impacto de las covariables. En este caso, puesto que la probabilidad es menor que 0.0001, concluimos que las variables contienen información significativa.

Goodness of fit Weibull

La siguiente tabla nos proporciona detalles sobre el modelo. Esta tabla resulta útil para entender el efecto de las distintas variables y parámetros de la distribución Weibull.

Parameters Weibull

En esta tabla podemos ver que la intercepción y los parámetros de la escala tienen un efecto significativo. El modelo se ajusta bien a una distribución Weibull. Las variables explicativas no tienen un efecto significativo sobre el modelo.

Finalmente, se muestra la función de supervivencia acumulativa tanto con los valores empíricos como con los teóricos. Podemos ver que la distribución de Weibull parece ser una buena elección para este modelo de regresión.

Survival distribution plot

Este estudio ha mostrado que la distribución de Weibull parece ser una buena elección, y que los valores estimados ajustan bien con los valores teóricos (cuando todas las covariables están en su valor medio).

¿Ha sido útil este artículo?

  • No