Su solución de análisis de datos

Modelo logit condicional: tutorial en Excel

03/03/2017

Este tutorial le mostrará cómo configurar e interpretar un Análisis logit condicional (Conditional Logit analysis) en Excel utilizando el software estadístico XLSTAT.

¿Qué es el modelo logit condicional?

El modelo logit condicional es un método estadístico similar a la regresión logística.
El modelo logit condicional es un método utilizado sobre todo en su forma evolucionada como parte del análisis conjunto. Sin embargo, es útil para analizar un determinado tipo de datos. McFadden presentó este modelo en 1973. En lugar de tener una línea por cada individuo, hay tantas líneas como alternativas. Por lo tanto, ya no son las características de los individuos las que se modelan, sino las alternativas.
Si tratamos de estudiar los modos de transporte, vamos a tener cuatro modos de transporte (coche / tren / avión / bus), cada medio de transporte tiene sus propias características (precio, velocidad), pero una persona sólo puede elegir uno de los cuatro modos.
Como parte de un modelo logit condicional, tenemos para N individuos, N*4 filas con 4 filas asociadas a las cuatro opciones. La variable de respuesta binaria indicará la elección del individuo con el valor 1, y 0 corresponderá a las opciones que el individuo no eligió.
Seleccionamos en XLSTAT una columna asociada con el nombre de los individuos (con 4 líneas por individuo en nuestro ejemplo). Las variables explicativas también tendrán N*4 filas.

Datos para el modelo logit condicional

El ejemplo que discutimos a continuación es un caso clásico en el que se busca comparar los modos de viaje propuestos para ir de vacaciones. Proviene de Greene, W.H. (2003). Econometric Analysis, 5th edition. Upper Saddle River, NJ: Prentice Hall.
Puede descargar una hoja Excel que contiene los datos y los resultados haciendo clic aquí.
Los datos corresponden a una muestra de 210 individuos, cada uno con 4 posibilidades (avión, coche, autobús y tren). Le preguntamos a cada uno de ellos qué medio de transporte elegirían para ir de vacaciones.
El conjunto de datos tiene 840 filas. La primera columna identifica el individuo, la segunda es la variable binaria que modela el modo de viaje. Luego hay dos variables cuantitativas, respectivamente, el coste total y el tiempo de espera durante el viaje asociado a cada medio de transporte para cada individuo. Por último, en la última columna está la variable categórica asociada con el modo de transporte (avión, tren, autobús o coche).

Configuración de un modelo logit condicional

Para activar el cuadro de diálogo, seleccione XLSTAT / XLSTAT-Análisis conjunto / Logit condicional, o bien haga clic en el botón correspondiente en la barra de herramientas XLSTAT-CJT (véase más adelante).

menu-bar-condlogit.gif

Una vez haya hecho clic en el botón, aparece el cuadro de diálogo.

Seleccione los datos en la hoja de cálculo de Excel.

La variable de respuesta corresponde a la variable binaria. Las etiquetas de los sujetos se corresponden con los números asociados a los individuos (que también pueden tener nombres de las personas en su lugar). En nuestro caso hay tres predictores, uno cualitativo - el modo de viaje - y dos cuantitativos - el coste global y el tiempo de espera. Puesto que se seleccionaron las etiquetas de las variables, hay que marcar la opción Etiquetas de las variables.

cond-logit-dialog-box-general.gif

Una vez se hace clic en el botón OK, se llevan a cabo los cálculos y se muestran los resultados.

Interpretación de un modelo logit condicional

La siguiente tabla muestra varios indicadores de la calidad del modelo (o bondad del ajuste). Estos resultados son similares a R² y a la tabla de análisis de varianza de regresión lineal y del ANOVA. El valor más importante es el Chi-cuadrado asociado a la log ratio (LR). Esto es equivalente a la prueba F de Fisher en el modelo lineal: un intento de evaluar si las variables proporcionan una cantidad significativa de información para explicar la variabilidad de la variable binaria. En nuestro caso, puesto que la probabilidad es inferior a 0.0001, se puede concluir que las variables proporcionan una cantidad significativa de información.

cond-logit-results-goodness-of-fit.gif

Estos estadísticos de bondad del ajuste muestran que nuestro modelo es significativamente mejor que el modelo sin ningún predictor. La siguiente tabla confirma estas impresiones iniciales:

cond-logit-results-tests.gif

Los valores de p son todos muy pequeños, y el impacto de las tres variables es significativo en la tabla de análisis de tipo III.

cond-logit-results-type3.gif

Por último, los coeficientes del modelo muestran que se prefiere el avión, y que el tiempo de espera tiene un efecto negativo importante en la elección del medio de transporte.

cond-logit-results-coefficients.gif

cond-logit-plot-coefficients.gif

El análisis de los residuos también puede ser útil, y proporcionar otra información acerca de las elecciones de los individuos.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283