Su solución de análisis de datos

Modelo logístico multinomial: tutorial Excel

02/03/2017

Este tutorial le mostrará cómo configurar e interpretar una Regresión logit multinomial en Excel usando el software XLSTAT.
¿No está seguro de que esta sea la función de modelado que está buscando? Consulte por favor esta guía.
 

El modelo logit multinomial

El modelo logit multinomial es una generalización del modelo logit cuando la variable de respuesta tiene más de dos categorías. Este método es muy útil cuando se quiere entender o predecir el efecto de una serie de variables sobre una variable de respuesta cualitativa no ordenada (una variable que puede adoptar más de dos valores). El modelo logit multinomial puede ser útil para modelar el efecto de algunas variables descriptivas en la elección de una marca en un mercado con más de dos marcas. Todos los resultados se dan en relación a una categoría de referencia (por ejemplo, la marca que está mejor establecida).
Con XLSTAT puede ejecutar el modelo logit multinomial sobre los datos en bruto. El cuadro de diálogo para el modelo logit multinomial es el mismo que el utilizado para la regresión logística.
La metodología del modelo logit multinomial tiene por objeto el modelado de la probabilidad asociada a cada categoría en función de los valores de las variables explicativas, que pueden ser variables categóricas o numéricas.

Datos para ejecutar un modelo logit multinomial

El ejemplo que aquí tratamos es un caso de marketing en que deseamos detectar si los consumidores son propensos a elegir una de tres marcas dependiendo de su edad y sexo. Puede descargar una hoja de Excel con los datos y los resutados haciendo clic aquí.
Los datos consisten en 750 observaciones. La categoria de referencia es la marca 1.

Objetivo de este modelo logit multinomial

Nuestro objetivo es entender si los consumidores son más propensos a elegir la marca 2 o la 3 dependiendo de su edad y sexo.

Configuración de un modelo logit multinomial

Para activar el cuadro de diálogo Modelo Logit Multinomial, abra XLSTAT, y seleccione a continuación el comando XLSTAT / Modelación de datos / Regresión logística para datos de respuesta binaria, o bien haga clic en el botón regresión logística de la barra de herramientas Modelación de datos (ver más abajo).

barlog1.gif

Tras hacer clic en el botón, aparece el cuadro de diálogo Regresión logística.

Para activar el modelo logit multinomial, cambie el tipo de respuesta y seleccione multinomial. Aparece un nuevo cuadro de diálogo en el que puede elegir la categoría de control o de referencia (en nuestro caso elegimos a1=0, lo que significa que ajustamos a 0 el efecto relativo para la primera categoría).

logmult1.gif

Seleccione los datos en la hoja de Excel. La Respuesta corresponde a la columna en que está almacenada la variable a explicar. En este caso concreto, tenemos dos variables explicativas cuantitativas.

Puesto que seleccionamos los títulos de las columnas de todas las variables, mantenemos seleccionada la opción Incluir etiquetas de las variables.

logmultf2.gif

Hay muchas opciones disponibles en el cuadro de diálogo.

Nota: Las opciones por defecto corresponden a la elección básica; consulte por favor la ayuda de XLSTAT si desea más detalles.

Los cálculos comienzan una vez haya hecho clic en el botón OK.

Interpretación de un modelo logit multinomial

La siguiente tabla muestra varios indicadores sobre la calidad del modelo (o bondad de ajuste). Estos resultados son equivalentes a la R² y a la tabla de análisis de varianza de regresión lineal y ANOVA. El valor más importante a tener en cuenta es la probabilidad de la prueba de Chi-cuadrado sobre la log ratio. Esto es equivalente a la prueba F de Fisher: tratamos de evaluar si las variables contienen información significativa al comparar el modelo tal como se define, con un modelo más sencillo con una sola constante. En este caso, puesto que la probabilidad es inferior a 0.0001, se puede concluir que las variables contienen información significativa.

logmultf3.gif

La siguiente tabla proporciona detalles sobre el modelo. Esta tabla resulta útil para entender el efecto de las diferentes variables sobre las categorías de la variable de respuesta. Es muy diferente de la tabla de regresión logística. Se obtienen parámetros para cada variable y para cada categoría de la variable de respuesta (excepto para la categoría de referencia). También se ofrecen las odds ratios en orden a mejorar la comprensión de los resultados.

logmultf4.gif

La interpretación de los parámetros no es inmediata. La ecuación del modelo para la modalidad 2 es:

Log(P(Response=2)/P(Response=1))=-11.775+0.524*FEMALE+0.368*AGE

Por ejemplo, se puede decir que para una unidad de cambio en la variable edad (AGE), el log de la ratio de las dos probabilidades, P (Respuesta = 2) / P (Respuesta = 1), se incrementará en 0.368. Por tanto, podemos decir que, en general, mientras mayor sea una persona, con más probabilidad preferirá la marca 2. La ratio de la probabilidad de elegir una categoría de salida sobre la probabilidad de elegir la categoría de referencia se denomina frecuentemente “odds ratio” (también a veces se conoce como riesgo relativo o relative risk). Así pues, otra manera de interpretar los resultados de la regresión es en términos de odds ratios. Podemos decir que por un cambio de una unidad en la variable edad, se espera que el riesgo relativo de la elección de la marca 2 sobre la marca 1 aumente en 1.445.

Al examinar la probabilidad de los valores chi-cuadrado, vemos que la variable que más influye en la variable de respuesta tanto para la categoría 2 como para la categoría 3 es la edad del cliente. Las intercepciones son significativas. Los expertos en marketing deberían, por tanto, centrarse en las personas mayores si quieren aumentar la cuota de mercado de la marca 1.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283