Su solución de análisis de datos

Caracterización de variables: tutorial Excel

20/10/2017

Este tutorial muestra cómo caracterizar variables usando otras variables en Excel usando el software XLSTAT.

Datos para ejecutar una caracterización de variables

Puede descargar una hoja Excel con los datos y los resultados usados en este tutorial haciendo clic aquí.
Los datos se han recopilado para la supervisión médica de personas de Angers (Francia). Más exactamente, los médicos del hospital clínico han estudiado la condición de roncar de 100 pacientes entre 2000 y 2002.

Objetivo de este tutorial sobre caracterización de variables

Al usar caracterización de variables, el objetivo es estudiar las posibles relaciones entre las diferentes variables a nuestra disposición, a saber: edad, peso, talla, sexo, consumo de tabaco y alcohol y, obviamente, los ronquidos.
En este tutorial, se llevaron a cabo dos estudios introductorios, centrándose el primero en la dependencia entre las dos variables categóricas Género y Tabaco, antes de evaluar la correlación entre las variables continuasTalla y Peso.
A continuación, abandonando este marco clásico, nuestro interés se se trasladó a la caracterización de la categoría 1 de la variable Ronquido, primero con las variables categóricas Género y Tabaco, y luego con las variables continuas Edad, Peso, Alcohol y Talla.
En el último estudio, queremos discriminar a las personas que roncan con un conjunto de descriptores. Una manera fácil de lograrlo es comparar los valores de los parámetros de las variables en toda la población (la muestra inicial) y en la subpoblación (el grupo con la categoría). Cuando la variable es cuantitativa, comparamos las medias, mientras que cuando es cualitativa, comparamos las proporciones.

Configuración de la caracterización de la variable

Una vez abierto XLSTAT, seleccione XLSTAT / Descripción de datos / Caracterización de las variables (véase más abajo).

 menu

Una vez que haya hecho clic en el botón, aparece el cuadro de diálogo Caracterización de las Variables.

A continuación, puede seleccionar los datos en la hoja de cálculo de Excel.

Primer estudio: La dependencia entre el consumo de tabaco y Género

El Elemento(s) a caracterizar corresponde a la variable categórica Tabaco. El Elemento caracterizante corresponde a la variable categórica Género.

Puesto que hemos seleccionado el título de la columna en las variables, dejamos activado Etiquetas de las variables. Las otras opciones se han dejado en su valor por defecto.

 dialog box

El valor p es 0.004 (<= 0.05). Por lo tanto, puede rechazarse la hipótesis nula de independencia, y concluir que existe una dependencia significativa entre el consumo de tabaco y género en esta muestra.

Segundo estudio: correlación entre las variables continuas Talla y Peso

En esta segunda parte, se investiga brevemente la relación entre la Talla y el peso de la muestra.
El Elemento a caracterizar corresponde a la variable categórica Peso.
El Elemento caracterizante corresponde a la variable categórica Talla.
Puesto que hemos seleccionado el título de la columna en las variables, dejamos activado Etiquetas de las variables. Las otras opciones se han dejado en su valor por defecto.

Interpretación de los resultados de este segundo estudio

XLSTAT muestra los siguientes resultados:

 results 1

El valor p es inferior a 0.0001 (coeficiente de correlación es igual a 0.927). Por lo tanto existe una fuerte correlación entre el peso y la talla en esta muestra.

Tercer estudio: Caracterización de la categoría Ronquido = 1 con las variables categóricas Género y Tabaco y luego con las variables continuas Peso, Talla, Edad y Alcohol.

Este último paso consiste en la identificación de las mejores variables categóricas y continuas para caracterizar las personas que roncan.
El Elemento a caracterizar corresponde a la categoría: Ronquido = 1.
Los elementos caracterizantes corresponden en primer lugar a las categorías: Sexo = 0, Sexo = 1, Tabaco = 0, Tabaco = 1 y luego a las variables continuas: Peso, Talla, Edad y Alcohol.
Puesto que hemos seleccionado el título de la columna en las variables, dejamos activado Etiquetas de las variables. Las otras opciones se han dejado en su valor por defecto.

Interpretación de los resultados del tercer estudio

La primera tabla corresponde a las variables de caracterización categóricas:

 results 1

La mejor categoría para caracterizar las personas que roncan es la condición masculina (Sexo = 0). Paradójicamente, en esta muestra y entre las personas que roncan, los no-fumadores están sobre-representados.

La segunda tabla corresponde a las variables de caracterización continuas:

results 1

Las personas mayores (que la media de la muestra) y las personas que beben más alcohol (que la media de la muestra) están sobreexpuestas a la condición presentar ronquidos.

Conclusión de la caracterización de variables

En esta muestra, la persona que ronca típica es un varón de 56 años de edad que toma unas 4 bebidas al día.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283