Tabla cruzada inteligente en Excel
Este tutorial muestra cómo utilizar la característica de XLSTAT tabla inteligente dinámica, que ofrece sustanciales ventajas comparada con las tablas pivote clásicas de Excel.
Datos para crear una tabla dinámica inteligente
Este conjunto de datos se ha utilizado varias veces por los estadísticos para evaluar el rendimiento predictivo de nuevos algoritmos. Cada registro contiene 8 descriptores sobre un individuo, tales como la edad, ocupación, educación, sexo, etc. El número de registros se ha limitado a 8000. La variable de ponderación (que permite a cada individuo representar un cierto porcentaje de la población) no se utiliza en el siguiente ejemplo.
Objetivo de este tutorial
El objetivo consiste en crear rápidamente una tabla dinámica y un gráfico de contribución que ayudará al usuario a comprender qué factores y qué combinación de factores pueden ejercer influencia sobre el hecho de que una persona tenga ingresos mayores o menores de 50k $ (la variable correspondiente se encuentra en la columna J). XLSTAT permite hacer esta operación de forma rápida y fácil.
Generar una tabla dinámica inteligente
Una vez abierto XLSTAT, seleccione el comando XLSTAT / Descripción de datos / Tabla dinámica, o bien haga clic en el botón correspondiente del menú Descripción de datos (ver más abajo).
Tras hacer clic en el botón, aparece el cuadro de diálogo.
Seleccione los datos en la hoja de cálculo de Excel. Dado que la primera fila corresponde a las etiquetas, y que las siguientes filas corresponden a los datos, es posible utilizar el modo de selección rápida de XLSTAT: seleccionar directamente las columnas haciendo clic en las letras correspondientes.
Seleccione la opción Incluir etiquetas, puesto que la primera fila se corresponde con el nombre de las variables.
Tenga en cuenta que las variables explicativas y las variables de respuesta pueden ser cualitativas o cuantitativas.
Dado que la variable a explicar es una variable cualitativa, seleccione ‘cualitativa’ en el tipo de variable. A continuación, seleccione la modalidad de destino a usar en la tabla dinámica. En nuestro caso, nos centramos en el caso ">50K".
Luego haga clic en OK para que XLSTAT-Pivot pueda iniciar los cálculos. El algoritmo de tablas dinámicas se basa en árboles clasificación y en el algoritmo CHAID.
El siguiente cuadro de diálogo muestra las opciones para crear tablas dinámicas óptimas. Seleccione las variables que desee utilizar en las tablas dinámicas. Las contribuciones de las variables al modelo se muestran al lado del nombre de la variable (cuanto mayor sea la contribución, mayor será la información que aporta para explicar la variabilidad de la variable explicativa).
Cuando esté satisfecho con la selección (en este ejemplo no hemos hecho ningún cambio en las opciones por defecto), haga clic en Continuar.
Interpretación de una tabla dinámica inteligente
Aparecerá nueva hoja con un histograma de las contribuciones de las variables, así como una tabla cruzada dinámica.
El gráfico confirma que la variable que tiene el mayor efecto sobre los ingresos es el estado civil seguido por el número de años de educación. La tabla dinámica puede mostrar hasta 4 valores para cada combinación de categorías:
- Promedio Objetivo: Si se trata de una variable cualitativa, corresponde al porcentaje de los casos en los que está presente la categoría objetivo de la variable de respuesta; si se trata de una variable continua, corresponde al promedio de la variable objetivo calculado sobre la subpoblación correspondiente a la combinación;
- Tamaño del objetivo: Frecuencia de las apariciones de la categoría objetivo para la variable de respuesta en el caso de que la variable sea cualitativa;
- Tamaño de la población%: Porcentaje de la población total que corresponde a la combinación;
- Tamaño de la población: Tamaño de la población que corresponde a la combinación.
La tabla dinámica es la siguiente:
Deberíamos ahora analizar la tabla cruzada dinámica, para identificar las combinaciones que más influyen en el hecho de que las personas ganen más de $50k. Advierta que, una vez que tenga una tabla dinámica, podría ser interesante hacer un análisis de correspondencias para ver cómo las categorías de las distintas variables explicativas están relacionados entre sí. Para construir la tabla de entrada, mantener sólo los valores de "Tamaño objetivo".
¿Ha sido útil este artículo?
- Sí
- No