Su solución de análisis de datos

Tabla cruzada inteligente en Excel

03/03/2017

Este tutorial muestra cómo utilizar la característica de XLSTAT tabla inteligente dinámica, que ofrece sustanciales ventajas comparada con las tablas pivote clásicas de Excel.

Datos para crear una tabla dinámica inteligente

Puede descargar aquí una hoja Excel (archivo comprimido) con los datos y resultados. Los datos se recopilaron en el censo de 1994, por la Oficina Americana del Censo, American Census Bureau (http://www.census.gov).
Este conjunto de datos se ha utilizado varias veces por los estadísticos para evaluar el rendimiento predictivo de nuevos algoritmos. Cada registro contiene 8 descriptores sobre un individuo, tales como la edad, ocupación, educación, sexo, etc. El número de registros se ha limitado a 8000. La variable de ponderación (que permite a cada individuo representar un cierto porcentaje de la población) no se utiliza en el siguiente ejemplo.

Objetivo de este tutorial

El objetivo consiste en crear rápidamente una tabla dinámica y un gráfico de contribución que ayudará al usuario a comprender qué factores y qué combinación de factores pueden ejercer influencia sobre el hecho de que una persona tenga ingresos mayores o menores de 50k $ (la variable correspondiente se encuentra en la columna J). XLSTAT permite hacer esta operación de forma rápida y fácil.

Generar una tabla dinámica inteligente

Una vez abierto XLSTAT, seleccione el comando XLSTAT / Descripción de datos / Tabla dinámica, o bien haga clic en el botón correspondiente del menú Descripción de datos (ver más abajo).

Menu pivot

Tras hacer clic en el botón, aparece el cuadro de diálogo.

Seleccione los datos en la hoja de cálculo de Excel. Dado que la primera fila corresponde a las etiquetas, y que las siguientes filas corresponden a los datos, es posible utilizar el modo de selección rápida de XLSTAT: seleccionar directamente las columnas haciendo clic en las letras correspondientes.

Seleccione la opción Incluir etiquetas, puesto que la primera fila se corresponde con el nombre de las variables.

Tenga en cuenta que las variables explicativas y las variables de respuesta pueden ser cualitativas o cuantitativas.

Dado que la variable a explicar es una variable cualitativa, seleccione ‘cualitativa’ en el tipo de variable. A continuación, seleccione la modalidad de destino a usar en la tabla dinámica. En nuestro caso, nos centramos en el caso ">50K".

Dialog box general pivot

Luego haga clic en OK para que XLSTAT-Pivot pueda iniciar los cálculos. El algoritmo de tablas dinámicas se basa en árboles clasificación y en el algoritmo CHAID.

El siguiente cuadro de diálogo muestra las opciones para crear tablas dinámicas óptimas. Seleccione las variables que desee utilizar en las tablas dinámicas. Las contribuciones de las variables al modelo se muestran al lado del nombre de la variable (cuanto mayor sea la contribución, mayor será la información que aporta para explicar la variabilidad de la variable explicativa).

Cuando esté satisfecho con la selección (en este ejemplo no hemos hecho ningún cambio en las opciones por defecto), haga clic en Continuar.

Dialog box selection pivot

Interpretación de una tabla dinámica inteligente

Aparecerá nueva hoja con un histograma de las contribuciones de las variables, así como una tabla cruzada dinámica.

Contribution plot pivot

El gráfico confirma que la variable que tiene el mayor efecto sobre los ingresos es el estado civil seguido por el número de años de educación.
La tabla dinámica puede mostrar hasta 4 valores para cada combinación de categorías:

  • Promedio Objetivo: Si se trata de una variable cualitativa, corresponde al porcentaje de los casos en los que está presente la categoría objetivo de la variable de respuesta; si se trata de una variable continua, corresponde al promedio de la variable objetivo calculado sobre la subpoblación correspondiente a la combinación;
  • Tamaño del objetivo: Frecuencia de las apariciones de la categoría objetivo para la variable de respuesta en el caso de que la variable sea cualitativa;
  • Tamaño de la población%: Porcentaje de la población total que corresponde a la combinación;
  • Tamaño de la población: Tamaño de la población que corresponde a la combinación.

La tabla dinámica es la siguiente:

 Pivot table

Deberíamos ahora analizar la tabla cruzada dinámica, para identificar las combinaciones que más influyen en el hecho de que las personas ganen más de $50k.
Advierta que, una vez que tenga una tabla dinámica, podría ser interesante hacer un análisis de correspondencias para ver cómo las categorías de las distintas variables explicativas están relacionados entre sí. Para construir la tabla de entrada, mantener sólo los valores de "Tamaño objetivo".
 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283