Pasar al contenido principal

Dispersigrama con elipses de confianza Excel

Este tutorial muestra cómo trazar fácilmente diagramas de dispersión con elipses de confianza en Excel usando el solftware XLSTAT.

Datos para crear diagramas de dispersión con elipses de confianza en Excel

En este tutorial se utiliza una tabla de datos donde las filas corresponden a los clientes de un sitio web comercial y las columnas incluyen el número de conexiones de cada cliente al Facebook de la página web, el dinero que gastan en el sitio web, así como el grupo de edad a la que se pertenecen (15 – 30; 30 – 45; > 45). Se

Objetivo de este tutorial

El objetivo de este tutorial es usar la función diagramas de dispersión (scatter plots) de XLSTAT con la opción elipses de confianza al 95% para explorar perfiles de consumidores de un sitio web comercial.

Configuración de un diagrama de dispersión con elipses de confianza en XLSTAT

Haga clic en el menú XLSTAT / Visualización de datos / Diagramas de dispersión. En la pestaña General, vamos a asignar la variable número de conexiones Facebook conexiones al eje X de los diagramas de dispersión, y el dinero gastado al eje Y. Seleccione los datos en consecuencia. Por otra parte, vamos a pedir a XLSTAT que coloree a los puntos del gráfico de dispersión de acuerdo a la variable de grupo de edad. por lo tanto vamos a activar la opción Grupos y seleccionamos la columna Grupo de edad en el campo correspondiente.

Scatter plot general tab

En la pestaña Opciones, nos aseguramos de que están seleccionadas las opciones Leyenda y Elipses de confianza.

Scatter Plot options tab

Interpretación de un diagrama de dispersión con elipses de confianza en XLSTAT

scatter plot with conf ellipses

Globalmente, se observa una relación positiva entre el número de conexiones de Facebook y el dinero gastado en el sitio web. Esta conclusión es bastante trivial. Las cosas se vuelven más interesantes cuando se comparan los grupos de edad entre sí.

  • Los clientes de más de 45 años (puntos violeta en la esquina inferior izquierda del gráfico) parecen conectarse menos a Facebook y gastar menos dinero en comparación con los otros dos grupos de edad. La elipse asociada a este grupo de edad no se solapa con las otras dos elipses. Podemos decir que este grupo es relativamente diferente de los otros dos con respecto al dinero gastado y al número de conexiones a Facebook.
  • Los clientes de entre 35 - 45 años (puntos verdes) son los que gastan más dinero. También se conectan a Facebook mucho más que las personas de más de 45 años, pero un poco menos de los clientes más jóvenes.
  • El grupo más joven (15 - 30; puntos azules) se caracteriza por el mayor número de conexiones a Facebook y relativamente altas cantidades de dinero (aunque menos que el grupo de edad intermedia). A medida que sus elipses de confianza se solapan, los grupos de jóvenes y de edad intermedia son relativamente similares entre sí.

Se pueden proponer muchas interpretaciones. Por ejemplo, podemos decir que a los clientes más jóvenes les encanta pasar tiempo en Facebook, pero no tienen suficiente dinero para gastar. Los clientes que pertenecen al grupo de mayor edad están menos interesados en las redes sociales y prefieren gastar su dinero en tiendas "reales". Los clientes de edad intermedia de tienen más dinero para gastar que las personas más jóvenes y crecieron con la tecnología de Internet, lo que puede explicar el hecho de que se conectan a Facebook casi tan a menudo como los clientes más jóvenes.

Un paso más: Incrementar el número de dimensiones con Análisis de Componentes Principales (PCA)

Imagine que llevamos a cabo este tipo de análisis exploratorios con un número de variables mucho mayor. El Análisis de Componentes Principales es una herramienta muy popular que reducirá la dimensionalidad de la tabla de datos para poder interpretar patrones en los gráficos bidimensionales.

¿Ha sido útil este artículo?

  • No