Su solución de análisis de datos

Análisis CATA (Check-All-That-Apply) en Excel

03/03/2017

Este tutorial le mostrará cómo configurar e interpretar un análisis Check-all-that-apply (CATA) en Excel usando el software estadístico XLSTAT.

Datos para ejecutar un análisis CATA en XLSTAT

Para este tutorial, hemos usado datos provenientes de Ares et al. (2014). Corresponden a la evaluación de 6 productos (5 regulares y 1 ideal) por 119 consumidores mediante 15 atributos. Los datos se registran en formato binario (0: el atributo no se ha señalado; 1: el atributo se ha señalado). Además, cada consumidor otorga a cada uno de los productos (excepto el ideal) una calificación global (0-10).
Los datos están en formato vertical, lo que significa que tenemos una fila por combinación de consumidor y producto.
Puede descargar una hoja Excel con los datos y los restultados haciendo clic aquí
 

Objetivo de este tutorial

El objetivo de este tutorial es llevar a cabo un análisis CATA (check-all-that-apply) para caracterizar productos puestos a prueba por los consumidores.
 

Configuración de un análisis CATA en XLSTAT

Para ejecutar un análisis CATA, haga clic en XLSTAT-Análisis de datos sensoriales / Análisis de datos CATA.

XLSTAT Sensory Data Analysis menu CATA EN

En la pestaña General, nos aseguramos en primer lugar de que hemos seleccionado el formato de datos vertical. En el campo de datos CATA, seleccione la tabla de atributos. Seleccione a continuación las columnas Consumer, Sample y Liking en los campos de datos Evaluadores, Productos y Datos de preferencia, respectivamente. Capture el identificador del producto ideal en el campo de producto Ideal.

cata general

En la pestaña Opciones(1), seleccione la distancia de Chi-cuadrado para el Análisis de Correspondencias.

Options(1) cata

Haga clic en el botón OK. Aparece un cuadro de diálogo para que el usuario seleccione y valide los ejes a mostrar en la representación gráfica del análisis de correspondencias.

Interpretación de los resultados de un análisis CATA en XLSTAT, parte primera

La primera tabla únicamente toma en consideración los datos que emergen de los atributos y productos evaluados. La primera columna contiene los valores p asociados a las pruebas Q de Cochran, que compara los productos de forma independiente para cada atributo. El significado de la tabla contiene proporciones de 1’s a través de los evaluadores para cada combinación de productos y atributos.

Una proporción elevada significa que el atributo es marcado frecuentemente por los consumidores en el producto evaluado.

cata cochran

Para un atributo dado, la prueba Q de Cochran permite comprobar el efecto de una variable explicativa (Productos) sobre si los consumidores sienten el atributo o no. Un valor p bajo más allá del umbral de significación indica que los productos difieren significativamente entre sí. Si el valor p es significativo, el usuario puede estar interesado en examinar comparaciones múltiples por pares, representadas por pequeñas letras dentro de las celdas de la tabla: dos productos que compartan la(s) misma(s) letra(s) no difieren significativamente. Dos productos que no tengan letras en común, difieren significativamente.

Podemos ver que todos los atributos, con excepción de dos referidos al olor (inodoro, olor intenso) están asociados a valores p significativos con 0.05. Por ejemplo, si consideramos el atributo crujiente, podemos ver que el producto 257 el el más crujiente, pero no es significativamente más crujiente que el 548 (compruebe las letras). Los productos 992 y 366 con los menos crujientes, y no difieren significativamente entre sí.

La tabla de contingencia siguiente es la suma de las tablas de atributos a través de los evaluadores. Se usa para construir un análisis de correspondencias (CA).

Se somete a prueba la independencia entre las filas y las columnas (este resultado únicamente está disponible para el análisis de corespondencias clásico (usando la distancia de Chi-cuadrado). Puesto que el valor p es más bajo que el nivel de significación (0.05), concluimos que es muy probable que existan diferencias reales en los productos en términos de sus perfiles sensoriales.

 

cata ca

La tabla de los valores propios y el gráfico correspondiente permiten verificar la calidad del análisis. La calidad del análisis es buena (el 90% de la inercia total es explicada por las dos primeras dimensiones). De acuerdo al mapa del análisis, un producto ideal debería ser relativamente sabroso, jugoso, crujiente, firme y dulce, y debería tener un olor relativamente intenso y un sabor a manzana.
Por otra parte, no debería ser demasiado ácido, amargo, astringente, granulado, suave, harinoso, sin sabor o sin olor. El producto 548 parece ser el más próximo al producto ideal, en tanto que el producto 106 está muy lejos debido a su relativo amargor, acidez y astringencia. Los productos 366 y 992 están también relativamente lejos del producto ideal.
Si desea más información sobre el análisis de correspondencias, puede consultar aquí.
 
A continuación, se muestra una matriz de correlaciones que incluye los atributos (correlaciones tetracóricas) y las puntuaciones de gusto (correlaciones biseriales, última fila). Vemos algunas correlaciones elevadas. La correlación negativa entre dulce y amargo indica que cuando la gente marca amargo, no marca dulce, y viceversa. Las puntuaciones de gusto parecen estar positivamente (aunque de forma débil) correlacionadas con los atributos que estaban vinculados con el producto ideal en el análisis de correspondencias (jugoso, gustoso, sabor a manzana).

cata correlation matrix

El Análisis de Coordenadas Principales (Principal Coordinates Analysis, PCoA) se aplica a los coeficientes de correlación, y los resultados se visualizan en un mapa bidimensional. Las primeras dos dimensiones explican el 40.78% de la variación y el gráfico de sedimentación indica que las dos primeras dimensiones son suficientes para interpretar las relaciones entre los atributos. Una vez más, vemos aquí que el gusto se asocia con los atributos de jugoso, gustoso y con sabor a manzana.

cata coordinate analysis

Si desea más información sobre el  análisis de coordenadas principales, puede consultar aquí.

Interpretación de los resultados de un análisis CATA en XLSTAT, parte segunda

Cuando tenemos disponibles los datos de gusto, los siguientes resultados se refieren al análisis penalty.
Un primer análisis basado en la incongruencia en la que el atributo está ausente en el producto real pero no en el ideal, permite identificar los atributos que debería tener (imprescindibles). Una tabla resumen indica las frecuencias con las que ocurren P(No)|( Sí) y P(Sí)|( Sí) para cada atributo. La representación gráfica que sigue muestra 

cata penalty 1

Las caídas medias en gusto entre las dos situaciones se presentan a continuación para cada atributo, y se someten a prueba sus niveles de significación. Por ejemplo, el atributo “firme” implica un incremento de 1.5 puntos de Gusto entre los productos evaluados y el producto ideal. Este incremento es significativo al nivel de 0.05 (p < 0.0001).

Nota. En el caso en que no hay producto ideal, este análisis es sustituido por un análisis de presencia y ausencia de los atributos.

cata penalty 1

El gráfico de impacto medio muestra los atributos con un impacto medio significativo. Se muestran los incrementos de la media en azul y se identifican como “must have” (imprescindibles), en tanto que los decrementos de la media se muestran en rojo.

cata penalty 1

El gráfico de caídas medias vs % también permite identificar claramente los atributos “must have” (imprescindibles). El eje Y corresponde a las diferencias entre la celda [1,1] y la celda [0,1] (los atributos marcados para el producto ideal y para el producto evaluado menos los marcados solamente para el ideal). El eje X representa el porcentaje de respuestas que incluyen una marca del producto ideal pero no una marca del producto en un atributo dado, lo que corresponde a situaciones donde el atributo describe bien el producto ideal, pero en alguna medida está ausente en los productos reales. Por consiguiente, los atributos que están asociados a coordenadas elevadas en ambos ejes X e Y (gustoso, dulce, jugoso, con sabor a manzana, crujiente, firme, olor intenso) apacecen de nuevo aquí como atributos “must have” (imprescindibles).

cata penalty 1

Un segundo análisis permite identificar los atributos “nice to have” (deseables). Es similar al primero, pero basado en la incongruencia en la que el atributo está ausente en el producto ideal pero no en el real.

Nota: Este análisis solo se puede realizar cuando tenemos disponible un producto ideal.

El gráfico de impacto medio muestra los atributos con un impacto medio significativo. Los incrementos medios se muestran en azul y son identificados como “nice to haves” (deseables), los decrementos medios se muestran en rojo y se identifican como must not haves (no deseables).

cata penalty 1

El gráfico de caídas medias vs % también permite identificar claramente los “must not haves” (indeseables) y los “nice to haves” (deseables). El eje Y corresponde a las diferencias entre la celda [0,0] y la celda [1,0] (atributos no marcados para el producto ideal y para el producto evaluado menos los marcados solamente para el producto evaluado). El eje X representa el porcentaje de respuestas que incluyen una marca del producto evaluado, pero no una marca del producto ideal en un atributo dado, lo que corresponde a situaciones donde el atributo describe bien los productos reales pero está en cierto modo ausente en el producto ideal. Por tanto, los atributos asociados a coordenadas bajas en el eje Y (agrio, amargo, suave, harinoso, granulado, insípido e inodoro) parecen aquí de nuevo ser atributos “must not haves” (indeseables). Los atributos asociados a coordenadas altas en el eje Y son “nice to haves” (desdeables). 

cata penalty 1

Los dos análisis precedentes se resumen finalmente en un mapa. Aquí de nuevo los atributos gustoso, dulce, con sabor a manzana, firme, crujiente y de olor intenso aparecen como “must haves” (imprescindibles); y agrio, amargo, astringente, suave, harinoso, granulado, insípido e inodoro son“must not haves” (no deseables).  

cata penalty 1

Seguidamente, se muestra una tabla de 2x2 por cada atributo. A la izquierda de cada tabla, tenemos los valores registrados en relación al producto ideal y, en la parte superior, los valores obtenidos de los productos evaluados. En las celdas de las tablas, podemos encontrar la preferencia promedio (promediada sobre los evaluadores y los productos) y el % de todos los registros que corresponden a esta combinación de ceros y unos.

Para un atributo dado, si el atributo es marcado para el producto ideal (segunda fila), entonces, si la preferencia para los productos que están marcados (celda [1,1]) es mayor que cuando no están marcados (celda [1,0]), entonces el atributo es un “must have” (imprescindible). De forma simétrica, si el atributo no está marcado en el producto ideal (primera fila), entonces, si la preferencia para los productos que no están marcados (celda [0,0]) es mayor que cuando sí están marcados (celda [0,1]), entonces el atributo es un “must not have” (indeseable). Si el atributo no está marcado para el producto ideal (primera fila) y si la preferncia para los productos que están marcados (celda [0,1]) es aproximadamente la misma que cuando no están marcados (celda [0,0]), entonces el atributo es un “does not harm” (no hace daño). Finalmente, si (celda [0,1]) > (celda [0,0]), entonces el atributo es un “nice to have” (deseable).

Por ejemplo, para el atributo “gustoso”, el 28% de los registros de los productos evaluados (no ideal) están marcados tanto para el producto evaluado como para el producto ideal. El promedio de gusto de estos registros es 7.8.

 

xlstat penalty table

En la tabla resumen final, podemos ver que 6 de los 15 atributos son “must haves” (imprescindibles) y 7 atributos son “must not haves” (indeseables). Los restantes 2 atributos son “does not harms” (no hace daño).

 

xlstat penalty table

Referencias

Ares G., Dauber C., Fernández E., Giménez A., & Varela P. (2014). Penalty analysis based on CATA questions to identify drivers of liking and directions for product reformulation. Food Quality and Preference, 32A, 65-76. 

Meyners M., Castura J. C., Carr B. T. (2013). Existing and new approaches for the analysis of CATA data. Food Quality and Preference, 30(2), 309-319.

 

 

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283