Su solución de análisis de datos

Sensibilidad y especificidad: tutorial Excel

17/11/2017

Este tutorial muestra cómo configurar e interpretar una análisis de sensibilidad y especificidad en Excel usando el software estadístico XLSTAT.

¿Qué es un análisis de sensibilidad y especificidad?

Este método fue desarrollado por primera vez durante la Segunda Guerra Mundial para implementar medios eficaces de detección de aviones japoneses. Posteriormente, se ha venido aplicando de manera más general a la detección de señales, así como en medicina, disciplina en la que se utiliza ampliamente.
El problema es el siguiente: se estudia un fenómeno, a menudo binario (por ejemplo, la presencia o ausencia de una enfermedad) y queremos desarrollar una prueba para detectar eficazmente la aparición de un evento preciso (por ejemplo, la presencia de esa enfermedad).
Sea V la variable binaria o multinomial que describe el fenómeno para N individuos de los que se está haciendo el seguimiento. Señalamos con + a los individuos para los cuales el evento ocurre y - para aquellos que no ocurre. Sea T una prueba cuyo objetivo es detectar si el evento ha ocurrido o no. T puede ser una variable binaria (presencia/ausencia), cualitativa (por ejemplo, el color) o cuantitativa (por ejemplo, una concentración).
Una vez que la prueba ha sido aplicada a los N individuos, conseguimos una tabla de individuos por variables en la que se registra para cada individuo si el evento ha ocurrido o no, y el resultado de la prueba.

Datos para un análisis de sensibilidad y especificidad

Puede descargar una hoja Excel con los datos y resultados utilizados en este tutorial haciendo clic aquí.
Los datos corresponden a un experimento médido durante el cual 18 pacientes con una enfermedad y 18 individuos sanos han sido sometidos a una nueva prueba de diagnóstico, menos cara que la actual, más potente. Esta prueba es binaria, puesto que se supone que muestra un color rojo cuando el paciente está enfermo y ningún color en caso contrario.
Los resulatdos se registran en una tabla individuos por variables. Queremos usar un análisis de sensibilidad y especificidad para evaluar la prueba.

Configuración de un análisis de sensibilidad y especificidad

Tras abrir XLSTAT, seleccione el comando Análisis de supervivencia / Sensibilidad y especificidad.

Survival Analysis / Sensitivity - Specificity

Cuando hacemos clic en el botón, aparece un cuadro de diálogo. Seleccione los datos que corresponden a los datos de evento y a los datos de prueba, y escriba qué código está asociado a los casos positivos para ambos conjuntos de datos.

sens1.gif

En la pestaña Opciones, puede especificar el método para calcular los intervalos de confianza. XLSTAT es el software que ofrece el rango de elecciones más amplio. Los valores por defecto son los más recomendados.

sens2.gif

Cuando hacemos clic en OK, se ejecutan los cálculos y se muestran los resultados.

Interpretación de los resultados de un análisis de sensibilidad y especificidad

La primera tabla es una tabla de contingencia (tabulación cruzada) que resume la tabla de entrada con los siguientes valores:
  • Verdaderos positivos (VP): Número de casos que la prueba declara positivos y que realmente son positivos.
  • Falsos negativos (FN): Número de caso que la prueba declara positivos y que realmente son negativos.
  • Verderos negativos (VN): Número de caso que la prueba declara negativos y que realmente son negativos.
  • Falsos negativos (FN): Número de caso que la prueba declara negativos y que realmente son positivos.

sens3.gif

Usando estas frecuencias y N (suma de estos valores), calculamos los diferentes índices que permiten evaluar el desempeño de la prueba de diagnóstico.

sens4.gif

Para interpretar fácilmente estos resultados, he aquí una descripción de los diferentes índices:

  • Sensibilidad (equivalente a Tasa de Verdaderos Positivos): Proporción de casos positivos que son correctamente detectados por la prueba. En otras palabras, la sensibilidad mide hasta qué punto la prueba es efectiva cuando se usa con individuos positivos. La prueba es perfecta para individuos positivos cuando la sensibilidad es 1, y equivale a lo que se obtendría por azar cuando la sensibilidad es 0.5. Si es inferior a 0.5, la prueba se está comportando en contra de lo esperado, y podría ser útil revertir la regla de forma que la sensibilidad fuera mayor que 0.5 (en el supuesto de que esto no afecte a la especificidad). La definición matemática viene dada por: Sensibilidad = TP/(TP + FN).
  • Especificidad (también llamada Tasa de Verdaderos Negativos): Proporción de casos negativos que son correctamente detectados por la prueba. En otras palabras, la especificidad mide hasta qué punto la prueba es efectiva cuando se usa con individuos negativos. La prueba es perfecta para individuos negativos cuando la especificidad es 1, y equivale a lo que se obtendría por azar cuando la especificidad es 0.5. Si es inferior a 0.5, la prueba se está comportando en contra de lo esperado, y podría ser útil revertir la regla de forma que la especificidad fuera mayor que 0.5 (en el supuesto de que esto no afecte a la sensibilidad). La definición matemática viene dada por: Especificidad = TN/(TN + FP).
  • Tasa de Falsos Positivos (FPR): Proporción de casos negativos que la prueba detecta como positivos (FPR = 1-Especificidad).
  • Tasa de Falsos Negativos (FNR): Proporción de casos positivos que la prueba detecta como negativos (FNR = 1-Sensibilidad).
  • Prevalencia: frecuencia relativa del evento de interés en la muestra total (VP+FN)/N.
  • Valor Predictivo Positivo (PPV): Proporción de casos verdaderamente negativos entre los casos negativos detectados por lal prueba. Tenemos que PPV = TP / (TP + FP), o PPV = Sensibilidad x Prevalencia / [(Sensibilidad x Prevalencia + (1- Especificidad)(1- Prevalencia)]. Es un valor fundamental que depende de la prevalencia, un índice que es independiente de la calidad de la prueba.
  • Valor Predictivo Negativo (NPV): Proporción de casos verdaderamente negativos entre los casos negativos detectados por lal prueba. Tenemos que NPV = TN / (TN + FN), o PPV = Especificidad x (1 - Prevalencia) / [(Especificidad (1-Prevalencia) + (1- Sensibilidad) x Prevalencia].
  • Ratio de Probabilidad Positiva (LR+): Esta razón indica hasta qué punto un individuo tiene más probabilidades de ser positivo en realidad cuando la prueba está diciendo que es positivo. LR+ = Sensibilidad / (1- Especificidad). La LR- es un valor positivo o nulo.
  • Ratio de Probabilidad Negativa (LR-): Esta razón indica hasta qué punto un individuo tiene más probabilidades de ser negativo en realidad cuando la prueba está diciendo que es positivo. LR- = (1-Sensibilidad) / (Especificidad). La LR- es un valor positivo o nulo.
  • Odds ratio: La odds ratio indica en qué medida un individuo tiene más probabilidad de ser positivo si la prueba es positiva, comparado con los casos en los que la prueba es negativa. Por ejemplo, una odds ratio de 2 significa que la probabilidad de que ocurra el evento positivo es dos veces mayor si la prueba es positiva que si es negativa. La odds ratio es un valor positivo o nulo. Odds ratio = TPxTN / (FPxFN).
  • Riesgo relativo: El riesgo relativo es la razón que mide en qué medida la prueba se comporta mejor cuando el informe es positivo que cuando es negativo. Por ejemplo, un riesgo relativo de 2 significa que la prueba es dos veces más potente cuando es positiva que cuando es negativa. Un valor cercano a 1 corresponde a un caso de independencia entre las filas y las columnas, y a una prueba que se comporta igualmente bien cuando es positiva que cuando es negativa. El valor nulo o positivo del riesgo relativo viene dado por Riesgo relativo = TP/(TP+FP) / (FN/(FN+TN)).

El rendimiento de la prueba es simplemente promedio y ni la sensibilidad ni la especificidad son realmente satisfactorias. Sin embargo, el muy bajo costo de la prueba la hace interesante. Una ligera mejora de la sensibilidad y vincularla con otra prueba podría hacerla más efectiva.
Nota: Los valores predictivos están sesgados en este caso. Ciertamente la prevalencia de la enfermedad en nuestra muestra es del 50% (1 persona de cada 2 está enferma), lo que no se corresponde con la realidad de la población total, en la que la enfermedad afecta a una persona de cada 2000. Para corregir los valores predictivos, únicamente necesitamos añadir en la pestaña “Opciones” la indicación de que la prevalencia de entrada es 0.0005.

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
Cargando
hace #{num} segundos
hace un minuto
hace #{num} minutos
hace una hora
hace #{num} horas
hace un día
Hace #{num} días
sobre
false
Se han encontrado caracteres no válidos
/customer/portal/articles/autocomplete
9283