De pruebas diagnósticas y percepción de probabilidades

Una farmacéutica ha estado probando un test diagnóstico nuevo para una enfermedad concreta, digamos… algún tipo de cáncer. Observan que si el paciente tiene la enfermedad, el test tiene un 80% de probabilidades de detectarla. 

Pepe va al médico y da positivo en ese test. ¿Cómo de preocupado debería estar Pepe? ¿Un 80% de preocupado? 

Lo cierto es que no lo sabemos. No tenemos la información necesaria para saber cuál es la probabilidad real de que Pepe tenga cáncer. Para conocer la precisión diagnóstica de un test necesitamos tener más datos y hacer algún cálculo sencillo. Pero a Pepe le va a merecer la pena hacerlo. Los datos que necesita son:

  1. Número de personas que tienen la enfermedad y dan positivo en el test
  2. Número de personas que tienen la enfermedad y dan negativo en el test
  3. Número de personas que no tienen la enfermedad y dan positivo en el test
  4. Número de personas que no tienen la enfermedad y dan negativo en el test
  5. Porcentaje de personas que presentan la enfermedad en la población estudiada.

Según los datos de la farmacéutica el 80% del que hablábamos al principio es el número 1 de esa lista. Son las personas que tienen la enfermedad y dan positivo en el test. El número dos sabemos directamente que es un 20%, y son lo que llamamos falsos negativos (tienen la enfermedad pero el test no las detecta).

Necesitamos saber también el porcentaje de lo que llamamos falsos positivos, que es el número 3, o aquellas personas que se llevan el susto de ver que tienen la enfermedad en el test pero que realmente no lo tienen. Vamos a suponer que el porcentaje de falsos positivos es 10%. 

Estos números se reflejan en la especificidad y en la sensibilidad de un test. Una alta especificidad da un número bajo de falsos positivos y una alta sensibilidad de un número bajo de falsos negativos. Un buen test debe cumplir los dos criterios.

Un test diagóstico que diagnostica a un 80% de los casos positivos y da un 10% de falsos positivos no parece terrible. Pero no podemos olvidarnos del número 5 en esa lista, un dato muy importante y que se deja de lado a menudo: la frecuencia base de la que partimos, o cuánta gente tiene esa enfermedad en la población que se está estudiando. Imaginemos entonces que esta frecuencia base -la prevalencia de la enfermedad- es un 1%.

Pero pasemos a los números si los midiéramos en 1000 personas. Hemos dicho que la prueba da un 20% de faltsos negativos y un 10% de falsos positivos. Si la enfermedad solo la tiene un 1% de la población, en esa población habrá 10 personas que tienen la enfermedad y 990 que no. Los números que necesitamos son:

  1. Número de personas que tienen la enfermedad y dan positivo en el test = 8
  2. Número de personas que tienen la enfermedad y dan negativo en el test = 2
  3. Número de personas que no tienen la enfermedad y dan positivo en el test = 99
  4. Número de personas que no tienen la enfermedad y dan negativo en el test = 891

Los números ya empiezan a tener un aspecto diferente. Resulta que de todos los positivos que han obtenido en esas 1000 personas, 99 no tienen la enfermedad y 8 sí.

Para calcular la probabilidad real de que Pepe tenga la enfermedad de la que ha sido diagnosticado necesitamos hacer lo que en estadística se llama una tabla 2×2: 

Con estos datos, el cálculo de la probabilidad de que Pepe tenga la enfermedad es muy sencillo:  8/107 = 0.0747

Eso quiere decir que la probabilidad real de que Pepe tenga la enfermedad de la que fue diagnosticado es del 7.5%. Así que Pepe debería estar preocupado solo un 7.5%.

Esto es así porque antes de que el médico le proporcionase el test a Pepe, el tenía una probailidad del 1% de tener cáncer, y esa probabilidad hay que tenerla en cuenta, condiciona la probablidad posterior. 

Un test diagnótico que tiene la misma especificidad y misma sensibilidad podría tener una eficacia diagnóstica mucho más alta en una enfermedad que es más común en la población estudiada. Porque el número absoluto de falsos positivos o falsos negativos varía mucho en función del porcentaje de la población que presenta la enfermedad.

Si imaginásemos que la enfermedad que estamos intentando diagnosticar la sufre un 40% de la población, aunque estemos usando el mismo test, los números varían mucho. Analizando a 1000 personas, 400 personas tendrían la enfermedad y 600 no. Con el mismo test obtendríamos los siguientes números:

  1. Número de personas que tienen la enfermedad y dan positivo en el test = 320
  2. Número de personas que tienen la enfermedad y dan negativo en el test = 80
  3. Número de personas que no tienen la enfermedad y dan positivo en el test = 60
  4. Número de personas que no tienen la enfermedad y dan negativo en el test = 540

Haciendo el mismo cálculo, la probabilidad de que un positivo sea realmente positivo es mucho más alta: 320/380, es decir, un 84%. La capacidad diagnóstica del test ha cambiado radicalmente al cambiar la prevalencia de la enfermedad.

Este tipo de información es la que se tiene en cuenta cuando se recomiendan pruebas diagnósticas en la población general. Si la probabilidad de tener esa enfermedad no es suficientemente alta, el número de falsos diagnósticos -con los costes emocionales, de recursos y financieros que conllevan- no compensan el número de diagnósticos reales. 

Cuando la frecuencia base no se tiene en cuenta a la hora de calcular una probabilidad se cae en lo que se conoce como la falacia de la frecuencia base, que aplica no solo a pruebas diagnósticas. Cada vez que queramos conocer una probabilidad y esa probabilidad esté afectada por una probabilidad anterior -la frecuencia base- habrá que tenerla en cuenta. 

Por ejemplo, si desarrollamos un software que es capaz de detectar la cara de un terrorista con un 99% de precisión, tenemos que tener en cuenta cuál es es el porcentaje de terroristas en la población (mínusculo), o tendremos muchas detenciones innecesarias. O si un testigo identifica un determinado coche en un accidente hay que tener en cuenta las probabilidades de que el testigo identifique el coche adecuadamente, pero también cuál es el porcentaje de ese coche particular en el parque móvil. 

Si te ha parecido interesante, no dejes de suscribirte a la newsletter para poder contarte todo lo que ocurra por aquí:

Para los curiosos:

  1. Sobre la falacia de la frecuencia base
  2. Sobre tablas 2×2 y tests diagnósticos
  3. Sobre falacias y paradojas estadísticas

Leave a Reply

Your email address will not be published. Required fields are marked *