De pruebas diagnósticas y percepción de probabilidades

Una farmacéutica ha estado probando un test diagnóstico nuevo para una enfermedad concreta, digamos… algún tipo de cáncer. Observan que si el paciente tiene la enfermedad, el test tiene un 80% de probabilidades de detectarla. 

Pepe va al médico y da positivo en ese test. ¿Cómo de preocupado debería estar Pepe? ¿Un 80% de preocupado? 

Lo cierto es que no lo sabemos. No tenemos la información necesaria para saber cuál es la probabilidad real de que Pepe tenga cáncer. Para conocer la precisión diagnóstica de un test necesitamos tener más datos y hacer algún cálculo sencillo. Pero a Pepe le va a merecer la pena hacerlo. Los datos que necesita son:

  1. Número de personas que tienen la enfermedad y dan positivo en el test
  2. Número de personas que tienen la enfermedad y dan negativo en el test
  3. Número de personas que no tienen la enfermedad y dan positivo en el test
  4. Número de personas que no tienen la enfermedad y dan negativo en el test
  5. Porcentaje de personas que presentan la enfermedad en la población estudiada.

Según los datos de la farmacéutica el 80% del que hablábamos al principio es el número 1 de esa lista. Son las personas que tienen la enfermedad y dan positivo en el test. El número dos sabemos directamente que es un 20%, y son lo que llamamos falsos negativos (tienen la enfermedad pero el test no las detecta).

Necesitamos saber también el porcentaje de lo que llamamos falsos positivos, que es el número 3, o aquellas personas que se llevan el susto de ver que tienen la enfermedad en el test pero que realmente no lo tienen. Vamos a suponer que el porcentaje de falsos positivos es 10%. 

Un test diagóstico que diagnostica con 80% de fiabilidad cuando hay cáncer y da un 10% de falsos positivos no parece terrible. Pero no podemos olvidarnos del número 5 en esa lista, un dato muy importante y que se deja de lado a menudo: la frecuencia base de la que partimos, o cuánta gente tiene esa enfermedad en la población que se está estudiando. Imaginemos entonces que esta frecuencia base es un 1%.

Si la farmacéútica ha probado el test en 1000 personas, en función de los datos que tenemos, sabemos que de esas 1000 personas 10 personas tienen la enfermedad y 990 no. 

Pero pasemos a los números si los midiéramos en 1000 personas, teniendo en cuenta que la enfermedad solo la tiene un 1% de la población:

  1. Número de personas que tienen la enfermedad y dan positivo en el test = 8
  2. Número de personas que tienen la enfermedad y dan negativo en el test = 2
  3. Número de personas que no tienen la enfermedad y dan positivo en el test = 99
  4. Número de personas que no tienen la enfermedad y dan negativo en el test = 891

Los números ya empiezan a tener un aspecto diferente. Resulta que de todos los positivos que han obtenido en esas 1000 personas, 99 no tienen la enfermedad y 8 sí.

Para calcular la probabilidad real de que Pepe tenga la enfermedad de la que ha sido diagnosticado necesitamos hacer lo que en estadística se llama una tabla 2×2: 

Con estos datos, el cálculo de la probabilidad de que Pepe tenga la enfermedad es muy sencillo:  8/107 = 0.0747

Eso quiere decir que la probabilidad real de que Pepe tenga la enfermedad de la que fue diagnosticado es del 7.5%. Así que Pepe debería estar preocupado solo un 7.5%.

Esto es así porque antes de que el médico le proporcionase el test a Pepe, el tenía una probailidad del 1% de tener cáncer, y esa probabilidad hay que tenerla en cuenta, condiciona la probablidad posterior. 

Un test diagnótico que tiene el mismo porcentaje de diagnósticos y falsos positivos y negativos podría tener una eficacia diagnóstica mucho más alta en una enfermedad que es más común en la población estudiada. Porque el número absoluto de falsos positivos o falsos negativos varía mucho en función del porcentaje de la población que presenta la enfermedad. Un 80% de diagnósticos solo da 8 positivos, pero un 10% de falsos positivos da 99 positivos. 

Este tipo de información es la que se tiene en cuenta cuando se recomiendan pruebas diagnósticas en la población general. Si la probabilidad de tener esa enfermedad no es suficientemente alta, el número de falsos diagnósticos -con los costes emocionales, de recursos y financieros que conllevan- no compensan el número de diagnósticos reales. 

Cuando la frecuencia base no se tiene en cuenta a la hora de calcular una probabilidad se cae en lo que se conoce como la falacia de la frecuencia base, que aplica no solo a pruebas diagnósticas. Cada vez que queramos conocer una probabilidad y esa probabilidad esté afectada por una probabilidad anterior -la frecuencia base- habrá que tenerla en cuenta. 

Por ejemplo, si desarrollamos un software que es capaz de detectar la cara de un terrorista con un 99% de precisión, tenemos que tener en cuenta cuál es es el porcentaje de terroristas en la población (mínusculo), o tendremos muchas detenciones innecesarias. O si un testigo identifica un determinado coche en un accidente hay que tener en cuenta las probabilidades de que el testigo identifique el coche adecuadamente, pero también cuál es el porcentaje de ese coche particular en el parque móvil. 

Si te ha parecido interesante, no dejes de suscribirte a la newsletter para poder contarte todo lo que ocurra por aquí:

Para los curiosos:

  1. Sobre la falacia de la frecuencia base
  2. Sobre tablas 2×2 y tests diagnósticos
  3. Sobre falacias y paradojas estadísticas

2 thoughts on “De pruebas diagnósticas y percepción de probabilidades”

  1. Debo reconocer que esta entrada me ha costado. Se junta que ya mi cerebro a estas horas está funcionando con las pilas de reserva, con el hecho de que la estadística siempre ha sido mi punto débil… pero ha sido interesante hacer el ejercicio matemático, según avanzaba en la lectura, y todo ha quedado claro… 😋

    1. Bueno, es que con pilas llenas o de reserva cuesta…. porque justo la entrada trata de profundizar en algo que no es obvio de primeras! Me alegra que al final se entienda 😀

Leave a Reply

Your email address will not be published. Required fields are marked *