Expertos

¿Cuántas pruebas de detección debemos hacer?

ANTONIO RUBIA / PEDRO SERRANO

Foto: UNSPLASH

Sábado 5 de septiembre de 2020

8 minutos

Antonio Rubia y Pedro Serrano:  ¿Cuántas pruebas de detección debemos hacer?
ANTONIO RUBIA / PEDRO SERRANO

Foto: UNSPLASH

Sábado 5 de septiembre de 2020

8 minutos

Una herramienta fundamental para la contención de la Covid-19 es la identificación de personas infectadas asintomáticas, para lo que es necesario el uso de pruebas de detección. Idealmente, dichas pruebas deberían hacerse al mayor número de individuos posible y de forma continuada en el tiempo, puesto que personas que hoy están sanas podrían contagiarse posteriormente. Dado el importante coste económico que un análisis generalizado de estas características puede conllevar para cualquier organización, el objetivo de este artículo es proporcionar una referencia basada en criterios estadísticos para determinar el número óptimo de pruebas que debería realizarse en una determinada población objetivo −por ejemplo, los niños de un colegio, o los empleados de una empresa− con la finalidad de detectar al menos a una persona contagiada con un alto grado de probabilidad. En caso de que dicho análisis revelase contagiados, la organización podría tomar medidas más exhaustivas.

Antes de entrar en detalles, permítannos una serie de consideraciones previas. La primera es que el pilar fundamental sobre el que se apoya la metodología que discutiremos es la Estadística, una rama de las Matemáticas que permite inferir propiedades de una determinada población usando únicamente una parte relativamente reducida de la misma, esto es, una muestra. La ventaja fundamental de este tipo de análisis radica en el formidable ahorro de recursos, dado que no es necesario hacer pruebas a toda la población para estar razonablemente seguros de la incidencia del virus.

La segunda consideración es que, desafortunadamente, el análisis estadístico siempre expresa sus conclusiones en términos probabilísticos y, con ello, asume cierto margen de error. Por ejemplo, ante la pregunta: ¿qué equipo ganará la liga del próximo año?, un análisis estadístico serio nunca contestaría “lo hará el equipo X”, sino “existe una gran probabilidad de que lo haga dicho equipo”. Aunque el análisis estadístico conlleva cierto margen de incertidumbre, es posible determinar el tamaño de la muestra adecuado para que el margen de error implicado sea pequeño. Así pues, afirmaciones del tipo “hay que hacer 50 tests para estar completamente seguros de que no hay contagiados en la empresa” no resultan posible en el marco estadístico. En su lugar, esperen recomendaciones del tipo “hay que hacer 50 tests para, con una seguridad del 99%, poder detectar la presencia de individuos contagiados”. Este grado de certeza (denominado nivel de confianza) se elige arbitrariamente y es habitual tomar valores altos, como 90%, 95% o 99%. Evidentemente, la certeza completa sólo resulta posible si se está dispuesto a realizar las pruebas a la totalidad de la población objetivo, lo que seguramente es factible cuando la población es reducida, pero no en términos más generales.

Condiciones de partida para el análisis 

 

test

 

La tercera y última consideración atiende a los supuestos del modelo estadístico utilizado. Estos supuestos son condiciones de partida que debemos asumir en el análisis para que la predicción teórica del modelo resulte correcta en la práctica. En nuestro caso, consideraremos el supuesto habitual de que las observaciones de la muestra son independientes e idénticamente distribuidas, esto es, que los individuos se seleccionen aleatoriamente y que la probabilidad media de contagio de todos los individuos seleccionados es la misma y coincide con la de la población. En tanto en cuanto se cumpla este supuesto, los resultados basados en la metodología desarrollada en este artículo serán más cercanos a la realidad.

Tras estas matizaciones previas, analicemos la cuestión central que nos ocupa: ¿cuántas pruebas son necesarios para detectar la presencia de, al menos, un contagiado en la población objetivo con un alto grado de fiabilidad? Para ello, sólo necesitaremos tres datos de partida: uno, la probabilidad media de que una persona seleccionada al azar en la población objetivo esté contagiada; dos, la eficacia del test para detectar a un contagiado; y tres, el nivel de confianza sobre el que deseamos tener una estimación (recordemos que este valor se puede elegir arbitrariamente). Ilustremos a continuación con datos reales dos ejemplos y discutamos la interpretación estadística después.

Dos ejemplos

Por un lado, consideremos un municipio con una alta tasa de incidencia de la enfermedad. Según los datos reportados recientemente en prensa, la localidad de Aitona (Lérida) presentó una tasa de 7.410,3 positivos por cada 100.000 habitantes el día 19 de julio de 2020. Es decir, la probabilidad media de encontrar un positivo en dicha localidad era de aproximadamente 7,41% (el resultado de dividir los positivos entre 100.000). Por otro lado, consideremos también una localidad con una tasa más reducida. Por ejemplo, la localidad de Bernedo (Álava), mostraba en las mismas fechas una tasa de 1.547,4 casos por cada 100.000 habitantes, es decir, una probabilidad media de encontrar un contagiado de 1,55%. Asumiendo por sencillez que el test de detección tiene una eficacia del 100% (en la práctica, la eficacia es sólo ligeramente inferior), y que la probabilidad de estar contagiado en individuos tomados al azar en cada una de estas localidades se aproxima bien por los valores de 7,41% y 1,55% mencionados anteriormente, la siguiente tabla presenta el número de pruebas necesarias para detectar al menos a un positivo dados los niveles habituales de confianza del 90%, 95% y 99%

Captura de pantalla 2020 09 03 a las 13.52.58

Así, imaginemos que los propietarios de una empresa de Aitona desean seleccionar aleatoriamente un número de empleados para hacer los test y aceptan basar sus conclusiones en el 95% de confianza (ver tabla superior, columna central). Dada la estimación de probabilidad de incidencia media en esta localidad, las pruebas se deberían realizar a, al menos, 39 trabajadores, dado que con ello existe una probabilidad ligeramente superior al 95% de que este análisis baste para detectar a un contagiado como mínimo. Lógicamente, si los dueños de la empresa quisieran tener un grado de certeza mayor, la muestra debería ser más amplia. Por ejemplo, para tener un grado de certeza del 99% sería necesario realizar el análisis a 60 individuos. En comparación con Aitona, la menor probabilidad de contagio en la localidad de Bernedo hace necesario un análisis sobre una muestra mayor para que los resultados pueden interpretarse con el mismo grado de fiabilidad estadística. Así, una muestra en Bernedo debería incluir al menos a 192 individuos para ser capaz de detectar a al menos una contagiado con un 95% de probabilidad. Evidentemente, el procedimiento requiere un número menor de tests cuanto mayor es la tasa de incidencia de la enfermedad, dado que al existir a priori una mayor proporción relativa de contagiados entre la población, es más probable que los tests puedan detectarlos incluso en muestras pequeñas.

Datos para acomodar el análisis a las características de su población

Permítanos proporcionar a continuación los datos técnicos necesarios para que quienes deseen implementar este sencillo análisis lo puedan acomodar a las características específicas de su población. La fórmula teórica para calcular el número de tests se determina a partir de la distribución de probabilidad de una distribución binomial, y es el valor redondeado al entero más próximo de la expresión matemática ln(1-NC)/ln(1-(PC*ET)), siendo ln(x) el logaritmo natural del número x; “NC” el nivel de confianza (en nuestro ejemplos, 90, 95 y 99%), expresado en tanto por uno; “PC” la probabilidad de contagio en tanto por uno, que se puede obtener de la tasa de incidencia de la enfermedad en el municipio, y finalmente “ET” es la eficacia del test, medido por la probabilidad de detectar a un contagiado, expresada en tanto por uno. Por ejemplo, el valor 39 en la población de Aitona dado el supuesto de 100% de eficacia de los tests se obtiene redondeando al alza el número ln(1-0,95)/ln(1-0,0741*1)=38,911.

Para finalizar, deseamos remarcar que este artículo pretende abrir un debate sobre el número idóneo de pruebas de detección en poblaciones objetivo, en este caso, basado en la metodología estadística. La finalidad principal de todo ello es proporcionar mecanismos para poblaciones objetivo que, como las residencias de mayores, retenes de policía, etc., hagan particularmente relevante el detectar tempranamente la presencia de personas contagiadas o el control periódico. Otras cuestiones legales o clínicas, como la posibilidad de hacer tests a menores, o cuáles son las pruebas de detección idóneas, quedan fuera del alcance de este artículo.


Antonio Rubia y Pedro Serrano son profesores titulares de Economía Financiera y Contabilidad en las Universidades de Alicante (@UA_Universidad) y Carlos III de Madrid (@uc3m), respectivamente.

Sobre el autor:

ANTONIO RUBIA / PEDRO SERRANO