Main logo

Cavilando sobre el embuste de los datos

Al final del día, las consecuencias del 'cuchareo' acabarán por incrementar el costo en vidas humanas. | Leonardo Martínez Flores

Por
Escrito en OPINIÓN el

La pandemia que nos azota ha sacado a relucir las enormes diferencias existentes entre los gobiernos nacionales y locales de muchos países. En los hechos, las diferencias han sido notables en términos de visión de Estado, de responsabilidad social y defensa de los derechos humanos, de rescate económico y de eficiencia en el manejo de la crisis.

Pocos gobiernos entendieron desde sus inicios la envergadura del tsunami que se estaba gestando, otros muchos lo fueron entendiendo lentamente ante la evidencia de los contagios y las muertes, y unos cuantos perdieron tiempo valioso coqueteando con el negacionismo y postergando la aplicación a fondo de medidas para proteger adecuadamente las vidas y los empleos de sus connacionales. Los ejemplos de los polos contrarios son muy claros: por un lado, los gobiernos de Corea del Sur, Alemania y Nueva Zelanda actuaron rápida y responsablemente y han logrado controlar admirablemente los estragos. Por el otro, los gobiernos de Brasil, Estados Unidos y México han mostrado un comportamiento dominado claramente por una combinación de ignorancia y machismo que les ha hecho perder un valiosísimo tiempo para contener el valor presente de los costos totales de la crisis sanitaria.    

En todos los casos, ya sea en los ejemplares o en los descartables, la información y los datos que se han ido recopilando tanto doméstica como internacionalmente han sido determinantes tanto en la cronología de las medidas aplicadas como en las intensidades su aplicación. La generación de datos oportunos y confiables, y la interpretación que se hace de los mismos, son insumos de alto valor para la toma de decisiones acertadas que reduzcan los estragos de corto y de largo plazo que enfrentamos.

Vale la pena aclarar un par de cosas antes de comentar algunos puntos sobre la información y los datos que nos llegan todos los días. Una cosa es la interpretación médica de los aspectos relacionados con el contagio, la toxicología, la sintomatología, los daños fisiológicos y las causas de muerte del SARS-Cov-2, y otra cosa muy distinta tiene que ver con los procesos sociales de transmisión y contagio del coronavirus y con los sistemas de generación y distribución de los datos asociados. El primer punto se lo dejamos a los médicos especialistas, pero sobre el segundo tengo varios aspectos que comentar.

La naturaleza de los procesos sociales de transmisión del virus es tan compleja, que es literalmente imposible contar con un registro certero de los árboles de transmisión, del número de personas infectadas o de las muertes directamente provocadas por el covid-19. Por eso se insiste en que los números que vemos son siempre estimaciones que, cuando están razonablemente bien hechas, nos dan una idea del estado y las tendencias del fenómeno.

Lo que sucede es que hay de estimaciones a estimaciones. Hay países en los que se puede confiar y pensar que sus cifras son un reflejo aceptable de la realidad, y hay muchos otros cuyas cifras no son creíbles, ya sea porque tienen políticas de opacidad y desinformación, o porque cuentan con sistemas de registro y publicación de datos obsoletos o deficientes.

Lo anterior es importante tenerlo presente cuando se observan las comparaciones que se hacen de las gráficas de casos confirmados de infección, de fallecimientos o de tasas de letalidad entre países. No todas las gráficas son formalmente comparables debido a razones como las que se comentan enseguida.

El número de casos confirmados de infección depende del número de pruebas aplicadas, las cuales no son infalibles. Esto significa que hay pruebas de mala calidad que pueden dar resultados equivocados. Pero aún entre las pruebas de buena calidad los resultados no están exentos de factores probabilísticos: hay veces que dan falsos positivos, y hay veces que dan falsos negativos.

Para que las gráficas de casos confirmados entre dos países sean estrictamente comparables, es deseable contar con ciertas condiciones necesarias: que las pruebas se hayan empezado a aplicar cuando ambos contaban con la misma proporción real de infectados (lo cual es prácticamente imposible de saber), bajo los mismos criterios operacionales (los cuales varían mucho entre países) y que la aplicación de pruebas corresponda al mismo número de pruebas por millón de habitantes. Sobra decir que las pruebas en ambos países también deberían de ser equivalentes en términos de calidad y confiabilidad probabilística de resultados.

Como lo anterior difícilmente se cumple, países como México que han seguido una estrategia reprobable y deficiente en términos de aplicación de pruebas, se ven artificialmente mejor colocados en las comparaciones internacionales de casos confirmados y tasas de letalidad. Es decir, la curva de México muestra menos casos confirmados simplemente porque se han aplicado menos pruebas y porque las que se aplican son prácticamente confirmaciones, pues se guardan para los casos que ya presentan síntomas graves de covid-19. Todos los asintomáticos o con síntomas leves se dejan fuera, lo cual no sucede en otros países. Esto finalmente provoca que cuando vemos una gráfica que compara los casos confirmados entre varios países, la curva de México no representa la realidad del país y da la falsa impresión de estar comparativamente mejor de lo que realmente estamos.

El tema del sesgo de los datos en México ha surgido varias veces. El mismo López-Gatell tuvo que reconocer, debido a la insistencia de un medio extranjero, que el número de casos confirmados que publican las autoridades de salud no corresponde a la realidad. En ese momento habló de un factor de ajuste o expansión que aplicaban en su modelo centinela para estimar el número real de casos de infección. Posteriormente en una de sus conferencias mostró una tabla con los datos oficiales y explicó que el factor de ajuste era de 8, es decir, que había que multiplicar por 8 el número de “casos confirmados” para obtener el número real.

Un simple ejercicio de confirmación mostró que el factor mencionado por Gatell estaba errado y que había sido obtenido relacionando cantidades con fechas distintas. El propósito era claro: ocultar el verdadero factor, que era de 30, para reducir artificialmente el número estimado de infectados.   

Esta lamentable simulación me recordó que en enero de 2018 López Obrador declaraba siendo candidato que todas las encuestas de intención de voto se cuchareaban, que los encuestadores usaban cuchara chica, cuchara grande y hasta cucharones para alterar los resultados. Esta acepción tan mexicana del término, para dar la idea de que a algo se le puede poner o quitar con cuchara hasta dejarlo al gusto del cliente, le cae como amillo al dedo a lo que han estado haciendo con la estrategia gubernamental para hacer frente al covid-19. El tema es grave porque, al final del día, las consecuencias del cuchareo acabarán por incrementar el costo en vidas humanas.

Llama también la atención la reticencia de Gatell a reconocer la evidencia defendida por muchos especialistas en todo el mundo, sobre la importancia de aplicar pruebas extensivamente. Él ha declarado que “Hay una expectativa pública, que me parece que en cierta manera ha sido alimentada, no creo que sea tan espontánea, de comparar la cantidad de pruebas que se han hecho en otros países, y tratar de relacionarlas con la eficacia, con la efectividad de las intervenciones. Esto carece de sentido técnico y científico”. Lamentable declaración de quien además declaró en otra entrevista a otro medio extranjero, que todavía tenía sus dudas sobre si esta pandemia es peor que la influenza estacional.

Para finalizar con estas observaciones notemos que, si al día de ayer el gobierno reconocía 9 mil 500 confirmados, aplicando el factor de ajuste no cuchareado de las mismas autoridades de salud esa cifra se eleva a alrededor de 285 mil casos reales. Pero eso no es todo, si tomamos en cuenta las observaciones hechas en los párrafos anteriores es evidente que ese número base de 9 mil 500 casos confirmados está subestimado, luego entonces el número de casos reales al día de hoy puede ser mucho mayor a los 285 mil casos. Seguiremos con el tema.