El Instituto Internacional de Ciencia de Datos – IICD® comunica que a partir del pasado 11 de mayo se dejó de emitir la cantidad pronosticada de nuevas personas infectadas con coronavirus. Fueron un total de 23 pronósticos se publicaron desde el día 12 de abril hasta 10 de mayo, con un error promedio diario de 13,6%, con respecto a las cifras comunicadas por la Secretaría de Salud Pública de México.

Continúa la lectura para que te enteres de las razones por las cuales hemos tomado la decisión de suspender el pronóstico, los resultados globales del modelo predictivo, y otros cuestionamientos que seguramente podrían ser de tu interés.

¿Por qué el Instituto de Ciencia de Datos tomó la decisión de suspender el pronóstico diario?

¿Por qué el Instituto de Ciencia de Datos tomó la decisión de suspender el pronóstico diario? 

La decisión se tomó dadas las siguientes posibles fuentes de desviaciones en la estimación precisa de la cantidad diaria de personas contagiadas:

  1. Variables, método y supuestos preliminares ya no son válidos: Las variables utilizadas por el modelo ya no son relevantes para la predicción, el inicio de la Fase 3, sugiere tener en consideración otras variables tales como: (1) las políticas de sana distancia, (2) las tasas de contagio y (3) de mortalidad. Es importante tener presente que no existe aún una medida confiable de cómo han evolucionado las políticas de sana distancia. Siendo ésta última, una de las principales variables dependientes, que deben considerarse para poder realizar una estimación adecuada del volumen diario de personas contagiadas, especialmente en la fase que nos encontramos de la pandemia (Fase 3). La tasa de contagio y mortalidad, también son dos variables dependientes que no estaban siendo consideradas en el modelo predictivo del Instituto, por lo que su inclusión en el modelo, es clave para mejorar la estimación de personas infectadas diariamente. Por otro lado, el modelo predictivo hace uso de la estacionalidad semanal de la cantidad de personas infectadas, y durante la Fase 3 el comportamiento de la curva de infectados carece de estacionalidad. Esto sugiere que la hipótesis de estacionalidad del modelo propuesto por el IICD®, es inadecuado para un pronóstico de esta naturaleza.
  2. Recursos insuficientes para hacer frente a la cantidad de contagiados: Si bien México ha recibido apoyo de médicos provenientes de otros países, el cuerpo de personal médico atendiendo a los contagiados por Covid-19, sigue siendo significativamente el mismo que durante las Fases 1 y 2. De manera similar, la infraestructura hospitalaria corre con la misma suerte, a pesar de los hospitales móviles construidos provisionalmente, en el Autódromo Hermanos Rodríguez y Centro CitiBanamex. Los dos anteriores aspectos, podrían estar causando retrasos en la logística de recopilación de datos acerca de la cantidad de infectados por Covid-19. De tal manera, que infectados de un día, podrían estar siendo comunicados en el Reporte Técnico Diario del doctor López-Gatell, dos o tres o más días después de los resultados de laboratorio. Este hecho sugiere que sea necesario incluir en el modelo predictivo, alguna variable o variables, que permitan recrear los retrasos en el proceso de recopilación de datos desde los hospitales estatales, hasta las Oficina de Gobierno encargada del seguimiento de la pandemia en CDMX. Las variables mencionadas en el párrafo anterior, tampoco han sido incluidas en los diferentes modelos predictivos generados por el IICD®, a lo largo del periodo de los pronósticos.
  3. Comunicación estratégica de cifras para salvaguardar la salud emocional y económica de la sociedad: Es posible que el Gobierno de la República en su intención de salvaguardar de la salud emocional de los ciudadanos, y de la economía del país, recurra a la comunicación estratégica de las cifras de mortalidad y contagiados, en el Reporte Técnico Diario. Esta posible causa de desviaciones en la estimación diaria de la cantidad de contagiados, juega un papel relevante en la precisión de cualquier modelo predictivo. Ningún conjunto de variables sería capaz de recrear, las desviaciones o fluctuaciones que tendría la variable objetivo, dada la presencia de comunicación estratégica de las cifras, para este caso particular, la de contagios diarios en todo el territorio mexicano.

 

Durante el periodo de contagios el IICD® realizó varios modelos predictivos que ayudan a mejorar la estimación a medida que iban pasando los días. Las variables de sana distancia, tasa de contagios y mortalidad, no son consideradas por estos modelos. Ahora en Fase 3, estas variables son aún más relevantes. El tiempo que se requiere para conseguirlas rebasa la capacidad de tiempo que los miembros del IICD® pueden dedicar a esta tarea de manera diaria o semanal.

¿Es posible realizar un mejor modelo predictivo?

¿Es posible realizar un mejor modelo predictivo?

Sí, efectivamente es posible realizar un mejor modelo predictivo. Un modelo que considere los efectos de las políticas de sana distancia, las tasas de contagio y las de mortalidad, será un modelo que seguramente presentaría un mejor ajuste en la estimación de la cantidad diaria de personas contagiadas por el nuevo coronavirus. También, el modelo debería considerar las desviaciones como consecuencia de la comunicación estratégica de cifras, emanada desde el gobierno central, a través de Reporte Técnico Diario del López-Gatell.

Como puede notar, se requiere de un equipo robusto de personas dedicadas a la generación del modelo. El IICD® te invita a participar de esta iniciativa.

¿Cuáles fueron los resultados globales obtenidos por el modelo predictivo durante todo el periodo en el que se realizó el pronóstico?

¿Cuáles fueron los resultados globales obtenidos por el modelo predictivo durante todo el periodo en el que se realizó el pronóstico?

Durante un periodo de 29 días, se realizaron un total de 23 pronósticos. Los 6 días restantes fueron utilizados para ajustes en el modelo. Fueron un total de 3 modelos predictivos utilizados para generar los 23 pronósticos.

En la siguiente gráfica se muestran los pronósticos (azul y naranja) y errores absolutos (gris) obtenidos durante los 29 días contados a partir de 12 de abril hasta 10 de mayo. La cantidad de personas estimadas es la curva de color azul, mientras que la naranja es la cifra real emitida por Secretaría de Salud. 

De la gráfica anterior se puede resaltar lo siguiente:

  1. Hubo un total de 10 pronósticos con errores menores o iguales al 5%, y 14 menores o iguales al 10%.
  2. Los errores tuvieron una tendencia al alza recurrente, a partir de la entrada de la Fase 3.
  3. Los periodos de mejor ajuste fueron al principio a mediados de la Fase 2, es decir, segunda y tercera semana de abril.

Ahora que formalizamos el final de la comunicación del pronóstico diario, el IICD® invita a su comunidad a proponer alternativas para realizar un pronóstico diario, o a discutir filosóficamente en torno al tema.