Durante la evolución de la pandemia las correspondientes oficinas de gobierno de cada país, encargadas de gestionar la propagación del COVID-19, publican diariamente datos relacionados con la cantidad de personas sospechosas, infectadas y recuperadas, así como los decesos a causa del coronavirus. 

Para el caso particular de México es la Secretaría de Salud quien se encarga de tal labor. Se pueden consultar y/o descargar los datos en el sitio web de la Secretaría. Sin embargo, las características de los datos publicados por esta instancia de gobierno dicultan el proceso de preparación para su análisis.

¿Por qué es complicado utilizar los datos de evolución del virus Covid-19 publicados diariamente por la Secretaría de Salud?

¿Por qué es complicado utilizar los datos de evolución del virus Covid-19 publicados diariamente por la Secretaría de Salud?

La situación con los datos publicados por la Secretaría es que carecen de estandarización, esto quiere decir, que los datos publicados de un día, no siguen el mismo formato o estructura de los publicados en días anteriores. Por mencionar algunos ejemplos, como es el caso de una fecha o en un reporte:

  1. En el país de procedencia contiene a “Estados Unidos”, y en otra, a “Estados Unidos de Norte América”.
  2. Se refiere a “F” como el género femenino, y en otra, “FEMENINO” para referirse al mismo género.
  3. Incluye un campo o característica en específico, y en otra fecha, ese mismo campo no está contenido en el reporte.

 La situación anterior agrega complejidad al proceso de preparación de los datos para ser usados posteriormente, y responder una pregunta acerca de cómo se está propagando el virus, y qué acciones se deberían tomar para reducir el impacto y propagación.

CovidMex es una plataforma que permite utilizar los datos publicados por la Secretaría de Salud, sin la necesidad de invertir tiempo en su preparación. Por lo anterior, CovidMex se convierte en una herramienta que facilita la información a Cientícos de Datos, funcionarios públicos y cualquier ciudadano que requiera los datos acerca de la evolución del virus Covid-19 en México. Con CovidMex se podrá responder rápidamente alguna pregunta de interés relacionada con la pandemia.

CovidMex es una iniciativa altruista impulsada por Guillermo Alvarado, Francisco Araya y César Montedonico. Sus datos son actualizados diariamente mediante un proceso 95% automático, que se activa cada vez que la Secretaría de Salud publica su Reporte Técnico Diario.

A continuación algunas preguntas acerca de CovidMex  que posiblemente sean de tu interés:

¿En qué consiste el proceso de automático que utiliza CovidMex para estandarizar los datos de Covid-19 contenidos en el Reporte Técnico Diario de la Secretaría de Salud?

¿En qué consiste el proceso de automático que utiliza CovidMex para estandarizar los datos de Covid-19 contenidos en el Reporte Técnico Diario de la Secretaría de Salud?

  1. Descarga de documento fuente no estandarizado: Diariamente se descarga en formato PDF el comunicado Técnico Diario de la Secretaría de Salud. Éste es actualizado alrededor de las 19:30 por la Secretaría.
  2. Estandarización: Se convierten los datos contenidos en el documento PDF, en un mismo formato de campos y tipos de datos.
  3. Almacenamiento: Se almacena en tres formatos diferentes los datos contenidos en el documento PDF, así: CSV, JSON y tabla de MySQL.
  4. Actualización de gráficos: Una vez almacenados los datos, los gráficos de la página principal son actualizados con los nuevos datos que acaban de aterrizar en CovidMex. 
  5. Descarga de datos estandarizados: Los datos pueden ser descargados por cualquier persona en cualesquiera de los tres formatos que se adecue a sus necesidades.

Si deseas conocer más detalles acerca del proceso puedes ponerte en contacto con Guillermo, Francisco o César, ellos estarán dispuestos a conversar al respecto.

¿Cuáles son los datos fuente que utiliza CovidMex dentro de su proceso de estandarización?

¿Cuáles son los datos fuente que utiliza CovidMex dentro de su proceso de estandarización?

La fuente ocial para los datos en México es el informe técnico diario de la Dirección General de Epidemiología. Puedes encontrar el informe el siguiente enlace:

https://www.gob.mx/salud/documentos/coronavirus-covid-19-comunicado-tecnico-diario-238 449

¿CovidMex es patrocinado por la Secretaría de Salud o alguna otra organización de carácter público o privado?

¿CovidMex es patrocinado por la Secretaría de Salud o alguna otra organización de carácter público o privado?

CovidMex es una realidad gracias a un colectivo de personas altruistas que son apasionados y fomentan la cultura de la tendencia de código y datos abiertos. 

Apoyemos a la sociedad a responder sus retos más importantes con la ayuda de los datos. Esta es una de las alternativas para tener mejores políticas públicas, una mejor sociedad, y una muestra de que se pueden resolver retos con datos.

Síguelos en Twitter para conocer más detalles sobre CovidMex: 

Guillermo Alvarado: @galvarado89

Francisco Araya: @fjaraya 

César Montedonico: @cmontedonico 

Descubre a qué datos puedes acceder y sus características leyendo la entrada «CovidMex: Explorando los datos estandarizados de los publicados por la Secretaría de Salud«.