Debido a la expansión incontrolable de la COVID-19, especialistas en Ciencia de Datos han encontrado pertinente generar modelos estadísticos relacionados al comportamiento de esta pandemia, pero, ¿debe la Ciencia de Datos hacer modelos sobre fenómenos biológicos? En primer lugar, es pertinente resaltar que las técnicas estadísticas que usan los biotecnisistas en los tiempos que corren son tan especializadas que no todo científico de datos puede manejarlas, lo que resulta en un gran ejemplo de que, la falta de dominio de un tema, puede significar, también, falta de conocimientos o revelar un análisis meramente tendencioso.

Además, no es un secreto que la Ciencia de Datos y su aplicación han evolucionado en un sinfín de maneras a lo largo del tiempo. Las posibilidades de análisis de un conjunto de datos se expanden día con día. Por ejemplo, cuando iniciaron las prácticas analíticas a través de datos, sólo existía la posibilidad tecnológica de utilizarse para producir estadísticas; después, permitieron una construcción integral de bases de datos; posteriormente, comienza a aplicarse el machine learning y los modelos de aprendizaje profundo. Por lo que se considera que la Epidemiología y la Bioestadística son campos tan especializados que, académicamente, cada uno representa una carrera distinta. 

Por un lado, la Epidemiología es el estudio de la frecuencia y la distribución de enfermedades en la humanidad. Representa un aspecto importante de la salud pública, pues se relaciona con el entendimiento de una enfermedad determinada en un contexto social para posteriormente ejecutar una evaluación de riesgos. Quienes estudian la Epidemiología y sus alcances tienen, por lo general, formación en ciencias como la biología, la medicina o la virología. Así se construyen por lo regular los conocimientos que permiten el entendimiento de modelos especializados. 

Por otro lado, la bioestadística es la aplicación de técnicas estadísticas a la investigación científica en campos relacionados a la salud, incluyendo la medicina, epidemiología y salud pública. Mientras que alguien que se ha formado como estadista puede aplicar sus conocimientos en campos muy heterogéneos como, por ejemplo: ventas, estudios demográficos, bienes raíces, economía o finanzas, se requiere de una formación  mucho más especializada para ejercer la bioestadística. 

En ese sentido, existe una recomendación para especialistas en datos (que no tengan formación en estadística o matemáticas) de ser particularmente cuidadosos en difundir (o generar) modelos estadísticos relacionados a la COVID-19 que no hayan sido generados por una persona con cabal capacidad de lectura y análisis de información médica o biológica.

Así como la Ciencia de Datos representa posibilidades incontables de mejora en la exploración y conocimiento de nuestra realidad, es también una herramienta delicada que requiere de individuos responsables con el sentido del #DataForGood. ¡Sigamos resolviendo retos con datos!

FUENTE Mendis, Asel. Should Data Scientists Model COVID19 and other Biological Events, KDnuggets, abril de 2020. Consultado en: https://www.kdnuggets.com/2020/04/data-scientists-model-covid19-biological-events.html