A nivel global existe aún mucha incertidumbre acerca de las características, actividades y conocimientos que tienen o deben tener los científicos de datos. Uno de los propósitos principales del Instituto de Ciencia de Datos es otorgar mayor claridad en este ámbito para que Empresas e Instituciones interesadas en la Ciencia de Datos puedan encontrar y desarrollar el talento necesario para que sus iniciativas e inversiones tengan éxito. En este artículo el autor hablará acerca de algunas de las principales dudas que existen alrededor de los científicos de datos.

¿El científico de datos debe dominar todo el ciclo del dato?

En las primeras conferencias en las que se definió a la Ciencia de Datos se mencionaron las actividades del ciclo del dato, que en conjunto con la aplicación del método científico, nos otorgaron la primera definición del científico de datos. A pesar de que existen profesionales muy talentosos que cuentan con experiencia en todas las partes del ciclo del dato, medios de comunicación y otros profesionales propagaron la idea de que una única persona debía reunir todas esas habilidades y conocimientos. Conforme han avanzado las tecnologías de Big Data y Ciencia de Datos, se ha vuelto evidente que es imposible que una sola persona domine el ciclo completo, por lo que se necesita un equipo multidisciplinario para implementar exitosamente la Ciencia de Datos.

¿El científico de datos debe tener estudios de posgrado?

Esta pregunta es derivada por los orígenes de los primeros científicos de datos. Debido a la naturaleza de la disciplina, los conocimientos estadísticos, econométricos, de investigación de operaciones y ciencias de la computación, entre otros, eran únicamente aprendidos en programas de posgrado especializados. Las primeras empresas que entendieron el alto valor diferencial de la Ciencia de Datos se vieron forzadas a reclutar personas de “Ciencias Duras” como la Física, Matemáticas, Astronomía para tener el talento necesario, sin embargo se dieron cuenta que el conocimiento del negocio y las habilidades de comunicación eran esenciales para obtener buenos resultados, por lo que personas con muchos años de experiencia sin un posgrado otorgaban también resultados muy valiosos. En conclusión no es estrictamente necesario un posgrado, pero en la opinión del autor definitivamente en equipos grandes debe existir al menos un científico de datos con maestría o doctorado.

¿Cuándo puedo definirme a mí mismo o a alguien más como científico de datos?

En mi opinión, ésta es la pregunta más controvertida. Existen ya algunas certificaciones de algunas Empresas e Instituciones que pueden resultar convincentes a algunos e insuficientes a otros. El autor comparte la iniciativa del Doctor Jeffrey Strickland, en la cual propone que para ser considerado un Científico de Datos se deben cumplir los siguientes requisitos:

  • Nivel de estudio de Posgrado, o bien, Licenciatura con al menos 3 años de experiencia profesional en Matemáticas, Ciencias, Ingeniería o equivalente.

  • Dos años como mínimo de experiencia en investigación o proyectos aplicativos.

  • Habilidades demostradas de análisis y diseño de soluciones.

  • Conocimiento y experiencia en una variedad de lenguajes y plataformas de software.

  • Habilidades demostradas de entendimiento de algoritmos y conceptos de Ciencia de Datos.

  • Habilidades demostradas de comunicación de ideas claras y estructuradas a usuarios técnicos y no técnicos.

  • Habilidades demostradas para proporcionar guía técnica a analistas y miembros del equipo menos experimentados.

  • Fuertes habilidades analíticas.

  • Capacidad para alinear proyectos a los valores y metas de la Compañía donde trabaja.

Como conclusión será una prioridad del Instituto de Ciencia de Datos llegar a un consenso que quite la ambigüedad a los puntos y preguntas planteadas en este artículo y definir estándares que nos permitan reconocer a los científicos de datos. El Instituto tiene un gran trabajo por delante para definir específicamente los puntos comentados en la última pregunta y las sugerencias y opiniones de toda la comunidad de Ciencia de Datos serán muy valiosas.

¿Ustedes tienen alguna otra perspectiva acerca de las preguntas planteadas en el artículo?