Resulta común que, cuando se discuta acerca de Machine Learning, haya referencia constante a la Ciencia de Datos o viceversa, existe una razón para que esto suceda: ambas especialidades comparten vasos comunicantes que las relacionan. En este artículo profundizaremos en esos puntos de convergencia que van desde las metodologías de análisis hasta la formación académica de quienes se especializan en estos rubros.

Es posible definir el Machine Learning (también conocido como aprendizaje automático) como la práctica de tomar algoritmos como base para extraer datos, aprender a partir de estos y posteriormente pronosticar tendencias futuras para un tópico dado. Además, existen software de aprendizaje automatizado compuestos por análisis estadísticos y predictivos que se usan para ubicar patrones y encontrar ideas ocultas en una compilación de datos.

Para que sea un poco más claro, un buen ejemplo para adentrarnos en la definición de Machine Learning puede ser Facebook: un algoritmo que reúne información conductual de cada uno de los usuarios de la plataforma. Tomando como base el comportamiento pasado, el algoritmo predice intereses y recomienda enlaces o artículos en el news feed. Amazon actúa de forma similar cuando sugiere productos específicos o Netflix al colocar ciertos títulos en tus posibles intereses. Por otro lado, algunos de los productos más populares que usan machine learning son los lectores de escritura usados en los servicios postales, detectores de spam, sistemas de reconocimiento de voz y recomendación de película.

Ahora, ¿por qué los conceptos de aprendizaje automático y Ciencia de Datos están en constante relación? Esto se debe a que la Ciencia de Datos es un término amplio que abarca múltiples disciplinas, dentro de las cuales está, justamente, el Machine Learning, que construye algoritmos de predicción usando datos. Sin embargo, la Ciencia de Datos es un término más extenso que no se enfoca solamente en algoritmos y estadísticas, sino que también se encarga de todo el proceso metodológico relacionado a los datos.

Entonces, es cierto que el aprendizaje automático y la Ciencia de Datos tienen similitudes importantes, pero los requerimientos necesarios para ejecutar cada una de estas es distinto. En el caso del aprendizaje automático es necesario contar con entendimiento de los principios básicos de computación y programación; conocimientos de probabilidad y estadística y capacidad de modelar y evaluar datos.

Mientras existen habilidades que no son sólo deseables, sino necesarias para tener una carrera como científico de datos: análisis, programación y conocimiento determinado de un área de estudio. Así como: manejo de los programas Python, SAS, R y Scala; experiencia práctica en codificación de bases de datos SQL; habilidad para trabajar con datos no-estructurados provenientes de fuentes varias; comprensión de múltiples funciones analíticas y, por supuesto, conocimiento de machine learning.

Por último, es importante recordar que esta ciencia también reúne datos de múltiples fuentes y aplica, además de machine learning, análisis predictivo y análisis de opiniones para, así, extraer información crítica de los conjuntos de datos1 recolectados. Y, dado que los científicos de datos entienden su objeto de estudio desde un punto de vista empresarial, pueden proveer predicciones acertadas e ideas de mucha utilidad para potenciar la toma crítica de decisiones.

FUENTES

https://online-learning.harvard.edu/course/data-science-machine-learning 

https://www.simplilearn.com/data-science-vs-data-analytics-vs-machine-learning-article