Los datos están en todos lados. Aunque a simple vista no se puedan ver, nos rodean y, como decodifican nuestra realidad, su producción crece a un ritmo acelerado. Entonces, ¿si el mundo está generando datos a un nivel tan avanzado, de qué manera maneja la sociedad estas cantidades incontables de información? Ahí, es donde tienen cabida tres disciplinas con muchas similitudes entre sí: la Ciencia de Datos, el análisis de datos y el Big Data. Tres conceptos de los cuales detallaremos sus características, herramientas y aplicaciones en el siguiente artículo.

El entendimiento de nuestra sociedad a partir de datos nos ha llevado a enfrentarnos con vastas cantidades de información estructurada y no-estructurada. En ese sentido, la Ciencia de Datos es justamente el campo de estudio donde se conjugan los procesos colectivos, teorías y tecnologías que permiten la revisión, análisis y extracción de conocimiento de valor e información de datos duros. 

Las áreas de aplicación más comunes de la Ciencia de Datos son las siguientes: publicidad digital, investigación web, sistemas de recomendación (Netflix, Amazon, Spotify, Facebook), aplicaciones de reconocimiento de voz y de escritura. Por lo regular, en esta disciplina resultan de mucha utilidad las siguientes herramientas: Phyton (lenguaje de programación avanzado), SAS (suite de software integrado para análisis avanzado) y SQL (lenguaje de gestión de base de datos que almacena información de forma tabular).

Dentro de los mismos cánones, se puede encontrar el concepto de Big Data, que se entiende como el conjunto de voluminosas cantidades de información (tanto estructurada como no-estructurada). Este conjunto de información puede extraerse y analizarse para beneficio empresarial. Su uso es popular en el ámbito de la comunicación (sobre todo en el periodismo), en la compra y venta de bienes, servicios financieros y en el sector educativo. 

Quienes trabajan con Big Data usualmente se apoyan de Hadoop (marco de software de código abierto para almacenar datos y grupos de aplicaciones activas), NoSOL (lenguaje de gestión de base de datos que se encarga de las aplicaciones web) y Hive (herramienta ETL y de almacenamiento de datos).

Por su parte, análisis de datos es el proceso de estudio de un conjuntos de datos con el propósito de esbozar conclusiones sobre la información que contienen. Este análisis se realiza con el apoyo de sistemas y software especializados. Es común que se aplique en creación de juegos de video, la industria turística, gestión energética y cuidado de la salud. 

Las herramientas que resultan de mucha utilidad para el análisis de datos son R (lenguaje de programación y entorno de software para computación estadística y gráficas), Tableau Public (servicio gratuito que permite a cualquier persona  publicar visualizaciones interactivas de datos en línea) y Apache Spark (motor informático de código abierto con una distribución de uso general para procesar y analizar grandes cantidades de datos).

Ahora que ya conoces las diferencias entre cada uno de estos conceptos, puede que sea más claro el camino que te interesa emprender para resolver retos con datos. Si es así, te recomendamos la lectura de este artículo XXX.

FUENTE

Data Science vs. Big Data vs. Data Analytics de Avantika Monnappa consultado en http://simplilearn.com/data-science-vs-big-data-vs-data-analytics-article