Análisis de Datos vs Minería de Datos
Los datos están por todas partes, cada día se generan cantidades inmensas y se guardan para después aprovecharlos. Vivimos en un mundo impulsado por datos, entonces se han creado y mejorado las ciencias y herramientas para hacer mejor uso de ellos. Con tantas áreas con datos como enfoque, no es tan sencillo diferenciarlas y definir sus límites. Aquí hablaremos de dos de ellas: Análisis de Datos y Minería de Datos.
Análisis de Datos
Es el proceso de inspección, limpieza, transformación y visualización de datos con el objetivo de obtener información útil e importante para la toma de decisiones y generación de reportes. Es particularmente relevante porque es la manera en que los negocios toman decisiones impulsadas por datos.
Minería de Datos
Se trata del proceso de exploración y extracción de datos. Mediante la Minería de Datos se encuentran patrones y datos valiosos dentro de bancos de datos, que se utilizarán más adelante en el proyecto para construir un modelo de Inteligencia Artificial.
Diferencias
A continuación se muestra una tabla de comparación con algunas características de cada campo:
Análisis de Datos
Minería de Datos
Objetivo
Inspección de datos para llegar a conclusiones y tomar decisiones.
Descubrimiento de datos y patrones en bancos de datos. Se busca encontrar la mayor cantidad de datos útiles.
Dataset
Se trabaja sobre cualquier tamaño de conjunto de datos. Los datos pueden ser estructurados, semi estructurados o no estructurados.
Normalmente se trabaja sobre datos estructurados. El tamaño del dataset suele ser grande.
Visualización
Casi siempre se utiliza visualización para presentar resultados.
No se suele utilizar la visualización.
Tamaño de Equipo
Regularmente se necesita un equipo de varios especialistas en diferentes áreas.
Es posible que un especialista lleve a cabo todas las tareas de Minería de Datos.
Calidad de Datos
Es común trabajar con datos de buena calidad. Un paso incluye la limpieza de datos si no se encuentran en buen estado.
Debido a la naturaleza de la Minería de Datos se trabaja con datos sin procesar, que suelen estar en mal estado.
Responsabilidades
Proveen reportes e interpretan datos para informar a otras personas.
La obtención de datos y la estructura en que se presentan al final del proceso.
Resultados
Reportes, hipótesis demostradas o desmentidas.
Patrones, conjunto de datos filtrado.
Ambas áreas son parte importante de cualquier proyecto de Ciencia de Datos, y usándolas en conjunto se obtienen los mejores resultados. Se podría decir que la Minería de Datos es parte del proceso de Análisis de Datos, mientras que este último es el proceso general de entender el conjunto de datos.
Lic. Daniela Rodríguez Galindo
Fuentes
Conn, R. (4 de Diciembre de 2020). 7 Key Differences Between Data Analytics and Data Mining. Obtenido de Codemotion: https://www.codemotion.com/magazine/ai-ml/big-data/data-analytics-data-mining/?fbclid=IwAR0lQpeMrmfg8pvLYFIkae9ZToVYoa5RrqwtqNCtV4vIS7512xQlIe3BcsU
Difference Between Data Mining and Data Analysis. (12 de Septiembre de 2021). Obtenido de GeeksforGeeks: https://www.geeksforgeeks.org/difference-between-data-mining-and-data-analysis/
Sarangam, A. (10 de Febrero de 2021). Data Mining vs Data Analysis – An Easy Guide In Just 3 Points. Obtenido de Jigsaw: https://www.jigsawacademy.com/blogs/data-science/data-mining-vs-data-analysis/?fbclid=IwAR22T4gUnnk3qv1iQoVa0GjGE154yUXwtuX2U4pvfHtRpmggdETMyLKFFHg