RESUMEN¶
Ideas importantes¶
- Los datos son el nuevo petróleo.
- Lo más importante es encontrar las variables necesarias para poder hacer un buen análisis.
- Cualquier compañía se puede beneficiar del Big Data.
- La correlación de variables no significa causa-efecto.
- Todos los proyectos de Big Data tienen un proceso de digitalización de datos.
- Big data implica transformación. Son proyectos que pueden durar años.
- La paralelización es la técnica utilizada en Big Data que permite reducir el tiempo de computación de un proceso gracias a dividir el esfuerzo entre varios nodos. La técnica más conocida es MAPREDUCE.
- Las 5 V's son velocidad, volumen, variedad, valor, veracidad.
- La nube como método para el almacenamiento, gestión y procesado de los datos.
- Diferencia entre Data Warehouse y Data Lake.
- El proceso de Big Data conlleva el recopilar, almacenar, procesar y analizar, hasta visualizar los datos.
CICLO DE VIDA DEL DATO