Saltar a contenido

RESUMEN

Ideas importantes

  • Los datos son el nuevo petróleo.
  • Lo más importante es encontrar las variables necesarias para poder hacer un buen análisis.
  • Cualquier compañía se puede beneficiar del Big Data.
  • La correlación de variables no significa causa-efecto.
  • Todos los proyectos de Big Data tienen un proceso de digitalización de datos.
  • Big data implica transformación. Son proyectos que pueden durar años.
  • La paralelización es la técnica utilizada en Big Data que permite reducir el tiempo de computación de un proceso gracias a dividir el esfuerzo entre varios nodos. La técnica más conocida es MAPREDUCE.
  • Las 5 V's son velocidad, volumen, variedad, valor, veracidad.
  • La nube como método para el almacenamiento, gestión y procesado de los datos.
  • Diferencia entre Data Warehouse y Data Lake.
  • El proceso de Big Data conlleva el recopilar, almacenar, procesar y analizar, hasta visualizar los datos.

CICLO DE VIDA DEL DATO

imagen