"Nuestra Maestría en Big Data & Business Analytics es de referencia internacional, escogida por empresas Multinacionales y Gobiernos como la más completa en su categoría"

Temario Maestría Big Data

Temario de la Maestría en Big Data & Business Analytics

Herramientas analíticas y nociones básicas de Big Data

Fundamentos básicos de Big Data

  • ¿Qué es? Múltiples definiciones. Poner énfasis en que los mismos datos se convierten en big data en función de lo que se quiera hacer con ellos. Ejemplo: 100M registros, hacer una media = no big data, entrenar un modelo complejo = big data.
  • Principio de funcionamiento: MapReduce. Ejemplos clásicos para entender el concepto (contar palabras en un texto, etc.).
  • Framework Open Source para computación distribuida. Basado en el whitepaper de Google sobre MapReduce de 2004 y GFS (Google File System). Orientación a Cloudera.
  • Concepto de Data Lake.
  • Concepto ETL, ELT.
  • La importancia del metadato y el data governance para la analítica.
    Los Datalabs en un modelo de integración analítica con el Data Lake y el Gobierno del dato.
  • Plataformas de Servicios en la nube (Cloud Services).

Infraestructura Big Data

  • Hadoop: Almacenamiento y procesamiento distribuido.
  • Herramientas de obtención de datos: Sqoop, Flume y Nifi.
  • Motores de consulta SQL:
    • Hive e impala:
      • Principio de funcionamiento.
      • Sintaxis y funciones propias de HiveQL e Impala.
    • Procesamiento de datos “in-memory”:
      • Introducción y principio de funcionamiento.
      • DataFrames & Spark SQL.

Introducción a la Ciencia de Datos

  • Definición e historia de la Ciencia de Datos.
  • Aplicaciones típicas por sector y casos de éxito reales.
  • Principales perfiles en el mundo Data: Data Engineer, Data Scientist, Data Analyst.
  • Errores comunes de las empresas al desarrollar proyectos de Data Science y cómo evitarlos.
  • Entorno de trabajo de un Data Scientist: principales herramientas, tecnologías, lenguajes de programación y entornos de desarrollo.

Estudio y Modelado del Dato

Análisis inicial del dato:

  • Análisis exploratorio de los datos.
  • Localización de datos atípicos y métodos de detección de outliers y valores extremos.
  • Obtención de estadísticos descriptivos.
  • Evaluación de la calidad del dato.
  • Tipologías de datos: categóricos, numéricos, ordinales, temporales (fechas).
  • Caso práctico: evaluación de un dataset real propuesto por los profesores.

El modelo de datos en tres capas:

  • Capa Raw: ingesta de datos en crudo.
  • Capa Master: principales filtros y agregaciones sobre los datos.
  • Capa de Consumo: limpieza final y feature engineering para consumo en dashboards y modelos de IA.

Visualización:

  • Tipos de visualizaciones de datos y cuándo usar cada tipo de visualización.
  • Principales librerías open source para visualización, con sus ventajas e inconvenientes:
    • matplotlib y seaborn: principales librerías de visualización estática.
    • Plotly: librería para visualización dinámica.
  • Business Intelligence:
    • Herramientas de reporting (Tableau y Microsoft Power BI).
    • Ejercicio práctico: realización de un dashboard con Power BI.

Inteligencia Artificial

  • Metodología para el desarrollo de algoritmos de Inteligencia Artificial:
    • Sesgo y Varianza.
    • Conjuntos de entrenamiento, validación y test.
    • Validación cruzada (cross-validation).
  • Algoritmos de Inteligencia Artificial:
    • Aprendizaje supervisado:
      • Modelos lineales.
      • Modelos basados en árboles de decisión.
      • Redes Neuronales (Deep Learning).
      • Clasificación y Regresión.
  • Aprendizaje no supervisado:
    • Clusterización.
    • Detección de anomalías.
  • Procesamiento del Lenguaje Natural.
  • Visión Artificial.

Gobierno del Dato

  • Gestión de datos:

Cómo desarrollamos , ejecutamos y supervisamos los planes , políticas, programas y prácticas que permiten entregar, controlar, proteger e incrementar el valor de los datos durante su ciclo de vida.

  • Conceptos esenciales
  • Ética en el manejo del dato
  • Gobierno de datos (Data Governance) y Arquitectura de datos

Qué datos tenemos, dónde residen y cómo se pueden utilizar

  • Conceptos esenciales,actividades y herramientas.
  • Arquitectura, modelo y diseño del dato.
    • Conceptos esenciales, actividades y herramientas.
  • Gestión de metadatos (Metadata Management)

Datos que hablan de datos, describen el contenido de los archivos o de su información de los mismos

  • Conceptos esenciales.
  • Tipos, fuentes y arquitectura de Metadatos
  • Almacenamiento de datos y Operaciones:
    • Conceptos esenciales, herramientas y técnicas.
  • Tiempo de vida de los datos.
  • Data Security:

Medidas de protección de la privacidad digital que se aplican para evitar el acceso no autorizado a los datos.

  • DSA (Data Sharing Agreement). Seguridad en base a contratos de uso (Compliance).
  • Integración con los sistemas Legacy de seguridad y servicios en las empresas
    Integración de los procesos existentes en una plataforma para que pasen a estar gobernados.
  • Reglamentos de protección del dato.
  • Roles típicos dentro de los procedimientos de gobierno:

Quién es quién en el gobierno del dato

  • Artefactos a controlar. DSA, Datasets, Procesos
  • Uso de los datos

¿Cómo se están usando los datos? ¿Quién los usa?

  • Analítica semántica de los datos de mayor interés para anticipar necesidades futuras de datos.
  • Data lineage. datos y procesos:

De dónde vienen los datos y donde se mueven en el tiempo

  • Tipos de lineage: estático, semi dinámico, dinámico y de negocio.
  • Data Quality:

Asegurar que los datos sean exactos, íntegros, confiables , relevantes y actualizados están.

  • Ciclo de vida de los datos.
  • Ciclo de vida de la calidad del Dato.
  • Perfilado de los datos.
  • Roles de la calidad del dato.
  • Data Quality y Data Governance.
  • Diccionario de datos.

Cómo utilizar el conjunto de definiciones que contiene las características de los datos.

  • Enriquecimiento del metadato:
  • Aprovechar las sinergias en cuanto a la existencia de un Diccionario en la empresa.
  • Aprovechar las sinergias en cuanto a la existencia de Modelos de Datos en la empresa.
  • Data Governance en la nube

Dónde y cómo poner en práctica todo lo aprendido de Data Governance

  • Plataformas
  • Características y servicios de gobernanza.
  • Soluciones

Gestión de Proyectos Big Data y Analíticos

  • Introducción en la gestión de proyectos Big Data y Analíticos.
  • Cuáles son los principales desafíos y riesgos de un Proyecto de Big Data y Analíticos.
  • Cómo organizar, estructurar y desplegar un Proyecto de Big Data:
    • Etapas
    • Riesgos
    • Metodologías
    • Claves para el éxito y desafíos de la gestión.
  • Cómo organizar, estructurar y desplegar un proyecto de Analítica:
    • Etapas: implementación y automatización. ML Operations. Feature Stores.
    • Riesgos: reproducibilidad de modelos y predicciones. Drifting.
    • Diagnóstico (referencia incorrecta – repetida). Error Analysis.
    • Gobernanza y cumplimiento normativo.
    • Claves para el éxito y desafíos de la gestión.
  • Optimización y elaboración de Plan de Desarrollo de proyecto (PDP).
  • Cultura y Metodologías Ágiles: Nuevas capacidades y Roles, metodologías LEAN: Scrum y Kanban. Etapas y entregables.
  • Adaptación de las metodologías ágiles a los proyectos de Analítica.
  • Operatividad en los proyectos: despliegue, orquestación, integración continua y entrega continua.
  • Aciertos y errores en los casos de uso de Big Data y Analiticos.
  • Claves para el éxito de un proyecto de Big Data y Analiticos.

Casos de uso y trabajo fin de máster

  • Casos de uso.
  • Trabajo fin de máster.

Acreditaciones y Reconocimientos Internacionales

SOLICITA MÁS INFORMACIÓN

Master en Big Data & Business Analytics

    RECIBE EN TU EMAIL:

    El precio y facilidades de pago.
    Postulación a la BECA 65% dcto.
    Complementos: Curso de idiomas GRATIS (Sólo por pago único) + Networking Profesional.