Cross-cutting

Arquitecturas Big Data: Hadoop y Spark

El curso Arquitecturas Big Data: Hadoop y Spark está diseñado para profesionales y titulados del sector tecnológico que buscan ampliar sus conocimientos en Big Data. Ideal para interesados en explorar el ecosistema Hadoop 3.x, programación en Scala, y técnicas de machine learning con RDD, dataframes y datasets, fortaleciendo sus habilidades en análisis y procesamiento de datos masivos.

45 hours Big Data

The course Arquitecturas Big Data: Hadoop y Spark es tu puerta de entrada al mundo del análisis masivo de datos, un sector actualmente en auge con una demanda laboral creciente. A medida que las empresas buscan aprovechar el poder de los datos, las habilidades en Big Data se han vuelto esenciales. Este curso te proporciona una comprensión integral del ecosistema Hadoop y la programación en Scala, herramientas fundamentales para cualquier profesional que aspire a destacar en la era digital. Además, aprenderás a manejar RDD, dataframes y datasets, y explorarás el machine learning, ampliando tus capacidades analíticas. No solo adquirirás conocimientos teóricos, sino que también desarrollarás practical skills que te posicionarán en el mercado laboral. Aprovecha esta oportunidad para convertirte en un experto en tecnologías que están redefiniendo la forma en que las organizaciones toman decisiones.

Course objectives

  • Comprender los conceptos fundamentales del Big Data para su aplicación en proyectos reales.

  • Analizar el ecosistema Hadoop 3.x y sus componentes para optimizar el procesamiento de datos.

  • Programar en Scala para desarrollar aplicaciones eficientes en entornos Big Data.

  • Utilizar RDD, dataframes y datasets para manipular grandes volúmenes de datos de manera eficaz.

  • Implementar algoritmos de machine learning para extraer valor de los datos con Spark.

  • Evaluar la eficiencia de distintos métodos de procesamiento de datos en Hadoop y Spark.

  • Aplicar conocimientos de Big Data para diseñar innovative solutions en problemas complejos.

What does it prepare you for?

Este curso te prepara para dominar las arquitecturas Big Data, centrándose en Hadoop y Spark. Aprenderás a gestionar grandes volúmenes de datos mediante el ecosistema Hadoop 3.x, desarrollar aplicaciones eficientes en Scala, y trabajar con RDD, dataframes y datasets. Además, adquirirás habilidades en machine learning, permitiéndote analizar y extraer valor de los datos, optimizando procesos y mejorando la toma de decisiones en proyectos complejos.

Teaching units

UNIDAD DIDÁCTICA 1. BIG DATA

1. Introducción a un ecosistema big data
2. Puesta en marcha del entorno
3. Definición y características
4. Ciclo de vida de un proyecto big data
5. Toma de decisiones a partir de datos

UNIDAD DIDÁCTICA 2. ECOSISTEMA HADOOP 3.X

1. Introducción a Apache Hadoop
2. Arquitectura Apache Hadoop
3. Hadoop distributed file system
4. Hadoop yarn
5. Hadoop map reduce (Hadoop MR)

UNIDAD DIDÁCTICA 3. PROGRAMACIÓN EN SCALA

1. Introducción a la programación Big Data
2. Scala como lenguaje de programación
3. Scala y el paradigma orientado a objetos
4. Scala y el paradigma funcional
5. Multiparadigma Scala en práctica

UNIDAD DIDÁCTICA 4. RDD, DARAFRAMES, DARASETS Y MACHINE LEARNING

1. Spark: instalación y puesta a punto
2. Spark core: rdd
3. Spark sql: dataframes y datasets
4. Spark datastreaming (real time)
5. Spark -amp; machine learning

Scroll to Top