Compueducación

AWSBDSOL – Building Batch Data Analytics Solutions on AWS

AWS

Avatar del usuario

Detalles

Rol Audiencia Duración Idioma Curso Idioma Manual
Científico de Datos 1 día, 8 horas Español/Ingles Inglés

DESCRIPCIÓN DEL CURSO

En este curso, aprenderás a construir soluciones de análisis de datos por lotes utilizando Amazon EMR, un servicio gestionado de nivel empresarial para Apache Spark y Apache Hadoop. Aprenderás cómo Amazon EMR se integra con proyectos de código abierto como Apache Hive, Hue y HBase, así como con servicios de AWS como AWS Glue y AWS Lake Formation. El curso aborda componentes de recolección, ingestión, catalogación, almacenamiento y procesamiento de datos en el contexto de Spark y Hadoop. Aprenderás a utilizar cuadernos EMR para respaldar cargas de trabajo tanto de análisis como de aprendizaje automático. También aprenderás a aplicar las mejores prácticas de seguridad, rendimiento y gestión de costos en la operación de Amazon EMR.

CERTIFICACIÓN

  • N/A.

REQUISITOS

Los estudiantes con al menos un año de experiencia en la gestión de marcos de datos de código abierto como Apache Spark o Apache Hadoop se beneficiarán de este curso.
Sugerimos el curso Fundamentos de AWS Hadoop para aquellos que necesiten refrescar sus conocimientos sobre Apache Hadoop.
Recomendamos que los asistentes a este curso hayan:

  • Completado AWS Technical Essentials o Architecting on AWS.
  • Completado Building Data Lakes on AWS o Getting Started with AWS Glue.

Gratuito