Detalles
![]() |
![]() |
![]() |
![]() ![]() ![]() |
Científico de Datos | 1 día, 8 horas | Español/Ingles | Inglés |
DESCRIPCIÓN DEL CURSO
En este curso, aprenderás a construir soluciones de análisis de datos por lotes utilizando Amazon EMR, un servicio gestionado de nivel empresarial para Apache Spark y Apache Hadoop. Aprenderás cómo Amazon EMR se integra con proyectos de código abierto como Apache Hive, Hue y HBase, así como con servicios de AWS como AWS Glue y AWS Lake Formation. El curso aborda componentes de recolección, ingestión, catalogación, almacenamiento y procesamiento de datos en el contexto de Spark y Hadoop. Aprenderás a utilizar cuadernos EMR para respaldar cargas de trabajo tanto de análisis como de aprendizaje automático. También aprenderás a aplicar las mejores prácticas de seguridad, rendimiento y gestión de costos en la operación de Amazon EMR.
CERTIFICACIÓN
- N/A.
REQUISITOS
Los estudiantes con al menos un año de experiencia en la gestión de marcos de datos de código abierto como Apache Spark o Apache Hadoop se beneficiarán de este curso.
Sugerimos el curso Fundamentos de AWS Hadoop para aquellos que necesiten refrescar sus conocimientos sobre Apache Hadoop.
Recomendamos que los asistentes a este curso hayan:
- Completado AWS Technical Essentials o Architecting on AWS.
- Completado Building Data Lakes on AWS o Getting Started with AWS Glue.