Cloudera

Cloudera Administrator Training for Apache Hadoop

Elige la convocatoria

inscribirme
Presencial o virtual class
Duración
28 horas
Idioma
Precio
1670,00 €
Próximas convocatorias
Acerca de este curso
A quién va dirigido
Objetivos del curso
Certificación asociada
Contenidos
Convocatorias abiertas

Certificación asociada: CCAH

Próximas convocatorias
Ver todas

17 jul 17
27 jul 17

Barcelona | Español | De Lunes a Jueves (16:00h - 19:30h)
28 h.    1670 €
17 jul 17
27 jul 17

Madrid | Español | De Lunes a Jueves (16:00h - 19:30h)
28 h.    1670 €
02 oct 17
06 oct 17

Madrid | Español | De Lunes a Viernes (09:00h - 14:35h)
28 h.    1670 €

Acerca de este curso

El curso de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos del mundo real que enfrentan por los administradores de Hadoop

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

El curso oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo.

Esta formación oficial está diseñada para personas con un nivel básico de conocimientos en la administración de sistemas Linux. No es necesario tener un conocimiento previo de Hadoop.

Objetivos del curso

Al finalizar la formación, el participante sabrá:

  • Funciones de Cloudera Manager que facilitan la gestión de clústeres, agregación de logs, gestión de configuración, administración de recursos, informes, alertas y administración de servicios.
  • Fundamentos de la arquitectura de YARN, MapReduce, Spark y HDFS.
  • Determinar el hardware y la infraestructura correctos para el clúster.
  • Configuración y despliegue del clúster necesarios para integrarlo en el data center.
  • Cómo cargar datos en el clúster desde archivos generados dinámicamente mediante Flume y desde RDBMS utilizando Sqoop.
  • Configurar FairScheduler para proporcionar acuerdos de nivel de servicio para varios usuarios de un clúster.
  • Mejores prácticas para preparar y mantener Apache Hadoop en producción.
  • Trouleshooting, diagnóstico, tinning y resolución de problemas en Hadoop.

Certificación asociada:

La Certificación Cloudera Certified Administrator for Apache Hadoop, ha sido diseñada para comprobar que los candidatos controlan los conceptos y habilidades requeridas en las siguiente áreas:

  1. Apache Hadoop Cluster Core Technologies
  2. Apache Hadoop Cluster Planning
  3. Apache Hadoop Cluster Management
  4. Job Scheduling
  5. Monitoring and Logging

Tras la realización del presente curso oficial el alumno estará preparado para superar el examen de certificación Cloudera Certified Administrator for Apache Hadoop (CCAH).

Más información sobre la certificación CCAH en el siguiente enlace.

Contenidos

Introducción

Historia de Apache Hadoop

  • ¿Por qué Hadoop?
  • Componentes principales de Hadoop
  • Conceptos fundamentales

Instalación del Clúster Hadoop

  • Fundamentos de un Cluster Management Solution
  • Funciones de Cloudera Manager
  • Instalación de Cloudera Manager
  • Instalación de Hadoop (CDH)

El Hadoop Distributed File System (HDFS)

  • Características de HDFS
  • Lectura y escritura de archivos
  • Consideraciones acerca de memoria de NameNode
  • Aspectos generales de seguridad en HDFS
  • Empleo del Namenode Web UI
  • Empleo del File Shell de Hadoop

MapReduce y Spark en YARN

  • Funciones de Framework computacionales
  • YARN: El gestor de recursos del cluster
  • Conceptos de MapReduce
  • Conceptos de Apache Spark
  • Ejecución de Computational Frameworks en YARN
  • Exploración de las aplicaciones de YARN Applications a través de la Web UIs y de Shell
  • Agregación de los logs de YARN

Configuración de Hadoop y registros de Daemon

  • Elementos de Cloudera Manager para la gestión de configuraciones
  • Localizar configuraciones y aplicar cambios de configuración
  • Gestión de instancias de Role y añadir servicios
  • Configuración del servicio HDFS
  • Configuración de los logs de Hadoop Daemon
  • Configuración del servicio YARN

Obtención de datos en HDFS

  • Ingestión de datos desde fuentes de recursos externos con Flume
  • Ingestión de datos desde bases de datos relacionales con Sqoop
  • REST Interfaces
  • Buenas prácticas para la importación de datos

Planificación de un cluster Hadoop

  • Consideraciones generales de planificación
  • Elección correcta de Hardware
  • Opciones de Virtualización
  • Consideraciones de red
  • Configuración de nodos

Instalación y configuración de Hive, Pig e Impala

  • Hive
  • Impala
  • Pig

Clientes Hadoop incluidos en Hue

  • ¿Qué es un cliente de Hadoop?
  • Instalación y configuración de clientes Hadoop
  • Instalación y configuración de Hue
  • Autorizaciones y autenticación Hue

Configuración avanzada de un cluster

  • Parámetros avanzados de configuración
  • Configuración de puertos Hadoop
  • Configuración de HDFS para la organización en rack
  • Configuración de HDFS para obtención de alta disponibilidad

Seguridad Hadoop

  • ¿Por qué es importante la seguridad en Hadoop?
  • Conceptos del sistema de seguridad de Hadoop
  • Qué es Kerberos y cómo funciona
  • Securización de un clúster Hadoop Cluster con Kerberos
  • Otros conceptos de seguridad

Gestión de recursos

  • Configuración de cgroups con Static Service Pools
  • El Fair Scheduler
  • Configuración de Dynamic Resource Pools
  • Configuraciones de CPU y memoria YARN
  • Impala Query Scheduling

Mantenimiento de un cluster

  • Chequeo del estado de HDFS
  • Copia de datos entre clústers
  • Añadir y eliminar de nodos en el clúster
  • Rebalanceo del Cluster
  • Directorio de Snapshots
  • Actualización del clúster

Solución de problemas y monitorización de un cluster

  • Sistema general de monitorización
  • Monitorización de clústers Hadoop
  • Solución de problemas habituales en el clúster de Hadoop
  • Errores habituales en la configuración

Conclusión

Convocatorias abiertas

17 jul 17
27 jul 17

Barcelona | Español | De Lunes a Jueves (16:00h - 19:30h)
28 h.    1670 €
17 jul 17
27 jul 17

Madrid | Español | De Lunes a Jueves (16:00h - 19:30h)
28 h.    1670 €
02 oct 17
06 oct 17

Madrid | Español | De Lunes a Viernes (09:00h - 14:35h)
28 h.    1670 €
02 oct 17
06 oct 17

Barcelona | Español | De Lunes a Viernes (09:00h - 14:35h)
28 h.    1670 €
27 nov 17
01 dic 17

Madrid | Español | De Lunes a Viernes (09:00h - 14:35h)
28 h.    1670 €
27 nov 17
01 dic 17

Barcelona | Español | De Lunes a Viernes (09:00h - 14:35h)
28 h.    1670 €