Cloudera
Cloudera Administrator Training for Apache Hadoop

Elige la convocatoria

inscribirme Solicitar Info
Presencial
Duración 28 horas
Idioma
Precio 1995,00 €
Acerca de este curso
A quién va dirigido
Objetivos del curso
Certificación asociada
Contenidos
Próximos cursos

Acerca de este curso

Este curso de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos del mundo real que enfrentan por los administradores de Hadoop

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo.

Este curso está diseñado para personas con un nivel básico de conocimientos en la administración de sistemas Linux. No es necesario tener un conocimiento previo de Hadoop.

Objetivos del curso

A la finalización de la formación, el participante sabrá:

  • Cómo funciona Hadoop Distributed File System y MapReduce.
  • Qué configuraciones de hardware son óptimas para los clusters Hadoop.
  • Qué hay que tener en cuenta a nivel de red para construir un clúster.
  • Cómo configurar las opciones de Hadoop para obtener el mejor rendimiento.
  • Cómo configurar la Alta Disponibilidad de NameNode.
  • Cómo configurar NameNode Federation.
  • Cómo configurar el FairScheduler para cumplir los service-level agreements para múltiples usuarios de un cluster.
  • Cómo instalar e implementar la seguridad basada en Kerberos para tu cluster.
  • Cómo mantener y monitorizar tu cluster.
  • Cómo cargar datos de ficheros generados dinámicamente usando Flume, y de base de datos relacionales utilizando Sqoop.
  • Qué problemas existen desde el punto de vista de la Administración de Sistemas con otros proyectos Hadoop como Hive, Pig, y HBase.

Certificación asociada

La Certificación Cloudera Certified Administrator for Apache Hadoop, ha sido diseñada para comprobar que los candidatos controlan los conceptos y habilidades requeridas en las siguiente áreas:

  1. HDFS
  2. YARN and MapReduce version 2 (MRv2)
  3. Hadoop Cluster Planning
  4. Hadoop Cluster Installation and Administration
  5. Resource Management
  6. Monitoring and Logging

Tras la realización del presente curso oficial el alumno estará preparado para superar el examen de certificación Cloudera Certified Administrator for Apache Hadoop (CCAH).

Más información sobre la certificación CCAH en el siguiente enlace.

Contenidos

- Introducción.

- Historia de Apache Hadoop.

  • ¿Por qué Hadoop?.
  • Componentes principales de Hadoop.
  • Conceptos fundamentales.

- HDFS.

  • Características de HDFS.
  • Lectura y escritura de archivos.
  • Consideraciones acerca de memoria de NameNode.
  • Aspectos generales de seguridad en HDFS.
  • Empleo del Namenode Web UI.
  • Empleo del File Shell de Hadoop.

- Obtención de datos en HDFS.

  • Ingestión de datos desde recursos externos con Flume.
  • Ingestión de datos desde bases de datos relacionales con Sqoop.
  • REST Interfaces.
  • Buenas prácticas para la importación de datos.

- MapReduce.

  • ¿Qué es MapReduce?.
  • Conceptos básicos de MapReduce.
  • Arquitectura del clúster YARN.
  • Asignación de Recursos.
  • Recuperación ante fallos.
  • Empleo de YARN Web UI.
  • MapReduce Versión 1.

- Planificación de un cluster Hadoop.

  • Consideraciones generales de planificación.
  • Elección correcta de Hardware.
  • Consideraciones de red.
  • Configuración de nodos.
  • Planificación de la administración del clúster.

- Instalación y configuración inicial.

  • Tipos de desarrollo.
  • Instalación de Hadoop.
  • Especificaciones en la configuración de Hadoop.
  • Realizar la configuración inicial HDFS.
  • Realizar la configuración inicial de YARN y MapReduce.
  • Hadoop Logging.

- Instalación y configuración de Hive, Pig e Impala.

  • Hive.
  • Impala.
  • Pig.

- Clientes Hadoop.

  • ¿Qué es un cliente de Hadoop?.
  • Instalación y configuración de clientes Hadoop.
  • Instalación y configuración de Hue.
  • Autorizaciones y autenticación Hue.

- Cloudera Manager.

  • Objetivos de Cloudera Manager.
  • Características de Cloudera Manager.
  • Versiones Express y Enterprise.
  • Topología de Cloudera Manager.
  • Instalación de Cloudera Manager.
  • Instalación de Hadoop empleando Cloudera Manager.
  • Realización de tareas de administración básicas empleando Cloudera Manager.

- Configuración avanzada de un cluster.

  • Parámetros avanzados de configuración.
  • Configuración de puertos Hadoop.
  • Inclusión y exlusión explícitas de hosts.
  • Configuración de HDFS para la organización en rack.
  • Configuración de HDFS para obtención de alta disponibilidad.

- Seguridad Hadoop.

  • ¿Por qué es importante la seguridad en Hadoop?.
  • Conceptos del sistema de seguridad de Hadoop.
  • Qué es Kerberos y cómo trabaja.
  • Protección de un clúster Hadoop Cluster con Kerberos.

- Gestión y planificación de tareas o trabajos.

  • Administración de trabajos activos.
  • Organización de trabajos Hadoop.
  • Configuración del FairScheduler.
  • Organización de consultas Impala.

- Mantenimiento de un cluster.

  • Chequeo de estatus de HDFS.
  • Copia de datos entre clústers.
  • Eliminación y añadido de nodos en el clúster.
  • Rebalanceo del Cluster.
  • Actualización del clúster.

- Solución de problemas y monitorización de un cluster.

  • Sistema general de monitorización.
  • Monitorización de clústers Hadoop.
  • Solución de problemas habituales en el clúster de Hadoop.
  • Errores habituales en la configuración.

- Conclusiones.

Próximos cursos

Fechas03 oct 2016 - 06 oct 2016 Horarios de lun a jue (09:00h - 17:00h) CiudadBarcelona IdiomaEspañol inscribirme
Fechas03 oct 2016 - 07 oct 2016 Horarios de lun a vie (09:00h - 14:30h) CiudadMadrid IdiomaEspañol inscribirme
Fechas21 nov 2016 - 25 nov 2016 Horarios de lun a vie (09:00h - 14:30h) CiudadMadrid IdiomaEspañol inscribirme