Cloudera

Cloudera Administrator Training for Apache Hadoop - Virtual English

Elige la convocatoria

inscribirme
Virtual Class
Duración
28 horas
Idioma
Inglés
Precio
2695,00 €
Próximas convocatorias
Acerca de este curso
A quién va dirigido
Objetivos del curso
Certificación asociada
Contenidos
Convocatorias abiertas

Certificación asociada: CCA131

Próximas convocatorias
Ver todas

12 feb 18
16 feb 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €
19 mar 18
23 mar 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €
14 may 18
18 may 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €

Acerca de este curso

El curso de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos del mundo real que enfrentan por los administradores de Hadoop

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Esta formación oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo.

Esta formación oficial está diseñada para personas con un nivel básico de conocimientos en la administración de sistemas Linux. No es necesario tener un conocimiento previo de Hadoop.

Objetivos del curso

Al finalizar la formación, el participante sabrá:

  • Funciones de Cloudera Manager que facilitan la gestión de clústeres, agregación de logs, gestión de configuración, administración de recursos, informes, alertas y administración de servicios.
  • Fundamentos de la arquitectura de YARN, MapReduce, Spark y HDFS.
  • Determinar el hardware y la infraestructura correctos para el clúster.
  • Configuración y despliegue del clúster necesarios para integrarlo en el data center.
  • Cómo cargar datos en el clúster desde archivos generados dinámicamente mediante Flume y desde RDBMS utilizando Sqoop.
  • Configurar FairScheduler para proporcionar acuerdos de nivel de servicio para varios usuarios de un clúster.
  • Mejores prácticas para preparar y mantener Apache Hadoop en producción.
  • Trouleshooting, diagnóstico, tinning y resolución de problemas en Hadoop.

Certificación asociada:

La Certificación Cloudera Certified Administrator for Apache Hadoop, ha sido diseñada para comprobar que los candidatos controlan los siguientes conceptos y habilidades:

  1. Instalar: Demostrar una comprensión del proceso de instalación de Cloudera Manager, CDH y proyectos del ecosistema
  2. Configurar: Realizar la configuración básica y avanzada necesaria para administrar eficazmente un clúster Hadoop
  3. Administrar: Mantener y modificar el clúster para dar soporte a las operaciones cotidianas en la empresa
  4. Seguridad: Habilitar los servicios relevantes y configurar el clúster para cumplir con los objetivos definidos por la directiva de seguridad; Demostrar el conocimiento de las prácticas básicas de seguridad
  5. Test: Parametrizar las métricas operativas del clúster, la configuración del sistema de prueba para el funcionamiento y la eficiencia
  6. Troubleshoot: Demostrar capacidad para encontrar la causa raíz de un problema, optimizar la ejecución ineficiente y resolver escenarios de contención de recursos

Tras la realización del presente curso oficial el alumno estará preparado para superar el examen de certificación CCA Administrator Exam (CCA131).

Más información sobre la certificación CCA en el siguiente enlace.

Contenidos

Introducción

Historia de Apache Hadoop

  • ¿Por qué Hadoop?
  • Componentes principales de Hadoop
  • Conceptos fundamentales

Instalación del Clúster Hadoop

  • Fundamentos de un Cluster Management Solution
  • Funciones de Cloudera Manager
  • Instalación de Cloudera Manager
  • Instalación de Hadoop (CDH)

El Hadoop Distributed File System (HDFS)

  • Características de HDFS
  • Lectura y escritura de archivos
  • Consideraciones acerca de memoria de NameNode
  • Aspectos generales de seguridad en HDFS
  • Empleo del Namenode Web UI
  • Empleo del File Shell de Hadoop

MapReduce y Spark en YARN

  • Funciones de Framework computacionales
  • YARN: El gestor de recursos del cluster
  • Conceptos de MapReduce
  • Conceptos de Apache Spark
  • Ejecución de Computational Frameworks en YARN
  • Exploración de las aplicaciones de YARN Applications a través de la Web UIs y de Shell
  • Agregación de los logs de YARN

Configuración de Hadoop y registros de Daemon

  • Elementos de Cloudera Manager para la gestión de configuraciones
  • Localizar configuraciones y aplicar cambios de configuración
  • Gestión de instancias de Role y añadir servicios
  • Configuración del servicio HDFS
  • Configuración de los logs de Hadoop Daemon
  • Configuración del servicio YARN

Obtención de datos en HDFS

  • Ingestión de datos desde fuentes de recursos externos con Flume
  • Ingestión de datos desde bases de datos relacionales con Sqoop
  • REST Interfaces
  • Buenas prácticas para la importación de datos

Planificación de un cluster Hadoop

  • Consideraciones generales de planificación
  • Elección correcta de Hardware
  • Opciones de Virtualización
  • Consideraciones de red
  • Configuración de nodos

Instalación y configuración de Hive, Pig e Impala

  • Hive
  • Impala
  • Pig

Clientes Hadoop incluidos en Hue

  • ¿Qué es un cliente de Hadoop?
  • Instalación y configuración de clientes Hadoop
  • Instalación y configuración de Hue
  • Autorizaciones y autenticación Hue

Configuración avanzada de un cluster

  • Parámetros avanzados de configuración
  • Configuración de puertos Hadoop
  • Configuración de HDFS para la organización en rack
  • Configuración de HDFS para obtención de alta disponibilidad

Seguridad Hadoop

  • ¿Por qué es importante la seguridad en Hadoop?
  • Conceptos del sistema de seguridad de Hadoop
  • Qué es Kerberos y cómo funciona
  • Securización de un clúster Hadoop Cluster con Kerberos
  • Otros conceptos de seguridad

Gestión de recursos

  • Configuración de cgroups con Static Service Pools
  • El Fair Scheduler
  • Configuración de Dynamic Resource Pools
  • Configuraciones de CPU y memoria YARN
  • Impala Query Scheduling

Mantenimiento de un cluster

  • Chequeo del estado de HDFS
  • Copia de datos entre clústers
  • Añadir y eliminar de nodos en el clúster
  • Rebalanceo del Cluster
  • Directorio de Snapshots
  • Actualización del clúster

Solución de problemas y monitorización de un cluster

  • Sistema general de monitorización
  • Monitorización de clústers Hadoop
  • Solución de problemas habituales en el clúster de Hadoop
  • Errores habituales en la configuración

Conclusión

Convocatorias abiertas

12 feb 18
16 feb 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €
19 mar 18
23 mar 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €
14 may 18
18 may 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €
02 jul 18
06 jul 18

Virtual Class | Inglés | De Lunes a Viernes (09:00h - 14:35h)
28 h.    2695 €