Cloudera

Cloudera Administrator Training for Apache Hadoop - Virtual Italian

Live Virtual Class
Duración
28 horas
Precio
2425,00 €
Próximas convocatorias
Acerca de este curso
A quién va dirigido
Objetivos del curso
Certificación asociada
Contenidos
Convocatorias abiertas

Próximas convocatorias
Ver todas las convocatorias

08 oct 19
11 oct 19
Confirmado |
Live Virtual Class | Italiano | De Martes a Viernes (09:00h - 17:00h)
28 h.    2425 €

Acerca de este curso

TASTE OF TRAINING

Este curso de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos del mundo real que enfrentan por los administradores de Hadoop

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo.

Este curso está diseñado para personas con un nivel básico de conocimientos en la administración de sistemas Linux. No es necesario tener un conocimiento previo de Hadoop.

Objetivos del curso

Al finalizar esta formación, el estudiante será capaz de:

  • Hacer uso de las funciones presentes en Cloudera Manager que sirven para facilitar la administracion de los clústeres, como agregar logging, administrar la configuración, la administración de recursos, informes, alertas y administración de los servicios.
  • Configuración e implementación de clústeres a escala de producción que proporcionan servicios clave relacionados con Hadoop, se incluyen YARN, HDFS, Impala, Hive, Spark, Kudu y Kafka.
  • Determinar el hardware y la infraestructura ideales para su Clúster.
  • Proporcionar una configuración e implementación de un Clúster para integrar con el Data Center.
  • Ingesta, almacenamiento y acceso a los datos en HDFS, Kudu y almacenamiento de objetos en la nube como Amazon S3.
  • Realizar la carga de datos, basados en ficheros, en streaming dentro del clúster, mediante el uso de Kafka y Flume.
  • Configuración de la administración automática de recursos para garantizar que se cumplan los acuerdos de nivel de servicio para múltiples usuarios de un clúster.
  • Mejores prácticas para preparar, ajustar y mantener un Clúster de producción.
  • Resolución de problemas, diagnóstico y solución de problemas de Clúster.

Certificación asociada

La Certificación Cloudera Certified Administrator for Apache Hadoop, ha sido diseñada para comprobar que los candidatos controlan los siguientes conceptos y habilidades:

  • Instalación: Demostrar una comprensión del proceso de instalación de Cloudera Manager, CDH y proyectos del ecosistema.Configuración de la administración automática de recursos para garantizar que se cumplan los acuerdos de nivel de servicio para múltiples usuarios de un clúster
  • Configuración: Realizar la configuración básica y avanzada necesaria para administrar eficazmente un clúster Hadoop
  • Administrar: Mantener y modificar el clúster para dar soporte a las operaciones cotidianas en la empresa
  • Seguridad: Habilitar los servicios relevantes y configurar el clúster para cumplir con los objetivos definidos por la directiva de seguridad; Demostrar el conocimiento de las prácticas básicas de seguridad
  • Test: Parametrizar las métricas operativas del clúster, la configuración del sistema de prueba para el funcionamiento y la eficiencia
  • Resolución de problemas: Demostrar capacidad para encontrar la causa raíz de un problema, optimizar la ejecución ineficiente y resolver escenarios de contención de recursos

Tras la realización del presente curso oficial el alumno estará preparado para superar el examen de certificación CCA Administrator Exam (CCA131).

Más información sobre la certificación CCA en el siguiente enlace.

Contenidos

Introducción

Cloudera Enterprise Data Hub

  • Cloudera Enterprise Data Hub
  • Descripción general de CDH
  • Descripción general de Cloudera Manager
  • Responsabilidades del administrador de Hadoop

Instalación de Cloudera Manager y CDH

  • Descripción general de la instalación de un Clúster
  • Instalación de Cloudera Manager
  • Instalación de CDH
  • CDH Cluster Services

Configuración de un Clúster de Cloudera

  • Descripción general
  • Ajustes de configuración
  • Modificación de configuraciones de servicio
  • Ficheros de configuración
  • Administración de Role Instances
  • Agregar nuevos servicios
  • Agregar y quitar hosts

Hadoop Distributed File System

  • Descripción general
  • Topología de HDFS y roles
  • Editar logs y puntos de control
  • Rendimiento de HDFS y tolerancia a fallos
  • Descripción general de seguridad HDFS y Hadoop
  • Interfaces de usuario web para HDFS
  • Uso de la interfaz de línea de comandos HDFS
  • Otras utilidades de línea de comandos

Ingesta de datos con HDFS

  • Información general de ingesta de datos
  • Formatos de ficheros
  • Ingesta de datos mediante transferencia de archivos o interfaces REST
  • Importación de datos de bases de datos relacionales con Apache Sqoop
  • Ingesta de datos de fuentes externas con Apache Flume
  • Mejores prácticas para la importación de datos

Hive e Impala

  • Apache Hive
  • Apache Impala

YARN y MapReduce

  • Descripción general de YARN
  • Ejecución de aplicaciones en YARN
  • Visualización de aplicaciones en YARN
  • Logs de aplicaciones en YARN
  • Aplicaciones de MapReduce
  • Configuración de memoria y CPU de YARN

Apache Spark

  • Descripción general de Spark
  • Aplicaciones Spark
  • Ejecución las aplicaciones Spark en YARN
  • Monitorización de aplicaciones Spark

Planificación de su Clúster

  • Consideraciones generales de planificación
  • Elegir el hardware adecuado
  • Consideraciones de red
  • Opciones de virtualización
  • Opciones de implementación Cloud
  • Configuración de nodos

Configuración avanzada del cluster

  • Configuración de puertos de servicio
  • ModificarHDFS y MapReduce
  • Habilitar alta disponibilidad en HDFS

Gestión de recursos

  • Configuración de cgroups con Static Service Pools
  • El Fair Scheduler
  • Configuración de Dynamic Resource Pools
  • Programación de consultas en Impala

Mantenimiento de un Clúster

  • Comprobación del estado de HDFS
  • Copia de datos entre Clústeres
  • Rebalanceo de datos en HDFS
  • HDFS Directory Snapshots
  • Actualización de un clúster

Monitorización de Clústeres

  • Funciones de monitorización de Cloudera Manager
  • Pruebas de salud
  • Eventos y alertas
  • Gráficos e informes
  • Recomendaciones de monitorización

Resolución de problemas de un clúster

  • Descripción general
  • Herramientas de resolución de problemas
  • Ejemplos de mala configuración
  • Puntos esenciales

Instalación y gestión de Hue

  • Descripción general
  • Administración y configuración de Hue
  • Autenticación y autorización en Hue

Seguridad

  • Conceptos de seguridad en Hadoop
  • Autenticación en Hadoop mediante Kerberos
  • Autorización en Hadoop
  • Cifrado en Hadoop
  • Securización de un clúster de Hadoop

Apache Kudu

  • Descripción general de Kudu
  • Arquitectura
  • Instalación y configuración
  • Herramientas de monitorización y administración

Apache Kafka

  • ¿Qué es Apache Kafka?
  • Descripción general de Apache Kafka
  • Arquitectura de un Clúster Apache Kafka
  • Herramientas de línea de comandos Apache Kafka
  • Uso de Kafka con Flume

Almacenamiento de objetos Cloud

  • Almacenamiento de objetos
  • Conexión de Hadoop con el almacenamiento de objetos

Convocatorias abiertas

08 oct 19
11 oct 19
Confirmado |
Live Virtual Class | Italiano | De Martes a Viernes (09:00h - 17:00h)
28 h.    2425 €