Cloudera

Administrator Training: CDP Private Cloud Base - Italian

28 horas
2425,00 €
Presencial o Live Virtual Class
Presencial o Live Virtual Class

Acerca de este curso

El curso de formación para administradores de Cloudera CDP Private Cloud Base brinda a los participantes una comprensión integral de todos los pasos necesarios para operar y mantener clústeres locales utilizando Cloudera Manager. Desde la instalación y configuración hasta el equilibrio de carga y el ajuste, este curso de capacitación de Cloudera es la mejor preparación para los desafíos del mundo real a los que enfrentan los administradores que ejecutan CDP Private Cloud Base.

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso está enfocado para administradores de sistemas que tienen experiencia básica en Linux.

Prerrequisitos

Para aprovechar al máximo este curso, los participantes deben tener conocimientos previos de CDP. No se requiere conocimiento de plataformas anteriores como Cloudera's CDH o Hortonworks HDP.

Objetivos del curso

Este curso enseña a los participantes las siguientes habilidades:

  • Instalar Cloudera Manager
  • Utilizar Cloudera Manager para instalar un clúster CDP Private Cloud Base
  • Configurar y monitorear el clúster utilizando Cloudera Manager
  • Comprender, evaluar y seleccionar la opción de almacenamiento de datos más adecuada.
  • Optimizar el rendimiento del clúster
  • Realizar tareas rutinarias de mantenimiento del clúster.
  • Detectar, solucionar y reparar problemas con el clúster

Contenidos

Módulo 1: Plataforma de datos de Cloudera

  • Tendencias de la industria para Big Data
  • El desafío de convertirse en impulsado por datos
  • La nube de datos empresariales
  • Descripción general de CDP
  • Factores de forma de CDP

Módulo 2: Instalación de la base de nube privada de CDP

  • Descripción general de la instalación
  • Instalación de Cloudera Manager
  • Descripción general del tiempo de ejecución de CDP
  • Introducción a Cloudera Manager

Módulo 3: Configuración de clúster

  • Visión general
  • Ajustes de configuración
  • Modificación de configuraciones de servicio
  • Archivos de configuración
  • Administrar instancias de roles
  • Agregar nuevos servicios
  • Agregar y quitar hosts

Módulo 4: Almacenamiento de datos

  • Visión general
  • Topología y roles de HDFS
  • Rendimiento de HDFS y tolerancia a fallos
  • Descripción general de seguridad de HDFS y Hadoop
  • Trabajando con HDFS
  • Descripción general de HBase
  • Descripción general de Kudu
  • Descripción general de Cloud Storage

Módulo 5: Ingesta de datos

  • Descripción general de la ingesta de datos
  • Formatos de archivo
  • Ingesta de datos mediante transferencia de archivos o interfaces REST
  • Importación de datos de bases de datos relacionales con Apache Sqoop
  • Ingesta de datos con NiFi
  • Mejores prácticas para importar datos

Módulo 6: Flujo de datos

  • Descripción general de Cloudera Flow Management y NiFi
  • Arquitectura NiFi
  • Gestión de flujo de Cloudera Edge y MiNiFi
  • Servicios de controlador
  • Descripción general de Apache Kafka
  • Arquitectura del clúster de Apache Kafka
  • Herramientas de línea de comandos de Apache Kafka

Módulo 7: Acceso y descubrimiento de datos

  • Apache Hive
  • Apache Impala
  • Sintonización de Apache Impala
  • Resumen de búsqueda
  • Descripción general de Hue
  • Administrar y configurar Hue
  • Autenticación y autorización de Hue
  • Descripción general de CDSW

Módulo 8: Computación de datos

  • Resumen de YARN
  • Ejecución de aplicaciones en YARN
  • Visualización de aplicaciones de YARN
  • Registros de aplicaciones de YARN
  • Aplicaciones MapReduce
  • Configuración de CPU y memoria YARN
  • Descripción general de Tez
  • Colmena en Tez
  • ACID para Hive
  • Descripción general de Spark
  • Cómo se ejecutan las aplicaciones Spark en YARN
  • Supervisión de aplicaciones Spark
  • Descripción general de Phoenix

Módulo 9: Gestión de recursos

  • Configuración de cgroups con programación de CPU
  • El programador de capacidad
  • Administrar colas
  • Programación de consultas de Impala

Módulo 10: Planificación de su clúster

  • Consideraciones generales de planificación
  • Elegir el hardware adecuado
  • Consideraciones de red
  • Consideraciones sobre la nube privada de CDP
  • Configurar nodos

Módulo 11: Configuración avanzada de clústeres

  • Configuración de puertos de servicio
  • Ajuste de HDFS y MapReduce
  • Gestión del crecimiento del clúster
  • Codificación de borrado
  • Habilitación de alta disponibilidad de HDFS

Módulo 12: Mantenimiento de clústeres

  • Comprobación del estado de HDFS
  • Copia de datos entre clústeres
  • Reequilibrio de datos en HDFS
  • Instantáneas del directorio HDFS
  • Mantenimiento de host
  • Actualizar un clúster

Módulo 13: Monitoreo de clústeres

  • Herramientas de monitorización de Cloudera Manager
  • Pruebas de salud
  • Eventos y alertas
  • Gráficos e informes
  • Recomendaciones de monitorización

Módulo 14: Solución de problemas del clúster

  • Visión general
  • Herramientas de resolución de problemas
  • Ejemplos de configuración incorrecta

Módulo 15: Seguridad

  • Gobernanza de datos con SDX
  • Conceptos de seguridad de Hadoop
  • Autenticación de Hadoop mediante Kerberos
  • Autorización de Hadoop
  • Cifrado Hadoop
  • Asegurar un clúster de Hadoop
  • Apache Ranger
  • Apache Atlas
  • Copia de seguridad y recuperación

Módulo 16: Nube privada / Nube pública

  • Descripción general de CDP
  • Capacidades de nube privada
  • Capacidades de nube pública
  • ¿Qué es Kubernetes?
  • Descripción general de WXM
  • Auto-scaling

Convocatorias abiertas