Cloudera

Running Cloudera Public Cloud - Virtual English

28 horas
2970,00 €
Live Virtual Class
Live Virtual Class

Acerca de este curso

Este curso de Administración de CDP Public Cloud proporciona a los participantes una comprensión integral de todos los pasos necesarios para configurar, operar y mantener instancias de CDP en la nube pública. Este curso abarca todo el proceso, desde la instalación inicial hasta la configuración de diversos servicios de datos para ejecutar cargas de trabajo en la nube en todos los principales proveedores de servicios en la nube, utilizando Cloudera Management Console. También cubre varias opciones de configuración mediante la interfaz web y escenarios de automatización mediante Ansible. En cuanto a la optimización, aborda el balanceo de carga y la optimización de instancias de CDP PC. Este curso de formación de Cloudera es la mejor preparación para los desafíos del mundo real que enfrentan los administradores que ejecutan CDP en la nube pública.

A quién va dirigido

Este curso es muy adecuado para administradores y operadores de sistemas en la nube que tienen al menos experiencia básica en Linux y en AWS/Azure/GCP. No es necesario tener conocimientos previos de CDP ni de plataformas anteriores como CDH de Cloudera o HDP de Hortonworks, pero puede ser útil.

Objetivos del curso

A través de discusiones dirigidas por el instructor y ejercicios interactivos prácticos, aprenderás a:

  • Evaluar y seleccionar la opción de implementación adecuada.
  • Configurar CDP Public Cloud utilizando Cloudera Management Console.
  • Configurar y supervisar varios servicios de datos.
  • Configurar y supervisar instancias mediante Cloudera Manager.
  • Optimizar el rendimiento y la seguridad del clúster.
  • Detectar, solucionar problemas y reparar problemas con el clúster.
  • Escalar automáticamente clústeres de Data Hub y servicios de datos.

Contenidos

Instalación (Quick Start)

  • Consola de Administración de Cloudera
  • Credenciales de CDP
  • Regiones del Panel de Control de CDP
  • Registrar un entorno CDP
  • Plataforma de Datos Cloudera (CDP)
  • Tendencias de la Industria para Big Data
  • El Desafío de Convertirse en una Empresa Impulsada por Datos
  • La Nube de Datos Empresariales
  • Descripción General de CDP
  • Factores de Forma de CDP

Arquitectura de CDP

  • Descripción General
  • Conceptos Clave y Componentes
  • Descripción General de CDP Runtime
  • Hardware Mínimo
  • Conexiones Salientes

Descripción General del Plano de Control

  • Acceso y Gestión de un Entorno
  • Descripción General de la Gestión de Datos
  • Consola de Administración
  • Panel de Control
  • Entornos
  • Data Lakes
  • Gestión de Usuarios
  • Clusters Clásicos
  • Data Hubs
  • Catálogo de Datos
  • Gestor de Replicación
  • Observabilidad

Ingeniería de Datos

  • Descripción General del Servicio de Ingeniería de Datos
  • Descripción General de Apache Spark/Flink/Kafka Streams
  • Escalado Automático
  • Data Warehouse
  • Descripción General del Servicio de Almacén de Datos
  • Agregar y Gestionar un Catálogo de Bases de Datos
  • Agregar y Ajustar rendimiento en un Almacén Virtual
  • Consultas a un Almacén de Datos
  • Visualización de Datos
  • Monitorización y Solución de Problemas

Base de Datos Operativa

  • Descripción General del Servicio de Base de Datos Operacional
  • Apache HBase/ Introducción a las Búsquedas
  • Escalado Automático

Interfaz de Línea de Comandos de CDP (CLI)

  • Interfaz de Línea de Comandos de CDP (CLI) de CDP
  • Instalación de la CLI de CDP / Configuración del Cliente CLI
  • Módulos de CLI
  • Generar una Clave de Acceso a la API / Configuración del Cliente CDP
  • Inicio de Sesión en la CLI/SDK de CDP
  • Configuración de Autocompletado de la CLI / Referencia de la CLI / Acceso a la Ayuda de la CLI
  • Descripción General de la API de CDP / Descripción General del SDK de CDP para Java / Descripción General de cURL de CDP

Gestión del Acceso de CDP

  • Consola de Administración
  • Gestión de Usuarios
  • Crear Usuario de Máquina
  • Permisos de Usuario
  • Sincronizar Usuarios
  • Configurar Grupos
  • Proveedores de Identidad
  • Roles y Roles de Recursos
  • Configuración Global
  • Credenciales de Almacenamiento de Auditoría

Descripción General de los Data Hubs

  • Data Hubs
  • Planificación / Creación de su Clúster de Data Hub
  • Consideraciones Generales de Planificación
  • Configuración de Nodos
  • Gestión de Data Hub
  • Elección del Hardware Adecuado
  • Configuración Avanzada del Clúster
  • Tipos de Data Hub
  • DataFlow
  • Ingeniería de Datos
  • Resolución de Problemas

Aprendizaje Automático

  • Descripción General del Servicio de Aprendizaje Automático
  • Motores de CML
  • Requisitos para Espacios de Trabajo de CML
  • Aprovisionamiento de un Espacio de Trabajo de CML
  • CML Auto-Scaling
  • Monitorización

Monitorización y Gestión

  • Monitorización y Gestión en la Nube Pública de CDP
  • Monitorización del Clúster de Data Lake y Auditoría de CDP
  • Primeros Pasos con el Monitorización en CDP
  • Monitorización con Cloudera Manager: Pruebas de Salud y Paneles
  • Monitorización de Clústeres, Servicios, Nodos, Roles y Actividades
  • Solución de Problemas de Configuración y Operación del Clúster

Gestión de Data Hubs

  • Mejores Prácticas en Data Hubs
  • Dimensionamiento de Data Hubs
  • Consola de Administración de Cloudera
  • Servicios de Data Hub
  • Escalado Automático / Información del Data Hub
  • Verificación del Estado de Salud del Clúster / Eventos y Alertas
  • Mantenimiento de Hosts
  • Actualización de un Clúster de Data Hub
  • Monitorización / Funciones de Monitorización

Descripción General de los Servicios de Datos

  • Descripción General de los Servicios de Datos
  • Servicios de Datos
  • Planificación de su Clúster de Servicios de Datos
  • Elección del Hardware Adecuado / Consideraciones de Red
  • Creación de Servicios de Datos
  • DataFlow
  • Ingeniería de Datos
  • Almacén de Datos
  • Base de Datos Operativa
  • Aprendizaje Automático
  • Resolución de Problemas

DataFlow

  • Descripción General del Servicio de DataFlow
  • Descripción General de la Ingestión de Datos
  • Ingestión de Datos mediante Transferencia de Archivos o Interfaces REST
  • Ingestión de Datos Mediante NiFi
  • Escalado Automático

Gestión de Datos

  • SDX - Seguridad y Gobernanza
  • Conceptos de Seguridad
  • Acceso a Almacenamiento en la Nube
  • Seguridad del Data Lake: SDX
  • Apache Ranger
  • Autorización / Autenticación de CDP
  • Gobernanza de Datos
  • Apache Atlas
  • Catálogo de Datos

Observabilidad

  • Descripción General
  • Soporte
  • Arquitectura de Implementación de la Observabilidad
  • Capacidades de Monitorización
  • Trabajar con Alertas, Costos e Informes

Convocatorias abiertas