Cloudera

Cloudera DataFlow: Flow Management with Apache NiFi - Virtual English

21 horas
2230,00 €
Live Virtual Class
Live Virtual Class

Acerca de este curso

Esta formación proporciona los conceptos y experiencia necesarios para automatizar la ingesta,  flujo, transformación y salida de datos mediante el uso de Apache NiFi.

Los participantes aprenderán en profundidad las características, conceptos y beneficios clave de utilizar NiFi, todos estos conocimientos se acompañarán de un enfoque práctico mediante la creación y ejecución de Dataflows NiFi para una variedad de escenarios. Con este método, los participantes obtendrán una amplia experiencia utilizando procesadores, conexiones y grupos de procesos, además harán uso el lenguaje de expresión NiFi para controlar el Dataflow desde varias fuentes a múltiples destinos. También aprenderán monitorización de Dataflows, examinarán el progreso de los datos a través de un Dataflow y conectarán los Dataflows a sistemas externos como Kafka, HDFS y HBase.

Una vez finalizada esta formación, los participantes habrán adquirido todos conocimientos y experiencia necesarios para configurar y administrar la ingesta de datos, así como, el movimiento y la transformación de los distintos escenarios posibles de una empresa.

PUE, Strategic Partner de Cloudera, está autorizado oficialmente por esta multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Esta formación está diseñada para desarrolladores, ingenieros de datos, científicos de datos y administradores de datos. Se proporciona un enfoque gráfico sin código para configurar soluciones de transmisión, ingesta y administración de datos en tiempo real para una variedad de casos de uso.

No se requieren conocimientos de programación, sin embargo, es útil disponer de conocimientos previos de Linux. También puede resultar de utilidad conocer los distintos conceptos y aplicaciones de Big Data.

Objetivos del curso

Al final de esta formación, los participantes serán capaces de:

  • Entender el rol de Apache NiFi y MiNiFi en la plataforma Cloudera Dataflow
  • Describir la arquitectura de NiFi, tanto las configuraciones standalone como las clusterizadas
  • Utilizar características clave, incluyendo FlowFiles, procesadores, grupos de procesos, controladores y conexiones, para definir un dataflow NiFi
  • Navegar, configurar dataflows, y utilizar la información del dataflow con la interfaz de usuario NiFi
  • Realizar trazas de la vida de los datos, su origen, transformación y destino, utilizando la procedencia de los mismos
  • Organizar y simplificar dataflows
  • Administrar versiones de dataflows con el NiFi  Registry
  • Utilizar el lenguaje de expresión NiFi para controlar dataflows
  • Implementar métodos de optimización de dataflows, funciones de monitorización y características de reportes
  • Conectar dataflows con otros sistemas, como Kafka y HDFS
  • Describir las diferentes características de la seguridad en NiFi

Contenidos

Introducción a Apache NiFi

  • Descripción general de Cloudera Flow Management y NiFi
  • La interfaz de usuario de NiFi

Procesadores

  • Descripción general de los procesadores
  • Processor Surface Panel
  • Processor Configuration Panel

Conexiones

  • Anatomía de una conexión
  • Configuración de una conexión
  • Connector Context Menu

Dataflows

  • Command y Control de un Dataflow
  • Relaciones del procesador
  • Back Pressure
  • Prioritizers
  • Etiquetas

Grupos de procesos

  • Anatomía de un grupo de procesos
  • Puertos de entrada y salida

Procedencia de datos

  • Eventos de procedencia de datos
  • Linaje FlowFile
  • Reproducción de un FlowFile

Plantillas de Dataflow

  • Descripción general de las plantillas
  • Administración de plantillas

Registro de Apache NiFi

  • Descripción general del registro de Apache NiFi
  • Uso del registro

Atributos de FlowFile

  • Atributos de FlowFile
  • Enrutamiento de atributos

Lenguaje de expresión NiFi

  • Descripción general del lenguaje de expresión NiFi
  • Sintaxis
  • Editor de lenguaje de expresión
  • Establecer valores condicionales

Optimización de Dataflows

  • Optimización de un Dataflow
  • Tasa de control
  • Administración del cómputo

Arquitectura de NiFi

  • Descripción general de la arquitectura NiFi
  • Arquitectura de un clúster
  • Heartbeats
  • Administración de clústeres

Dataflows Site-to-Site

  • Teoría Site-to-Site
  • Arquitectura Site-to-Site
  • Anatomía de un grupo de proceso remoto
  • Añadir y configurar el grupos remotos de procesos

Cloudera Edge Management y MiNiFi

  • Descripción general de MiNiFi
  • Ejemplo de Walk-through

Monitorización y reportes

  • Monitorización desde NiFi
  • Descripción general de los reportes
  • Ejemplos del reporte de tareas comunes

Servicios del controlador

  • Descripción general de los servicios del controlador
  • Servicios comunes del controlador

Integración de NiFi con el ecosistema Cloudera

  • Arquitectura de la integración de NiFi
  • Procesadores del ecosistema NiFi
  • Análisis en profundidad de NiFi y Apache Hive
  • Análisis en profundidad de NiFi y Apache Kafka

Seguridad NiFi

  • Descripción general de la seguridad en NiFi
  • Securizar el acceso a la interfaz de usuario de NiFi
  • Autenticación
  • La importancia de Kerberos
  • Seguridad del registro NiFi
  • Resumen sobre la seguridad en NiFi

Convocatorias abiertas