Cloudera

Cloudera Training for Apache HBase

Elige la convocatoria

inscribirme
Presencial o virtual class
Duración
21 horas
Idioma
Precio
1360,00 €
Próximas convocatorias
Acerca de este curso
A quién va dirigido
Objetivos del curso
Contenidos
Convocatorias abiertas

Próximas convocatorias
Ver todas

09 oct 17
11 oct 17

Madrid | Español | Lunes - Martes - Miércoles (09:00h - 17:00h)
21 h.    1360 €
09 oct 17
11 oct 17

Barcelona | Español | Lunes - Martes - Miércoles (09:00h - 17:00h)
21 h.    1360 €

Acerca de este curso

El curso permite a los participantes almacenar y acceder a cantidades masivas de datos multi-estructurados y realizar cientos de miles de operaciones por segundo.

Apache HBase una base de datos NoSQL distribuida y escalable construida sobre Hadoop. HBase puede almacenar datos en tablas masivas que se componen de miles de millones de filas y de millones de columnas, servir los datos a muchos usuarios y aplicaciones en tiempo real, y proporcionar un acceso rápido y aleatorio de lectura/escritura tanto para usuarios como aplicaciones.

Este curso ayuda a los participantes a comprender lo que hacen los data scientists, los problemas que resuelven y las herramientas y técnicas que utilizan. A través de simulaciones en clase, los participantes aplican los métodos de data science a los retos del mundo real en diferentes industrias y, en última instancia, se preparan para las funciones de data scientist en el campo.

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

El curso está dirigido a desarrolladores y administradores que tengan la intención de usar HBase. Será útil tener experiencia previa con bases de datos y modelado de datos, pero no es un requisito necesario. Se asume el conocimiento de Java. No se requiere conocimiento previo de Hadoop.

Objetivos del curso

Al finalizar la formación, el participante conocerá:

  • Casos y ocasiones de uso de HBase, Hadoop y RDBMS.
  • Uso del shell de HBase para manipular directamente tablas de HBase.
  • Diseño de esquemas HBase óptimos para un almacenamiento y recuperación eficiente de datos.
  • Cómo conectarse a HBase utilizando Java API para insertar y recuperar datos en tiempo real.
  • Mejores prácticas para identificar y resolver cuellos de botella de rendimiento.

Contenidos

Introducción a Hadoop y Hbase/p>

  • ¿Qué es Big Data?
  • Introducción a Hadoop
  • Componentes de Hadoop
  • ¿Qué es Hbase?
  • ¿Por qué se usa HBase?
  • Puntos fuertes de Hbase
  • HBase en producción
  • Puntos debiles de Hbase

Tablas HBase

  • Conceptos Hbase
  • Fundamentos de una tabla HBase
  • Pensar en el diseño de tabla

HBase Shell

  • Creación de tablas con la HBase Shell
  • Trabajar con tablas
  • Trabajar con los datos de las tablas

Fundamentos de la Arquitectura de HBase

  • Regiones HBase
  • Arquitectura de un Cluster HBase
  • HBase y HDFS: Localidad de Datos

Hbase Schema Design

  • Consideraciones sobre el diseño
  • Diseño centrado en la Aplicación
  • Diseñar HBase Row Keys
  • Otros Características de las tablas

Acceso Básico a los datos mediante la API de HBase

  • Opciones para acceder a los datos
  • Creación y eliminación de las Tablas HBase
  • Recuperación de datos con Get
  • Recuperación de datos con Scan
  • Inserción y Actualización de Datos
  • Eliminación de datos

Características más avanzadas de la API HBase

  • Filtros
  • Mejores Prácticas
  • Coprocesadores HBase

HBase en el Cluster

  • Cómo HBase utiliza HDFS
  • Compactaciones y Splits
  • HBase Reads and Writes
  • Cómo HBase escribe datos
  • Cómo HBase lee datos
  • Bloqueo de chachés para lectura

HBase Performance Tuning

  • Familias de columnas: Consideraciones
  • Consideraciones sobre el diseño de esquemas
  • Configuración para Caching
  • Tratar con series de tiempo y datos secuenciales
  • Regiones: Pre-Splitting

Administración de HBase y Administración del Cluster

  • Demonios de HBase
  • Zookeeper
  • Alta Disponibilidad
  • HBase Balancer
  • Reparar tablas con hbck
  • Seguridad HBase

HBase Replicación y Backup

  • HBase replicación
  • Copia de seguridad HBase
  • MapReduce y HBase Clusters
  • Utilizar Hive e Impala con HBase
  • Uso de Hive e Impala con HBase

Conclusión

Apéndice A: Acceso de datos con Python y Thrift

  • Uso de Thrift
  • Trabajo con tablas
  • Obtención y colocación de datos
  • Escaneo de datos
  • Borrado de datos
  • Contadores
  • Filtros

Apéndice B: OpenTSDB

Convocatorias abiertas

09 oct 17
11 oct 17

Madrid | Español | Lunes - Martes - Miércoles (09:00h - 17:00h)
21 h.    1360 €
09 oct 17
11 oct 17

Barcelona | Español | Lunes - Martes - Miércoles (09:00h - 17:00h)
21 h.    1360 €