Cloudera
Cloudera Search Training

Elige la convocatoria

inscribirme Solicitar Info
Presencial
Duración 21 horas
Idioma
Precio 1595,00 €
Acerca de este curso
A quién va dirigido
Objetivos del curso
Contenidos
Próximos cursos

Acerca de este curso

A quién va dirigido

El curso Cloudera Search Training está dirigido a desarrolladores e ingenieros de datos que deseen indexar datos en Hadoop para crear consultas potentes en tiempo real y relacionar Cloudera Search con aplicaciones externas.

Es aconsejable que los asistentes al curso posean conocimientos de alguno de estos lenguajes de programación (Python/Scala) y nociones básicas de Linux. No se requieren conocimientos de Hadoop.

Objetivos del curso

El curso Cloudera Search Training ofrece un conocimiento global para tener la capacidad de operar y mantener un clúster Hadoop.

El curso está diseñado para capacitar al alumno en la instalación y configuración a través de balanceo de carga y tuning.

Contenidos

- Introducción.

  • Información general sobre Cloudera Search.
  • ¿Qué es Cloudera Search?.
  • Características útiles.
  • Casos de uso.
  • Arquitectura básica.

- Realizar consultas básicas.

  • Ejecución de una consulta en la interfaz de usuario de administración.
  • Sintaxis básica.
  • Las técnicas para Coincidencia aproximada.
  • El control de salida.

- Escribiendo consultas más potentes.

  • Relevancia y Filtros.
  • Analizadores de consulta.
  • Funciones.
  • Geoespacial Search.
  • Faceting.

- Preparación para indexar documentos.

  • Descripción general del proceso de indexación.
  • Entender Morphlines.
  • Generación de Archivos de configuración.
  • Diseño de esquemas.
  • Collection Management.

- La indexación Batch de datos HDFS con MapReduce.

  • Descripción general del proceso de indexación Batch HDFS.
  • Uso de la herramienta de indexación MapReduce.
  • Testing y solución de problemas.

- Indexación Near-Real-Time con Flume.

  • Visión general del proceso de indexación Near-Real-Time.
  • Introducción a Apache Flume.
  • Cómo realizar la indexación Near-Real-Time con Flume.
  • Testing y solución de problemas.

- Indexación de datos HBase con Lily.

  • ¿Qué es Apache HBase?.
  • La indexación Batch para HBase.
  • Indexación de Tablas HBase en Near-Real-Time.

- Indexación de datos en otros idiomas y formatos.

  • Tipos de campo y Analizador de Cadenas.
  • Etimología, Mapeo de caracteres, y Soporte de idiomas.
  • Esquema y Analysis Support en el Admin UI.
  • Metadatos y Extracción de Contenido con Apache Tika.
  • Indexación de tipos de archivos binarios con SolrCell.

- Mejorar la Calidad y el Rendimiento de Cloudera Search.

  • Entrega de Resultados Relevantes.
  • Cómo ayudar a los usuarios encontrar información.
  • Rendimiento de consultas y solución de problemas.

- Construir interfaces de usuario para Search.

  • Visión general de UI Search.
  • La construcción de una interfaz de usuario con Hue.
  • Integrar Search en aplicaciones personalizadas.

- Consideraciones para la Implementación.

  • Planificación de la implementación.
  • La determinación de las necesidades de hardware.
  • Descripción de la seguridad.
  • Colección de alias.

- Conclusión.

Próximos cursos

Fechas21 nov 2016 - 23 nov 2016 Horarios lun - mar - mie (09:00h - 17:00h) CiudadBarcelona IdiomaEspañol inscribirme