Cloudera

Cloudera Machine Learning with Spark ML and MLlib

8 horas
695 €
Presencial o Live Virtual Class
Presencial o Live Virtual Class

Acerca de este curso

Este curso de Machine Learning con Spark ML y MLlib se basa en los conceptos del lenguaje clave de machine learning, Spark MLlib, y Spark ML. El curso incluye cobertura de collaborative filtering, clustering, clasificación, algoritmos y volumen de datos.

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso está dirigido a ingenieros de software que tienen experiencia básica en Linux además de experiencia con los lenguajes de programación Scala o Python (los ejemplos de código y ejercicios se podrán realizar en ambos lenguajes).

Se requiere un conocimiento de Apache Spark, por lo que se espera que los estudiantes hayan recibido previamente nuestro curso de formación de Developer Training for Spark and Hadoop.

Objetivos del curso

Al finalizar la formación, el participante aprenderá:

  • Tipos de datos, soporte estadístico, extracción de entidades, transformación de vectores y uso de StandardScaler class.
  • A tener una visión general de la reducción de la dimensionalidad.
  • Modelos de machine learning, regresión, apoyo de regresión lineal y regularización.
  • A usar data frames, transformadores y estimadores, y el uso de pipelines para generar modelos y regularización.

Contenidos

1. Vista general de Machine Learning

  • Introducción
  • Filtrado colaborativo
  • Clustering
  • Clasificación
  • Relación de Algoritmos y Volumen de Datos

2. Machine Learning con Spark MLlib

  • Introducción
  • Tipos de datos
  • Estadística básica
  • Extracción de características
  • Reducción de dimensionalidad
  • Modelos
  • Regresión

3. Machine Learning con Spark ML

  • Vista general de Spark ML
  • DataFrames
  • Transformadores y Estimadores
  • Pipelines
  • Clasificadores de Tree Classifiers
  • k-Means Clustering

Convocatorias abiertas