Cloudera Machine Learning with Spark ML and MLlib

Presencial / Live Virtual Class

8 horas

695.00 €

Solicitar Info

Actualmente no existen convocatorias programadas para estos cursos

Acerca de este curso

Este curso de Machine Learning con Spark ML y MLlib se basa en los conceptos del lenguaje clave de machine learning, Spark MLlib, y Spark ML. El curso incluye cobertura de collaborative filtering, clustering, clasificación, algoritmos y volumen de datos.

PUE es Strategic Partner de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

A quién va dirigido

Este curso está dirigido a ingenieros de software que tienen experiencia básica en Linux además de experiencia con los lenguajes de programación Scala o Python (los ejemplos de código y ejercicios se podrán realizar en ambos lenguajes).

Se requiere un conocimiento de Apache Spark, por lo que se espera que los estudiantes hayan recibido previamente nuestro curso de formación de Developer Training for Spark and Hadoop.

Objetivos del curso

Al finalizar la formación, el participante aprenderá:

Tipos de datos, soporte estadístico, extracción de entidades, transformación de vectores y uso de StandardScaler class.
A tener una visión general de la reducción de la dimensionalidad.
Modelos de machine learning, regresión, apoyo de regresión lineal y regularización.
A usar data frames, transformadores y estimadores, y el uso de pipelines para generar modelos y regularización.

Contenidos

1. Vista general de Machine Learning

Introducción
Filtrado colaborativo
Clustering
Clasificación
Relación de Algoritmos y Volumen de Datos

2. Machine Learning con Spark MLlib

Introducción
Tipos de datos
Estadística básica
Extracción de características
Reducción de dimensionalidad
Modelos
Regresión

3. Machine Learning con Spark ML

Vista general de Spark ML
DataFrames
Transformadores y Estimadores
Pipelines
Clasificadores de Tree Classifiers
k-Means Clustering

Próximas convocatorias

Actualmente no existen convocatorias programadas para estos cursos

Para más información:

training@pue.es

BCN: (+34) 93 206 02 49

¿Dónde estamos?