Google Cloud

Data Engineering on Google Cloud Platform

Presencial o Live Virtual Class
Duración
28 horas
Precio
1850,00 €
Próximas convocatorias
Acerca de este curso
A quién va dirigido
Objetivos del curso
Contenidos
Convocatorias abiertas

Próximas convocatorias
Ver todas las convocatorias

01 oct 19
04 oct 19

Live Virtual Class | Inglés | De Martes a Viernes (09:00h - 17:00h)
28 h.    1850 €
11 nov 19
14 nov 19

Barcelona o Live Virtual Class | Español | De Lunes a Jueves (09:00h - 17:00h)
28 h.    1850 €
11 nov 19
14 nov 19

Madrid o Live Virtual Class | Español | De Lunes a Jueves (09:00h - 17:00h)
28 h.    1850 €

Acerca de este curso

TASTE OF TRAINING

Este curso proporciona a los alumnos una introducción al diseño y construcción de sistemas de procesamiento de datos en Google Cloud Platform. Mediante la combinación de demos y laboratorios, los alumnos aprenderán a como diseñar sistemas de procesado de datos, construir canales end-to-end, analizar datos y realizar machine learning. Este curso cubre datos estructurados, no estructurados y transferencia continua

A quién va dirigido

Este curso está dirigido a desarrolladores con experiencia que son responsables de la administración de las transformaciones big data, incluyendo:

  • Extracción, carga, transformación, limpieza y validación de datos.
  • Diseño de canales y arquitecturas para procesamiento de datos.
  • Creación y administración de machine learning y modelos estadísticos.
  • Realizar consultar a dataset, visualización de resultados de consultar y creación de reportes.

Para aprovechar al máximo este curso, los alumnos deben tener:

  • Completado el curso Google Cloud Fundamentals: Big Data & Machine Learning o experiencia equivalente.
  • Competencia básica con lenguaje de consultas común como SQL.
  • Experiencia con modelado, extracción, transformación y carga de datos.
  • Competencia en desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.
  • Familiaridad con Machine Learning y/o estadística.

Objetivos del curso

Al finalizar este curso, el alumno será capaz de:

  • Diseñar y construir sistemas de procesamiento de datos en Google Cloud Platform.
  • Procesar datos batch y transferencia continua implementando canales de autoescalado de datos en Cloud Dataflow.
  • Conseguir información de negoción de datasets enormes utilizando Google BigQuery.
  • Evaluar y predecir utilizando modelos machine learning utilizando Tensorflow y Cloud ML.
  • Hacer uso de datos no estructurado utilizando Spark y APIs ML en Cloud Datapro.
  • Habilitar información instantánea de la transferencia continua de datos.

Contenidos

Google Cloud Dataproc

  • Creación y administración de clusters.
  • Hacer uso de tipos de máquinas personalizadas y nodos de trabajo preventivos.
  • Escalado y borrado de Clusters.
  • Lab: Creación de clusters Hadoop con Google Cloud Dataproc.

Ejecución de trabajos de Dataproc

  • Ejecución de trabajos Pig y Hive.
  • Separación de almacenamiento y computación.
  • Lab: Ejecución de trabajos Hadoop y SPark con Dataproc.
  • Lab: Entrega y monitorización de trabajos.

Integración de Dataproc con Google Cloud Platform

  • Personalización de cluster con acciones de inicialización.
  • BigQuery Support.
  • Lab: Haciendo uso de los servicios de Google Cloud Platform.

Haciendo sentido de datos no estructurado con las APIs de Machine Learning de Google

  • APIs de Machine Learning de Google.
  • Casos de uso comunes de ML.
  • Invocación de APIs ML.
  • Lab: Adición de capacidades de Machine Learning al Análisis de Big Data.

Análisis de datos Serverless con BigQuery

  • ¿Qué es BigQuery?.
  • Consultas y funciones.
  • Lab: Escribir consultas en BigQuery.
  • Carga de datos a BigQuery.
  • Exportación de datos desde BigQuery.
  • Lab: Carga y exportación de datos.
  • Campos anidados y repetidos.
  • Realización de consultas a múltiples tablas.
  • Lab: Consultas complejas.
  • Rendimiento y tasación.

Canales Serverless y autoescalado de datos con Dataflow

  • Modelo de programación Beam.
  • Canales de datos en Beam Python.
  • Canales de datos en Beam Java.
  • Lab: Escritura de canal de dataflow.
  • Procesamiento Big Data escalable utilizando Beam.
  • Lab: MapReduce en Dataflow.
  • Incorporación adicional de datos.
  • Lab: Side inputs.
  • Tratamientos de datos continuos.
  • Arquitectura de referencia de GCP.

Comienzo con Machine Learning

  • Que es Machine Learning (ML).
  • ML efectivo: conceptos y tipos.
  • Datasets de ML, generalización.
  • Lab: Exploración y creación de dataset de ML.

Construcción de modelos ML con TensorFlow

  • Comienzo con TensorFlow.
  • Lab: Utilizando tf.learn.
  • Gráficos y loops de TensorFlow + Lab.
  • Lab: Uso de TensorFlow a bajo nivel + parada temprana.
  • Monitorización de enseñanza de ML.
  • Lab: Caracteres y gráficos de enseñanza de TensorFlow.

Escalado de modelos ML con CloudML

  • ¿Por qué Cloud ML?.
  • Empaquetar modelo de TensorFlow.
  • Enseñanza end-to-end.
  • Lab: Ejecución de modelo de ML en local y en la nube.

Ingeniería característica

  • Creación de buenas características.
  • Transformación de inputs.
  • Características sintéticas.
  • Pre procesamiento con Cloud ML.
  • Lab: Ingeniería característica.

Arquitectura de canales analíticos de transferencia continua

  • Procesamiento de datos continuos: Desafíos.
  • Tratamiento de volúmenes de datos variables.
  • Trabajo con datos no ordenados.
  • Lab: Diseño de canales de transferencia continua.

Ingesta de Volúmenes variables

  • ¿Qué es Cloud Pub/Sub?.
  • Como funciona: tópicos y subscripciones.
  • Lab: Simulador.

Implementación de canales de transferencia continua

  • Desafíos de procesamiento continuo.
  • Tratamiento de datos tardíos: marcas de agua, disparadores, acumulación.
  • Lab: Canal de procesamiento de datos continuo para el tráfico de datos a tiempo real.

Análisis de transferencia continua y paneles de información

  • Análisis de transferencia continua: de datos a decisiones.
  • Realización de consultas a datos continuos con bigQuery.
  • ¿Qué es Google Data Studio?.
  • Lab: montaje de panel de información a tiempo real para visualizados datos procesados.

Alto rendimiento y baja latencia con BigTable

  • ¿Qué es Cloud Spanner.
  • Diseño de esquemas de Bigtable.
  • Ingesta en Bigtable.
  • Lab: Transferencia continua a Bigtable.

Convocatorias abiertas

01 oct 19
04 oct 19

Live Virtual Class | Inglés | De Martes a Viernes (09:00h - 17:00h)
28 h.    1850 €
11 nov 19
14 nov 19

Barcelona o Live Virtual Class | Español | De Lunes a Jueves (09:00h - 17:00h)
28 h.    1850 €
11 nov 19
14 nov 19

Madrid o Live Virtual Class | Español | De Lunes a Jueves (09:00h - 17:00h)
28 h.    1850 €
02 dic 19
05 dic 19

Live Virtual Class | Inglés | De Lunes a Jueves (09:00h - 17:00h)
28 h.    1850 €