Big DATA

Google Cloud Platform Big Data and Machine Learning Fundamentals

Avec cette formation, vous apprendrez les fondamentaux du big data et du machine learning sur Google Cloud Platform (GCP). Vous aurez ainsi une vision d’ensemble de Google Cloud Platform et des capacités de traitement des données.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :
  • Connaissance des produits et services de GCP notamment ceux liés aux traitements des données et au machine learning
  • Connaissance des produits et services fondamentaux concernant le calcul et le stockage
  • Connaissance de Cloud SQL et de Dataproc
  • Connaissance de Datalab et BigQuery
  • Connaissance de TensorFlow et des APIs machine learning (ML)
  • Connaissance de Pub/Sub et de Dataflow

Public concerné

Toute personne souhaitant connaître les produits et services Google Cloud Platform orientés traitement des données et machine learning.

Prérequis

Expérience avec un langage de requête commun tel que SQL, avec un ETL, en modélisation des données, en machine learning et/ou statistiques, dans la programmation avec Python.
Vous recevrez par mail des informations permettant de valider vos prérequis avant la formation.

Programme de la formation

Présentation de Google Cloud Platform

  • Présentation des principes de base de la plateforme Google.
  • Produits big data de Google Cloud Platform.
 

Fondamentaux du calcul et du stockage

  • CPU à la demande (Compute Engine).
  • Système de fichiers global (Cloud Storage).
  • CloudShell.
Travaux pratiques
Configurer un pipeline de traitement des données Ingest-Transform-Publish.
 

Data Analytics sur le cloud

  • Tremplins vers le cloud.
  • Cloud SQL : votre base de données SQL sur le cloud.
  • Importation de vos données dans Cloud SQL et exécution de requêtes.
  • Spark sur Dataproc.
Travaux pratiques
Recommandations d’apprentissage automatique avec Spark sur Dataproc.
 

Mise à l’échelle de l’analyse des données

  • Accès aléatoire rapide.
  • Datalab.
  • BigQuery.
Travaux pratiques
Créer un ensemble de données d’apprentissage automatique.
 

Apprentissage automatique

  • Apprentissage automatique avec TensorFlow.
  • Modèles préconstruits pour des besoins communs.
Travaux pratiques
Effectuer du ML avec TensorFlow. Utiliser des API ML.
 

Architectures de traitement des données

  • Architectures orientées messages avec Pub/Sub.
  • Création de pipelines avec Dataflow.
  • Architecture de référence pour le traitement de données en temps réel et par lots.
 

Résumé

  • Pourquoi Google Cloud Platform ?
  • Que faire ensuite ?
  • Ressources supplémentaires.
 
 
 

Certification

Nous vous recommandons de suivre cette formation si vous souhaitez préparer la certification « Google Cloud Professional Data Engineer ».
 

Modalités pratiques

Méthodes pédagogiques;
Animation de la formation en français. Support de cours officiel en anglais.
 

Modalités d’évaluation

Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.