[SESSION COMPLÈTE] 15 décembre 2022 – 9h-18h
Les fondamentaux du Big Data et du Machine Learning sur Google Cloud Platform
GCP100B
1 jour (7 heures)
Description du cours
Ce cours d’une journée présente aux participants les capacités de Big Data et de Machine Learning de Google Cloud Platform (GCP). Il fournit un aperçu rapide de Google Cloud Platform et une vue plus approfondie des capacités de traitement des données.
Objectifs pédagogiques
Ce cours permet aux participants d’acquérir les compétences suivantes:
Connaissance des produits et services de Google Cloud Platform, particulièrement ceux liés au traitement des données et au machine learning
Connaissance des produits et services fondamentaux concernant le calcul et le stockage
Connaissance de Cloud SQL et de Dataproc
Connaissance de Datalab et BigQuery
Connaissance de TensorFlow et des APIs Machine Learning
Connaissance de Pub / Sub et de Dataflow
Prérequis
Pour tirer le meilleur parti de ce cours, les participants doivent disposer des éléments suivants:
expérience avec un langage de requête commun tel que SQL
expérience avec un ETL
expérience de modélisation des données
expérience en machine learning et / ou statistiques
expérience avec la programmation en Python
Public cible
Ce cours est destiné aux participants suivants:
Participants désirant un aperçu des produits et services Google Cloud Platform orientés traitement des données et machine learning.
Programme de formation
Module 1: Présentation de Google Cloud Platform
Présentation des principes de base de la plateforme Google.
Produits Big Data de Google Cloud Platform.
Module 2: Fondamentaux du calcul et du stockage
CPU à la demande (Compute Engine).
Un système de fichiers global (Cloud Storage).
CloudShell.
Atelier: Configurer un pipeline de traitement des données Ingest-Transform-Publish.
Module 3: Data Analytics sur le Cloud
Tremplins vers le nuage.
Cloud SQL: votre base de données SQL sur le cloud.
Atelier: Importation de données dans CloudSQL et exécution de requêtes.
Spark sur Dataproc.
Travaux pratiques: recommandations d’apprentissage automatique avec Spark sur Dataproc.
Module 4: Mise à l’échelle de l’analyse des données
Accès aléatoire rapide.
Datalab.
BigQuery.
Atelier: Créer un ensemble de données d’apprentissage automatique.
Module 5: Apprentissage automatique
Apprentissage automatique avec TensorFlow.
Laboratoire: Effectuer ML avec TensorFlow
Modèles pré-construits pour les besoins communs.
Atelier: Utiliser des API ML.
Module 6: Architectures de traitement des données
Architectures orientées message avec Pub / Sub.
Création de pipelines avec Dataflow.
Architecture de référence pour le traitement de données en temps réel et par lots.
Module 7: Résumé
Pourquoi GCP ?
Où aller en partant d’ici
Ressources supplémentaires