- Durée : 1 jour
- Format : En présentiel ou à distance
- Prérequis : Expérience de base dans les domaines suivant :
– Langage de requête commun tel que SQL
– Outil d’ETL
– Modélisation des données
– Machine learning et / ou statistiques
– Programmation en Python
Expérience en développement applicatif. - Audience : Personnes souhaitant un aperçu des produits et services Google Cloud Platform orientés traitement des données et machine learning.
- Tarif : nous contacter
- Plus d’informations dans le catalogue de nos formations
Présentation détaillée de la formation
Module 1: Présentation de Google Cloud Platform
- Présentation des principes de base de la plateforme Google.
- Produits Big Data de Google Cloud Platform.
Module 2: Fondamentaux du calcul et du stockage
- CPU à la demande (Compute Engine).
- Un système de fichiers global (Cloud Storage).
- CloudShell.
- Atelier: Configurer un pipeline de traitement des données Ingest-Transform-Publish.
Module 3: Data Analytics sur le Cloud
- Tremplins vers le nuage.
- Cloud SQL: votre base de données SQL sur le cloud.
- Atelier: Importation de données dans CloudSQL et exécution de requêtes.
- Spark sur Dataproc.
- Travaux pratiques: recommandations d’apprentissage automatique avec Spark sur Dataproc.
Module 4: Mise à l’échelle de l’analyse des données
- Accès aléatoire rapide.
- Datalab.
- BigQuery.
- Atelier: Créer un ensemble de données d’apprentissage automatique.
Module 5: Apprentissage automatique
- Apprentissage automatique avec TensorFlow.
- Laboratoire: Effectuer ML avec TensorFlow
- Modèles pré-construits pour les besoins communs.
- Atelier: Utiliser des API ML.
Module 6: Architectures de traitement des données
- Architectures orientées message avec Pub / Sub.
- Création de pipelines avec Dataflow.
- Architecture de référence pour le traitement de données en temps réel et par lots.
Module 7: Résumé
- Pourquoi GCP?
- Où aller en partant d’ici
- Ressources supplémentaires