Passer au contenu

From Data to Insights with Google Cloud Platform

Ce cours de trois jours enseigne aux participants comment extraire de l’information grâce à l’analyse et à la visualisation de données à l’aide de Google Cloud Platform.

Le cours présente des scénarios interactifs et des ateliers pratiques où les participants explorent, exploitent, chargent, visualisent et extraient des informations à partir de divers ensembles de données BigQuery. Le cours couvre également le chargement des données, l’interrogation, la modélisation de schéma, l’optimisation des performances, la tarification des requêtes et la visualisation des données.

  • Durée : 3 jours
  • Format : En présentiel ou à distance
  • Prérequis : Bonne maîtrise de l’ANSI SQL.
  • Audience : Data Analysts, Business Analysts, Experts Business Intelligence, Data Engineers
  • Tarif : nous contacter
  • Plus d’informations dans le catalogue de nos formations

Présentation détaillée de la formation

 

Module 1: Introduction à Google Cloud Platform

  • Mise en avant des défis d’analyse de données rencontrés par les data Analysts
  • Comparaison du Big Data On-Premises par rapport au Cloud
  • En savoir plus sur des cas concrets où l’analyse de données opérée sur le cloud a véritablement transformé l’entreprise
  • Les bases pour naviguer dans un projet Google Cloud Platform 

 

Module 2: Analyser de larges datasets avec BigQuery

  • Exposition des tâches réalisées par le Data Analyst, ses défis et introduction aux outils de traitement des données dans GCP
  • Demo: Analyser 10 milliards d’entrées avec Google BigQuery
  • Exploration des 9 fonctionnalités fondamentales de Google BigQuery
  • Comparaison des outils GCP pour les les analystes, les Data Scientists, et les Data Engineers
  • Lab: Les bases de BigQuery

 

Module 3: Explorer un dataset public avec SQL

  • Comparaison des techniques d’exploration de données les plus courantes
  • Apprendre comment coder avec SQL en respectant de hauts standards de qualité
  • Exploration des dataset Google BigQuery publics
  • Prévisualisation: Google Data Studio
  • Lab: Explorer votre dataset de e-commerce avec SQL dans Google BigQuery

 

Module 4: Nettoyer et transformer vos données avec Cloud Dataprep

  • Examiner les 5 principes d’intégrité d’un dataset
  • Caractériser la forme et les données asymétriques d’un dataset 
  • Nettoyer et transformer les données à l’aide de SQL
  • Nettoyer et transformer les données en utilisant la nouvelle interface graphique: Introduction à Cloud Dataprep
  • Lab: Création d’un pipeline de transformation des données avec Cloud Dataprep

 

Module 5: Visualiser les Insights et créer des requêtes planifiées

  • Aperçu des principes de visualisation des données
  • Approche de l’analyse exploratoire vs l’analyse explicative
  • Démo: Google Data Studio UI
  • Connexion de Google Data Studio à Google BigQuery
  • Lab: comment construire un Dashboard de BI en utilisant Google Data Studio et BigQuery

 

Module 6: Stockage et ingestion de nouveaux ensembles de données

  • Comparer les tables permanentes et temporaires
  • Enregistrer et exporter les résultats de requête
  • Aperçu des performances: cache de requête
  • Lab: Ingestion de nouveaux jeux de données dans BigQuery

 

Module 7: Enrichir votre entrepôt de données avec JOINs

  • Fusionner les tables de données historiques avec UNION
  • Présentation des wildcards de tables pour des fusions faciles
  • Examen des schémas de données: liaison de données entre plusieurs tables
  • Exemples de jointures et pièges liés aux jointures
  • Lab: Dépannage et résolution des problèmes liés aux jointures

 

Module 8: Partitionnement de vos requêtes et tables pour des informations avancées

  • Examen des instructions SQL Case
  • Présentation des fonctions de fenêtre analytique
  • Protéger vos données avec le cryptage de champs unidirectionnel
  • Discussion autour de la conception efficace de sous-requêtes et CTE
  • Comparer les UDF SQL et Javascript
  • Lab: Création de tables partitionnées par date dans BigQuery

 

Module 9: Conception de schémas à l’échelle: tableaux et structures dans BigQuery

  • Comparer Google BigQuery à l’architecture des bases de données RDBMS traditionnelle
  • Normalisation vs dénormalisation: compromis sur les performances
  • Revue de schéma: le bon, le mauvais et le laid
  • Tableaux et données imbriquées dans Google BigQuery
  • Lab: Interrogation de données imbriquées et répétées
  • Lab: Conception de schéma pour la performance: tableaux et structures dans BigQuery

 

Module 10: Optimisation des requêtes pour la performance

  • Exploration d’un job BigQuery
  • Calculer les tarifs BigQuery: coûts de stockage, de requête et de streaming
  • Optimiser les requêtes pour le coût

 

Module 11: Contrôle de l’accès avec les meilleures pratiques de sécurité des données

  • Meilleures pratiques de sécurité des données
  • Contrôle des accès avec les vues autorisées

 

 

Module 12: Prédire les achats de retour des visiteurs avec BigQuery ML

  • Introduction au ML
  • Sélection de fonctionnalité
  • Types de modèles
  • Apprentissage automatique dans BigQuery
  • Atelier: prédire les achats des visiteurs avec un modèle de classification avec BigQuery ML

 

Module 13: Dériver des informations à partir de données non structurées à l’aide du Machine Learning

  • ML structuré vs non structuré
  • Modèles ML préconstruits
  • Atelier: Extraire, analyser et traduire du texte à partir d’images avec les API Cloud ML
  • Atelier: Formation avec des modèles ML prédéfinis à l’aide de l’API Cloud Vision et d’AutoML

 

Module 14: Achèvement

  • Résumé et conclusion du cours

 

Contactez-nous Vous avez des questions ou êtes intéressé.e par nos autres services Google Cloud ?
Nos experts sont heureux de vous aider !