- Durée : 3 jours
- Format : En présentiel ou à distance
- Prérequis : Bonne maîtrise de l’ANSI SQL.
- Audience : Data Analysts, Business Analysts, Experts Business Intelligence, Data Engineers
- Tarif : nous contacter
- Plus d’informations dans le catalogue de nos formations
Présentation détaillée de la formation
Module 1: Introduction à Google Cloud Platform
- Mise en avant des défis d’analyse de données rencontrés par les data Analysts
- Comparaison du Big Data On-Premises par rapport au Cloud
- En savoir plus sur des cas concrets où l’analyse de données opérée sur le cloud a véritablement transformé l’entreprise
- Les bases pour naviguer dans un projet Google Cloud Platform
Module 2: Analyser de larges datasets avec BigQuery
- Exposition des tâches réalisées par le Data Analyst, ses défis et introduction aux outils de traitement des données dans GCP
- Demo: Analyser 10 milliards d’entrées avec Google BigQuery
- Exploration des 9 fonctionnalités fondamentales de Google BigQuery
- Comparaison des outils GCP pour les les analystes, les Data Scientists, et les Data Engineers
- Lab: Les bases de BigQuery
Module 3: Explorer un dataset public avec SQL
- Comparaison des techniques d’exploration de données les plus courantes
- Apprendre comment coder avec SQL en respectant de hauts standards de qualité
- Exploration des dataset Google BigQuery publics
- Prévisualisation: Google Data Studio
- Lab: Explorer votre dataset de e-commerce avec SQL dans Google BigQuery
Module 4: Nettoyer et transformer vos données avec Cloud Dataprep
- Examiner les 5 principes d’intégrité d’un dataset
- Caractériser la forme et les données asymétriques d’un dataset
- Nettoyer et transformer les données à l’aide de SQL
- Nettoyer et transformer les données en utilisant la nouvelle interface graphique: Introduction à Cloud Dataprep
- Lab: Création d’un pipeline de transformation des données avec Cloud Dataprep
Module 5: Visualiser les Insights et créer des requêtes planifiées
- Aperçu des principes de visualisation des données
- Approche de l’analyse exploratoire vs l’analyse explicative
- Démo: Google Data Studio UI
- Connexion de Google Data Studio à Google BigQuery
- Lab: comment construire un Dashboard de BI en utilisant Google Data Studio et BigQuery
Module 6: Stockage et ingestion de nouveaux ensembles de données
- Comparer les tables permanentes et temporaires
- Enregistrer et exporter les résultats de requête
- Aperçu des performances: cache de requête
- Lab: Ingestion de nouveaux jeux de données dans BigQuery
Module 7: Enrichir votre entrepôt de données avec JOINs
- Fusionner les tables de données historiques avec UNION
- Présentation des wildcards de tables pour des fusions faciles
- Examen des schémas de données: liaison de données entre plusieurs tables
- Exemples de jointures et pièges liés aux jointures
- Lab: Dépannage et résolution des problèmes liés aux jointures
Module 8: Partitionnement de vos requêtes et tables pour des informations avancées
- Examen des instructions SQL Case
- Présentation des fonctions de fenêtre analytique
- Protéger vos données avec le cryptage de champs unidirectionnel
- Discussion autour de la conception efficace de sous-requêtes et CTE
- Comparer les UDF SQL et Javascript
- Lab: Création de tables partitionnées par date dans BigQuery
Module 9: Conception de schémas à l’échelle: tableaux et structures dans BigQuery
- Comparer Google BigQuery à l’architecture des bases de données RDBMS traditionnelle
- Normalisation vs dénormalisation: compromis sur les performances
- Revue de schéma: le bon, le mauvais et le laid
- Tableaux et données imbriquées dans Google BigQuery
- Lab: Interrogation de données imbriquées et répétées
- Lab: Conception de schéma pour la performance: tableaux et structures dans BigQuery
Module 10: Optimisation des requêtes pour la performance
- Exploration d’un job BigQuery
- Calculer les tarifs BigQuery: coûts de stockage, de requête et de streaming
- Optimiser les requêtes pour le coût
Module 11: Contrôle de l’accès avec les meilleures pratiques de sécurité des données
- Meilleures pratiques de sécurité des données
- Contrôle des accès avec les vues autorisées
Module 12: Prédire les achats de retour des visiteurs avec BigQuery ML
- Introduction au ML
- Sélection de fonctionnalité
- Types de modèles
- Apprentissage automatique dans BigQuery
- Atelier: prédire les achats des visiteurs avec un modèle de classification avec BigQuery ML
Module 13: Dériver des informations à partir de données non structurées à l’aide du Machine Learning
- ML structuré vs non structuré
- Modèles ML préconstruits
- Atelier: Extraire, analyser et traduire du texte à partir d’images avec les API Cloud ML
- Atelier: Formation avec des modèles ML prédéfinis à l’aide de l’API Cloud Vision et d’AutoML
Module 14: Achèvement
- Résumé et conclusion du cours