Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Fondements du Data Warehousing
- Objectif, composants et architecture de l'entrepôt de données
- Data marts, entrepôts d'entreprise et modèles lakehouse
- Principes fondamentaux de l'OLTP vs OLAP et séparation des charges de travail
Modélisation dimensionnelle
- Faits, dimensions et grain
- Schéma étoile vs schéma flocon de neige
- Types de dimensions évoluant lentement et gestion
Processus ETL et ELT
- Stratégies d'extraction à partir de l'OLTP et des API
- Transformations, nettoyage des données et conformité
- Modèles de chargement, orchestration et gestion des dépendances
Gestion de la qualité des données et de la métadonnées
- Profilage des données et règles de validation
- Alignement des données maîtres et de référence
- Lignée, catalogues et documentation
Analyse et performance
- Concepts de cubage, agrégats et vues matérialisées
- Partitionnement, clustering et indexation pour l'analyse
- Gestion des charges de travail, mise en cache et optimisation des requêtes
Sécurité et gouvernance
- Contrôle d'accès, rôles et sécurité au niveau des lignes
- Considérations de conformité et audit
- Pratiques de sauvegarde, récupération et fiabilité
Architectures modernes
- Entrepôts de données cloud et élasticité
- Ingestion en flux et analyse quasi temps réel
- Optimisation des coûts et monitoring
Projet final : Du source au schéma étoile
- Modélisation d'un processus métier en faits et dimensions
- Construction d'un workflow ETL ou ELT complet
- Publication de tableaux de bord et validation des métriques
Résumé et étapes suivantes
Pré requis
- Une compréhension des bases de données relationnelles et du SQL
- Une expérience en analyse de données ou en reporting
- Une familiarité de base avec des plateformes de données dans le cloud ou sur site
Audience
- Analystes de données en transition vers le data warehousing
- Développeurs BI et ingénieurs ETL
- Architectes de données et responsables d'équipe
35 Heures
Nos clients témoignent (3)
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique