Plan du cours
Introduction à Apache Iceberg
- Aperçu d'Apache Iceberg
- Révision des concepts de base
Plongée approfondie dans l'architecture Iceberg
- Analyse détaillée du format de table Iceberg
- Présentation détaillée de l'architecture, y compris la métadonnées et la disposition des fichiers
- Fonctionnement interne de l'évolution du schéma et de la partition
Installation avancée et configuration
- Configuration d'Iceberg pour une performance optimale dans différents environnements
- Intégration avec divers moteurs de traitement de données
- Configuration avancée : sécurité, chiffrement et contrôles d'accès
- Mise en place d'Iceberg dans un environnement distribué
Opérations et maintenance avancées
- Gestion de tables Iceberg à grande échelle
- Mise en œuvre et gestion de changements de schéma complexes
- Gestion de l'évolution des partitions et partitionnement caché
- Opérations CRUD avancées avec changements de schéma et de partition
Techniques d'optimisation des requêtes
- Techniques pour réduire la latence des requêtes
- Élagage de partitions et de fichiers
- Mise en cache des métadonnées et stratégies d'optimisation
- Mise en œuvre et test de techniques d'optimisation des requêtes
Optimisation des performances pour les grands ensembles de données
- Optimisation des performances pour les ensembles de données à grande échelle
- Utilisation des fonctionnalités intégrées d'Iceberg pour l'optimisation des performances
- Études de cas sur l'optimisation des performances dans des scénarios du monde réel
- Optimisation des performances pour les ensembles de données à grande échelle
Migration et intégration avancées des données
- Migration de structures de données complexes d'autres systèmes
- Intégration d'Iceberg avec des flux de données en temps réel
- Migration de jeux de données complexes et intégration de flux de données en temps réel
Fiabilité et cohérence
- Assurer la cohérence et l'intégrité des données dans les environnements distribués
- Mise en œuvre et gestion des garanties transactionnelles
- Gestion des pannes et mécanismes de récupération
- Mise en œuvre de fonctionnalités de fiabilité et de cohérence
Fonctionnalités avancées et personnalisation
- Implémentations de catalogues personnalisés
- Extension d'Iceberg avec des fonctionnalités personnalisées
- Mise en œuvre de catalogues personnalisés et extension des fonctionnalités d'Iceberg
Gouvernance et conformité des données
- Mise en œuvre de politiques de gouvernance des données
- Conformité aux réglementations sur les données
- Gestion des traînées d'audit et de la généalogie des données
- Mise en œuvre de fonctionnalités de gouvernance et de conformité
Résumé et étapes suivantes
Pré requis
- Connaissance des concepts de base, des opérations élémentaires et de la gestion des tables Iceberg
Public visé
- Ingénieurs de données
- Architectes de données
- Analystes de données
- Développeurs logiciels
Nos clients témoignent (5)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique