Plan du cours

Introduction à Apache Iceberg

  • Aperçu d'Apache Iceberg
  • Révision des concepts de base

Plongée approfondie dans l'architecture Iceberg

  • Analyse détaillée du format de table Iceberg
  • Présentation détaillée de l'architecture, y compris la métadonnées et la disposition des fichiers
  • Fonctionnement interne de l'évolution du schéma et de la partition

Installation avancée et configuration

  • Configuration d'Iceberg pour une performance optimale dans différents environnements
  • Intégration avec divers moteurs de traitement de données
  • Configuration avancée : sécurité, chiffrement et contrôles d'accès
  • Mise en place d'Iceberg dans un environnement distribué

Opérations et maintenance avancées

  • Gestion de tables Iceberg à grande échelle
  • Mise en œuvre et gestion de changements de schéma complexes
  • Gestion de l'évolution des partitions et partitionnement caché
  • Opérations CRUD avancées avec changements de schéma et de partition

Techniques d'optimisation des requêtes

  • Techniques pour réduire la latence des requêtes
  • Élagage de partitions et de fichiers
  • Mise en cache des métadonnées et stratégies d'optimisation
  • Mise en œuvre et test de techniques d'optimisation des requêtes

Optimisation des performances pour les grands ensembles de données

  • Optimisation des performances pour les ensembles de données à grande échelle
  • Utilisation des fonctionnalités intégrées d'Iceberg pour l'optimisation des performances
  • Études de cas sur l'optimisation des performances dans des scénarios du monde réel
  • Optimisation des performances pour les ensembles de données à grande échelle

Migration et intégration avancées des données

  • Migration de structures de données complexes d'autres systèmes
  • Intégration d'Iceberg avec des flux de données en temps réel
  • Migration de jeux de données complexes et intégration de flux de données en temps réel

Fiabilité et cohérence

  • Assurer la cohérence et l'intégrité des données dans les environnements distribués
  • Mise en œuvre et gestion des garanties transactionnelles
  • Gestion des pannes et mécanismes de récupération
  • Mise en œuvre de fonctionnalités de fiabilité et de cohérence

Fonctionnalités avancées et personnalisation

  • Implémentations de catalogues personnalisés
  • Extension d'Iceberg avec des fonctionnalités personnalisées
  • Mise en œuvre de catalogues personnalisés et extension des fonctionnalités d'Iceberg

Gouvernance et conformité des données

  • Mise en œuvre de politiques de gouvernance des données
  • Conformité aux réglementations sur les données
  • Gestion des traînées d'audit et de la généalogie des données
  • Mise en œuvre de fonctionnalités de gouvernance et de conformité

Résumé et étapes suivantes

Pré requis

  • Connaissance des concepts de base, des opérations élémentaires et de la gestion des tables Iceberg

Public visé

  • Ingénieurs de données
  • Architectes de données
  • Analystes de données
  • Développeurs logiciels
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires