Plan du cours
Introduction à Apache Iceberg
- Aperçu d'Apache Iceberg
- Importance et cas d'utilisation dans l'architecture moderne des données
- Principales fonctionnalités et avantages
Concepts de base
- Format et architecture des tables Iceberg
- Comparaison avec d'autres formats de table
- Partitionnement et évolution du schéma
- Voyage dans le temps et versionnement des données
Configuration d'Apache Iceberg
- Installation et configuration
- Intégration d'Iceberg avec divers moteurs de traitement des données
- Configuration d'un environnement Iceberg sur une machine locale
Opérations de base
- Création et gestion des tables Iceberg
- Écriture dans et lecture depuis les tables Iceberg
- Opérations CRUD de base
Migration des données et intégration
- Migration des données depuis Hive et d'autres systèmes vers Iceberg
- Intégration avec les outils de BI
- Migration d'un jeu de données d'exemple vers Iceberg
Optimisation des performances
- Techniques d'optimisation des performances
- Optimisation des requêtes et des scans de données
- Optimisation des performances dans Iceberg
Aperçu des fonctionnalités avancées
- Évolution de la partition et partitionnement masqué
- Évolution de la table et modifications du schéma
- Voyage dans le temps et fonctionnalités de retour en arrière
- Mise en œuvre des fonctionnalités avancées d'Iceberg
Résumé et étapes suivantes
Pré requis
- Familiarité avec des concepts tels que les tables, les schémas, les partitions et l'ingestion de données
- Connaissances de base en SQL
Public cible
- Ingénieurs de données
- Architectes de données
- Analystes de données
- Développeurs logiciels
Nos clients témoignent (5)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique