Plan du cours

Architecture de Greenplum

  • Traitement parallèle et multiprocessus symétrique
  • Rôles des segments et configuration du cluster
  • Extensibilité et déplacement des données
  • Architecture de Greenplum Data Warehouse

Structures de table Greenplum

  • Tables distribuées versus tables aléatoires
  • Tables en tas versus tables en append-only
  • Formats de stockage ligne versus colonne
  • Tables partitionnées et clusterisées

Distribution des données et hachage

  • Logique de hachage et clés de distribution
  • Gestion du déséquilibre (skew) et impact sur les performances
  • Cartes de hachage et stratégies de placement des lignes

Indexation et optimisation des performances

  • Index clusterisés et non-clusterisés
  • Cas d'utilisation des index B-tree et bitmap
  • Scan d'index et comportement de stockage

Conception physique de la base de données

  • Normalisation et conception du modèle logique
  • Stratégies d'accès utilisateur et analyse de distribution
  • Démographie des données et décisions d'indexation

Techniques de dénormalisation

  • Données dérivées, tables résumées et préjointes
  • Tables en colonne comme partitionnement vertical
  • Data marts et vues matérialisées

SQL avancé et exécution des requêtes

  • Stratégies de jointure et redistribution
  • OLAP et fonctions de fenêtre
  • Tables temporaires, sous-requêtes et tables dérivées

Plans EXPLAIN et optimisation des requêtes

  • Lecture et interprétation de la sortie EXPLAIN
  • Analyse du coût et optimisation du plan
  • Déplacement des jointures et opérations locales par segment

Outils et bonnes pratiques de Greenplum

  • ANALYZE et VACUUM
  • Chargement et déplacement des données avec Nexus
  • Sécurité, autorisations et conseils sur les performances

Résumé et étapes suivantes

Pré requis

  • Une compréhension des bases de données relationnelles et du SQL
  • Une expérience avec les entrepôts de données ou les systèmes analytiques
  • Une familiarité avec les opérations en ligne de commande Linux

Public visé

  • Architectes et ingénieurs de données
  • Administrateurs de bases de données et responsables techniques
  • Développeurs BI et spécialistes d'analyse travaillant avec Greenplum
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires