Plan du cours

Architecture de Greenplum

  • Traitement parallèle et multi-processeur symétrique
  • Rôles des segments et configuration du cluster
  • Echelleabilité et mouvement des données
  • Architecture de Greenplum Data Warehouse

Structures des tables de Greenplum

  • Tables distribuées vs. assignation aléatoire
  • Tables tas vs. tables en mode append-only
  • Formats de stockage par ligne et par colonne
  • Tables partitionnées et regroupées

Distribution des données et hachage

  • Bilan logique du hachage et clés de distribution
  • Gestion des écarts et impact sur les performances
  • Cartes de hachage et stratégies d'affectation des lignes

Index et optimisation des performances

  • Indexes regroupés et non regroupés
  • Cas d'utilisation des index B-tree et bitmap
  • Balayages d'index et comportement de stockage

Développement physique Database

  • Normalisation et conception du modèle logique
  • Stratégies d'accès des utilisateurs et analyse de distribution
  • Démographie des données et décisions sur l'indexation

Techniques de dénormalisation

  • Données dérivées, tables de résumé et pré-joins
  • Tables par colonnes comme partitionnement vertical
  • Data marts et vues matérialisées

Avancé SQL et exécution des requêtes

  • Stratégies de jointure et redistribution
  • Fonctions OLAP et WINDOW
  • Tables temporaires, sous-requêtes et tables dérivées

Plans EXPLAIN et ajustement des requêtes

  • Lecture et interprétation du résultat EXPLAIN
  • Analyse de coûts et optimisation des plans
  • Déplacement jointure et opérations locales aux segments

Utilitaires Greenplum et meilleures pratiques

  • ANALYZE et VACUUM
  • Chargement et mouvement de données avec Nexus
  • Sécurité, permissions et conseils pour les performances

Résumé et prochains pas

Pré requis

  • Une compréhension des bases de données relationnelles et SQL
  • Expérience avec les entrepôts de données ou les systèmes analytiques
  • Familiarité avec les opérations en ligne de commande Linux

Public cible

  • Architectes et ingénieurs de données
  • Database administrateurs et chefs techniques
  • Développeurs BI et spécialistes analytiques travaillant avec Greenplum
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires