Plan du cours

Introduction à Teradata

Module 1: Fondamentaux de Teradata et son architecture

  • Qu'est-ce que Teradata et à quoi sert-il ?
  • Architecture parallèle : AMPs, PEs, BYNET
  • Distribution des données et hashing
  • Concepts clés : sessions, spool, locks
  • Connexion au système : Teradata Studio / BTEQ / SQL Assistant

Module 2: Introduction à SQL dans Teradata

  • SELECT de base, WHERE, ORDER BY
  • Types de données et casting
  • Fonctions mathématiques et de date
  • Utilisation d'ALIAS, expressions CASE
  • Opérateurs spéciaux de Teradata (TOP, QUALIFY, SAMPLE)
  • Pratique guidée : requêtes sur des tables réelles

Module 3: Joins, sous-requêtes et opérateurs d'ensemble

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joins sans clause ON (produit cartésien)
  • Sous-requêtes scalaires et corrélatives
  • UNION, INTERSECT, MINUS
  • Exercices pratiques d'intégration de données

Module 4: Fonctions analytiques et OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Partitionnement des données avec PARTITION BY
  • Fenêtres avec OVER() et ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Cas d'utilisation : KPIs, tendances, cumuls

Module 5: Gestion des données et tables

  • Types de tables : permanentes, volatiles, temporaires globales
  • Création et utilisation d'index secondaires et join indexes
  • Insertions, mises à jour et suppression de enregistrements
  • MERGE, UPSERT et contrôle des doublons
  • Transactions et contrôle des locks

Module 6: Optimisation et tuning des performances

  • L'Optimizeur de Teradata : comment il décide des plans
  • Utilisation de EXPLAIN et COLLECT STATISTICS
  • Skew et comment l'éviter
  • Meilleures pratiques pour la conception des requêtes
  • Identification des goulets d'étranglement (spool, locks, redistribution)
  • Pratique : comparaison entre requêtes optimisées et non optimisées

Module 7: Partitionnement et compression des données

  • Types de partitionnement : Range, Case, Multi-Level
  • Avantages et utilisation pratique dans les requêtes à grande échelle
  • Compression au niveau des blocs (BLC) et compression par colonnes
  • Avantages et limitations

Module 8: Chargement et extraction de données

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Chargement massif vs. insertion par lot
  • Gestion des erreurs et réessais
  • Exportation de résultats vers des fichiers ou systèmes externes
  • Automatisation basique avec scripts et utilitaires

Module 9: Administration de base pour les utilisateurs techniques

  • Rôles et permissions
  • Contrôle des ressources (Query Bands, Priority Scheduler)
  • Surveillance avec DBQLOGTBL, DBC.Tables, ResUsage
  • Bonnes pratiques pour les environnements partagés

Module 10: Laboratoire final d'intégration

  • Cas pratique de bout en bout :
    • Chargement des données
    • Transformation et agrégation
    • Construction d'indicateurs avec les fonctions OLAP
    • Optimisation et explication
    • Exportation finale
  • Discussion sur les bonnes pratiques et les erreurs courantes

Pré requis

  • Compréhension des bases de données relationnelles et concepts de SQL
  • Expérience dans la requête de grands ensembles de données ou le travail dans des environnements de données
  • Familiarité avec les objectifs d'intelligence d'affaires ou l'analytique

Audience

  • Analystes de données et professionnels de l'intelligence d'affaires
  • Développeurs SQL et ingénieurs de données
  • Utilisateurs techniques qui gèrent ou optimisent des données dans des environnements Teradata
 35 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires