Plan du cours

Introduction à Teradata

Module 1 : Fondements et architecture de Teradata

  • Qu'est-ce que Teradata et à quoi sert-il ?
  • Architecture parallèle : AMPs, PEs, BYNET
  • Distribution des données et hachage
  • Concepts clés : sessions, spool, verrous
  • Connexion au système : Teradata Studio / BTEQ / SQL Assistant

Module 2 : Introduction à SQL dans Teradata

  • SELECT de base, WHERE, ORDER BY
  • Types de données et conversion
  • Fonctions mathématiques et date
  • Utilisation d'ALIAS, des expressions CASE
  • Opérateurs spécifiques à Teradata (TOP, QUALIFY, SAMPLE)
  • Pratique guidée : requêtes sur des tables réelles

Module 3 : Joins, sous-requêtes et opérateurs de jeu

  • INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN
  • Joins sans clause ON (produit cartésien)
  • Sous-requêtes scalaires et corrélées
  • UNION, INTERSECT, MINUS
  • Exercices pratiques sur l'intégration de données

Module 4 : Fonctions analytiques et OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Partitionnement des données avec PARTITION BY
  • Fenêtrage avec OVER() et ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Cas d'utilisation : KPIs, tendances, valeurs cumulées

Module 5 : Données et tables Management

  • Types de table : permanentes, volatiles, temporaires globales
  • Création et utilisation d'index secondaires et de jointure
  • Opérations d’insertion, mise à jour et suppression
  • MERGE, UPSERT et contrôle des doublons
  • Transactions et contrôle des verrous

Module 6 : Optimisation et ajustement de performance

  • Optimiseur Teradata : comment il choisit les plans d'exécution
  • Utilisation de EXPLAIN et COLLECT STATISTICS
  • Torsion et comment l'éviter
  • Meilleures pratiques en matière de conception des requêtes
  • Identification des goulets d’étranglement (spool, verrous, redistribution)
  • Pratique : comparaison des requêtes optimisées et non optimisées

Module 7 : Partitionnement et compression des données

  • Types de partitionnement : Range, Case, Multi-Level
  • Avantages et usages pratiques dans les grandes requêtes
  • Compression au niveau du bloc (BLC) et compression par colonnes
  • Avantages et limites

Module 8 : Chargement et extraction de données

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Chargement en masse vs. insertions par lots
  • Gestion des erreurs et des redémarrages
  • Exportation des résultats vers des fichiers ou des systèmes externes
  • Automatisation de base avec des scripts et utilitaires

Module 9 : Administration de base pour les utilisateurs techniques

  • Rôles et permissions
  • Contrôle des ressources (Query Bands, Priority Scheduler)
  • Suivi avec DBQLOGTBL, DBC.Tables, ResUsage
  • Meilleures pratiques pour les environnements partagés

Module 10 : Laboratoire d'intégration finale

  • Cas pratique de bout en bout :
  • Chargement des données
  • Transformation et agrégation
  • Création de KPIs avec les fonctions OLAP
  • Optimisation et EXPLAIN
  • Export final
  • Discussion sur les meilleures pratiques et erreurs courantes

Résumé et prochains pas

Pré requis

  • Compréhension des bases de données relationnelles et des concepts SQL
  • Expérience dans l'interrogation de grands ensembles de données ou dans la gestion d'environnements de données
  • Familiarité avec les objectifs de l'intelligence d'affaires ou des analyses

Public cible

  • Analystes de données et professionnels de l'intelligence d'affaires
  • Développeurs SQL et ingénieurs des données
  • Utilisateurs techniques gérant ou optimisant les données dans des environnements Teradata
 35 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires