Plan du cours

Fondamentaux de Python pour les tâches de données

  • Installation de Python et configuration de l'environnement de développement
  • Fundamentals du langage : variables, types de données, structures de contrôle
  • Rédaction et exécution de scripts Python simples

Gestion des fichiers : CSV et Excel

  • Lecture et écriture de fichiers CSV à l'aide du module csv et Pandas
  • Manipulation de fichiers Excel à l'aide de openpyxl/xlrd et Pandas
  • Exercices pratiques : automatisation de conversions de fichiers

Introduction à Pandas

  • Bases des DataFrames : création, indexation, sélection et filtrage
  • Opérations d'agrégation et de groupement
  • Opérations courantes de nettoyage : valeurs manquantes, doublons et conversions de type

Introduction à Polars

  • Concepts de Polars et caractéristiques de performance comparées à Pandas
  • Opérations de base sur les DataFrames avec Polars
  • Exemple d'utilisation : quand choisir Polars plutôt que Pandas

Transformation avancée des données (intermédiaire)

  • Joins complexes, fonctions de fenêtre et opérations pivot avec Pandas
  • Modes de traitement efficaces des données avec Polars
  • Enchaînement d'opérations et optimisation de l'utilisation de la mémoire

Automatisation des processus avec Python

  • Rédaction de scripts pour automatiser les tâches de données répétitives et les étapes ETL
  • Planification de scripts avec des planificateurs de système d'exploitation ou des planificateurs de tâches
  • Journalisation, gestion des erreurs et notifications

Emballage de scripts et bonnes pratiques

  • Création d'exécutables avec PyInstaller ou des outils similaires
  • Structure de projet, environnements virtuels et gestion des dépendances
  • Bases du contrôle de version et documentation des flux de travail

Mini-projet pratique

  • Tâche de bout en bout : lecture de fichiers bruts, nettoyage et transformation des données, production de sorties
  • Automatisation du workflow et empaquetage en script ou exécutable exécutable
  • Examen et améliorations basés sur les commentaires des pairs

Résumé et étapes suivantes

Pré requis

  • Familiarité de base avec les concepts de programmation ou volonté d'apprendre
  • Confort dans l'utilisation de la ligne de commande ou du terminal pour l'installation de packages
  • Expérience de travail avec des tableurs (CSV/Excel)

Public cible

  • Analystes de données et personnel opérationnel automatisant des tâches de données
  • Ingénieurs analytiques recherchant un scripting ETL léger
  • Professionnels intéressés par des workflows de données pratiques basés sur Python
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires