Plan du cours
Fondamentaux de Python pour les tâches de données
- Installation de Python et configuration de l'environnement de développement
- Fundamentals du langage : variables, types de données, structures de contrôle
- Rédaction et exécution de scripts Python simples
Gestion des fichiers : CSV et Excel
- Lecture et écriture de fichiers CSV à l'aide du module csv et Pandas
- Manipulation de fichiers Excel à l'aide de openpyxl/xlrd et Pandas
- Exercices pratiques : automatisation de conversions de fichiers
Introduction à Pandas
- Bases des DataFrames : création, indexation, sélection et filtrage
- Opérations d'agrégation et de groupement
- Opérations courantes de nettoyage : valeurs manquantes, doublons et conversions de type
Introduction à Polars
- Concepts de Polars et caractéristiques de performance comparées à Pandas
- Opérations de base sur les DataFrames avec Polars
- Exemple d'utilisation : quand choisir Polars plutôt que Pandas
Transformation avancée des données (intermédiaire)
- Joins complexes, fonctions de fenêtre et opérations pivot avec Pandas
- Modes de traitement efficaces des données avec Polars
- Enchaînement d'opérations et optimisation de l'utilisation de la mémoire
Automatisation des processus avec Python
- Rédaction de scripts pour automatiser les tâches de données répétitives et les étapes ETL
- Planification de scripts avec des planificateurs de système d'exploitation ou des planificateurs de tâches
- Journalisation, gestion des erreurs et notifications
Emballage de scripts et bonnes pratiques
- Création d'exécutables avec PyInstaller ou des outils similaires
- Structure de projet, environnements virtuels et gestion des dépendances
- Bases du contrôle de version et documentation des flux de travail
Mini-projet pratique
- Tâche de bout en bout : lecture de fichiers bruts, nettoyage et transformation des données, production de sorties
- Automatisation du workflow et empaquetage en script ou exécutable exécutable
- Examen et améliorations basés sur les commentaires des pairs
Résumé et étapes suivantes
Pré requis
- Familiarité de base avec les concepts de programmation ou volonté d'apprendre
- Confort dans l'utilisation de la ligne de commande ou du terminal pour l'installation de packages
- Expérience de travail avec des tableurs (CSV/Excel)
Public cible
- Analystes de données et personnel opérationnel automatisant des tâches de données
- Ingénieurs analytiques recherchant un scripting ETL léger
- Professionnels intéressés par des workflows de données pratiques basés sur Python
Nos clients témoignent (5)
Le fait d'avoir plus d'exercices pratiques utilisant des données plus similaires à celles que nous utilisons dans nos projets (images satellites au format raster)
Matthieu - CS Group
Formation - Scaling Data Analysis with Python and Dask
Traduction automatique
J'ai trouvé que le formateur était très compétent et a répondu aux questions avec assurance pour clarifier la compréhension.
Jenna - TCMT
Formation - Machine Learning with Python – 2 Days
Traduction automatique
Très bonne préparation et expertise de l'animateur, communication parfaite en anglais. Le cours était pratique (exercices + partage d'exemples d'usage).
Monika - Procter & Gamble Polska Sp. z o.o.
Formation - Developing APIs with Python and FastAPI
Traduction automatique
L'explication
Wei Yang Teo - Ministry of Defence, Singapore
Formation - Machine Learning with Python – 4 Days
Traduction automatique
Le formateur développe la formation en fonction du rythme des participants
Farris Chua
Formation - Data Analysis in Python using Pandas and Numpy
Traduction automatique