Formation Récupération de Données web avec Python
Web Scraping est une technique permettant d'extraire des données d'un site Web, puis de les enregistrer dans un fichier ou une base de données locale.
Cette formation en direct, animée par un instructeur (sur site ou à distance), est destinée aux développeurs souhaitant utiliser Python pour automatiser le processus d’exploration de nombreux sites Web afin d’extraire des données à des fins de traitement et d’analyse.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer Python et tous les paquets pertinents.
- Récupérer et analyser les données stockées sur de nombreux sites Web.
- Comprendre le fonctionnement des sites Web et la structure de leur HTML.
- Construire des robots d’exploration pour parcourir le web à grande échelle.
- Utiliser Selenium pour explorer les pages web pilotées par AJAX.
Format du cours permettant d'évaluer les participants
- Exposé interactif et discussion.
- De nombreux exercices et mises en pratique.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Ce cours suppose une connaissance de la programmation.
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Plan du cours
Introduction
Configuration de l'environnement de développement
Python Introduction : structures de données, conditions, gestion des fichiers, etc.
Python Packages pour le Web Scraping : Scrapy et BeautifulSoup
Comment fonctionne un site Web
Comment HTML est structuré
Faire une demande Web
Gratter une page HTML
Travailler avec XPath et CSS
Filtrage des données à l'aide d'ions Express réguliers
Création d'un robot d'exploration Web
Explorer les pages AJAX et JavaScript avec Selenium.
Meilleures pratiques de web scraping
Dépannage
Sommaire et conclusion
Pré requis
- Expérience de programmation, de préférence en Python. Si les participants ont une expérience de programmation dans un langage autre que Python, la formation peut être prolongée pour inclure des exercices Python plus introductifs.
Public
- Développeurs
Les formations ouvertes requièrent plus de 3 participants.
Formation Récupération de Données web avec Python - Réservation
Formation Récupération de Données web avec Python - Enquiry
Récupération de Données web avec Python - Demande d'informations consulting
Demande d'informations consulting
Nos clients témoignent (1)
De nombreux exemples et sujets ont été abordés, allant de l'investigation de base à la gestion des connexions et de la gestion des pages dynamiques.
Daniele Tagliaferro - Creditsafe Italia Srl
Formation - Web Scraping with Python
Traduction automatique
Cours à venir
Cours Similaires
Analyse de Données à Grande Échelle avec Python et Dask
14 HeuresCette formation en <loc> ; (en ligne ou sur site) est destinée aux data scientists et aux ingénieurs logiciels qui souhaitent utiliser Dask avec l'écosystème Python pour construire, mettre à l'échelle et analyser de grands ensembles de données.
A l'issue de cette formation, les participants seront capables de :
- Mettre en place l'environnement pour commencer à construire des traitements de big data avec Dask et Python.
- Explorer les fonctionnalités, les bibliothèques, les outils et les API disponibles dans Dask.
- Comprendre comment Dask accélère le calcul parallèle en Python.
- Apprendre à faire évoluer l'écosystème Python (Numpy, SciPy et Pandas) en utilisant Dask.
- Optimiser l'environnement Dask pour maintenir de hautes performances dans le traitement de grands ensembles de données.
Analyse de Données avec Python, Pandas et NumPy
14 HeuresCe formation en direct, dirigée par un formateur (en ligne ou sur site) est destinée aux développeurs et analystes de données intermédiaires qui souhaitent améliorer leurs compétences en analyse et manipulation des données à l'aide de Python, Pandas et NumPy.
À la fin de cette formation, les participants seront capables de :
- Configurer un environnement de développement comprenant Python, Pandas et NumPy.
- Créer une application d'analyse des données utilisant Pandas et NumPy.
- Réaliser des opérations avancées de préparation, de tri et de filtrage des données.
- Conduire des opérations agrégées et analyser les séries temporelles.
- Visualiser les données à l'aide de Matplotlib et d'autres bibliothèques de visualisation.
- Déboguer et optimiser leur code d'analyse des données.
FARM (FastAPI, React et MongoDB) Développement Full Stack
14 HeuresCe cours de formation dirigé par un instructeur (en ligne ou sur site) est destiné aux développeurs qui souhaitent utiliser la pile FARM (FastAPI, React et MongoDB) pour créer des applications web dynamiques, haute performance et évolutives.
À la fin de cette formation, les participants seront en mesure de :
- Mettre en place l'environnement de développement nécessaire intégrant FastAPI, React et MongoDB.
- Comprendre les concepts clés, les fonctionnalités et les avantages de la pile FARM.
- Apprendre à construire des API REST avec FastAPI.
- Apprendre à concevoir des applications interactives avec React.
- Développer, tester et déployer des applications (front end et back end) en utilisant la pile FARM.
Développement d'APIs avec Python et FastAPI
14 HeuresCette formation en direct (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser FastAPI avec Python pour créer, tester et déployer des API RESTful plus facilement et plus rapidement.
A l'issue de cette formation, les participants seront capables de :
- Configurer l'environnement de développement nécessaire pour développer des API avec Python et FastAPI.
- Créer des API plus rapidement et plus facilement en utilisant la bibliothèque FastAPI.
- Apprendre à créer des modèles de données et des schémas basés sur Pydantic et OpenAPI.
- Connecter les API à une base de données en utilisant SQLAlchemy.
- Implémenter la sécurité et l'authentification dans les API en utilisant les outils FastAPI.
- Construire des images conteneur et déployer des API web sur un serveur cloud.
Machine Learning avec Python, les Fondamentaux
14 HeuresL'objectif de ce cours est de fournir une compétence de base dans l'application Machine Learning des méthodes en pratique. Grâce à l'utilisation du langage de programmation Python et ses différentes bibliothèques, et sur la base d'une multitude d'exemples pratiques, ce cours enseigne comment utiliser les blocs de construction les plus importants Machine Learning, comment prendre des décisions de modélisation des données, interpréter les résultats des algorithmes et valider les résultats.
Notre objectif est de vous donner les compétences pour comprendre et utiliser les outils les plus fondamentaux de la boîte d'outils Machine Learning avec confiance et éviter les tombes communes des applications Data Science.
Apprentissage Automatique avec Python – 4 Jours
28 Heuresle but de ce cours est de fournir une compétence générale dans l’application des méthodes de machine learning dans la pratique. Grâce à l’utilisation du langage de programmation Python et de ses différentes bibliothèques, et basé sur une multitude d’exemples pratiques, ce cours enseigne comment utiliser les principaux éléments constitutifs de machine learning, comment faire des décisions de modélisation de données, interpréter les les sorties des algorithmes et valider les résultats.
notre objectif est de vous donner les compétences pour comprendre et utiliser les outils les plus fondamentaux de la boîte à outils machine learning en toute confiance et d’éviter les pièges communs des applications Data sciences.
Accélération des Flux de Travail Python Pandas avec Modin
14 HeuresCette formation en direct avec instructeur dans France (en ligne ou sur site) est destinée aux scientifiques des données et aux développeurs qui souhaitent utiliser Modin pour construire et mettre en œuvre des calculs parallèles avec Pandas afin d'accélérer l'analyse des données.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement nécessaire pour commencer à développer des flux de travail Pandas à l'échelle avec Modin.
- Comprendre les caractéristiques, l'architecture et les avantages de Modin.
- Connaître les différences entre Modin, Dask et Ray.
- Effectuer des opérations Pandas plus rapidement avec Modin.
- Mettre en œuvre l'ensemble de l'API et des fonctions Pandas.
Python pour la Génération de Langue Naturelle (NLG)
21 HeuresDans cette formation en direct animée par un formateur à France, les participants apprendront à utiliser Python pour produire du texte de haute qualité en langage naturel en construisant leur propre système NLG depuis zéro. Des études de cas seront également examinées et les concepts pertinents seront appliqués à des projets pratiques de création de contenu.
À la fin de cette formation, les participants pourront :
- Utiliser le NLG pour générer automatiquement du contenu dans divers secteurs, allant du journalisme au marché immobilier, en passant par l'actualité météo et sportive.
- Sélectionner et organiser le contenu source, planifier les phrases et préparer un système pour la génération automatisée de contenu original.
- Comprendre le pipeline NLG et appliquer les bonnes techniques à chaque étape.
- Comprendre l'architecture d'un système Natural Language Generation (NLG).
- Mettre en œuvre les algorithmes et modèles les plus appropriés pour l'analyse et l'ordonnancement.
- Tirer des données provenant de sources publiques ainsi que de bases de données curatées pour servir de matière première au texte généré.
- Remplacer les processus manuels et fastidieux d'écriture par la création automatisée de contenu générée par ordinateur.
Apprentissage automatique avancé avec Python
21 HeuresDans ce cours dirigé par un instructeur et en direct à France, les participants apprendront les techniques de machine learning les plus pertinentes et innovantes en Python tout en construisant une série d'applications démonstratives impliquant des images, de la musique, du texte et des données financières.
À la fin de ce cours, les participants seront capables de :
- Mettre en œuvre des algorithmes et techniques de machine learning pour résoudre des problèmes complexes.
- Appliquer l'apprentissage profond et semi-supervisé à des applications impliquant des images, de la musique, du texte et des données financières.
- Pousser les algorithmes Python à leur potentiel maximum.
- Utiliser des bibliothèques et packages tels que NumPy et Theano.
Python : Automatiser les Tâches Fastidieuses
14 HeuresCette formation en direct et dirigée par un instructeur en <loc> ; est basée sur le livre populaire, "Automate the Boring Stuff with Python" ;, d'Al Sweigart. Il s'adresse aux débutants et couvre les concepts essentiels de la programmation Python par le biais d'exercices pratiques et de discussions. L'accent est mis sur l'apprentissage de l'écriture de code afin d'augmenter considérablement la productivité au bureau.
À l'issue de cette formation, les participants sauront comment programmer en Python et appliqueront cette nouvelle compétence pour :
- Automatiser les tâches en écrivant des programmes Python simples.
- Écrire des programmes capables de reconnaître des motifs textuels grâce aux "expressions régulières".
- Générer et mettre à jour des feuilles de calcul Excel par programmation.
- Analyser des fichiers PDF et des documents Word.
- Explorer des sites web et extraire des informations provenant de sources en ligne.
- Écrire des programmes qui envoient des notifications par e-mail.
- Utiliser les outils de débogage de Python pour résoudre rapidement les erreurs.
- Contrôler la souris et le clavier par programmation pour cliquer et taper à votre place.
Programmation Python pour la Finance
35 HeuresPython est un langage de programmation qui a acquis une énorme popularité dans le secteur financier. Adopté par les plus grandes banques d’investissement et les hedge funds, il est utilisé pour créer un large éventail d’applications financières allant des programmes de négociation centraux aux systèmes de gestion des risques.
Dans cette formation en direct animée par un instructeur, les participants apprendront à utiliser Python pour développer des applications pratiques permettant de résoudre un certain nombre de problèmes spécifiques liés à la finance.
À la fin de cette formation, les participants seront en mesure de:
- Comprendre les fondamentaux du langage de programmation Python
- Télécharger, installer et maintenir les meilleurs outils de développement pour créer des applications financières en Python
- Sélectionner et utiliser les packages et techniques de programmation Python les plus appropriés pour organiser, visualiser et analyser les données financières provenant de diverses sources (CSV, Excel, bases de données, web, etc.)
- Développer des applications qui résolvent des problèmes liés à l’allocation d’actifs, à l’analyse des risques, à la performance des investissements et plus encore
- Déboguer, intégrer, déployer et optimiser une application Python
Public
- Développeurs
- Analystes
- Quants
Format du cours permettant d'évaluer les participants
- Partie magistrale, partie discussion, exercices et pratique intensive
Remarque
- Cette formation vise à fournir des solutions à certains des principaux problèmes rencontrés par les professionnels de la finance. Cependant, si vous avez un sujet, un outil ou une technique particulier(ère) que vous souhaitez approfondir ou élaborer, n’hésitez pas à nous contacter pour en discuter.
Python Avancé - 4 Jours
28 HeuresDans cette formation en direct, dirigée par un instructeur, les participants apprendront des techniques de programmation Python avancées, notamment comment appliquer ce langage polyvalent pour résoudre des problèmes dans des domaines tels que les applications distribuées, l'analyse et la visualisation de données, la programmation de l'interface utilisateur et les scripts de maintenance.
Programmation Python - 4 jours
28 HeuresCe cours est conçu pour ceux qui souhaitent apprendre le langage de programmation Python. L'accent est mis sur le langage Python, les bibliothèques de base, ainsi que sur la sélection des meilleures et des plus utiles bibliothèques développées par la communauté Python. Python alimente les entreprises et est utilisé par des scientifiques du monde entier – c'est l'un des langages de programmation les plus populaires.
Le cours peut être dispensé avec la dernière version 3.x de Python, accompagnée d'exercices pratiques exploitant toute sa puissance. Ce cours peut être délivré sur n'importe quel système d'exploitation (toutes les versions de UNIX, y compris Linux et Mac OS X, ainsi que Microsoft Windows).
Les exercices pratiques constituent environ 70 % du temps du cours, et environ 30 % sont des démonstrations et des présentations. Les discussions et les questions peuvent être posées tout au long du cours.
Note : la formation peut être adaptée à des besoins spécifiques sur demande avant la date prévue pour le cours.
Automatisation des Tests avec Selenium et Python
14 HeuresSelenium est un cadre open-source pour l'automatisation des tests d'applications web sur différents navigateurs. Avec Selenium 4, de nouvelles API WebDriver améliorées, des locateurs relatifs natifs et une meilleure prise en charge du réseau sont disponibles. Python offre une simplicité et une forte intégration avec les cadres de test comme Pytest, ce qui en fait un choix puissant pour le développement de suites d'automatisation de tests évolutives et maintenables.
Cette formation dirigée par un instructeur (en ligne ou sur site) est destinée aux testeurs et développeurs de niveau débutant à intermédiaire qui souhaitent utiliser Selenium avec Python pour automatiser les tests d'applications web dans des environnements réels.
À la fin de cette formation, les participants seront en mesure de :
- Installer et configurer Selenium avec Python dans un environnement de test.
- Créer des scripts d'automatisation robustes en utilisant Selenium WebDriver et Pytest.
- Appliquer le modèle Page Object (POM) pour des cadres de test maintenables.
- Exécuter des tests sur plusieurs navigateurs à l'aide de Selenium Grid.
- Intégrer des tests automatisés dans les pipelines CI/CD.
- Dépanner les problèmes courants et appliquer les meilleures pratiques pour la stabilité de l'automatisation.
Format du cours permettant d'évaluer les participants
- Cours interactif avec discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Résumé de texte avec Python
14 HeuresIn Python Machine Learning, the Text Summarization feature is able to read the input text and produce a text summary. This capability is available from the command-line or as a Python API/Library. One exciting application is the rapid creation of executive summaries; this is particularly useful for organizations that need to review large bodies of text data before generating reports and presentations.
In this instructor-led, live training, participants will learn to use Python to create a simple application that auto-generates a summary of input text.
A la fin de cette formation, les participants seront capables de :
- Use a command-line tool that summarizes text.
- Design and create Text Summarization code using Python libraries.
- Evaluate three Python summarization libraries: sumy 0.7.0, pysummarization 1.0.4, readless 1.0.17
Audience
- Développeurs
- Scientifiques des données
Format du cours permettant d'évaluer les participants
- Une partie de cours, une partie de discussion, des exercices et beaucoup de pratique.