Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Aperçu détaillé de la formation
- Introduction à l'IAUL (Intelligence Artificielle pour le Traitement du Langage Naturel)
- Comprendre l'IAUL
- Frameworks IAUL
- Applications commerciales de l'IAUL
- Récupération de données depuis la toile
- Travail avec diverses API pour récupérer des données textuelles
- Gestion et stockage de corpus textuels en sauvegardant le contenu et les métadonnées pertinentes
- Avantages de l'utilisation du cours intensif Python et NLTK
- Compréhension pratique d'un corpus et d'un jeu de données
- Pourquoi avons-nous besoin d'un corpus?
- Analyse de corpus
- Types d'attributs de données
- Différents formats de fichiers pour les corpus
- Préparation d'un jeu de données pour des applications IAUL
- Compréhension de la structure des phrases
- Composants de l'IAUL
- Compréhension du langage naturel
- Analyse morphologique - racine, mot, token, étiquettes de parole
- Analyse syntaxique
- Analyse sémantique
- Gestion des ambiguïtés
- Prétraitement des données textuelles
- Corpus - texte brut
- Segmentation en phrases
- Racinement pour le texte brut
- Lemmatisation du texte brut
- Suppression des mots vides
- Corpus - phrases brutes
- Word tokenization
- Word lemmatisation
- Travail avec des matrices terme-document/document-terme
- Segmentation textuelle en n-grammes et phrases
- Prétraitement pratique et personnalisé
- Corpus - texte brut
- Analyse de données textuelles
- Fonctionnalités de base de l'IAUL
- Analyseurs et analyse
- Étiquetage POS et étiqueteurs
- Détection d'entités nommées
- N-grammes
- Bag of words
- Fonctionnalités statistiques de l'IAUL
- Concepts d'algèbre linéaire pour l'IAUL
- Théorie probabiliste pour l'IAUL
- TF-IDF
- Vecteurisation
- Encodeurs et décodeurs
- Normalisation
- Modèles probabilistes
- Génie des caractéristiques avancées et IAUL
- Bases de word2vec
- Composants du modèle word2vec
- Raisonnement du modèle word2vec
- Extension du concept word2vec
- Application du modèle word2vec
- Cas d'étude : Application de bag of words : résumé automatique de texte en utilisant les algorithmes simplifiés et véritables de Luhn
- Fonctionnalités de base de l'IAUL
- Regroupement, classification et modélisation de sujets des documents
- Regroupement de documents et recherche de motifs (regroupement hiérarchique, k-means, etc.)
- Comparaison et classification de documents en utilisant TFIDF, Jaccard et mesures de distance cosinus
- Classification documentaire avec Naïve Bayes et Maximum Entropie
- Identification des éléments textuels importants Element
- Réduction de la dimensionnalité : Analyse en composantes principales, Décomposition en valeurs singulières, factorisation matricielle non négative
- Modélisation de sujets et récupération d'informations avec l'Analyse Sémantique Latente
- Extraction d'entités, Sentiment Analysis et modélisation de sujets avancée
- Positif vs. négatif : degré du sentiment
- Theorie de la réponse aux items (IRT)
- Étiquetage POS et son application : trouver des personnes, des lieux et des organisations mentionnés dans le texte
- Modélisation de sujets avancée : Allocation Dirichlet Latente
- Cas d'étude
- Extraction de commentaires utilisateurs non structurés
- Classification et visualisation des sentiments sur les données de revues de produits
- Extraction de journaux de recherche pour identifier des modèles d'utilisation
- Classification textuelle
- Modélisation de sujets
Pré requis
Connaissance et awareness des principes de l'IA linguistique (NLP) et appréciation des applications de l'intelligence artificielle dans les affaires
(Note: "awareness" is kept as-is because it doesn't have a direct translation that would make sense in this context without altering the meaning.)
21 Heures