Plan du cours

Aperçu détaillé de la formation

    Introduction à la PNL Comprendre les cadres de la PNL Applications commerciales de la PNL Récupérer des données sur le Web Travailler avec diverses API pour récupérer des données textuelles Travailler et stocker des corpus de textes en sauvegardant le contenu et les métadonnées pertinentes Avantages de l'utilisation du cours intensif Python et NLTK Compréhension pratique d'un corpus et d'un ensemble de données Pourquoi avons-nous besoin d'un corpus ? Analyse de corpus Types d'attributs de données Différents formats de fichiers pour les corpus Préparer un ensemble de données pour les applications PNL Comprendre la structure d'une phrase Composants de la PNL Compréhension du langage naturel Analyse morphologique - racine, mot, jeton, balises vocales Analyse syntaxique Analyse sémantique Gestion de l'ambiguïté Prétraitement des données textuelles Corpus - Texte brut Tokenisation de phrases Racine pour texte brut Lemmisation du texte brut Suppression des mots vides Phrases brutes de corpus Word tokenisation Word lemmatisation Travailler avec des matrices terme-document/document-terme Tokenisation de texte en n-grammes et phrases Prétraitement pratique et personnalisé Analyse des données textuelles Fonctionnalité de base des analyseurs NLP et analyse du marquage et des marqueurs POS Reconnaissance d'entités de nom N-grammes Sac de mots Caractéristiques statistiques de la PNL Concepts d'algèbre linéaire pour la PNL Théorie probabiliste pour la PNL Vectorisation TF-IDF Encodeurs et décodeurs Normalisation Modèles probabilistes Ingénierie de fonctionnalités avancée et PNL Bases de word2vec Composants du modèle word2vec Logique du modèle word2vec Extension du concept word2vec Application du modèle word2vec Étude de cas : Application du sac de mots : résumé automatique de texte à l'aide des algorithmes de Luhn simplifiés et vrais Regroupement de documents, classification et modélisation de sujets Regroupement de documents et exploration de modèles (clustering hiérarchique, k-means, clustering, etc.) Comparer et classer des documents à l'aide de mesures de distance TFIDF, Jaccard et cosinus Classification de documents à l'aide de Bayes naïfs et de l'entropie maximale Identifier les éléments de texte importants Réduire la dimensionnalité : analyse en composantes principales, décomposition en valeurs singulières factorisation matricielle non négative Modélisation de sujets et récupération d'informations à l'aide de l'analyse sémantique latente, extraction d'entités, analyse des sentiments et modélisation de sujets avancée Positif ou négatif : degré de sentiment Théorie de la réponse aux éléments Une partie du marquage vocal et son application : trouver des personnes, des lieux et des organisations mentionnés dans text Modélisation avancée de sujets : allocation de Dirichlet latente Études de cas Exploration d'avis d'utilisateurs non structurés Classification des sentiments et visualisation des revues de produits Exploration de données Journaux de recherche pour les modèles d'utilisation Classification de texte Modélisation de sujets

Pré requis

Connaissance et sensibilisation aux principes du NLP et appréciation des applications de l'IA dans l'entreprise.

  21 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Nos Clients témoignent (2)

Cours Similaires

Smart Robots for Developers

  84 heures

Catégories Similaires