Formation Data Mining with R
R est un langage de programmation gratuit à source ouverte pour l'informatique statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données au sein de sociétés et d'universités. R propose une grande variété de packages pour l'exploration de données.
Plan du cours
Sources de méthodes
- Intelligence artificielle
- Apprentissage automatique
- Statistics
- Sources de données
Prétraitement des données
- Importation/Exportation de données
- Exploration et visualisation des données
- Réduction de la dimensionalité
- Gestion des valeurs manquantes
- Paquets R
Tâches principales du data mining
- Analyse automatique ou semi-automatique de grandes quantités de données
- Extraction de modèles intéressants et inconnus auparavant
- groupes d'enregistrements de données (analyse de grappe)
- enregistrements inhabituels (détection d'anomalies)
- dépendances (minage des règles d'association)
Data mining
- Détection d'anomalies (détection de changements/déviations)
- Apprentissage des règles d'association (modélisation de dépendances)
- Agrégation
- Classification
- Régression
- Synthèse
- Minage des motifs fréquents
- Analyse de textes
- Arbres de décision
- Régression
- Neural Networks
- Minage des séquences
- Minage des motifs fréquents
Cherche-données, pêche aux données, fouille de données
Pré requis
Good R connaissances.
Les formations ouvertes requièrent plus de 3 participants.
Formation Data Mining with R - Booking
Formation Data Mining with R - Enquiry
Data Mining with R - Demande d'informations consulting
Demande d'informations consulting
Nos clients témoignent (1)
Very tailored to needs.
Yashan Wang
Formation - Data Mining with R
Traduction automatique
Cours à venir
Cours Similaires
From Data to Decision with Big Data and Predictive Analytics
21 HeuresPublic
Si vous essayez de comprendre les données auxquelles vous avez accès ou souhaitez analyser des données non structurées disponibles sur le réseau (comme Twitter, Linked in, etc.), ce cours est pour vous.
Il s’adresse principalement aux décideurs et aux personnes qui doivent choisir les données qui méritent d’être collectées et celles qui méritent d’être analysées.
Cela ne vise pas les personnes qui configurent la solution, ces personnes bénéficieront d'une vue d'ensemble.
Mode de livraison
Pendant le cours, des exemples concrets de technologies principalement open source seront présentés aux délégués.
De courtes conférences seront suivies de présentations et d'exercices simples des participants.
Contenu et logiciel utilisés
Tous les logiciels utilisés sont mis à jour à chaque exécution du cours, nous vérifions donc les dernières versions possibles.
Il couvre le processus d'obtention, de formatage, de traitement et d'analyse des données, afin d'expliquer comment automatiser le processus de prise de décision avec l'apprentissage automatique.
Data Mining and Analysis
28 HeuresObjectif :
Les délégués seront en mesure d'analyser des ensembles de données volumineuses, d'extraire des modèles, de choisir la bonne variable ayant un impact sur les résultats afin qu'un nouveau modèle soit prévu avec des résultats prédictifs.
Data Mining
21 HeuresLe cours peut être fourni avec tous les outils, y compris des logiciels gratuits d'exploration de données open source et des applications
Data Mining with Python
14 HeuresCette formation interactive (en ligne ou en personne) est destinée aux analystes de données et aux scientifiques des données qui souhaitent mettre en œuvre des techniques d'analyse de données avancées pour l'extraction de données à l'aide de Python.
À la fin de cette formation, les participants seront capables de :
- Comprendre les domaines importants de l'exploration de données, y compris le minage de règles d’association, l'analyse du sentiment des textes, la synthèse automatique de textes et la détection d'anomalies dans les données.
- Comparer et mettre en œuvre diverses stratégies pour résoudre les problèmes concrets de l'extraction de données.
- Comprendre et interpréter les résultats.
Format du cours permettant d'évaluer les participants
- Cours interactif et discussion.
- De nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire live.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Data Vault: Building a Scalable Data Warehouse
28 HeuresAu cours de cette formation en direct à France, les participants apprendront à construire un Data Vault.
À l'issue de cette formation, les participants seront en mesure de :
- Comprendre l'architecture et les concepts de conception derrière Data Vault 2.0, et son interaction avec Big Data, NoSQL et l'IA.
- Utiliser les techniques de mise en voûte des données pour permettre l'audit, le traçage et l'inspection des données historiques dans un entrepôt de données.
- Développer un processus ETL (Extract, Transform, Load) cohérent et reproductible.
- Construire et déployer des entrepôts hautement évolutifs et reproductibles.
Data Visualization
28 HeuresCe cours est destiné aux ingénieurs et aux décideurs travaillant dans l’exploration de données et l’exploration de connaissances.
Vous apprendrez à créer des parcelles de terrain efficaces et à présenter et à représenter vos données de manière à attirer les décideurs et à les aider à comprendre les informations cachées.
Data Mining & Machine Learning avec R
14 HeuresR est un langage de programmation libre et gratuit pour le calcul statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données dans les entreprises et les universités. R dispose d'une grande variété de packages pour l'exploration de données.
Data Science for Big Data Analytics
35 HeuresLes données volumineuses sont des ensembles de données si volumineux et complexes qu'un logiciel de traitement de données traditionnel ne permet pas de les traiter. Les défis du Big Data incluent la capture, le stockage, l'analyse, la recherche, le partage, le transfert, la visualisation, l'interrogation, la mise à jour et la confidentialité des informations.
Foundation R
7 HeuresCette formation dispensée par un formateur en direct dans France (en ligne ou sur site) s'adresse aux professionnels débutants qui souhaitent maîtriser les fondamentaux de R et savoir travailler avec des données.
À la fin de cette formation, les participants seront capables de :
- Comprendre l'environnement de programmation R et l'interface RStudio.
- Importer, manipuler et explorer des jeux de données en utilisant des commandes et packages R.
- Réaliser une analyse statistique de base et une synthèse de données.
- Générer des visualisations à la fois avec R de base et ggplot2.
- Gérer efficacement les espaces de travail, les scripts et les packages.
KNIME Analytics Platform for BI
21 HeuresKNIME Analytics Platform est l'une des principales options open source pour l'innovation pilotée par les données. Elle vous permet de découvrir le potentiel caché dans vos données, d'explorer de nouvelles informations ou de prévoir de nouveaux futurs. Avec plus de 1000 modules, des centaines d'exemples prêts à l'emploi, une gamme complète d'outils intégrés et le plus vaste choix d'algorithmes avancés disponibles, KNIME Analytics Platform est la boîte à outils idéale pour tout informaticien ou analyste métier.
Cette formation pour KNIME Analytics Platform est une occasion idéale pour les débutants, les utilisateurs expérimentés et les experts KNIME de se familiariser avec KNIME , d'apprendre à l'utiliser plus efficacement et à créer des rapports clairs et complets basés sur les workflows de KNIME
Oracle SQL Intermediate - Data Extraction
14 HeuresL'objectif du cours est de permettre aux participants d'acquérir une maîtrise dans l'utilisation du langage SQL avec la base de données Oracle pour l'extraction de données au niveau intermédiaire.
Process Mining
21 HeuresL'exploration de processus, ou Automated Business Process Discovery (ABPD), est une technique qui applique des algorithmes aux journaux d'événements dans le but d'analyser les processus d'entreprise. Le Process Mining va au-delà du stockage et de l'analyse des données ; il fait le lien entre les données et les processus et permet de comprendre les tendances et les modèles qui affectent l'efficacité des processus.
Format du cours permettant d'évaluer les participants
- Le cours commence par une vue d'ensemble des techniques les plus couramment utilisées pour l'exploration de processus. Nous discutons des différents algorithmes de découverte de processus et des outils utilisés pour découvrir et modéliser les processus basés sur des données brutes d'événements. Des études de cas réels sont examinées et des ensembles de données sont analysés en utilisant le framework open-source ProM.
Introductory R for Biologists
28 HeuresR est un langage de programmation gratuit à source ouverte pour l'informatique statistique, l'analyse de données et les graphiques. R est utilisé par un nombre croissant de gestionnaires et d'analystes de données au sein de sociétés et d'universités. R a également trouvé des adeptes parmi les statisticiens, ingénieurs et scientifiques sans compétences en programmation informatique et qui le trouvent facile à utiliser. Sa popularité est due à l'utilisation croissante de l'extraction de données pour divers objectifs, tels que fixer les prix des annonces, trouver plus rapidement de nouveaux médicaments ou affiner les modèles financiers. R propose une grande variété de packages pour l'exploration de données.
Statistics with SPSS Predictive Analytics Software
14 HeuresGoal :
Apprendre à travailler avec SPSS au niveau de l'indépendance
Les destinataires :
Analystes, chercheurs, scientifiques, étudiants et tous ceux qui souhaitent acquérir la capacité d'utiliser le progiciel SPSS et apprendre les techniques populaires d'exploration de données.
Introduction to Data Visualization with Tidyverse and R
7 HeuresPublic
Format du cours permettant d'évaluer les participants
À la fin de cette formation, les participants seront en mesure de :
Dans ce cours dispensé par un formateur, les participants apprendront à manipuler et visualiser des données en utilisant les outils inclus dans le Tidyverse.
Le Tidyverse est une collection de packages R polyvalents pour nettoyer, traiter, modéliser et visualiser des données. Parmi les packages inclus figurent : ggplot2, dplyr, tidyr, readr, purrr et tibble.
- Débutants en langage R
- Débutants en analyse de données et visualisation de données
- Partie cours, partie discussion, exercices et pratique intensive
- Effectuer une analyse de données et créer des visualisations attrayantes
- Tirer des conclusions utiles à partir de divers jeux de données d'exemples
- Filtrer, trier et résumer les données pour répondre aux questions exploratoires
- Transformer des données traitées en graphiques de ligne informatifs, diagrammes à barres et histogrammes
- Importer et filtrer les données provenant de diverses sources de données, y compris Excel, CSV et fichiers SPSS