Plan du cours
I. Introduction et préliminaires
1. Vue d'ensemble
- Rendre R plus convivial, R et les interfaces graphiques disponibles
- Rstudio
- Logiciels connexes et documentation
- R et les statistiques
- Utiliser R de manière interactive
- Une session d'introduction
- Obtenir de l'aide sur les fonctions et les caractéristiques
- Commandes R, sensibilité à la casse, etc.
- Rappel et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
- Permanence des données et suppression d'objets
- Go Pratique de la programmation : scripts autonomes, bonne lisibilité, par exemple scripts structurés, documentation, markdown
- installation de paquets ; CRAN et Bioconductor
2. Lecture des données
- Fichiers Txt (read.delim)
- Fichiers CSV
3. Manipulations simples ; nombres et vecteurs + tableaux
- Vecteurs et affectation
- Arithmétique vectorielle
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
- Tableaux
- Indexation des tableaux. Sous-sections d'un tableau
- Matrices d'indexation
- La fonction array() + les opérations simples sur les tableaux, par exemple la multiplication, la transposition.
- Autres types d'objets
4. Listes et cadres de données
- Les listes
- Construction et modification de listes
- Concaténation de listes
- Cadres de données
- Création de cadres de données
- Travailler avec des cadres de données
- Attacher des listes arbitraires
- Gestion du chemin de recherche
5. Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison d'ensembles de données
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, (), avec les tableaux
- Manipulation de caractères, paquetage stringr
- brève introduction à grep et regexpr
6. En savoir plus sur la lecture de données
- Fichiers XLS, XLSX
- paquets readr et readxl
- Données SPSS, SAS, Stata,... et autres formats
- Exporter des données vers txt, csv et d'autres formats
6. Groupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
- Introduction à apply, lapply, sapply, tapply
7. Les fonctions
- Création de fonctions
- Arguments facultatifs et valeurs par défaut
- Nombre variable d'arguments
- Portée et ses conséquences
8. Graphiques simples en R
- Création d'un graphique
- Graphiques de densité
- Graphiques en points
- Graphiques à barres
- Graphiques linéaires
- Graphiques circulaires
- Diagrammes en boîte
- Diagrammes de dispersion
- Combinaison de graphiques
II. Analyse statistique dans R
1. Distributions de probabilités
- R en tant qu'ensemble de tableaux statistiques
- Examen de la distribution d'un ensemble de données
2. Tests d'hypothèses
- Tests concernant la moyenne d'une population
- Test du rapport de vraisemblance
- Tests à un et deux échantillons
- Test d'ajustement du chi-carré Goodness-of-fit
- Statistique de Kolmogorov-Smirnov à un échantillon
- Test de Wilcoxon Signé-Rank
- Test à deux échantillons
- Test de la somme des rangs de Wilcoxon
- Test de Mann-Whitney
- Test de Kolmogorov-Smirnov
3. Tests multiples d'hypothèses
- Erreur de type I et FDR
- Courbes ROC et AUC
- Procédures de tests multiples (BH, Bonferroni, etc.)
4. Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur les modèles
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés
- Familles
- La fonction glm()
- Classification
- Régression logistique
- Analyse discriminante linéaire
- Apprentissage non supervisé
- Analyse des composantes principales
- Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
5. Analyse de survie (survival package)
- Objets de survie dans r
- Estimation de Kaplan-Meier, test de log-rank, régression paramétrique
- Bandes de confiance
- Analyse de données censurées (intervalle censuré)
- Modèles PH de Cox, covariables constantes
- Modèles PH de Cox, covariables dépendantes du temps
- Simulation : Comparaison de modèles (comparaison de modèles de régression)
6. Analyse de la variance
- ANOVA à une voie
- Classification de l'ANOVA à deux voies
- MANOVA
III. Problèmes pratiques en bioinformatique
- Brève introduction au paquet limma
- Flux de travail pour l'analyse des données de microréseaux
- Téléchargement des données à partir de GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Traitement des données (QC, normalisation, expression différentielle)
- Tracé de volcan
- Exemples de clustering + heatmaps
Nos clients témoignent (5)
comment le formateur démontre ses connaissances dans le sujet qu'il enseigne
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Formation - Data Vault: Building a Scalable Data Warehouse
Traduction automatique
Très utile car cela m'aide à comprendre ce que nous pouvons faire avec les données dans notre contexte. Cela m'aidera également
Nicolas NEMORIN - Adecco Groupe France
Formation - KNIME Analytics Platform for BI
Traduction automatique
J'ai vraiment apprécié les exercices de transmission manuelle.
Yunfa Zhu - Environmental and Climate Change Canada
Formation - Foundation R
Traduction automatique
Le rythme était parfait et l'atmosphère détendue a permis aux candidats de se sentir à l'aise pour poser des questions.
Rhian Hughes - Public Health Wales NHS Trust
Formation - Introduction to Data Visualization with Tidyverse and R
Traduction automatique
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Formation - From Data to Decision with Big Data and Predictive Analytics
Traduction automatique