Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Jour 1
Introduction et préliminaires
- Rendre R plus convivial, R et les interfaces graphiques disponibles
- Rstudio
- Logiciels connexes et documentation
- R et les statistiques
- Utiliser R de manière interactive
- Une session d'introduction
- Obtenir de l'aide sur les fonctions et les caractéristiques
- Commandes R, sensibilité à la casse, etc.
- Rappel et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
- Permanence des données et suppression d'objets
Manipulations simples ; nombres et vecteurs
- Vecteurs et affectation
- Arithmétique vectorielle
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
- Autres types d'objets
Les objets, leurs modes et leurs attributs
- Attributs intrinsèques : mode et longueur
- Modification de la longueur d'un objet
- Obtention et définition d'attributs
- La classe d'un objet
Facteurs ordonnés et non ordonnés
- Un exemple spécifique
- La fonction tapply() et les tableaux en escalier
- Facteurs ordonnés
Tableaux et matrices
- Les tableaux
- Indexation des tableaux. Sous-sections d'un tableau
- Indexation des matrices
- La fonction array()
- Arithmétique mixte des vecteurs et des tableaux. La règle de recyclage
- Le produit extérieur de deux tableaux
- Transposition généralisée d'un tableau
- Facilités Matrix.
- Multiplication Matrix
- Equations linéaires et inversion
- Valeurs propres et vecteurs propres
- Décomposition en valeurs singulières et déterminants
- Ajustement des moindres carrés et décomposition QR
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, (), avec les tableaux
- Tableaux de fréquences à partir de facteurs
Deuxième jour
Listes et cadres de données
- Les listes
- Construire et modifier des listes
- Concaténation de listes
- Cadres de données
- Création de cadres de données
- attach() et detach()
- Travailler avec des cadres de données
- Attacher des listes arbitraires
- Gestion du chemin de recherche
Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison d'ensembles de données
- Manipulation de caractères, package stringr
Lecture des données
- Fichiers Txt
- Fichiers CSV
- Fichiers XLS, XLSX
- SPSS, SAS, Stata,... et autres formats de données
- Exporter des données vers des formats txt, csv et autres
- Access données provenant de bases de données à l'aide du langage SQL.
Distributions de probabilités
- R comme ensemble de tableaux statistiques
- Examen de la distribution d'un ensemble de données
- Tests à un et deux échantillons
Groupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
Troisième jour
Écrire ses propres fonctions
- Exemples simples
- Définition de nouveaux opérateurs binaires
- Arguments nommés et valeurs par défaut
- L'argument '...'
- Affectations au sein des fonctions
- Exemples plus avancés
- Facteurs d'efficacité dans la conception des blocs
- Suppression de tous les noms dans un tableau imprimé
- Intégration numérique récursive
- Champ d'application
- Personnalisation de l'environnement
- Classes, fonctions génériques et orientation objet
Analyse statistique en R
- Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur les modèles
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés
- Familles
- La fonction glm()
- Classification
- Régression logistique
- Analyse discriminante linéaire
- Apprentissage non supervisé
- Analyse des composantes principales
- Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
- Analyse de survie
- Objets de survie en r
- Estimation de Kaplan-Meier
- Bandes de confiance
- Modèles PH de Cox, covariables constantes
- Modèles PH de Cox, covariables dépendantes du temps
Procédures graphiques
- Commandes de traçage de haut niveau
- La fonction plot()
- Affichage de données multivariées
- Affichage de graphiques
- Arguments des fonctions de traçage de haut niveau
- Graphiques de visualisation de base
- Relations multivariées avec le treillis et le paquetage ggplot
- Utilisation des paramètres graphiques
- Liste des paramètres graphiques
Rapports automatisés et interactifs
- Combiner les résultats de R avec du texte
- Création de documents html, pdf
Pré requis
Bonne compréhension des statistiques.
21 Heures