Présentation

Objectifs

Ce document est le support du cours Travailler avec R.

Il peut être téléchargé au format PDF.

Il propose une organisation du travail autour de R et RStudio pour, au-delà des statistiques, rédiger des documents efficacement avec R Markdown, aux formats variés (mémos, articles scientifiques, mémoires d’étudiants, livres, diaporamas), créer son site web et des applications R en ligne (Shiny), produire des packages et utiliser R pour l’enseignement. Il complète Reproducible Research with R and R Studio (Gandrud 2015) par une approche plus concrète, avec des solutions prêtes à l’emploi.

L’optimisation de l’utilisation des nombreux outils disponibles est traitée en détail : rmarkdown, bookdown et blogdown pour la rédaction, roxygen2, testthat et pkgdown pour les packages, le contrôle de source avec git et GitHub, l’intégration continue avec les Actions GitHub et Codecov. Des exemples sont présentés à chaque étape, et le code nécessaire est fourni.

Le chapitre 1 est consacré à l’installation des outils nécessaires : R, git et LaTeX. Le chapitre 2 détaille quelques aspects avancés de l’utilisation de R : les différents langages, les environnements, la performance du code. L’utilisation de base de R n’est pas reprise ici : de bons cours sont suggérés. Le chapitre 3 présente le contrôle de source avec git et GitHub.

Le chapitre 4 montre comment rédiger des documents simples (articles) ou complexes (ouvrages) avec R Markdown, intégrant les données, le code pour les traiter et le texte pour les présenter. Le chapitre 5 présente une méthode pas à pas pour créer efficacement un package. Le chapitre 6 introduit l’utilisation de l’intégration continue pour produire automatiquement des documents, vérifier le code des packages et produire leurs vignettes. Le chapitre 7 présente Shiny, l’outil de mise en ligne d’applications R. Enfin, le chapitre 8 introduit les outils destinés à l’enseignement avec R.

Conventions

Les noms des packages sont en gras dans le texte, par exemple : ggplot2.

L’identifiant utilisé sur GitHub est noté GitHubID. Le nom des projets, identique à celui de leur dépôt sur GitHub est noté RepoID.

Le signe |> dans le code des exemples indique que la suite du code devrait se trouver sur la même ligne, mais est coupée pour le formatage de ce document. Son usage est limité aux fichiers de configuration YAML, surtout utilisés dans le chapitre 6. Dans tous les autres cas, le code peut être utilisé directement.