5 juillet 2018

L'histoire

Contexte

Laboratoire de recherche.

Equipes de chercheurs - étudiants - techniciens.

Production de données, méthodes et documents.

Organisation spontanée

On pilote difficilement une équipe de chercheurs.

Haut niveau technique.

Tendance à diverger.

Objectifs

Etre plus efficace.

Echanger plus facilement.

Recherche reproductible.

Méthode

Les outils ne font pas l'organisation.

Les objectifs sans outils non plus.

Itérations besoins \(\leftrightarrow\) outils

Organiser les données

Données précieuses

Relativement peu de données en écologie.

Prix unitaire élevé.

Choix

Données standardisées : SGBDR

Données ponctuelles :

  • tableaux, format CSV

  • Accessibles en ligne (partages de fichiers, HTTP).

Une ingénieure de recherche dédiée dans l'unité.

Analyser les données

R

Script pour :

  • la reproductibilité

  • la versatilité

  • l'explicitation

Communauté, gratuité…

Documentation

Code R avec commentaires

# Addition
2 + 2
## [1] 4

Document RMarkdown avec chunks

Ecrire

Enjeux

Beaucoup de temps passé à produire des documents.

Processus collaboratif nécessaire.

Réutilisation.

Au début

Documents Word:

  • Structuration possible, mais rare,

  • Limites dans le rendu final.

Echange par messagerie.

Besoin individuel

Se concentrer sur le fond :

  • LaTeX plutôt que Word,

  • Markdown plutôt que LaTeX.

Construire sa pensée \(\leftrightarrow\) rédiger :

  • Intégrer les traitements au texte

  • knitR et LaTeX puis RMarkdown.

Besoin collectif

Ecriture en parallèle

Suivi des versions

Progrès possibles

Google Docs : collaboration.

SharePoint puis Office 365.

Overleaf:

Outils retenus

Environnement de travail unique : RStudio.

Markdown.

Git et GitHub.

Tout document est un projet R.

Tout groupe de méthodes diffusable est un package (GitHub + Travis + CodeCov).

Organisation

Un dépôt commun

Sur GitHub: EcoFoG.

Un package commun

Package EcoFoG.

Des modèles de documents

Présentation.

Article

Ouvrage

Des outils communs

Sans vocation à être publiés sur CRAN

Packages communs / Packages personnels

Dans le dépôt EcoFoG : industrialisation des méthodes.

Dans les dépôts des chercheurs : recherche propre.

Le tout publié sur CRAN.

Documents communs / Documents personnels

Même fonctionnement.

Utilisation systématique des pages GitHub.

Documents pas forcément publics : dépôt BitBucket.

Serveur RStudio

Pour les calculs longs ou parallélisés.

Applications Shiny.

Utilisation systématique

Formation des étudiants.

Cours en ligne.

Support des nouveaux projets.

Limites

Envie

Adhésion ou pas.

Arguments :

  • perte de contrôle,

  • rigidité,

  • pas Wywiwyg.

Compétences

Formations nécessaires :

  • à R,

  • à Git,

  • à MarkDown… à LaTeX.

Technique

Manques :

  • Correcteur d'orthographe en temps réel

Chaine complexe \(\leftrightarrow\) fragile.

Exemples :

  • undefined control sequence \@@magyar@captionfix;

  • R et RTools 3.5.0 et devtools.

Avantages

Recherche reproductible

Intégration complète de toute la chaîne.

Données \(\rightarrow\) Traitements \(\rightarrow\) Figures \(\rightarrow\) Texte.

Multiples formats de sortie

Systématiquement HTML et PDF \(\rightarrow\) Pages GitHub.

Reformatage facile, même vers Word.

Qualité des documents

Seulement possible avec LaTeX:

  • Respect des règles typographiques ;

  • Usage des marges.

Mais tout LaTeX n'est pas disponible avec RMarkdown.

Rigueur

Documentation au même niveau que la réflexion.

Possibilité de revenir en arrière, historique.

Réduction des zones d'ombre.

Capitalisation.

Références