1 Google Scholar

Le package scholar permet d’accéder à l’API de Google Scholar. L’objectif est d’analyser la production d’un auteur (ou d’une structure) disposant d’un identifiant, donc d’une page, Google Scholar.

Le paramètre de base est l’identifiant de l’auteur :

# AuthorID <- "4iLBmbUAAAAJ" # Eric Marcon
AuthorID <- "8XqZyDUAAAAJ" # UMR EcoFoG

La vignette du package fournit la majorité du code utile.

vignette(topic = "scholar", package = "scholar")

1.1 Information sur l’auteur

La fonction get_profile retourne une liste avec les informations sur l’auteur.

library("scholar")
get_profile(AuthorID)
## $id
## [1] "8XqZyDUAAAAJ"
## 
## $name
## [1] "UMR EcoFoG"
## 
## $affiliation
## [1] "Research Unit"
## 
## $total_cites
## [1] 38736
## 
## $h_index
## [1] 96
## 
## $i10_index
## [1] 501
## 
## $fields
## [1] "verified email at ecofog.gf - homepage"
## 
## $homepage
## [1] "http://www.ecofog.gf/"
## 
## $coauthors
##  [1] "Bruno Herault"        "Chris Baraloto"      
##  [3] "JACQUES BEAUCHENE"    "Lilian Blanc"        
##  [5] "Vivien Rossi"         "Didier Stien"        
##  [7] "Céline Leroy"         "Eric Marcon"         
##  [9] "C. E. Timothy Paine"  "Ivan Scotti"         
## [11] "Fabien Hubert Wagner" "Plínio Sist"         
## [13] "Bruno Clair"          "Clément Stahl"       
## [15] "Heidy Schimann"       "meriem FOURNIER"     
## [17] "Claire Fortunel"      "Julien Ruelle"       
## [19] "Olivier Roux"         "Nadine Amusant"

1.2 Liste des publications

La fonction get_publications retourne un dataframe contenant toutes les publications. Les colonnes contiennent le titre, la liste des auteurs (séparés par des virgules), le nom du journal, la pagination (sous la forme Volume (numéro), pages), le nombre de citations et les années correspondantes (sous la forme de vecteurs), et deux identifiants internes de la publication (cid et pubid).

Publications <- get_publications(AuthorID)
colnames(Publications)
## [1] "title"   "author"  "journal" "number" 
## [5] "cites"   "year"    "cid"     "pubid"

1.3 Citations par année

Evolution du nombre de citations d’un auteur :

library("ggplot2")
  
get_citation_history(AuthorID) %>%
  ggplot(aes(x = year, y = cites)) +
    geom_line() + 
    geom_point() +
    labs(caption= format(Sys.time(), "%Y-%m-%d %H:%M (GMT %Z)"))