4 Entropie

L’entropie est la surprise moyenne apportée par l’observation des individus d’une communauté, d’autant plus grande qu’un individu appartient à une espèce plus rare. L’entropie HCDT permet d’unifier les indices classiques de diversité : son paramètre, appelé ordre, fixe l’importance donnée aux espèces rares. L’entropie d’ordre 0 est la richesse ; celle d’ordre 1, l’indice de Shannon ; celle d’ordre 2, celui de Simpson. L’entropie est la moyenne du logarithme déformé de la rareté des espèces, définie comme l’inverse de leur probabilité.

L’entropie va de pair avec la diversité au sens strict (Nombres de Hill) : le nombre d’espèces équiprobables dont l’entropie est la même que celle de la communauté réelle. La diversité est l’exponentielle déformée de l’entropie. Les profils de diversité représentent la diversité en fonction de son ordre et permettent la comparaison de communautés.

L’estimation de la diversité est difficile pour des ordres inférieurs à \(0,5\) dans des taxocènes très divers comme les arbres des forêts tropicales.

L’entropie peut être entendue comme la surprise moyenne fournie par l’observation d’un échantillon. C’est intuitivement une bonne mesure de diversité (Pielou 1975). Ses propriétés mathématiques permettent d’unifier les mesures de diversité dans un cadre général.

4.1 Définition de l’entropie

Les textes fondateurs sont Davis (1941) et surtout Theil (1967) en économétrie, et Shannon (1948; 1963) pour la mesure de la diversité. Une revue est fournie par Maasoumi (1993).

Considérons une expérience dont les résultats possibles sont \(\{r_1, r_2, \dots , \ r_S\}\). La probabilité d’obtenir \(r_s\) est \(p_s\), et \(\mathbf{p}=(p_1, p_2, \dots, p_S)\) est le vecteur composé des probabilités d’obtenir chaque résultat. Les probabilités sont connues a priori. Tout ce qui suit est vrai aussi pour des valeurs de \(r\) continues, dont on connaîtrait la densité de probabilité.

On considère maintenant un échantillon de valeurs de \(r\). La présence de \(r_s\) dans l’échantillon est peu étonnante si \(p_s\) est grande : elle apporte peu d’information supplémentaire par rapport à la simple connaissance des probabilités. En revanche, si \(p_s\) est petite, la présence de \(r_s\) est surprenante. On définit donc une fonction d’information, \(I(p_s)\), décroissante quand la probabilité augmente, de \(I(0) > 0\) (éventuellement \(+\infty\)) à \(I(1) = 0\), parce qu’observer un résultat certain n’apporte aucune information. Chaque valeur observée dans l’échantillon apporte une certaine quantité d’information, dont la somme est l’information de l’échantillon. Patil and Taillie (1982) appellent l’information “rareté”.

La quantité d’information attendue de l’expérience est \(\sum^S_{s=1}{p_s I(p_s) = H(\mathbf{p})}\). Si on choisit \(I(p_s) = -\ln(p_s)\), \(H(\mathbf{p})\) est l’indice de Shannon, mais bien d’autres formes de \(I(p_s)\) sont possibles. \(H(\mathbf{p})\) est appelée entropie. C’est une mesure de l’incertitude (de la volatilité) du résultat de l’expérience. Si le résultat est certain (une seule valeur \(p_S\) vaut 1), l’entropie est nulle. L’entropie est maximale quand les résultats sont équiprobables.

Si \(\mathbf{p}\) est la distribution des probabilité des espèces dans une communauté, Patil and Taillie (1982) montrent que :

  • Si \(I(p_s) = (1 - p_s) / {p_s}\), alors \(H(\mathbf{p})\) est le nombre d’espèces \(S\) moins 1 ;
  • Si \(I(p_s) = -\ln(p_s)\), alors \(H(\mathbf{p})\) est l’indice de Shannon ;
  • Si \(I(p_s) = 1 - p_s\), alors \(H(\mathbf{p})\) est l’indice de Simpson.

Ces trois fonctions d’information sont représentées en figure ??.

Le code R nécessaire pour réaliser la figure est :

I0 <- function(p) (1- p) / p
I1 <- function(p) -log(p)
I2 <- function(p) 1 - p
tibble(x = c(0, 1)) %>% 
  ggplot(aes(x)) + 
    stat_function(fun = I0) +
    stat_function(fun = I1, lty = 2) +
    stat_function(fun = I2, lty = 3) +
    coord_cartesian(ylim = c(0, 10)) +
    labs(x = "p", y = "I(p)")

Valeur de \(p_{s}I(p_s)\) dans le nombre d’espèces (trait plein), l’indice de Shannon (pointillés longs) et l’indice de Simpson (pointillés). Les espèces rares contribuent peu, sauf pour le nombre d’espèces.

Figure 4.1: Valeur de \(p_{s}I(p_s)\) dans le nombre d’espèces (trait plein), l’indice de Shannon (pointillés longs) et l’indice de Simpson (pointillés). Les espèces rares contribuent peu, sauf pour le nombre d’espèces.

La contribution de chaque espèce à la valeur totale de l’entropie est représentée figure 4.1.

Code R :

H0 <- function(p) 1 - p
H1 <- function(p) -p * log(p)
H2 <- function(p) p * (1 - p)
tibble(x = c(0.001, 1)) %>% 
  ggplot(aes(x)) + 
    stat_function(fun = H0) +
    stat_function(fun = H1, lty = 2) +
    stat_function(fun = H2, lty = 3) +
    labs(x = "p", y = "H(p)")

4.2 Entropie relative

Considérons maintenant les probabilités \(q_s\) formant l’ensemble \(\mathbf{q}\) obtenues par la réalisation de l’expérience. Elles sont différentes des probabilités \(p_s\), par exemple parce que l’expérience ne s’est pas déroulée exactement comme prévu. On définit le gain d’information \(I(q_s, p_s)\) comme la quantité d’information supplémentaire fournie par l’observation d’un résultat de l’expérience, connaissant les probabilités a priori. La quantité totale d’information fournie par l’expérience, \(\sum^S_{s=1}{q_s I(q_s, p_s)} = H(\mathbf{q}, \mathbf{p})\), est souvent appelée entropie relative. Elle peut être vue comme une distance entre la distribution a priori et la distribution a posteriori. Il est possible que les distributions \(\mathbf{p}\) et \(\mathbf{q}\) soit identiques, que le gain d’information soit donc nul, mais les estimateurs empiriques n’étant pas exactement égaux entre eux, des tests de significativité de la valeur de \(\hat{H}(\mathbf{q},\mathbf{p})\) seront nécessaires.

Quelques formes possibles de \(H(\mathbf{q}, \mathbf{p})\) sont :

  • La divergence de Kullback-Leibler (Kullback and Leibler 1951) connue par les économistes comme l’indice de dissimilarité de Theil (1967) : \[\begin{equation} \tag{4.1} T = \sum^S_{s=1}{q_{s}\ln\frac{q_s}{p_s}}; \end{equation}\]
  • Sa proche parente, appelée parfois deuxième mesure de Theil (Conceição and Ferreira 2000), qui inverse simplement les rôles de \(p\) et \(q\) : \[\begin{equation} \tag{4.2} L = \sum^S_{s=1}{p_{s}\ln\frac{p_s}{q_s}}. \end{equation}\]

Valeur de \(q \ln(q / p)\) en fonction de \(p\) et \(q\). La divergence de Kullback-Leibler est la somme de cette valeur pour toutes les espèces

Figure 4.2: Valeur de \(q \ln(q / p)\) en fonction de \(p\) et \(q\). La divergence de Kullback-Leibler est la somme de cette valeur pour toutes les espèces

L’entropie relative est essentielle pour la définition de la diversité \(\beta\) présentée dans le chapitre ??. En se limitant à la diversité \(\alpha\), on peut remarquer que l’indice de Shannon est la divergence de Kullback-Leibler entre la distribution observée et l’équiprobabilité des espèces (Marcon et al. 2012).

La contribution à la divergence de chaque couple \((p_s, q_s)\) est représentées en figure 4.2. Elle est positive quand \(q_s > p_s\) (la valeur observée est plus grande que la valeur attendue), et croît avec \(q_s\) pour \(p_s\) fixé. Elle tend vers l’infini quand \(p_s \to 0\). Les valeurs les plus négatives ne sont pas obtenues pour les valeurs minimales de \(q\) parce que les évènements très rarement observés influent peu sur la quantité d’information totale. Le minimum \(-e^{-1} \approx 0.37\) est atteint pour \(p_s = 1\) et \(q_s = e^{-1}\), la valeur qui annule la dérivée de \(q \ln(q)\). En somme, la divergence de Kullback-Leibler est surtout influencée par les évènements beaucoup plus observés qu’attendus.

Le code R nécessaire pour réaliser la figure est :

p <- q <- seq(0.01, 1, .01)
KB <- function(p, q) q * log(q / p)
xyz <- outer(p, q, FUN = "KB")
library("sp")
image(
  xyz, 
  col = rainbow(n = 100, alpha = 0.8), 
  xlab = "p", 
  ylab = "q", 
  asp = 1
)
contour(
  xyz, 
  levels = c(seq(-.3, 0, .1), c(.2, .5), seq(1, 4, 1)), 
  labcex = 1, 
  add = T
)

4.3 L’appropriation de l’entropie par la biodiversité

MacArthur (1955) est le premier à avoir introduit la théorie de l’information en écologie (Ulanowicz 2001). MacArthur s’intéressait aux réseaux trophiques et cherchait à mesurer leur stabilité : l’indice de Shannon qui comptabilise le nombre de relations possibles lui paraissait une bonne façon de l’évaluer. Mais l’efficacité implique la spécialisation, ignorée dans \(H\) qui est une mesure neutre (toutes les espèces y jouent le même rôle). MacArthur a abandonné cette voie.

Les premiers travaux consistant à généraliser l’indice de Shannon sont dus à Rényi (1961). L’entropie d’ordre \(q\) de Rényi est

\[\begin{equation} ^{q}\!R =\frac{1}{1 - q \ln\sum^S_{q=1}{p^q_s}}. \end{equation}\]

Rényi pose également les axiomes pour une mesure d’entropie \(R(\mathbf{p})\), où \(\mathbf{p}=(p_1, p_2, \dots, p_S)\) :

  • La symétrie : les espèces doivent être interchangeables, aucune n’a de rôle particulier et leur ordre est indifférent ;
  • La mesure doit être continue par rapport aux probabilités ;
  • La valeur maximale est atteinte si toutes les probabilités sont égales.

Il montre que \(^{q}\!R\) respecte les 3 axiomes.

Patil and Taillie (1982) ont montré de plus que :

  • L’introduction d’une espèce dans une communauté augmente sa diversité (conséquence de la décroissance de \(g(p_s)\)) ;
  • Le remplacement d’un individu d’une espèce fréquente par un individu d’une espèce plus rare augmente l’entropie à condition que \(R(\mathbf{p})\) soit concave. Dans la littérature économique sur les inégalités, cette propriété est connue sous le nom de Pigou-Dalton (Dalton 1920).

Hill (1973) transforme l’entropie de Rényi en nombres de Hill, qui en sont simplement l’exponentielle :

\[\begin{equation} \tag{4.3} ^{q}\!D = {\left(\sum^S_{s=1}{p^q_s}\right)}^{\frac{1}{1 - q}}. \end{equation}\]

Le souci de Hill était de rendre les indices de diversité intelligibles après l’article remarqué de Hurlbert (1971) intitulé “le non-concept de diversité spécifique”. Hurlbert reprochait à la littérature sur la diversité sa trop grande abstraction et son éloignement des réalités biologiques, notamment en fournissant des exemples dans lesquels l’ordre des communautés n’est pas le même selon l’indice de diversité choisi. Les nombres de Hill sont le nombre d’espèces équiprobables donnant la même valeur de diversité que la distribution observée. Ils sont des transformations simples des indices classiques :

  • \(^{0}\!D\) est le nombre d’espèces ;
  • \(^{1}\!D = e^H\), l’exponentielle de l’indice de Shannon ;
  • \(^{2}\!D = {1} / {(1- E)}\), l’inverse de l’indice de concentration de Simpson, connu sous le nom d’indice de Stoddart (1983).

Ces résultats avaient déjà été obtenus avec une autre approche par MacArthur (1965) et repris par Adelman (1969) dans la littérature économique.

Les nombres de Hill sont des “nombres effectifs” ou “nombres équivalents”. Le concept a été défini rigoureusement par Gregorius (1991), d’après Wright (1931) (qui avait le premier défini la taille effective d’une population) : étant donné une variable caractéristique (ici, l’entropie) fonction seulement d’une variable numérique (ici, le nombre d’espèces), dans un cas idéal (ici, l’équiprobabilité des espèces), le nombre effectif est la valeur de la variable numérique pour laquelle la variable caractéristique est celle du jeu de données.

Gregorius (2014) montre que de nombreux autres indices de diversité sont acceptables dans le sens où ils vérifient les axiomes précédents et, de plus, que la diversité d’un assemblage de communautés est obligatoirement supérieure à la diversité moyenne de ces communautés (l’égalité n’étant possible que si les communautés sont toutes identiques). Cette dernière propriété sera traitée en détail dans la partie consacrée à la décomposition de la diversité. Ces indices doivent vérifier deux propriétés : leur fonction d’information doit être décroissante, et ils doivent être une fonction strictement concave de \(p_s\). Parmi les possibilités, \(I(p_s) = \cos{(p_s \pi / 2)}\) est envisageable par exemple : le choix de la fonction d’information est virtuellement illimité, mais seules quelques unes seront interprétables clairement.

Un nombre équivalent d’espèces existe pour tous ces indices, il est toujours égal à l’inverse de l’image de l’indice par la réciproque de la fonction d’information :

\[\begin{equation} \tag{4.4} D = \frac{1}{I^{-1} \left( \sum^S_{s=1}{p_s I(p_s)} \right)}. \end{equation}\]

D’autres entropies ont été utilisées, avec plus ou moins de succès. Par exemple, Ricotta and Avena (2003) proposent d’utiliser la fonction d’information \(I(p_s) = -\ln(k_s)\)\(k_s\) est la dissimilarité totale de l’espèce \(s\) avec les autres (par exemple, la somme des distances aux autres espèces dans un arbre phylogénétique, voir section ??), normalisée pour que \(\sum_s{k_s} = 1\). Ainsi, les espèces les plus originales apportent peu d’information, ce qui n’est pas très intuitif. Les auteurs montrent que leur mesure est la somme de l’entropie de Shannon et de la divergence de Kullback-Leibler entre les probabilités et les dissimilarités des espèces. Ricotta and Szeidl (2006) ont défini plus tard une entropie augmentant avec l’originalité de chaque espèce, présentée au chapitre ??.

4.4 Entropie HCDT

Tsallis (1988) propose une classe de mesures appelée entropie généralisée, définie par Havrda and Charvát (1967) pour la première fois et redécouverte plusieurs fois, notamment par Daróczy (1970), d’où son nom entropie HCDT (voir Mendes et al. (2008), page 451, pour un historique complet) :

\[\begin{equation} \tag{4.5} ^{q}\!H = \frac{1}{q-1} \left( 1 - \sum^S_{s=1}{p^q_s} \right). \end{equation}\]

Tsallis a montré que les indices de Simpson et de Shannon étaient des cas particuliers d’entropie généralisée, retrouvant, sans faire le rapprochement (Ricotta 2005a), la définition d’un indice de diversité de Patil and Taillie (1982).

Ces résultats ont été complétés par d’autres et repris en écologie par Keylock (2005) et Jost (2006, 2007). Là encore :

  • Le nombre d’espèces moins 1 est \(^{0}\!H\) ;
  • L’indice de Shannon est \(^{1}\!H\) ;
  • L’indice de Gini-Simpson est \(^{2}\!H\).

L’entropie HCDT est particulièrement attractive parce que sa relation avec la diversité au sens strict est simple, après introduction du formalisme adapté (les logarithmes déformés). Son biais d’estimation peut être corrigé globalement, et non seulement pour les cas particuliers (nombre d’espèces, Shannon, Simpson). Enfin, sa décomposition sera présentée en détail dans le chapitre ??.

4.5 Logarithmes déformés

L’écriture de l’entropie HCDT est largement simplifiée en introduisant le formalisme des logarithmes déformés (Tsallis 1994). Le logarithme d’ordre \(q\) est défini par \[\begin{equation} \tag{4.6} \ln_q{x} = \frac{x^{1-q} - 1}{1 - q}, \end{equation}\] dont la forme est identique à la transformation de Box and Cox (1964) utilisée en statistiques pour normaliser une variable.

Le logarithme déformé converge vers le logarithme naturel quand \(q \to 1\) (figure 4.3).

Valeur du logarithme d’ordre \(q\) de probabilités entre 0 et 1 pour différentes valeurs de \(q\) : \(q = 0\) (pointillés longs rouges), la courbe est une droite ; \(q = 1\) (trait plein) : logarithme naturel ; \(q = 2\) (pointillés courts bleus) : la courbe a la même forme que le logarithme naturel pour les valeurs positives de \(q\) ; \(q = -1\) (pointillés alternés verts) : la courbe est convexe pour les valeurs négatives de \(q\).

Figure 4.3: Valeur du logarithme d’ordre \(q\) de probabilités entre 0 et 1 pour différentes valeurs de \(q\) : \(q = 0\) (pointillés longs rouges), la courbe est une droite ; \(q = 1\) (trait plein) : logarithme naturel ; \(q = 2\) (pointillés courts bleus) : la courbe a la même forme que le logarithme naturel pour les valeurs positives de \(q\) ; \(q = -1\) (pointillés alternés verts) : la courbe est convexe pour les valeurs négatives de \(q\).

Le code R nécessaire pour réaliser la figure est :

ln0 <- function(p) lnq(p, 0)
ln2 <- function(p) lnq(p, 2)
lnm1 <- function(p) lnq(p, -1)
tibble(x = c(0, 1)) %>% 
  ggplot(aes(x)) + 
    stat_function(fun = log) +
    stat_function(fun = ln0, lty = 2, col = "red") +
    stat_function(fun = ln2, lty = 3, col = "blue") +
    stat_function(fun = lnm1, lty = 4, col = "green") +
    coord_cartesian(ylim = c(-4, 0)) +
    labs(x = "p", y = expression(ln[q](p)))

Sa fonction inverse est l’exponentielle d’ordre \(q\) :

\[\begin{equation} \tag{4.7} e^x_q = \left[ 1 + \left( 1 - q \right) x \right]^{\frac{1}{1 - q}}. \end{equation}\]

Enfin, le logarithme déformé est subadditif :

\[\begin{equation} \tag{4.8} \ln_q\left( xy \right) = \ln_q{x} + \ln_q{y} - \left( q - 1 \right) \left( \ln_q{x} \right) \left( \ln_q{y} \right). \end{equation}\]

Ses propriétés sont les suivantes :

\[\begin{equation} \tag{4.9} \ln_q\frac{1}{x} = -x^{q - 1} \ln_q{x}; \end{equation}\]

\[\begin{equation} \tag{4.10} \ln_q\left( xy \right) = \ln_q{x} + x^{1-q} \ln_q{y}; \end{equation}\]

\[\begin{equation} \tag{4.11} \ln_q\left( \frac{x}{y} \right) = \ln_q{x} - {\left( \frac{x}{y} \right)}^{1 - q} \ln_q{y}; \end{equation}\]

et

\[\begin{equation} \tag{4.12} e^{x + y}_q = e_q^x e_q^{\frac{y}{1 + \left( 1 - q \right) x}}. \end{equation}\]

Si \(q > 1\), \(\mathop{\lim}_{x \to +\infty}(\ln_q{x}) = {1} / {(q - 1)}\), donc \(e_q^x\) n’est pas définie pour \(x > 1 / (q - 1)\).

La dérivée du logarithme déformé est, quel que soit \(q\), \[\begin{equation} \tag{4.13} \ln'_q\left( x \right) = x^{-q}. \end{equation}\]

Les dérivées première et seconde de l’exponentielle déformée sont, quel que soit \(q\) : \[\begin{equation} \tag{4.14} \exp'_q\left( x \right) = \left( e_q^x \right)^{q}; \end{equation}\] \[\begin{equation} \tag{4.15} \exp''_q\left( x \right) = \left( e_q^x \right)^{2q - 1}. \end{equation}\]

Ces fonctions sont implémentées dans le package divent : ln_q(x, q) et exp_q(x, q).

L’entropie d’ordre \(q\) s’écrit

\[\begin{equation} \tag{4.16} ^{q}\!H = \frac{1}{q - 1} \left( 1 - \sum^S_{s=1}{p^q_s} \right) = -\sum_s{p^q_s} \ln_q{p_s} = \sum_s{p_s}{\ln_q\frac{1}{p_s}}. \end{equation}\]

Ces trois formes sont équivalentes mais les deux dernières s’interprètent comme une généralisation de l’entropie de Shannon (Marcon et al. 2014). La dernière est la plus intéressante parce qu’elle permet de définir l’entropie en général comme la moyenne du logarithme de l’inverse des probabilités, que nous appellerons la rareté des espèces.

Le calcul de \(^{q}\!H\) peut se faire avec la fonction ent_tsallis de la librairie divent :

ent_tsallis(bci_prob, q= 1.5)
## # A tibble: 1 × 3
##   estimator order entropy
##   <chr>     <dbl>   <dbl>
## 1 naive       1.5    1.72

4.6 Entropie et diversité

On voit immédiatement que l’entropie de Tsallis est le logarithme d’ordre \(q\) du nombre de Hill correspondant, comme l’entropie de Rényi en est le logarithme naturel :

\[\begin{equation} \tag{4.17} ^{q}\!H = \ln_q{^{q}\!D}; \end{equation}\]

\[\begin{equation} \tag{4.18} ^{q}\!D = e_q^{^{q}\!H}. \end{equation}\]

L’entropie est utile pour les calculs : la correction des biais d’estimation notamment. Les nombres de Hill, ou nombres équivalents d’espèces ou nombres effectif d’espèces permettent une appréhension plus intuitive de la notion de biodiversité (Jost 2006). En raison de leurs propriétés, notamment de décomposition (voir le chapitre ??), Jost (2007) les appelle “vraie diversité”. Hoffmann and Hoffmann (2008) critiquent cette définition totalitaire et fournissent une revue historique plus lointaine sur les origines de ces mesures. Jost (2009) reconnaît qu’un autre terme aurait pu être choisi (“diversité neutre” ou “diversité mathématique” par exemple).

Dauby and Hardy (2012) écrivent “diversité au sens strict” ; Gregorius (2010) “diversité explicite”.

Quoi qu’il en soit, les nombres de Hill respectent le principe de réplication (voir Chao, Chiu, and Jost (2010), section 3 pour une discussion et un historique) : si \(I\) communautés de même taille, de même niveau de diversité \(D\), mais sans espèces en commun sont regroupées dans une méta-communauté, la diversité de la méta-communauté doit être \(I \times D\).

L’intérêt de ces approches est de fournir une définition paramétrique de la diversité, qui donne plus ou moins d’importance aux espèces rares :

  • \(^{-\infty}\!D = {1} / {\min(p_S)}\) est l’inverse de la proportion de la communauté représentée par l’espèce la plus rare (toutes les autres espèces sont ignorées). Le biais d’estimation est incontrôlable : l’espèce la plus rare n’est pas dans l’échantillon tant que l’inventaire n’est pas exhaustif ;
  • \(^{0}\!D\) est le nombre d’espèces (alors que \(^{0}\!H\) est le nombre d’espèces moins 1). C’est la mesure classique qui donne le plus d’importance aux espèces rares : toutes les espèces ont la même importance, quel que soit leur effectif en termes d’individus. Il est bien adapté à une approche patrimoniale, celle du collectionneur qui considère que l’existence d’une espèce supplémentaire a un intérêt en soi, par exemple parce qu’elle peut contenir une molécule valorisable. Comme les espèces rares sont difficiles à échantillonner, le biais d’estimation est très important, et sa résolution a généré une littérature en soi (section 3.1) ;
  • \(^{1}\!D\) est l’exponentielle de l’indice de Shannon donne la même importance à tous les individus. Il est adapté à une approche d’écologue, intéressé par les interactions possibles : le nombre de combinaisons d’espèces en est une approche satisfaisante. Le biais d’estimation est sensible ;
  • \(^{2}\!D\) est l’inverse de l’indice de concentration de Gini-Simpson donne moins d’importance aux espèces rares. Hill (1973) l’appelle “le nombre d’espèces très abondantes”. Il comptabilise les interactions possibles entre paires d’individus : les espèces rares interviennent dans peu de paires, et influent peu sur l’indice. En conséquence, le biais d’estimation est très petit ; de plus, un estimateur non biaisé existe ;
  • \(^{\infty}\!D = {1} / {d}\) est l’inverse de l’indice de Berger-Parker (Berger and Parker 1970) qui est la proportion de la communauté représentée par l’espèce la plus abondante : \(d = \max(\mathbf{p})\). Toutes les autres espèces sont ignorées.

Le calcul de \(^{q}\!D\) peut se faire avec la fonction div_hill de la librairie divent :

div_hill(bci_prob, q = 1.5)
## # A tibble: 1 × 3
##   estimator order diversity
##   <chr>     <dbl>     <dbl>
## 1 naive       1.5      49.6

Les propriétés mathématiques de la diversité ne sont pas celles de l’entropie. L’entropie doit être une fonction concave des probabilités comme on l’a vu plus haut, mais pas la diversité (un exemple de confusion est fourni par Gadagkar (1989), qui reproche à \(^{2}\!D\) de ne pas être concave). L’entropie est une moyenne pondérée par les probabilités de la fonction d’information, c’est donc une fonction linéaire des probabilités, propriété importante pour définir l’entropie \(\alpha\) (section ??) comme la moyenne des entropies de plusieurs communautés, ou l’entropie phylogénétique (chapitre ??) comme la moyenne de l’entropie sur les périodes d’un arbre. La diversité n’est pas une fonction linéaire des probabilités : la diversité moyenne n’est en général pas la moyenne des diversités.

4.7 Synthèse

L’inverse de la probabilité d’une espèce, \(1/p_s\), définit sa rareté. L’entropie est la moyenne du logarithme de la rareté :

\[\begin{equation} \tag{4.19} ^{q}\!H = \frac{1}{q-1} \left( 1 - \sum^S_{s=1}{p^q_s} \right) = \sum_s{p_s}\ln_q\frac{1}{p_s}. \end{equation}\]

La diversité est son exponentielle :

\[\begin{equation} \tag{4.20} ^{q}\!D = e_q^{^{q}\!H}. \end{equation}\]

4.8 Estimation

Les estimateurs peuvent être classés dans quatre méthodes principales. La plus simple consiste simplement à insérer l’estimateur de \(p_s\) dans la définition de la diversité à évaluer pour obtenir ce que l’on appelle l’estimateur plug-in. Quand l’estimateur des probabilités est \(\hat{p}_s = n_s/n\), l’estimateur est dit naïf. L’estimateur naïf de l’entropie HCDT d’ordre \(q\) est :

\[\begin{equation} ^{q}{\hat{H}} = \sum_{s}{{\hat{p}}_s \ln_q{\frac{1}{\hat{p}}_s}} \tag{4.21} \end{equation}\]

L’estimateur naïf est inutile dans les communautés hyperdiverses car il sous-estime fortement la diversité en raison des espèces non observées et de la non-linéarité de la l’entropie en fonction des probabilités.

Des progrès ont été réalisés dans l’estimation de la distribution réelle de la probabilité des espèces en ajustant un modèle de leur distribution aux données. La distribution des espèces non observées peut être ajoutée si leur nombre est estimé et qu’une forme de distribution est choisie. La première méthode d’estimation de l’entropie consiste donc à estimer précisément la distribution réelle des probabilités puis à lui appliquer l’estimateur plug-in.

Chao et al. (2015) ont utilisé un modèle à deux paramètres basé sur l’estimation de la couverture généralisée de l’échantillon (non détaillé ici), estimé la richesse totale avec l’estimateur Chao1 et modélisé les espèces non observées comme une distribution géométrique pour dévoiler la distribution complète rang-abondance d’une communauté observée. Ils ont appliqué l’estimateur plug-in à cette distribution pour obtenir l’estimateur appelé “Chao-unveiled” dans divent. L’estimateur “iChao-unveiled” est une variation de l’estimateur “Chao-unveiled”, où la richesse est estimée par l’estimateur iChao1.

L’estimateur du jackknife (Burnham and Overton 1979) a montré de bonnes performances pour estimer la richesse lorsque l’effort d’échantillonnage est trop faible pour que l’estimateur Chao1 soit performant (Brose, Martinez, and Williams 2003).

L’estimation de la richesse à l’aide de l’estimateur du jackknife, dont l’ordre est choisi en fonction des données, définit l’estimateur “jackknife-unveiled”. L’utilisation de l’estimateur jackknife pour estimer la queue de la distribution d’abondance n’était pas l’intention de Chao et al. (2015) car elle n’est pas cohérente avec leur cadre théorique.

La seconde méthode repose sur l’estimateur Horvitz and Thompson (1952) de la somme pondérée d’une fonction de ses éléments \({x_1, x_2, ..., x_S}\), soit \(\sum_{s}{p_s f(x_s)}\) lorsque certains d’entre eux ne sont pas observés. Un estimateur sans biais de la somme est obtenu lorsque chaque terme est divisé par sa probabilité d’être observé \(1-(1-p_s)^n\). Chao and Shen (2003) ont proposé de le combiner avec l’estimateur de la couverture de l’échantillon : conditionnellement à l’ensemble des espèces observées, un estimateur sans biais (Ashbridge and Goudie 2000) de \(p_s\) est \(\tilde{p}_s = \hat{C} \hat{p}_s\). Chao et Shen ont estimé l’entropie de Shannon ; la méthode a ensuite été étendue à l’entropie HCDT (Marcon et al. 2014).

\[\begin{equation} ^{q}{\tilde{H}} =\sum_{s}{\frac{ \hat{C}{\hat{p}}_s \ln_q\dfrac{1}{\hat{C}{\hat{p}}_s} }{ 1 - {\left( 1 - \hat{C}{\hat{p}}_s \right)}^n} } \end{equation}\]

Un progrès supplémentaire peut être fait en remplaçant l’estimateur conditionnel des probabilités \(\tilde{p}_s = \hat{C} \hat{p}_s\) par celui de Chao et al. (2015). Étant donné que l’estimateur de probabilité amélioré dépend de la couverture généralisée de l’échantillon, l’estimateur amélioré de Chao-Shen est appelé “generalized coverage”.

La troisième méthode a été établie par Grassberger (1988) qui a donné un estimateur à biais réduit de la valeur d’un entier à la puissance \(q\). \({p_s^q}\) s’écrit \(n_s^q/n^q\) et \(n_s^q\) est estimé (Marcon et al. 2014) par :

\[\begin{equation} \tilde{n}^{q}_{s} = \frac{\mathrm{\Gamma}\left(n_s + 1 \right)}{\mathrm{\Gamma}\left( n_s - q + 1 \right)} + \frac{{\left( -1 \right)}^n \mathrm{\Gamma}\left( 1 + q \right)\sin{\pi q}}{\pi \left( n + 1 \right)} \end{equation}\]

L’estimateur de \({p_s^q}\) est simplement \(\tilde{p}^{q}_{s} = \tilde{n}^{q}_{s}/n^q\). On l’introduit dans la formule de l’entropie pour obtenir l’estimateur de Grassberger :

\[\begin{equation} ^{q}{\tilde{H}} = \frac{1 - \sum_{s}{\tilde{p}^{q}_{s}}}{q - 1} \tag{4.22} \end{equation}\]

La dernière méthode a fait l’objet d’une importante littérature. Une revue peut être trouvée dans Chao, Wang, and Jost (2013), Appendix A. Elle repose sur l’estimation de \(h_q = \sum_{s}{p_s^q}\). \(h_q\) peut être écrit comme la somme suivante :

\[\begin{equation} h_q = \sum_{r=0}^{\infty}{\binom{q - 1}{r} \left( -1 \right)^r \zeta_r} \tag{4.23} \end{equation}\]

\(\zeta_r\) est l’entropie de Simpson généralisée \(\sum_{s}{p_s(1 - p_s)^r}\) définie par Z. Zhang and Zhou (2010). Les \(n\) premiers éléments de la somme, notés \(\tilde{h}_{q}\), peuvent être estimés sans biais (Z. Zhang and Grabchak 2016) :

\[\begin{equation} \tilde{h}_{q} = \sum_{s=1}^{S}{\hat{p}_{s} \sum_{v=1}^{n - n_s}{\left[ \prod_{i=1}^{v}{\frac{i - q}{i} \prod_{j=1}^{v}{\left( 1 - \frac{n_s - 1}{n - j} \right)}} \right] }} \end{equation}\]

Z. Zhang (2013) montre que le biais dû à l’ignorance des termes restants est asymptotiquement normal et décroît exponentiellement vite. L’estimateur de Z. Zhang and Grabchak (2016) est celui basé sur \(\tilde{h}_{q}\) :

\[\begin{equation} ^{q}{\tilde{H}} = \frac{1 - \tilde{h}_{q}}{q - 1} \tag{4.24} \end{equation}\]

Des tentatives ont été faites pour estimer le biais restant (Z. Zhang and Grabchak 2013). La plus aboutie est celle de Chao and Jost (2015), qui complète Chao, Wang, and Jost (2013). Elle repose sur l’estimation du nombre total d’espèces par l’estimateur Chao1 et quelques approximations, notamment que les probabilités réelles des espèces non observées peuvent être supposées presque égales. Il en résulte que l’estimateur de la probabilité moyenne des espèces échantillonnées une fois est également égal à l’estimateur de la probabilité des espèces non observées. Sa valeur est notée \(A\). Elle vaut \(2 f_2 / [(n - 1) f_1 +2 f_2]\) si les singletons et les doubletons sont présents ou \(2 / [(n - 1)(f_1 -1) + 2]\) si les doubletons sont absents. L’estimateur Chao-Jost de l’entropie HCDT est :

\[\begin{equation} ^{q}{\tilde{H}} = \frac{1}{q - 1} \left[ 1 - \tilde{h}_q - \frac{f_1}{n}{\left( 1 - A \right)}^{1 - n} \left( A^{q - 1} - \sum_{r=0}^{n-1}{\binom{q - 1}{r} {\left( A - 1 \right)}^r} \right) \right] \end{equation}\]

En l’absence de singletons et de doubletons, \(A\) est fixé à 1 et l’estimateur est identique à celui de Zhang et Grabchak.

4.9 Profils de diversité

Leinster and Cobbold (2012), après Hill (1973), Patil and Taillie (1982), Tothmeresz (1995) et Kindt, Van Damme, and Simons (2006), recommandent de tracer des profils de diversité, c’est-à-dire la valeur de la diversité \(^{q}\!D\) en fonction de l’ordre \(q\) (figure 4.4) pour comparer plusieurs communautés. Une communauté peut être déclarée plus diverse qu’une autre si son profil de diversité est au-dessus de l’autre pour toutes les valeurs de \(q\). Si les courbes se croisent, il n’y a pas de relation d’ordre (Tothmeresz 1995).

Lande, DeVries, and Walla (2000) montrent que si la diversité de Simpson et la richesse de deux communautés n’ont pas le même ordre, alors les courbes d’accumulation du nombre d’espèces en fonction du nombre d’individus échantillonnés se croisent aussi.

Profils de diversité des quatre carrés de la parcelle 6 de Paracou. La correction du biais d’estimation est celle de Chao et Jost. Le carré 2 est plus divers que le carré 4, mais pas que les carrés 1 et 3, qui sont plus divers dans les grands ordres de diversité. Le profil de diversité est tracé ici jusqu’à l’ordre \(q = 3\).

Figure 4.4: Profils de diversité des quatre carrés de la parcelle 6 de Paracou. La correction du biais d’estimation est celle de Chao et Jost. Le carré 2 est plus divers que le carré 4, mais pas que les carrés 1 et 3, qui sont plus divers dans les grands ordres de diversité. Le profil de diversité est tracé ici jusqu’à l’ordre \(q = 3\).

Code R pour réaliser la figure 4.4 :

paracou_6_abd %>% 
  # Suppression de "subplot_" dans les noms des carrés
  mutate(site = str_replace(.$site, "subplot_", "")) %>% 
  # Profil
  profile_hill(orders = seq(0, 3, .1), estimator = "ChaoJost") %>%
  autoplot() +
  labs(color = "Carré")

Pallmann et al. (2012) ont développé un test statistique pour comparer la diversité de deux communautés pour plusieurs valeurs de \(q\) simultanément.

C. Liu et al. (2006) nomment séparables des communautés dont les profils ne se croisent pas. Ils montrent que des communautés peuvent être séparables en selon un profil de diversité de \(^{q}\!D\) sans l’être forcément selon un profil de diversité de Hurlbert (section 3.4), et inversement. Ils montrent que les communautés séparables selon un troisième type de profil, celui de la queue de distribution (Patil and Taillie 1982), le sont dans tous les cas. Le profil de la queue de distribution est construit en classant les espèces de la plus fréquente à la plus rare et en traçant la probabilité qu’un individu appartienne à une espèce plus rare que l’espèce en abscisse (figure 4.5).

Profil de queue de distribution calculé pour les carrés de la parcelle 6 de Paracou. En abscisse : rang de l’espèce dans le classement de la plus fréquente à la plus rare ; en ordonnée : probabilité qu’un individu de la communauté appartienne à une espèce plus rare. Les profils de queue de distribution se croisent d’autant plus tôt qu’ils se croisent pour de grands ordres de diversité dans la figure 4.4.

Figure 4.5: Profil de queue de distribution calculé pour les carrés de la parcelle 6 de Paracou. En abscisse : rang de l’espèce dans le classement de la plus fréquente à la plus rare ; en ordonnée : probabilité qu’un individu de la communauté appartienne à une espèce plus rare. Les profils de queue de distribution se croisent d’autant plus tôt qu’ils se croisent pour de grands ordres de diversité dans la figure 4.4.

Code R :

paracou_6_abd %>%
  # Transformation en probabilités
  as_probabilities() %>%
  # Elimination des colonnes de description
  as.matrix() %>% 
  # Tri des espèces par ordre croissant de probabilité
  apply(MARGIN = 1, FUN = sort) %>% 
  # Cumul des probabilités. Attention: apply a transposé la matrice
  apply(MARGIN = 2, FUN = cumsum) %>% 
  # Classement par valeurs décroissantes
  apply(MARGIN = 2, FUN = rev) %>% 
  # Création d'un tibble pour le graphique
  as_tibble() %>% 
  # Nom des colonnes: 1 à 4
  rename_with(~ str_replace(., "V", "")) %>% 
  # Ajout d'une colonne pour l'ordre
  mutate(rank = seq_len(nrow(.))) %>% 
  # Création du graphique
  pivot_longer(cols = -rank) %>% 
  ggplot() +
    geom_line(aes(x = rank, y = value, color = name, lty = name)) +
    scale_x_log10() +
    labs(
      x = "Rang de l'espèce", 
      y = "Probabilité", 
      color = "Carré",
      lty = "Carré"
    ) 

Les coordonnées des points du profil sont définies par \[\begin{equation} \tag{4.25} y(x) = \sum_{s=x+1}^{S}{p_{[s]}},\ x\in \{0, 1, \dots, S\}. \end{equation}\]

\(p_{[s]}\) est la probabilité de l’espèce \(s\) ; les espèces sont classées par probabilité décroissante.

Ce profil est exhaustif (toutes les espèces sont représentées) alors que les autres profils de diversité ne sont représentés que pour un intervalle restreint du paramètre et qu’un croisement de courbes peut se produire au-delà. En revanche, il ne prend pas en compte les espèces non observées.

Fattorini and Marcheselli (1999) proposent un test pour comparer deux profils de queue de distribution à partir d’échantillonnages multiples (nécessaires pour évaluer la variance de chacune des probabilités) mais qui néglige les espèces non observées.

Adelman, M. A. 1969. “Comment on the "H" Concentration Measure as a Numbers-Equivalent.” The Review of Economics and Statistics 51 (1): 99–101. https://doi.org/10.2307/1926955.
Agapow, Paul Michael, Olaf R. P. Binindal-Emonds, Keith A. Crandall, John L. Gittleman, Georgina M. Mace, Jonathon C. Marshall, and Andy Purvis. 2004. “The Impact of Species Concept on Biodiversity Studies.” The Quarterly Review of Biology 79 (2): 161–79. https://doi.org/10.1086/383542.
Ashbridge, J., and Ian B. J. Goudie. 2000. “Coverage-Adjusted Estimators for Mark-Recapture in Heterogeneous Populations.” Communications in Statistics - Simulation and Computation 29 (4): 1215–37. https://doi.org/10.1080/03610910008813661.
Balmford, Andrew, M. J. B. Green, and M. G. Murray. 1996. “Using Higher-Taxon Richness as a Surrogate for Species Richness: I. Regional Tests.” Proceedings of the Royal Society of London, Series B: Biological Sciences 263: 1267–74. https://doi.org/10.1098/rspb.1996.0186.
Balmford, Andrew, Rhys E. Green, and Martin Jenkins. 2003. “Measuring the Changing State of Nature.” Trends in Ecology & Evolution 18 (7): 326–30. https://doi.org/10.1016/S0169-5347(03)00067-3.
Balmford, Andrew, A. H. M. Jayasuriya, and M. J. B. Green. 1996. “Using Higher-Taxon Richness as a Surrogate for Species Richness: II. Local Applications.” Proceedings of the Royal Society of London, Series B: Biological Sciences 263: 1571–75. https://doi.org/10.1098/rspb.1996.0230.
Barberousse, Anouk, and Sarah Samadi. 2014. “La Taxonomie Et Les Collections d’histoire Naturelle à l’heure de La Sixième Extinction.” In La Biodiversité En Question. Enjeux Philosophiques, Éthiques Et Scientifiques, edited by Elena Casetta and Julien Delord, 155–82. Paris: Editions Matériologiques.
Basharin, G. P. 1959. “On a Statistical Estimate for the Entropy of a Sequence of Independent Random Variables.” Theory of Probability and Its Applications 4 (3): 333–36. https://doi.org/10.1137/1104033.
Basset, Yves, Lukas Cizek, Philippe Cuénoud, Raphael K. Didham, François Guilhaumon, Olivier Missa, Vojtech Novotny, et al. 2012. “Arthropod Diversity in a Tropical Forest.” Science 338 (6113): 1481–84. https://doi.org/10.1126/science.1226727.
Beck, Jan, and Wolfgang Schwanghart. 2010. “Comparing Measures of Species Diversity from Incomplete Inventories: An Update.” Methods in Ecology and Evolution 1 (1): 38–44. https://doi.org/10.1111/j.2041-210X.2009.00003.x.
Béguinot, Jean. 2014. “An Algebraic Derivation of Chao’s Estimator of the Number of Species in a Community Highlights the Condition Allowing Chao to Deliver Centered Estimates.” International Scholarly Research Notices 2014. https://doi.org/10.1155/2014/847328.
———. 2015. “Extrapolation of the Species Accumulation Curve for Incomplete Species Samplings: A New Nonparametric Approach to Estimate the Degree of Sample Completeness and Decide When to Stop Sampling.” Annual Research & Review in Biology 8 (5): 1–9. https://doi.org/10.9734/ARRB/2015/22351.
———. 2016. “Basic Theoretical Arguments Advocating Jackknife-2 as Usually Being the Most Appropriate Nonparametric Estimator of Total Species Richness.” Annual Research & Review in Biology 10 (1): 1–12. https://doi.org/10.9734/ARRB/2016/25104.
Berger, Wolfgang H., and Frances L. Parker. 1970. “Diversity of Planktonic Foraminifera in Deep-Sea Sediments.” Science 168 (3937): 1345–47. https://doi.org/10.1126/science.168.3937.1345.
Blandin, Patrick. 2014. “La Diversité Du Vivant Avant (Et Après) La Biodiversité : Repères Historiques Et Épistémologiques.” In La Biodiversité En Question. Enjeux Philosophiques, Éthiques Et Scientifiques, edited by Elena Casetta and Julien Delord, 31–68. Paris: Editions Matériologiques.
Bonachela, Juan A., Haye Hinrichsen, and Miguel A. Muñoz. 2008. “Entropy Estimates of Small Data Sets.” Journal of Physics A: Mathematical and Theoretical 41 (202001): 1–9. https://doi.org/10.1088/1751-8113/41/20/202001.
Box, G. E. P., and D. R. Cox. 1964. “An Analysis of Transformations.” Journal of the Royal Statistical Society: Series B (Statistical Methodology) 26 (2): 211–52. https://doi.org/10.1111/j.2517-6161.1964.tb00553.x.
Brillouin, Léon. 1962. Science and Information Theory. 2nd ed. Oxford: Academic Press. http://store.doverpublications.com/0486497550.html.
Brose, Ulrich, Neo D. Martinez, and Richard J. Williams. 2003. “Estimating Species Richness: Sensitivity to Sample Coverage and Insensitivity to Spatial Patterns.” Ecology 84 (9): 2364–77. https://doi.org/10.1890/02-0558.
Bulmer, M. G. 1974. “On Fitting the Poisson Lognormal Distribution to Species-Abundance Data.” Biometrics 30 (1): 101–10. https://doi.org/10.2307/1939021.
Burnham, K. P., and W. S. Overton. 1978. “Estimation of the Size of a Closed Population When Capture Probabilities Vary Among Animals.” Biometrika 65 (3): 625–33. https://doi.org/10.2307/2335915.
———. 1979. “Robust Estimation of Population Size When Capture Probabilities Vary Among Animals.” Ecology 60 (5): 927–36. https://doi.org/10.2307/1936861.
Caldarelli, Guido, A. Capocci, P. De Los Rios, and Miguel A. Muñoz. 2002. “Scale-Free Networks from Varying Vertex Intrinsic Fitness.” Physical Review Letters 89 (25): 258702. https://doi.org/10.1103/PhysRevLett.89.258702.
Cardinale, Bradley J., J. Emmett Duffy, Andrew Gonzalez, David U. Hooper, Charles Perrings, Patrick Venail, Anita Narwani, et al. 2012. “Biodiversity Loss and Its Impact on Humanity.” Nature 486 (7401): 59–67. https://doi.org/10.1038/nature11148.
Cartozo, Cecile Caretta, Diego Garlaschelli, Carlo Ricotta, Marc Barthélemy, and Guido Caldarelli. 2008. “Quantifying the Taxonomic Diversity in Real Species Communities.” Journal of Physics A: Mathematical and Theoretical 41: 224012. https://doi.org/10.1088/1751-8113/41/22/224012.
Casetta, Elena. 2014. “Évaluer Et Conserver La Biodiversité Face Au Problème Des Espèces.” In La Biodiversité En Question. Enjeux Philosophiques, Éthiques Et Scientifiques, edited by Elena Casetta and Julien Delord, 139–54. Paris: Editions Matériologiques. https://www.cairn-sciences.info/la-biodiversite-en-question--9782919694549-page-139.htm.
Ceballos, Gerardo, Paul R. Ehrlich, and Rodolfo Dirzo. 2017. “Biological Annihilation via the Ongoing Sixth Mass Extinction Signaled by Vertebrate Population Losses and Declines.” Proceedings of the National Academy of Sciences, 201704949. https://doi.org/10.1073/pnas.1704949114.
Chao, Anne. 1984. “Nonparametric Estimation of the Number of Classes in a Population.” Scandinavian Journal of Statistics 11 (4): 265–70. http://www.jstor.org/stable/4615964.
———. 1987. “Estimating the Population Size for Capture-Recapture Data with Unequal Catchability.” Biometrics 43 (4): 783–91. https://doi.org/10.2307/2531532.
———. 2004. “Species Richness Estimation.” In Encyclopedia of Statistical Sciences, edited by N Balakrishnan, C B Read, and B Vidakovic, 2nd ed. New York: Wiley.
Chao, Anne, Chun-Huo Chiu, and Lou Jost. 2010. “Phylogenetic Diversity Measures Based on Hill Numbers.” Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 365 (1558): 3599–609. https://doi.org/10.1098/rstb.2010.0272 Supplementary.
Chao, Anne, Robert K. Colwell, Chun-Huo Chiu, and Ditch Townsend. 2017. “Seen Once or More Than Once: Applying Good-Turing Theory to Estimate Species Richness Using Only Unique Observations and a Species List.” Methods in Ecology and Evolution 8 (10): 1221–32. https://doi.org/10.1111/2041-210X.12768.
Chao, Anne, Nicholas J. Gotelli, T. C. Hsieh, Elizabeth L. Sander, K. H. Ma, Robert K. Colwell, and Aaron M. Ellison. 2014. “Rarefaction and Extrapolation with Hill Numbers: A Framework for Sampling and Estimation in Species Diversity Studies.” Ecological Monographs 84 (1): 45–67. https://doi.org/10.1890/13-0133.1.
Chao, Anne, T. C. Hsieh, Robin L. Chazdon, Robert K. Colwell, and Nicholas J. Gotelli. 2015. “Unveiling the Species-Rank Abundance Distribution by Generalizing Good-Turing Sample Coverage Theory.” Ecology 96 (5): 1189–1201. https://doi.org/10.1890/14-0550.1.
Chao, Anne, and Lou Jost. 2012. “Coverage-Based Rarefaction and Extrapolation: Standardizing Samples by Completeness Rather Than Size.” Ecology 93 (12): 2533–47. https://doi.org/10.1890/11-1952.1.
———. 2015. “Estimating Diversity and Entropy Profiles via Discovery Rates of New Species.” Methods in Ecology and Evolution 6 (8): 873–82. https://doi.org/10.1111/2041-210X.12349.
Chao, Anne, and Shen-Ming Lee. 1992. “Estimating the Number of Classes via Sample Coverage.” Journal of the American Statistical Association 87 (417): 210–17. https://doi.org/10.1080/01621459.1992.10475194.
Chao, Anne, Shen-Ming Lee, and T.-C. Chen. 1988. “A Generalized Good’s Nonparametric Coverage Estimator.” Chinese Journal of Mathematics 16: 189–99. http://www.jstor.org/stable/43836340.
Chao, Anne, and Chih-Wei Lin. 2012. “Nonparametric Lower Bounds for Species Richness and Shared Species Richness Under Sampling Without Replacement.” Biometrics 68 (3): 912–21. https://doi.org/10.1111/j.1541-0420.2011.01739.x.
Chao, Anne, K. H. Ma, T. C. Hsieh, and Chun-Huo Chiu. 2016. SpadeR: Species Prediction and Diversity Estimation with R.” http://chao.stat.nthu.edu.tw/blog/software-download/.
Chao, Anne, and Tsung-Jen Shen. 2003. “Nonparametric Estimation of Shannon’s Index of Diversity When There Are Unseen Species in Sample.” Environmental and Ecological Statistics 10 (4): 429–43. https://doi.org/10.1023/A:1026096204727.
———. 2010. Program SPADE: Species Prediction and Diversity Estimation. Program and User’s Guide. CARE. http://chao.stat.nthu.edu.tw/wordpress/wp-content/uploads/software/SPADE_UserGuide.pdf.
Chao, Anne, Yi-Ting Wang, and Lou Jost. 2013. “Entropy and the Species Accumulation Curve: A Novel Entropy Estimator via Discovery Rates of New Species.” Methods in Ecology and Evolution 4 (11): 1091–1100. https://doi.org/10.1111/2041-210x.12108.
Chapin, F. Stuart III, Erika S. Zavaleta, Valerie T. Eviner, Rosamond L. Naylor, Peter M. Vitousek, Heather L. Reynolds, David U. Hooper, et al. 2000. “Consequences of Changing Biodiversity.” Nature 405 (6783): 234–42. https://doi.org/10.1038/35012241.
Chiu, Chun-Huo, Yi-Ting Wang, Bruno A. Walther, and Anne Chao. 2014. “An Improved Nonparametric Lower Bound of Species Richness via a Modified Good-Turing Frequency Formula.” Biometrics 70 (3): 671–82. https://doi.org/10.1111/biom.12200.
Clarke, K. R., and R. M. Warwick. 2001. “A Further Biodiversity Index Applicable to Species Lists: Variation in Taxonomic Distinctness.” Marine Ecology-Progress Series 216: 265–78. https://doi.org/10.3354/meps216265.
Clench, Harry K. 1979. “How to Make Regional Lists of Butterflies: Some Thoughts.” Journal of the Lepidopterists’ Society 33 (4): 216–31.
Colwell, Robert K., and Jonathan A. Coddington. 1994. “Estimating Terrestrial Biodiversity Through Extrapolation.” Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 345 (1311): 101–18. https://doi.org/10.1098/rstb.1994.0091.
Conceição, Pedro, and Pedro Ferreira. 2000. “The Young Person’s Guide to the Theil Index: Suggesting Intuitive Interpretations and Exploring Analytical Applications.” Austin, Texas. http://ssrn.com/paper=228703.
Condit, Richard, Ryan A. Chisholm, and Stephen P. Hubbell. 2012. “Thirty Years of Forest Census at Barro Colorado and the Importance of Immigration in Maintaining Diversity.” PLoS ONE 7 (11): e49826. https://doi.org/10.1371/journal.pone.0049826.
Connell, Joseph H. 1978. “Diversity in Tropical Rain Forests and Coral Reefs.” Science 199 (4335): 1302–10. https://doi.org/10.1126/science.199.4335.1302.
Cormack, R. M. 1989. “Log-Linear Models for Capture-Recapture.” Biometrics 45 (2): 395–413. https://doi.org/10.2307/2531485.
Cracraft, Joel. 1983. “Species Concepts and Speciation Analysis.” In Current Ornithology Volume 1, edited by Richard F. Johnston, 1:159–87. Current Ornithology. Springer US. https://doi.org/10.1007/978-1-4615-6781-3_6.
Dalton, Hugh. 1920. “The Measurement of the Inequality of Incomes.” The Economic Journal 30 (119): 348–61. https://doi.org/10.2307/2223525.
Daróczy, Zoltán. 1970. “Generalized Information Functions.” Information and Control 16 (1): 36–51. https://doi.org/10.1016/s0019-9958(70)80040-7.
Dauby, Gilles, and Olivier J. Hardy. 2012. “Sampled-Based Estimation of Diversity Sensu Stricto by Transforming Hurlbert Diversities into Effective Number of Species.” Ecography 35 (7): 661–72. https://doi.org/10.1111/j.1600-0587.2011.06860.x.
Davis, H. T. 1941. The Theory of Econometrics. Bloomington, Indiana: The Principia Press.
DeLong, Don C. Jr. 1996. “Defining Biodiversity.” Wildlife Society Bulletin 24 (4): 738–49. http://www.jstor.org/stable/3783168.
Delord, Julien. 2014. “La Biodiversité : Imposture Scientifique Ou Ruse Épistémologique ?” In La Biodiversité En Question. Enjeux Philosophiques, Éthiques Et Scientifiques, edited by Elena Casetta and Julien Delord, 83–118. Paris: Editions Matériologiques. https://doi.org/10.3917/edmat.delor.2014.01.0083.
Dengler, Jürgen. 2009. “Which Function Describes the Species-Area Relationship Best? A Review and Empirical Evaluation.” Journal of Biogeography 36 (4): 728–44. https://doi.org/10.1111/j.1365-2699.2008.02038.x.
Devictor, Vincent, David Mouillot, Christine Meynard, Frédéric Jiguet, Wilfried Thuiller, and Nicolas Mouquet. 2010. “Spatial Mismatch and Congruence Between Taxonomic, Phylogenetic and Functional Diversity: The Need for Integrative Conservation Strategies in a Changing World.” Ecology Letters 13 (8): 1030–40. https://doi.org/10.1111/j.1461-0248.2010.01493.x.
Dobzhansky, T. 1937. Genetics and the Origin of Species. New York: Columbia University Press. http://en.wikipedia.org/wiki/Genetics_and_the_Origin_of_Species.
Ellerman, David. 2013. “An Introduction to Logical Entropy and Its Relation to Shannon Entropy.” International Journal of Semantic Computing 7 (02): 121–45. https://doi.org/10.1142/S1793351X13400059.
Engen, Steinar, and Russell Lande. 1996. “Population Dynamic Models Generating the Lognormal Species Abundance Distribution.” Mathematical Biosciences 132 (2): 169–83. https://doi.org/10.1016/0025-5564(95)00054-2.
Eren, Metin I., Anne Chao, Wen-Han Hwang, and Robert K. Colwell. 2012. “Estimating the Richness of a Population When the Maximum Number of Classes Is Fixed: A Nonparametric Solution to an Archaeological Problem.” Plos One 7 (5). https://doi.org/10.1371/journal.pone.0034179.
Esty, Warren W. 1983. “A Normal Limit Law for a Nonparametric Estimator of the Coverage of a Random Sample.” The Annals of Statistics 11 (3): 905–12. https://doi.org/10.2307/2240652.
Fattorini, L., and M. Marcheselli. 1999. “Inference on Intrinsic Diversity Profiles of Biological Populations.” Environmetrics 10 (5): 589–99. https://doi.org/10.1002/(SICI)1099-095X(199909/10)10:5<589::AID-ENV374>3.0.CO;2-0.
Fisher, Ronald Aylmer, A. Steven Corbet, and Carrington Bonsor Williams. 1943. “The Relation Between the Number of Species and the Number of Individuals in a Random Sample of an Animal Population.” Journal of Animal Ecology 12: 42–58. https://doi.org/10.2307/1411.
Gadagkar, Raghavendra. 1989. “An Undesirable Property of Hill’s Diversity Index N2.” Oecologia 80: 140–41. https://doi.org/10.1007/BF00789944.
Gaston, Kevin J. 2000. “Global Patterns in Biodiversity.” Nature 405 (6783): 220–27. https://doi.org/10.1038/35012228.
Gini, Corrado. 1912. Variabilità e Mutabilità. Bologna: C. Cuppini.
Good, I. J. 1953. “The Population Frequency of Species and the Estimation of Population Parameters.” Biometrika 40 (3/4): 237–64. https://doi.org/10.1093/biomet/40.3-4.237.
Gourlet-Fleury, Sylvie, Jean Marc Guehl, and Olivier Laroussinie. 2004. Ecology & Management of a Neotropical Rainforest. Lessons Drawn from Paracou, a Long-Term Experimental Research Site in French Guiana. Paris: Elsevier.
Grassberger, Peter. 1988. “Finite Sample Corrections to Entropy and Dimension Estimates.” Physics Letters A 128 (6-7): 369–73. https://doi.org/10.1016/0375-9601(88)90193-4.
———. 2003. “Entropy Estimates from Insufficient Samplings.” arXiv Physics e-Prints 0307138 (v2). http://arxiv.org/abs/physics/0307138.
Gregorius, Hans-Rolf. 1991. “On the Concept of Effective Number.” Theoretical Population Biology 40 (2): 269–83. https://doi.org/10.1016/0040-5809(91)90056-L.
———. 2010. “Linking Diversity and Differentiation.” Diversity 2 (3): 370–94. https://doi.org/10.3390/d2030370.
———. 2014. “Partitioning of Diversity : The "Within Communities" Component.” Web Ecology 14: 51–60. https://doi.org/10.5194/we-14-51-2014.
Haegeman, Bart, Jérôme Hamelin, John Moriarty, Peter Neal, Jonathan Dushoff, and Joshua S Weitz. 2013. “Robust Estimation of Microbial Diversity in Theory and in Practice.” The ISME Journal 7 (6): 1092–1101. https://doi.org/10.1038/ismej.2013.10.
Hausser, Jean, and Korbinian Strimmer. 2009. “Entropy Inference and the James-Stein Estimator, with Application to Nonlinear Gene Association Networks.” Journal of Machine Learning Research 10: 1469–84. http://www.jmlr.org/papers/v10/hausser09a.html.
Havrda, Jan, and František Charvát. 1967. “Quantification Method of Classification Processes. Concept of Structural Alpha-Entropy.” Kybernetika 3 (1): 30–35. https://eudml.org/doc/28681.
Heltshe, James F., and Nancy E. Forrester. 1983. “Estimating Species Richness Using the Jackknife Procedure.” Biometrics 39 (1): 1–11. https://doi.org/10.2307/2530802.
Hey, Jody. 2001. “The Mind of the Species Problem.” Trends in Ecology & Evolution 16 (7): 326–29. https://doi.org/10.1016/S0169-5347(01)02145-0.
Hill, M. O. 1973. “Diversity and Evenness: A Unifying Notation and Its Consequences.” Ecology 54 (2): 427–32. https://doi.org/10.2307/1934352.
Hoffmann, Sönke, and Andreas Hoffmann. 2008. “Is There a "True" Diversity?” Ecological Economics 65 (2): 213–15. https://doi.org/10.1016/j.ecolecon.2008.01.009.
Holdridge, L. R., W. C. Grenke, W. H. Hatheway, T. Liang, and J. A. Tosi. 1971. Forest Environments in Tropical Life Zones. Oxford: Pergamon Press.
Horvitz, D. G., and D. J. Thompson. 1952. “A Generalization of Sampling Without Replacement from a Finite Universe.” Journal of the American Statistical Association 47 (260): 663–85. https://doi.org/10.1080/01621459.1952.10483446.
Hubbell, Stephen P. 2015. “Estimating the Global Number of Tropical Tree Species, and Fisher’s Paradox.” Proceedings of the National Academy of Sciences 112 (24): 7343–44. https://doi.org/10.1073/pnas.1507730112.
Hubbell, Stephen P. 2001. The Unified Neutral Theory of Biodiversity and Biogeography. Princeton University Press.
Hurlbert, Stuart H. 1971. “The Nonconcept of Species Diversity: A Critique and Alternative Parameters.” Ecology 52 (4): 577–86. https://doi.org/10.2307/1934145.
Hutcheson, Kermit. 1970. “A Test for Comparing Diversities Based on the Shannon Formula.” Journal of Theoretical Biology 29: 151–54. https://doi.org/10.1016/0022-5193(70)90124-4.
Hwang, Wen-Han, Chih-Wei Lin, and Tsung-Jen Shen. 2014. “Good-Turing Frequency Estimation in a Finite Population.” Biometrical Journal 57 (2): 321–39. https://doi.org/10.1002/bimj.201300168.
Izsák, János, and Sandrine Pavoine. 2012. “Links Between the Species Abundance Distribution and the Shape of the Corresponding Rank Abundance Curve.” Ecological Indicators 14 (1): 1–6. https://doi.org/10.1016/j.ecolind.2011.06.030.
James, W., and Charles Stein. 1961. “Estimation with Quadratic Loss.” In Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, edited by Jerzy Neyman, 1:361–79. Berkeley, California: University of California Press.
Jensen, J. L. W. V. 1906. “Sur les fonctions convexes et les inégalités entre les valeurs moyennes.” Acta Mathematica 30 (1): 175–93. https://doi.org/10.1007/bf02418571.
Jizhong, Zhou, Ma Shijun, and Chen Changming. 1991. “An Index of Ecosystem Diversity.” Ecological Modelling 59: 151–63. https://doi.org/10.1016/0304-3800(91)90176-2.
Jost, Lou. 2006. “Entropy and Diversity.” Oikos 113 (2): 363–75. https://doi.org/10.1111/j.2006.0030-1299.14714.x.
———. 2007. “Partitioning Diversity into Independent Alpha and Beta Components.” Ecology 88 (10): 2427–39. https://doi.org/10.1890/06-1736.1.
———. 2009. “Mismeasuring Biological Diversity: Response to Hoffmann and Hoffmann (2008).” Ecological Economics 68: 925–28. https://doi.org/10.1016/j.ecolecon.2008.10.015.
———. 2010. “The Relation Between Evenness and Diversity.” Diversity 2 (2): 207–32. https://doi.org/10.3390/d2020207.
Keylock, C. J. 2005. “Simpson Diversity and the Shannon-Wiener Index as Special Cases of a Generalized Entropy.” Oikos 109 (1): 203–7. https://doi.org/10.1111/j.0030-1299.2005.13735.x.
Kindt, R., P. Van Damme, and A. J. Simons. 2006. “Tree Diversity in Western Kenya: Using Profiles to Characterise Richness and Evenness.” Biodiversity and Conservation 15 (4): 1253–70. https://doi.org/10.1007/s10531-005-0772-x.
Kullback, S., and R. A. Leibler. 1951. “On Information and Sufficiency.” The Annals of Mathematical Statistics 22 (1): 79–86. https://www.jstor.org/stable/2236703.
Lande, Russell. 1996. “Statistics and Partitioning of Species Diversity, and Similarity Among Multiple Communities.” Oikos 76 (1): 5–13. https://doi.org/10.2307/3545743.
Lande, Russell, Philip J. DeVries, and Thomas R. Walla. 2000. “When Species Accumulation Curves Intersect: Implications for Ranking Diversity Using Small Samples.” Oikos 89 (3): 601–5. https://doi.org/10.1034/j.1600-0706.2000.890320.x.
Leinster, Tom, and Christina Cobbold. 2012. “Measuring Diversity: The Importance of Species Similarity.” Ecology 93 (3): 477–89. https://doi.org/10.1890/10-2402.1.
Lineweaver, Hans, and Dean Burk. 1934. “The Determination of Enzyme Dissociation Constants.” Journal of the American Chemical Society 56 (3): 658–66. https://doi.org/10.1021/ja01318a036.
Liu, Canran, Robert J. Whittaker, Keping Ma, and Jay R. Malcolm. 2006. “Unifying and Distinguishing Diversity Ordering Methods for Comparing Communities.” Population Ecology 49 (2): 89–100. https://doi.org/10.1007/s10144-006-0026-0.
Liu, Dengfeng, Dong Wang, Yuankun Wang, Jichun Wu, Vijay P. Singh, Xiankui Zeng, Lachun Wang, et al. 2016. “Entropy of Hydrological Systems Under Small Samples: Uncertainty and Variability.” Journal of Hydrology 532: 163–76. https://doi.org/10.1016/j.jhydrol.2015.11.019.
Loreau, Michel. 2005. “Discours de Clôture.” In Actes de La Conférence Internationale Biodiversité Science Et Gouvernance, edited by Robert Barbault and Jean-Patrick Le Duc, 254–56. Paris, France.: IRD Editions.
Maasoumi, Esfandiar. 1993. “A Compendium to Information Theory in Economics and Econometrics.” Econometric Reviews 12 (2): 137–81. https://doi.org/10.1080/07474939308800260.
MacArthur, Robert H. 1955. “Fluctuations of Animal Populations and a Measure of Community Stability.” Ecology 36 (3): 533–36. https://doi.org/doi:10.2307/1929601.
———. 1957. “On the Relative Abundance of Bird Species.” Proceedings of the National Academy of Sciences of the United States of America 43 (3): 293–95. https://doi.org/10.1073/pnas.43.3.293.
———. 1965. “Patterns of Species Diversity.” Biological Reviews 40 (4): 510–33. https://doi.org/10.1111/j.1469-185X.1965.tb00815.x.
Magurran, Anne E. 1988. Ecological Diversity and Its Measurement. Princeton, NJ: Princeton University Press.
Mao, Chang Xuan. 2007. “Estimating Species Accumulation Curves and Diversity Indices.” Statistica Sinica 17: 761–74. http://www3.stat.sinica.edu.tw/statistica/oldpdf/A17n217.pdf.
Mao, Chang Xuan, and Robert K. Colwell. 2005. “Estimation of Species Richness: Mixture Models, the Role of Rare Species, and Inferential Challenges.” Ecology 86 (5): 1143–53. https://doi.org/10.1890/04-1078.
Marcon, Eric. 2015. “Practical Estimation of Diversity from Abundance Data.” HAL 01212435. https://hal-agroparistech.archives-ouvertes.fr/hal-01212435.
Marcon, Eric, and Bruno Hérault. 2015. “Entropart, an R Package to Measure and Partition Diversity.” Journal of Statistical Software 67 (8): 1–26. https://doi.org/10.18637/jss.v067.i08.
Marcon, Eric, Bruno Hérault, Christopher Baraloto, and Gabriel Lang. 2012. “The Decomposition of Shannon’s Entropy and a Confidence Interval for Beta Diversity.” Oikos 121 (4): 516–22. https://doi.org/10.1111/j.1600-0706.2011.19267.x.
Marcon, Eric, Ivan Scotti, Bruno Hérault, Vivien Rossi, and Gabriel Lang. 2014. “Generalization of the Partitioning of Shannon Diversity.” Plos One 9 (3): e90289. https://doi.org/10.1371/journal.pone.0090289.
May, Robert M. 1975. “Patterns of Species Abundance and Diversity.” In Ecology and Evolution of Communities, edited by M L Cody and J M Diamond, 81–120. Harvard University Press.
———. 2011. “Why Worry about How Many Species and Their Loss?” PLoS Biology 9 (8): e1001130. https://doi.org/10.1371%2Fjournal.pbio.1001130.
Mayden, Richard L. 1997. “A Hierarchy of Species Concepts: The Denouement in the Saga of the Species Problem.” In Species. The Units of Biodiversity., edited by M. F. Claridge, H. A. Dawah, and M. R. Wilson, 381–424. London: Chapman and Hall.
Mayr, Ernst. 1942. Systematics and the Origin of Species from the Viewpoint of a Zoologist. New York: Columbia University Press.
McGill, Brian J., Rampal S. Etienne, John S. Gray, David Alonso, Marti J. Anderson, Habtamu Kassa Benecha, Maria Dornelas, et al. 2007. “Species Abundance Distributions: Moving Beyond Single Prediction Theories to Integration Within an Ecological Framework.” Ecology Letters 10 (10): 995–1015. https://doi.org/10.1111/j.1461-0248.2007.01094.x.
Mcintosh, Robert P. 1967. “An Index of Diversity and the Relation of Certain Concepts to Diversity.” Ecology 48 (3): 392–404. https://doi.org/10.2307/1932674.
Meine, Curt, Michael E. Soulé, and Reed F. Noss. 2006. “"A Mission-Driven Discipline": The Growth of Conservation Biology.” Conservation Biology 20 (3): 631–51. https://doi.org/10.1111/j.1523-1739.2006.00449.x.
Mendes, R. S., L. R. Evangelista, S. M. Thomaz, A. A. Agostinho, and L. C. Gomes. 2008. “A Unified Index to Measure Ecological Diversity and Species Rarity.” Ecography 31 (4): 450–56. https://doi.org/10.1111/j.0906-7590.2008.05469.x.
Michaelis, L., and Maud L. Menten. 1913. “Die Kinetik Der Invertinwirkung.” Biochemische Zeitschrift 49: 333–69. https://www.ncbi.nlm.nih.gov/pubmed/21888353.
Miller, G. A. 1955. “Note on the Bias of Information Estimates.” In Information Theory in Psychology: Problems and Methods, edited by Henry Quastler, 95–100. Glencoe, Ill.: Free Press.
Miraldo, Andreia, Sen Li, Michael K. Borregaard, A. Florez-Rodriguez, Shyam Gopalakrishnan, Mirnesa Rizvanovic, Zhiheng Wang, Carsten Rahbek, Katharine A. Marske, and D. Nogues-Bravo. 2016. “An Anthropocene Map of Genetic Diversity.” Science 353 (6307): 1532–35. https://doi.org/10.1126/science.aaf4381.
Mora, Camilo, Derek P. Tittensor, Sina Adl, Alastair G. B. Simpson, and Boris Worm. 2011. “How Many Species Are There on Earth and in the Ocean?” PLoS Biology 9 (8): e1001127. https://doi.org/10.1371/journal.pbio.1001127.
Moreno, Claudia E., and Pilar Rodríguez. 2010. “A Consistent Terminology for Quantifying Species Diversity?” Oecologia 163 (2): 279–82. https://doi.org/10.1007/s00442-010-1591-7.
Motomura, I. 1932. “On the statistical treatment of communities.” Zoological Magazine 44: 379–83.
Mouillot, David, and Alain Leprêtre. 1999. “A Comparison of Species Diversity Estimators.” Researches on Population Ecology 41 (2): 203–15. https://doi.org/10.1007/s101440050024.
Mouillot, David, Wendy Stubbs, Matthieu Faure, Olivier Dumay, Jean-Antoine Tomasini, J. Bastow Wilson, and Thang Do Chi. 2005. “Niche Overlap Estimates Based on Quantitative Functional Traits: A New Family of Non-Parametric Indices.” Oecologia 145 (3): 345–53. https://doi.org/10.1007/s00442-005-0151-z.
Norris, J. L., and K. H. Pollock. 1998. “Non-Parametric MLE for Poisson Species Abundance Models Allowing for Heterogeneity Between Species.” Environmental and Ecological Statistics 5 (4): 391–402. https://doi.org/10.1023/A:1009659922745.
O’Hara, R. B. 2005. “Species Richness Estimators: How Many Species Can Dance on the Head of a Pin?” Journal of Animal Ecology 74: 375–86. https://doi.org/10.1111/j.1365-2656.2005.00940.x.
Oksanen, Jari, F. Guillaume Blanchet, Roeland Kindt, Pierre Legendre, Peter R. Minchin, R. B. O’Hara, Gavin L. Simpson, Peter Solymos, M. Henry H. Stevens, and Helene Wagner. 2012. “Vegan: Community Ecology Package.” http://cran.r-project.org/package=vegan.
Olszewski, Thomas D. 2004. “A Unified Mathematical Framework for the Measurement of Richness and Evenness Within and Among Multiple Communities.” Oikos 104 (2): 377–87. https://doi.org/10.1111/j.0030-1299.2004.12519.x.
Pallmann, Philip, Frank Schaarschmidt, Ludwig A. Hothorn, Christiane Fischer, Heiko Nacke, Kai U. Priesnitz, and Nicholas J. Schork. 2012. “Assessing Group Differences in Biodiversity by Simultaneously Testing a User-Defined Selection of Diversity Indices.” Molecular Ecology Resources 12 (6): 1068–78. https://doi.org/10.1111/1755-0998.12004.
Patil, Ganapati P., and Charles Taillie. 1982. “Diversity as a Concept and Its Measurement.” Journal of the American Statistical Association 77 (379): 548–61. https://doi.org/10.2307/2287709.
Pavoine, Sandrine, and Michael B. Bonsall. 2011. “Measuring Biodiversity to Explain Community Assembly: A Unified Approach.” Biological Reviews 86 (4): 792–812. https://doi.org/10.1111/j.1469-185X.2010.00171.x.
Peet, Robert K. 1974. “The Measurement of Species Diversity.” Annual Review of Ecology and Systematics 5: 285–307. https://doi.org/10.1146/annurev.es.05.110174.001441.
Pernès, J., ed. 1984. Gestion Des Ressources Génétiques Des Plantes. Tome 2 : Manuel. Paris: Agence de Coopération culturelle et technique.
Pielou, Evelyn C. 1966a. “Species-Diversity and Pattern-Diversity in the Study of Ecological Succession.” Journal of Theoretical Biology 10 (2): 370–83. https://doi.org/10.1016/0022-5193(66)90133-0.
———. 1966b. “The Measurement of Diversity in Different Types of Biological Collections.” Journal of Theoretical Biology 13 (C): 131–44. https://doi.org/10.1016/0022-5193(66)90013-0.
———. 1975. Ecological Diversity. New York: Wiley.
Preston, F. W. 1948. “The Commonness, and Rarity, of Species.” Ecology 29 (3): 254–83. https://doi.org/10.2307/1930989.
Pueyo, Salvador, Fangliang He, and Tommaso Zillio. 2007. “The Maximum Entropy Formalism and the Idiosyncratic Theory of Biodiversity.” Ecology Letters 10 (11): 1017–28. https://doi.org/10.1111/j.1461-0248.2007.01096.x.
Purvis, Andy, and Andy Hector. 2000. “Getting the Measure of Biodiversity.” Nature 405 (6783): 212–19. https://doi.org/10.1038/35012221.
R Core Team. 2024. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. http://www.r-project.org.
Raaijmakers, Jeroen G. W. 1987. “Statistical Analysis of the Michaelis-Menten Equation.” Biometrics 43 (4): 793–803. https://doi.org/10.2307/2531533.
Rényi, Alfréd. 1961. “On Measures of Entropy and Information.” In 4th Berkeley Symposium on Mathematical Statistics and Probability, edited by Jerzy Neyman, 1:547–61. Berkeley, USA: University of California Press.
Richards, Richard A. 2010. The Species Problem. A Philosophical Analysis. Cambridge: Cambridge University Press.
Ricotta, Carlo. 2005a. “On Parametric Diversity Indices in Ecology: A Historical Note.” Community Ecology 6 (2): 241–44. https://doi.org/10.1556/ComEc.6.2005.2.12.
———. 2005b. “Through the Jungle of Biological Diversity.” Acta Biotheoretica 53 (1): 29–38. https://doi.org/10.1007/s10441-005-7001-6.
———. 2007. “A Semantic Taxonomy for Diversity Measures.” Acta Biotheoretica 55 (1): 23–33. https://doi.org/10.1007/s10441-007-9008-7.
Ricotta, Carlo, and Giancarlo C. Avena. 2003. “An Information-Theoretical Measure of Taxonomic Diversity.” Acta Biotheoretica 25 (51): 35–41. https://doi.org/10.1023/A:1023000322071.
Ricotta, Carlo, and Laszlo Szeidl. 2006. “Towards a Unifying Approach to Diversity Measures: Bridging the Gap Between the Shannon Entropy and Rao’s Quadratic Index.” Theoretical Population Biology 70 (3): 237–43. https://doi.org/10.1016/j.tpb.2006.06.003.
Runnegar, B. 1987. “Rates and Modes of Evolution in the Mollusca.” In Rates of Evolution, edited by M. Campbell and M. F. Day, 39–60. London: Allen & Unwin.
Scheiner, Samuel M. 2003. “Six Types of Species-Area Curves.” Global Ecology and Biogeography 12 (6): 441–47. https://doi.org/10.1046/j.1466-822X.2003.00061.x.
Schürmann, Thomas. 2004. “Bias Analysis in Entropy Estimation.” Journal of Physics A: Mathematical and General 37 (27): L295–301. https://doi.org/10.1088/0305-4470/37/27/L02.
Shannon, Claude E. 1948. “A Mathematical Theory of Communication.” The Bell System Technical Journal 27 (3): 379–423, 623–56. https://doi.org/10.1002/j.1538-7305.1948.tb01338.x.
Shannon, Claude E, and Warren Weaver. 1963. The Mathematical Theory of Communication. University of Illinois Press.
Shen, Tsung-Jen, Anne Chao, and Chih-Feng Lin. 2003. “Predicting the Number of New Species in a Further Taxonomic Sampling.” Ecology 84 (3): 798–804. https://doi.org/10.1890/0012-9658(2003)084[0798:PTNONS]2.0.CO;2.
Simpson, E. H. 1949. “Measurement of Diversity.” Nature 163 (4148): 688. https://doi.org/10.1038/163688a0.
Slik, J. W. Ferry, Víctor Arroyo-Rodríguez, Shin-Ichiro Aiba, Patricia Alvarez-Loayza, Luciana F. Alves, Peter S. Ashton, Patricia Balvanera, et al. 2015. “An Estimate of the Number of Tropical Tree Species.” Proceedings of the National Academy of Sciences of the United States of America 112 (24): 7472–77. https://doi.org/10.1073/pnas.1423147112.
Smith, Eric P., and Gerald Van Belle. 1984. “Nonparametric Estimation of Species Richness.” Biometrics 40 (1): 119–29. https://doi.org/10.1002/9780470015902.a0026329.
Smith, Woollcott, and J. Frederick Grassle. 1977. “Sampling Properties of a Family of Diversity Measures.” Biometrics 33 (2): 283–92. https://doi.org/10.2307/2529778.
Soberón M., Jorge, and Jorge Llorente B. 1993. “The Use of Species Accumulation Functions for the Prediction of Species Richness.” Conservation Biology 7 (3): 480–88. https://doi.org/10.1046/j.1523-1739.1993.07030480.x.
Spellerberg, Ian F., and Peter J. Feder. 2003. “A Tribute to Claude Shannon (1916–2001) and a Plea for More Rigorous Use of Species Richness, Species Diversity and the ‘ShannonWienerIndex.” Global Ecology and Biogeography 12 (3): 177–79. https://doi.org/10.1046/j.1466-822X.2003.00015.x.
Speth, James Gustave, Martin W. Holdgate, and Mostafa K. Tolba. 1992. “Foreword.” In Global Biodiversity Strategy, edited by Kathleen Courrier, v–vi. Washington, D.C.: WRI, IUCN, UNEP.
Steege, Hans ter, Nigel C. A. Pitman, Daniel Sabatier, Christopher Baraloto, Rafael P. Salomão, Juan Ernesto Guevara, Oliver L. Phillips, et al. 2013. “Hyperdominance in the Amazonian Tree Flora.” Science 342 (6156): 1243092. https://doi.org/10.1126/science.1243092.
Stegen, James C., and Allen H. Hurlbert. 2011. “Inferring Ecological Processes from Taxonomic, Phylogenetic and Functional Trait β-Diversity.” PloS One 6 (6): e20906. https://doi.org/10.1371/journal.pone.0020906.
Stirling, Andy. 2007. “A General Framework for Analysing Diversity in Science, Technology and Society.” Journal of the Royal Society, Interface 4 (15): 707–19. https://doi.org/10.1098/rsif.2007.0213.
Stoddart, James A. 1983. “A Genotypic Diversity Measure.” Journal of Heredity 74: 489–90. https://doi.org/10.1093/oxfordjournals.jhered.a109852.
Sukumaran, Jeet, and L. Lacey Knowles. 2017. “Multispecies Coalescent Delimits Structure, Not Species.” Proceedings of the National Academy of Sciences of the United States of America in press. https://doi.org/10.1073/PNAS.1607921114.
Theil, Henri. 1967. Economics and Information Theory. Chicago: Rand McNally & Company.
Tothmeresz, Béla. 1995. “Comparison of Different Methods for Diversity Ordering.” Journal of Vegetation Science 6 (2): 283–90. https://doi.org/10.2307/3236223.
Tsallis, Constantino. 1988. “Possible Generalization of Boltzmann-Gibbs Statistics.” Journal of Statistical Physics 52 (1): 479–87. https://doi.org/10.1007/BF01016429.
———. 1994. “What Are the Numbers That Experiments Provide?” Química Nova 17 (6): 468–71. http://quimicanova.sbq.org.br/detalhe_artigo.asp?id=5517.
Ulanowicz, Robert E. 2001. “Information Theory in Ecology.” Computers & Chemistry 25 (4): 393–99. https://doi.org/10.1016/S0097-8485(01)00073-0.
Van Valen, Leigh. 1976. “Ecological Species, Multispecies, and Oaks.” Taxon 25 (2/3): 233–39. https://doi.org/10.2307/1219444.
Vinck, Martin, Francesco P. Battaglia, Vladimir B. Balakirsky, A. J. Han Vinck, and Cyriel M. A. Pennartz. 2012. “Estimation of the Entropy Based on Its Polynomial Representation.” Physical Review E 85 (5). https://doi.org/10.1103/PhysRevE.85.051139.
Volkov, Igor, Jayanth R. Banavar, Stephen P. Hubbell, and Amos Maritan. 2003. “Neutral Theory and Relative Species Abundance in Ecology.” Nature 424 (6952): 1035–37. https://doi.org/10.1038/nature01883.
Vu, Vincent Q., Bin Yu, and Robert E. Kass. 2007. “Coverage-Adjusted Entropy Estimation.” Statistics in Medicine 26 (21): 4039–60. https://doi.org/10.1002/sim.2942.
Wang, Ji-Ping. 2010. “Estimating Species Richness by a Poisson-compound Gamma Model.” Biometrika 97 (3): 727–40. https://doi.org/10.1093/biomet/asq026.
———. 2011. SPECIES: An R Package for Species Richness Estimation.” Journal of Statistical Software 40 (9): 1–15. https://doi.org/10.18637/jss.v040.i09.
Wang, Ji-Ping, Bruce Lindsay, Liying Cui, P. Kerr Wall, Josh Marion, Jiaxuan Zhang, and Claude DePamphilis. 2005. “Gene Capture Prediction and Overlap Estimation in EST Sequencing from One or Multiple Libraries.” BMC Bioinformatics 6 (1): 300. https://doi.org/10.1186/1471-2105-6-300.
Whittaker, R. H. 1960. “Vegetation of the Siskiyou Mountains, Oregon and California.” Ecological Monographs 30 (3): 279–338. https://doi.org/10.2307/1943563.
———. 1965. “Dominance and Diversity in Land Plant Communities.” Science 147 (3655): 250–60. https://doi.org/10.1126/science.147.3655.250.
———. 1972. “Evolution and Measurement of Species Diversity.” Taxon 21 (2/3): 213–51. https://doi.org/10.2307/1218190.
———. 1977. “Evolution of Species Diversity in Land Communities.” Edited by M. K. Hecht, W. C. Steere, and B. Wallace. Evolutionary Biology 10: 1–67.
Williams, P. H., and Kevin J. Gaston. 1994. “Measuring More of Biodiversity: Can Higher-Taxon Richness Predict Wholesale Species Richness?” Biological Conservation 67: 211–17. https://doi.org/10.1016/0006-3207(94)90612-2.
Williamson, Mark, and Kevin J. Gaston. 2005. “The Lognormal Distribution Is Not an Appropriate Null Hypothesis for the Species-Abundance Distribution.” Journal of Animal Ecology 74 (2001): 409–22. https://doi.org/10.1111/j.1365-2656.2005.00936.x.
Williamson, Mark, Kevin J. Gaston, and W. M. Lonsdale. 2001. “The Species-Area Relationship Does Not Have an Asymptote!” Journal of Biogeography 28 (7): 827–30. https://doi.org/10.1046/j.1365-2699.2001.00603.x.
Wilson, Edward O., and Frances M. Peter, eds. 1988. Biodiversity. Washington, D.C.: The National Academies Press. https://www.nap.edu/read/989/chapter/1.
Wilson, J. Bastow, Robert K. Peet, Jürgen Dengler, and Meelis Pärtel. 2012. “Plant Species Richness: The World Records.” Journal of Vegetation Science 23 (4): 796–802. https://doi.org/10.1111/j.1654-1103.2012.01400.x.
Wright, Sewall. 1931. “Evolution in Mendelian Populations.” Genetics 16 (2): 97–159. https://www.genetics.org/content/16/2/97.
Zhang, Cun-Hui, and Zhiyi Zhang. 2009. “Asymptotic Normality of a Nonparametric Estimator of Sample Coverage.” Annals of Statistics 37: 2582–95. https://doi.org/10.1214/08-aos658.
Zhang, Zhiyi. 2012. “Entropy Estimation in Turing’s Perspective.” Neural Computation 24 (5): 1368–89. https://doi.org/10.1162/NECO_a_00266.
———. 2013. “Asymptotic Normality of an Entropy Estimator with Exponentially Decaying Bias.” IEEE Transactions on Information Theory 59 (1): 504–8. https://doi.org/10.1109/TIT.2012.2217393.
Zhang, Zhiyi, and Michael Grabchak. 2013. “Bias Adjustment for a Nonparametric Entropy Estimator.” Entropy 15 (6): 1999–2011. https://doi.org/10.3390/e15061999.
———. 2016. “Entropic Representation and Estimation of Diversity Indices.” Journal of Nonparametric Statistics 28 (3): 563–75. https://doi.org/10.1080/10485252.2016.1190357.
Zhang, Zhiyi, and Hongwei Huang. 2007. “Turing’s Formula Revisited.” Journal of Quantitative Linguistics 14 (2-3): 222–41. https://doi.org/10.1080/09296170701514189.
Zhang, Zhiyi, and Jun Zhou. 2010. “Re-Parameterization of Multinomial Distributions and Diversity Indices.” Journal of Statistical Planning and Inference 140 (7): 1731–38. https://doi.org/10.1016/j.jspi.2009.12.023.