23 Diversité \(\beta\) spatialement explicite
L’indice de Simpson spatialement explicite ou le variogramme de complémentarité relient la diversité \(\beta\) à la distance entre communautés.
La diversité \(\beta\) de différentiation mesure à quel point deux communautés sont différentes entre elles. Elle peut être reliée à la distance entre les communautés pour définir une diversité \(\beta\) spatialement explicite.
23.1 L’indice de Simpson spatialement explicite
Chave et Leigh (2002) écrivent un modèle neutre de dispersion des espèces forestières, appliqué à l’échelle de l’Amazonie occidentale (Condit et al. 2002). Ils définissent dans ce cadre la fonction \(F(r)\) égale à la probabilité que deux individus situés à distance \(r\) l’un de l’autre soient de la même espèce, c’est-a-dire l’indice de concentration de Simpson (3.26), appliqué à des paires d’individus distants. \(\beta_s(r)=1-F(r)\) est appelé “indice de Simpson spatialement explicite” par G. Shen et al. (2013) En pratique il est estimé à partir d’individus situés dans des parcelles distantes de \(r\), l’ordre de grandeur de \(r\) étant nettement plus grand que la taille des parcelles.
De la même façon que l’indice de Simpson est généralisable à l’indice de Rao, \(\beta_s(r)\) est généralisable à \(\beta_{phy}(r)\), l’indice de Rao spatialement explicite, égal à la divergence moyenne entre deux individus situés à distance \(r\).
Les deux mesures sont des entropies \(\beta\), au sens où ce sont des diversités de différenciation (Jurasinski, Retzer, et Beierkuhnlein 2009), voir section 10.3.2, qui mesurent à quel point des unités spatiales distantes de \(r\) sont différentes. Ce ne sont pas des mesures de diversité proportionnelle parce que ce ne sont pas les différences entre les entropies \(\gamma\) (de la méta-communauté composée de toutes les parcelles) et \(\alpha\) (la moyenne des entropies des parcelles). L’avantage de ces mesures est d’être facilement interprétables, estimables sans biais (en tant qu’entropies de Simpson ou de Rao), et indépendantes de la diversité \(\alpha\).
Une décomposition due à Nei (1973) reprise par Chave, Chust, et Thébaud (2007) montre que \(\beta_s(r)\) est en réalité un mélange d’entropie \(\alpha\) et \(\beta\). Notons \(E_{i,j}\) la probabilité que deux individus tirés respectivement dans les parcelles \(i\) et \(j\) soient d’espèces différentes :
\[\begin{equation} \tag{23.1} E_{i,j} = 1-\sum_{s}{p_{s|i}}{p_{s|j}}. \end{equation}\]
\(E_{ii}\) est l’entropie de Simpson calculée dans la parcelle \(i\). L’entropie \(\beta\) de Simpson (équation (12.11), dans le cadre de la décomposition de la variance) pour des parcelles de poids égal vaut
\[\begin{equation} \tag{23.2} E_{\beta} = \frac{1}{I^2} \sum_{i}\sum_{j\ne i}\left({E_{i,j}-\frac{E_{i,i}+E_{j,j}}{2}}\right). \end{equation}\]
En se limitant à deux parcelles \(i\) et \(j\) situées à distance \(r\), le premier terme de la somme \(E_{i,j}\) est l’indice de Simpson spatialement explicite, qui doit être corrigé du deuxième terme de la somme, l’entropie \(\alpha\) de la paire de parcelle, pour obtenir l’entropie \(\beta\) après la normalisation nécessaire (\(E_{i,j}=E_{j,i}\) est compté deux fois dans la somme mais divisé par \(I^2=4\)). L’extension à \(\beta_{phy}(r)\) est immédiate, en remplaçant l’entropie de Simpson par celle de Rao.
Il est donc préférable de calculer la diversité \(\beta\) de Simpson ou de Rao plutôt que \(\beta_{s}(r)\) ou \(\beta_{phy}(r)\).
23.2 Le variogramme de complémentarité
Wagner (2003) définit le variogramme de complémentarité à partir des techniques de géostatistique. Les espèces sont inventoriées dans des parcelles de taille identique, en présence-absence. Les distances entre parcelles sont regroupées par classes. L’indicatrice \({\mathbf 1}_{s|i}\) vaut 1 si l’espèce \(s\) est présente dans la parcelle \(i\), 0 sinon. \(n_r\) est le nombre de paires de parcelles \(i\) et \(j\) situées dans la classe de distances dont la valeur centrale est \(r\) (leur distance exacte est \(d(i,j)\)). La semi-variance empirique à distance \(r\) de la variable indicatrice de la présence de l’espèce \(s\) est \[\begin{equation} \tag{23.3} \hat{\gamma}_{s}(r) = \frac{1}{2 n_r} \sum_{i,j;d(i,j)\approx r}{({\mathbf 1}_{s|i} - {\mathbf 1}_{s|j})^2}. \end{equation}\]
Chaque terme de la somme vaut 1 si l’espèce est présente sur une seule des deux parcelles : \(\hat{\gamma}_{s}(r)\) estime donc la probabilité que l’espèce ne soit présente que sur une seule parcelle. Le variogramme de la variable indicatrice est obtenue en traçant la valeur de \(\hat{\gamma}_{s}(r)\) en fonction de \(r\). Ce variogramme univarié, classique en géostatistique, est généralisé aux données multivariées : le vecteur de présence des espèces \(\mathbf{s_i}\) dont chaque terme est \({\mathbf 1}_{s|i}\). La semi-variance de ce vecteur de composition spécifique est \[\begin{equation} \tag{23.4} \hat{\gamma}(r) = \frac{1}{2 n_r} \sum_{i,j;d(i,j)\approx r}{\| \mathbf{s_i}-\mathbf{s_j} \|^2} = \sum_{s}{\hat{\gamma}_{s}(r)}. \end{equation}\]
\(\|\mathbf{s_i}-\mathbf{s_j}\|\) est la distance euclidienne entre les deux vecteurs. Puisque \(\hat{\gamma}(r)\) est la somme des semi-variances spécifiques, c’est un estimateur de l’espérance du nombre d’espèces présentes sur une seule parcelle de chaque paire. Le variogramme de la composition spécifique est appelé “variogramme de complémentarité” pour cette raison.
Bacaro et Ricotta (2007) l’utilisent en tant que mesure de diversité \(\beta\).
\({\mathbb E}({\mathbf 1}_{s})\) est la probabilité qu’une parcelle quelconque contienne l’espèce \(s\). Ce n’est pas la probabilité \(p_s\) qu’un individu appartienne à l’espèce \(s\) : comme toutes les parcelles sont de taille identique, \(p_s\) est égal à \({{\mathbb E}({\mathbf 1}_{s})}/{\sum_s{{\mathbb E}({\mathbf 1}_{s})}}\).
En absence de structuration spatiale, ou à partir de la valeur de \(r\) appelée portée, au-delà de laquelle la variance se stabilise à son palier, \(\hat{\gamma}(r)\) est égal à \(\sum_s{{\mathbb E}({\mathbf 1}_{s})[1-{\mathbb E}({\mathbf 1}_{s})]}\). \(\hat{\gamma}(r)\) n’est pas une forme de l’indice de Simpson parce que la somme des \({\mathbb E}({\mathbf 1}_{s})\) ne vaut pas 1.
Le variogramme peut être standardisé en divisant toutes les valeurs par la valeur attendue du palier, \(\sum_s{{\mathbb E}({\mathbf 1}_{s})[1-{\mathbb E}({\mathbf 1}_{s})]}\), pour éliminer l’effet de la diversité et se concentrer sur la structuration spatiale.
Le variogramme peut être complété par un covariogramme. La covariance entre les indicatrices de présence des espèces \(s\) et \(t\) est \[\begin{equation} \tag{23.5} \hat{\gamma}_{s,t}(r) = \frac{1}{2 n_r} \sum_{i,j;d(i,j)\approx r}{({\mathbf 1}_{s|i} - {\mathbf 1}_{s|j})({\mathbf 1}_{t|i} - {\mathbf 1}_{t|j})}. \end{equation}\]
Wagner montre que l’estimateur de la variance de la richesse spécifique par parcelle est \[\begin{equation} \tag{23.6} \hat{\operatorname{Var}}(S) = \sum_r{\frac{n_r}{\sum_r{n_r}}} \sum_{s,t}{\hat{\gamma}_{s,t}(r)}. \end{equation}\]
Si les espèces sont distribuées indépendamment les unes des autres, la covariance est nulle pour toutes les paires d’espèces à toutes les distances. Le test d’égalité entre \(\operatorname{Var}(S)\) et \(\gamma_{s,t}(r)\) à chaque valeur de \(r\) (obtenu par la méthode de Monte-Carlo en redistribuant aléatoirement la présence de chaque espèce sur le même nombre de parcelles que dans les données réelles) permet de rejeter l’indépendance entre les espèces.