Notations

Les notations mathématiques peuvent différer de celles de la littérature citée pour l’homogénéité de ce document.

Les matrices sont notées en caractères gras et majuscules : \(\mathbf{X}\). Les éléments de la matrice \(\mathbf{X}\) sont notés \(x_{i,j}\).

Les vecteurs sont notés en gras minuscule : \(\mathbf{p}\). Les nombres sont notés en minuscules, \(n\), et les variables aléatoires en majuscules : \(N\). Les valeurs maximales des énumérations font exception : elles sont notées en majuscules pour les distinguer des indices : \(\sum_{s=1}^{S}{p_s}=1\).

Le produit matriciel de \(\mathbf{X}\) et \(\mathbf{Y}\) est noté \(\mathbf{X}\mathbf{Y}\). Dans les scripts R, l’opérateur est %*%. Le produit de Hadamard (terme à terme) est noté \(\mathbf{X}\circ\mathbf{Y}\) (opérateur * dans R). De même \(\mathbf{X}^n\) indique la puissance \(n\) au sens du produit matriciel d’une matrice carrée (opérateur %^% du package expm), alors que \(\mathbf{X}^{\circ n}\) est la matrice dont chaque terme est celui de \(\mathbf{X}\) à la puissance \(n\) (opérateur ^ de R). La matrice transposée de \(\mathbf{X}\) est notée \(\mathbf{X'}\).

Les notations sont les suivantes :

\({\mathbf 1}(\cdot)\) : la fonction indicatrice, qui vaut 1 si la condition dans la parenthèse est vraie, 0 sinon.

\(\mathbf{1}_s\) : le vecteur de longueur \(s\) composé uniquement de 1. \(\mathbf{1}_s\mathbf{1}_s'=\mathbf{J}_s\) où \(\mathbf{J}_s\) est la matrice carré de taille \(s\) ne contenant que des 1.

\(A\) : l’aire d’étude, et, selon le contexte, sa surface.

\(\alpha_\nu\) : la probabilité moyenne des espèces représentées par \(\nu\) individus.

\(C\) : le taux de couverture de l’échantillon, c’est-à-dire la probabilité qu’un individu de la communauté appartienne à une des espèces échantillonnées. \(C^{n}\) est le taux de couverture correspondant à un échantillon de taille \(n\).

\(^{q}\!D\) : la diversité vraie (nombre de Hill pour les diversités \(\alpha\) et \(\gamma\)), nombre équivalent de communautés pour la diversité \(\beta\). \(^{q}_{i}\!D_{\alpha}\) est la diversité \(\alpha\) mesurée dans la communauté \(i\). \(^{q}\!\bar{D}\left(T\right)\) est la diversité phylogénétique.

\(\boldsymbol{\Delta}\) : la matrice de dissimilarité dont les éléments sont \(\delta_{s,t}\), la dissimilarité entre l’espèce \(s\) et l’espèce \(t\).

\({\mathbb E}\left(X\right)\) : l’espérance de la variable aléatoire \(X\).

\(^{q}\!H\) : l’entropie de Tsallis (ou HCDT). \(^{q}_{i}\!H_{\alpha}\) est l’entropie \(\alpha\) mesurée dans la communauté \(i\). Si nécessaire, le vecteur des probabilités servant au calcul est précisé sous la forme \(^{q}\!H(\mathbf{p})\). \(^{q}\!\bar{H}(T)\) est l’entropie phylogénétique.

\(I\) : le nombre de communautés qui constituent une partition de la méta-communauté dans le cadre de la décomposition de la diversité. Les communautés sont indexées par \(i\).

\(I(p_s)\) : l’information apportée par l’observation d’un évènement de probabilité \(p_s\). \(I(q_s,p_s)\) est le gain d’information apporté par l’expérience (\(q_s\) est observé) par rapport aux probabilités \(p_s\) attendues.

\(\mathbf{I}_s\) : la matrice identité de rang \(s\) : matrice carrée de taille \(s\times s\) dont la diagonale ne comporte que des 1 et les autres élements sont nuls.

\(N\) : le nombre (aléatoire) d’individus se trouvant dans l’aire d’étude. \(N_s\) est la même variable aléatoire, mais restreinte aux individus de l’espèce \(s\).

\(n\) : le nombre d’individus échantillonnés. \(n_{s,i}\) est le nombre d’individus de l’espèce \(s\) dans la communauté \(i\). Les effectifs totaux sont \(n_{s+}\) (pour l’espèce \(s\)), \(n_{+i}\) pour la communauté \(i\) et \(n\) le total général. S’il n’y a qu’une communauté, le nombre d’individus par espèce est \(n_s\).

\(p_s\) : la probabilité qu’un individu tiré au hasard appartienne à l’espèce \(s\). Son estimateur, \({\hat{p}}_s\) est la fréquence observée. \(p_{s|i}\) est la même probabilité dans la communauté \(i\).

\(\mathbf{p}=\left( p_1, p_2, \dots, p_s, \dots, p_S \right)\) : le vecteur décrivant la distribution des probabilités \(p_s\), appelé simplexe en référence à sa représentation dans l’espace à \(S\) dimensions.

\({\pi}_{\nu}\) : la probabilité qu’une espèce choisie au hasard soit représentée par \(\nu\) individus, \(\sum^n_{\nu=1}{{\pi}_{\nu}}\)=1. Si l’espèce est choisie explicitement, la probabilité est notée \({\pi}_{n_s}\).

\(^{q}\!R\) : l’entropie de Rényi d’ordre \(q\).

\(S\) : le nombre d’espèces, considéré comme une variable aléatoire, estimé par \(\hat{S}\).

\(S^{n}_{\nu}\) : le nombre d’espèces, considéré comme une variable aléatoire, observées \(\nu\) fois dans l’échantillonnage. L’indice est le nombre de fois où l’espèce est détectée : par exemple \(S_{1}\) ou \(S_{\ne 0}\). L’exposant est la taille de l’échantillon : \(S^{A}\) pour la surface \(A\) ou \(\hat{S}^{n}\) pour un échantillon de \(n\) individus. \(S^{A}_{0}\) est le nombre d’espèces non rencontrées dans la surface \(A\). Pour alléger les notations, s’il n’y a pas d’ambiguïté, l’indice est omis pour les espèces présentes : \(S^{A}_{\ne 0}\) est noté \(S^{A}\). Si l’exposant n’est pas noté, l’échantillon n’est pas précisé et peut être aussi bien un nombre d’individus qu’une surface.

\(s^{n}_{\nu}\) : le nombre d’espèces observées, avec les mêmes notations que ci-dessus. \(s^{n}_{\nu}\) peut être considéré comme une réalisation de \(S^{n}_{\nu}\).

\(t^{n}_{1-\alpha/2}\) : le quantile d’une loi de Student à \(n\) degrés de liberté au seuil de risque \(\alpha\), classiquement 1,96 pour \(n\) grand et \(\alpha=5\%\).

\(\mathbf{Z}\) : la matrice de similarité entre espèces dont les éléments sont \(z_{s,t}\), la similarité entre l’espèce \(s\) et l’espèce \(t\).

\(\mathrm{\Gamma}(\cdot)\) : la fonction gamma.

\(\mathrm{\Psi}(\cdot)\) : la fonction digamma.

\(\binom{n}{k}\) : le nombre de combinaisons de \(k\) éléments parmi \(n\) : \[\binom{n}{k}=\frac{n!}{k!\,(n-k)!}\].

Calculs et données

1 Notions de Diversité