L'indice de Simpson est un indice permettant de mesurer la diversité d'un milieu, créé par Edward Simpson en 1949, en calculant la probabilité que deux individus sélectionnés au hasard appartiennent à la même espèce.

Plus globalement, cet indice mesure le degré de concentrations d'individus classés en catégories[1]. En économie on parle parfois de l'indice d'Herfindahl ou de Herfindahl-Hirschman, en raison du travail de ces économistes sur cette formule[2],[3].

Formule modifier

La probabilité que deux individus pris au hasard soient de la même espèce se calcul comme suit[1] :

,

R est le nombre total d'espèces dans le jeu de données (richesse).

Une condition de cette formule est que le premier individu retourne dans le milieu (jeu de données) avant d'échantillonner le second individu. Si le jeu de données est très large, ne pas respecter cette hypothèse ne porte pas à conséquence, mais dans des petits jeux de données la différence peut être substantielle. Si le jeu de données est trop petit et la remise de l'échantillon est assumée, la formule peut être modifiée comme suite:

ni est le nombre d'individus appartenant à la ième espèce et N est le nombre total d'individus dans le jeu de données[1]. Cet indice de Simpson modifié est aussi connu sous le nom d'indice de Hunter–Gaston en microbiologie[4].

Références modifier

  1. a b et c E. H. Simpson, « Measurement of diversity », Nature, vol. 163, no 4148,‎ , p. 688 (DOI 10.1038/163688a0 Accès libre, Bibcode 1949Natur.163..688S)
  2. Herfindahl, O. C. (1950) Concentration in the U.S. Steel Industry. Unpublished doctoral dissertation, Columbia University.
  3. Hirschman, A. O. (1945) National power and the structure of foreign trade. Berkeley.
  4. PR Hunter et MA Gaston, « Numerical index of the discriminatory ability of typing systems: an application of Simpson's index of diversity », J Clin Microbiol, vol. 26, no 11,‎ , p. 2465–2466 (PMID 3069867, PMCID 266921, DOI 10.1128/JCM.26.11.2465-2466.1988)

Voir aussi modifier