Coefficient de clustering

En théorie des graphes et en analyse des réseaux sociaux, le coefficient de clustering d'un graphe (aussi appelé coefficient d'agglomération, de connexion, de regroupement, d'agrégation ou de transitivité), est une mesure du regroupement des nœuds dans un réseau. Plus précisément, ce coefficient est la probabilité que deux nœuds soient connectés sachant qu'ils ont un voisin en commun.

Un graphe de fort coefficient de clustering.

C'est l'un des paramètres étudiés dans les réseaux sociaux : les amis de mes amis sont-ils mes amis ?

Définitions modifier

Il existe deux définitions différentes du coefficient de clustering : une version globale et une version locale[1].

Coefficient global modifier

Graphe de coefficient de clustering : c'est la proportion de paires de voisins connectés dans le graphe.

Le coefficient de clustering global est défini comme :

où un triangle est une clique de trois nœuds.

Le nombre de paires de voisins distincts d'un nœud de degré étant égal à , on obtient :

est le degré du nœud et l'ensemble des nœuds du graphe.

On a , avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3 (un graphe complet si le graphe est connecté).

Coefficient local modifier

Noeud de coefficient de clustering (en rouge). C'est la proportion de ses paires de voisins connectés.

Le coefficient de clustering local d'un nœud est défini comme :

soit

C'est la fraction de ses paires de voisins connectés, égale à 0 si par convention.

On a , avec égalité si et seulement si le nœud et son voisinage forment une clique d'au moins 3 nœuds.

En prenant la moyenne des coefficients locaux, on obtient le coefficient local moyen :

.

On a également , avec égalité si et seulement si le graphe est un ensemble de cliques de taille au moins 3.

Propriétés et variantes modifier

Relation entre les deux versions et interprétation modifier

Le coefficient global s'exprime à partir des coefficients locaux comme  :

C'est donc une moyenne pondérée des coefficients locaux, qui diffère du coefficient local moyen , sauf cas particuliers (graphe régulier par exemple). Les nœuds de fort degré ont donc plus de poids que ceux de faible degré[1]. Les poids reviennent à sélectionner un nœud en proportion du nombre de ses paires de voisins distincts, de sorte que le coefficient de clustering global s'interprète comme la probabilité que deux nœuds distincts soient connectés sachant qu'ils ont un voisin en commun.

Expression à partir de la matrice d'adjacence modifier

En notant la matrice d'adjacence du graphe, matrice binaire dont l'entrée est égale à 1 si et seulement si les nœuds sont voisins, le coefficient de clustering s'écrit :

En effet, le numérateur est égal à 6 fois le nombre de triangles et le dénominateur est égal à .

En l'absence de boucles (diagonale de nulle), le numérateur est la somme des éléments diagonaux de la matrice et le dénominateur la somme des éléments non-diagonaux de la matrice .

Variantes modifier

Il existe des versions du coefficient adaptées à certains types de graphes, comme les graphes pondérés[2] ou les graphes bipartis[3].

Modèle modifier

Le modèle de Watts-Strogatz permet de générer des graphes aléatoires ayant à la fois un fort coefficient de clustering et la propriété dite de petit monde[4],[5]. Ces deux propriétés sont caractéristiques les grands graphes réels, comme ceux formés par les réseaux sociaux[6].

Historique modifier

Le coefficient global est souvent attribué[7] à Barrat et Weigt pour l'article On the properties of small-world network models publié en 2000[4]. Le coefficient moyen local est attribué à Watts et Strogatz, pour l'article Collective dynamics of ‘small-world’ networks de 1998[5].

Voir aussi modifier

Notes et références modifier

  1. a et b Mark E.J. Newman, « The structure and function of complex networks », SIAM review, SIAM, vol. 45, no 2,‎ , p. 167-256
  2. A. Barrat, M. Barthelemy, R. Pastor-Satorras et A. Vespignani, « The architecture of complex weighted networks », Proceedings of the National Academy of Sciences, vol. 101, no 11,‎ , p. 3747-3752 (PMID 15007165, PMCID 374315, DOI 10.1073/pnas.0400087101, arXiv cond-mat/0311416)
  3. M. Latapy, C. Magnien et N. Del Vecchio, « Basic Notions for the Analysis of Large Two-mode Networks », Social Networks, vol. 30, no 1,‎ , p. 31-48 (DOI 10.1016/j.socnet.2007.04.006)
  4. a et b Alain Barrat et Martin Weigt, « On the properties of small-world network models », The European Physical Journal B-Condensed Matter and Complex Systems, Springer, vol. 13, no 3,‎ , p. 547-560
  5. a et b Duncan J. Watts et Steven H Strogatz, « Collective dynamics of ‘small-world’networks », Nature, Nature Publishing Group, vol. 393, no 6684,‎ , p. 440-442
  6. Albert-Laszlo Barabasi, Network Science,
  7. Par exemple dans (Newman 2003) et (Porter 2014)

Bibliographie modifier

  • (en) Mark E.J. Newman, « The structure and function of complex networks », SIAM review, SIAM, vol. 45, no 2,‎ , p. 167-256

Liens externes modifier