Sujet sur Discussion Projet:Les sans pagEs

Mesurer la diversité de genre des liens cités dans les articles

18
PAC2 (discutercontributions)

Augmenter la diversité de genre dans Wikipédia est l'un des grands défis du mouvement Wikimédia pour les prochaines années (voir notamment Katherine Maher, "Capstone: Making History, Building the Future Together" in *Wikipedia @20*, https://wikipedia20.pubpub.org/pub/4d61w771/release/2)

Il existe de nombreuses initiatives en ce sens comme ce projet sans pagEs ou le Wikidata Human Gender Indicator. Ce dernier s'appuit notamment sur le nombre d'articles biographiques consacrés à des hommes et des femmes.

En complément, on pourrait aussi prendre un article et regarder la diversité de genre des liens cités dans l'article. En travaillant sur l'article Économie (discipline), j'ai commencé à me rendre compte qu'il y avait relativement peu de femmes citées et qu'il fallait peut être y prêter un peu plus d'attention.

J'ai développé un petit script qui récupère la liste des 500 premiers liens cités dans l'article et va chercher pour chacun de ces liens le genre (propriété P21) tel qu'il est renseigné sur Wikidata.

Les résultats bruts sont assez instructifs.

Par exemple, au 20 janvier :

  • l'article "Science politique" compte 28 liens renvoyant vers des hommes contre 1 lien renvoyant vers 1 femme !
  • l'article "Sociologie" compte 74 liens vers des hommes et 0 liens vers des femmes !
  • l'article "Microéconomie" compte 42 liens vers des hommes et 1 liens vers une femme !

Evidemment cette approche pose de nombreuses questions. En particulier, on se sait pas du tout quelle est la "juste proportion" de femmes qui pourraient être citées dans un article. Il n'est pas forcément problématique qu'un article sur l'équipe de France masculine de handball renvoie principalement vers des hommes et pour les articles consacrés à des sujets plus neutres comme les disciplines académiques, il est difficile de se faire une idée sur la proportion raisonnable de liens renvoyant vers des femmes.

En revanche, cette approche peut permettre de se rendre compte, de rendre visible des situations aberrantes. On pourrait par exemple imaginer de faire attention à ce que les articles labellisés respectent une certaine diversité de genre dans les liens cités. On pourrait aussi imaginer de laisser des alertes dans les pages de discussion pour les articles exclusivement "masculins" ou au contraire de valoriser, labelliser les articles qui respectent une certaines diversité de genre.

Je ne sais pas quelle est la bonne idée mais je lance la discussion.

Pa2chant.bis (discutercontributions)

J'en rêvais, tu l'as fait ! Cela s'inscrit dans un constat plus large (absence ou part congrue de la situation des femmes dans des articles d'histoire, ou sur des pays ; inventrices non citées dans les pages sur leur découverte alors que nombre d'hommes sont cités ; sources très masculines dans des domaines où les femmes sont pourtant fortement représentées, par exemple en biologie). Peser sur les labels serait à mon avis une mauvaise idée, car c'est quelquefois représentatif de l'état du monde, et ce serait ajouter une crispation bien inutile. Par contre, avoir l'information est très utile. Dans un premier temps, j'imagine plutôt des listes de travail. Est-ce qu'une catégorie de maintenance (donc non visible dans l'article) pourrait être une solution ? Quels outils sont nécessaires pour lancer ta requête sur une catégorie d'articles ?

PAC2 (discutercontributions)

Merci pour ton retour. C'est pas encore un outil. Pour le moment, c'est un simple script R qui tourne sur ma machine et c'est assez lent. Faut voir si j'arrive à bidouiller un truc javascript pour en faire un outil en ligne.

DeuxPlusQuatre (discutercontributions)

Avoir cette information me parait très intéressante. Cette information demandera sans doute une analyse fine de l'article mais pourrait bien révéler des surprises. À suivre.

Lewisiscrazy (discutercontributions)
PAC2 (discutercontributions)

Merci pour ce retour. Je ne connaissais pas ce modèle mais effectivement ce serait assez complémentaire. PAC2 (discuter) 23 janvier 2021 à 19:38 (CET)

PAC2 (discutercontributions)

Je commence par avancer doucement en laissant un message en page de discussion et en rééquilibrant les articles un à un (voir ici). On peut peut être lancer un hashtag #citonslesfemmes en résumé de contribution.

PAC2 (discutercontributions)

Je poursuis les investigations.

Plus j'avance, plus je me rends compte de la quasi absence des femmes dans des articles généralistes.

PAC2 (discutercontributions)

Pour info, l'outillage avance.

Grâce au bulletin hebdo de Wikidata, j'ai découvert qu'on pouvait habilement combiner des requêtes à l'api et une requête SPARQL (Compteur de liens genrés).

À partir de là, j'ai pu inclure un lien direct vers la requête dans le script Utilisateur:PAC2/Chouette pour l'interface web mobile et développer {{Indice de diversité de genre}} qui permet de créer le lien vers la bonne requête.

PAC2 (discutercontributions)
PAC2 (discutercontributions)

Je développe ma méthode d'investigation et mon outillage sur la question. Ce matin, j'ai regardé les "professions". J'ai pris les 100 professions avec le plus de liens de site sur Wikidata (sorte d'indice de notoriété interne à Wikidata) avec un article en français, je calcule la "diversité de genre" pour ces professions et je regarde les résultats.

J'obtiens un classement des articles en fonction de la par de femmes dans les articles.

Tous les calculs et les résultats sont présentés dans un notebook.

Les résultats sont surprenants :

En bas de l'échelle, on trouve les articles Poète, Architecte, Économiste, Intellectuel, Journaliste, Artiste peintre, etc.

Je retiens de cette petite expérience que l'idée d'avoir une section consacrée à la place des femmes dans un article sur une profession est une bonne idée que l'on pourrait ajouter dans le Wikipédia:Guide au sujet des biais de genre et de sexe.

Tous les retours sur les bienvenus. PAC2 (discuter) 18 juillet 2021 à 10:32 (CEST)

Pa2chant.bis (discutercontributions)

D'où l'intérêt de ne pas faire des articles séparés.

PAC2 (discutercontributions)

Je reprends mes analyses sur la diversité de genre dans les articles avec cette fois un focus sur les disciplines académiques : https://observablehq.com/@pac02/gender-diversity-in-academic-disciplines-in-fr-wikipedia-o.

Évidemment beaucoup de disciplines ont été historiquement dominées par des hommes mais on s'attend quand même à une certaine diversité de genre dans les articles consacrés à des disciplines académiques.

Je fais évoluer l'outillage aussi. J'utilise toujours l'outil Wikipédia:PAWS pour la récupération des données mais j'utilise un notebook Observable pour visualiser les résultats. Mon idée c'est que c'est pertinent de faire des analyses à un moment donné plutôt que d'avoir un outil qui calculé les résultats en temps réel.

J'ai rédigé en anglais parce que j'ambitionne aussi de faire la même chose sur en.wikipedia.org mais peut être qu'il faudrait rédiger une version française pour toucher le public de fr.wikipedia.org.

Pa2chant.bis (discutercontributions)

Tu fais un superbe boulot !

PAC2 (discutercontributions)

Merci.

PAC2 (discutercontributions)
.Anja. (discutercontributions)

Mais ces outils sont géniaux ! Ça permet ainsi d'illustrer de manière concrète le fait que les articles de WP renvoie + vers des bio d'hommes que des bio de femmes pendant un éditathon. Merci !

Allweno (discutercontributions)

Bravo @PAC2 et merci pour ces outils supers!

Répondre à « Mesurer la diversité de genre des liens cités dans les articles »