Biais géographique sur Wikipédia

Le biais géographique sur Wikipédia est une inégalité dans la distribution de son contenu par rapport à l'association géographique des sujets d'articles. C'est un élément de critique de Wikipédia, en plus d'autres préjugés, tels que les biais de genre, les biais raciaux ou les biais idéologiques. La recherche montre que malgré des différences considérables de cette distribution selon la langue de Wikipédia, il existe une tendance commune vers plus de contenu lié aux États-Unis et à l'Europe de l'Ouest et moins d'informations sur certaines régions du reste du monde[1].

Densité mondiale d'entrées Wikipédia géolocalisées (2013) [Passage à actualiser]

Contenus sur- et sous-représentés modifier

Plusieurs études sur la géographie d'Internet et Wikipédia ont été publiées par les membres de l'Oxford Internet Institute (OII).

Un article de 2009 de Mark Graham de l'OII dans The Guardian présentait une carte du monde codée par des couleurs illustrant la disparité entre le nombre d'articles Wikipédia géomarqués (dans toutes les langues) pour les pays du Nord et du Sud. Graham écrit :

Presque tout le continent africain est géographiquement mal représenté dans Wikipédia. De manière remarquable, il y a plus d'articles Wikipédia écrits sur l'Antarctique que sur tous les 53 pays d'Afrique sauf un (ou peut-être plus étonnant, il y a plus d'articles Wikipédia écrits sur les lieux fictifs de la Terre du Milieu et du Disque-Monde que sur de nombreux pays d'Afrique, d'Asie, et les Amériques)[2].

Une analyse de 2010 des wikipédiens par nombre de contributions montre que l'Asie, continent le plus peuplé, n'est représentée que dans 16,67% des éditions. L'Afrique (6,35 %) et l'Amérique du Sud (2,58 %) sont également sous-représentées[3]. Une étude réalisée en 2011 par l'OII a révélé que 84 % des articles géolocalisés se trouvaient en Europe ou en Amérique du Nord, et que l'Antarctique comptait plus d'entrées que n'importe quel pays d'Afrique ou d'Amérique du Sud[4]. Selon Adama Sanneh, le fondateur de l'initiative WikiAfrica Education, à partir de 2021, il y a plus d'articles sur la Wikipédia anglophone sur Paris que sur l'Afrique[5],[6].

En 2015, l'OII fait toujours état d'une répartition géographique très inégale des contributions à Wikipédia[7].

Une étude de 2023 qui porte sur l'ensemble des versions linguistiques de Wikipédia donne quelques exemples du fossé entre les thèmes occidentaux et non-occidentaux : Léonard de Vinci, l'artiste occidental le plus représenté, a des articles dans 222 versions linguistiques de Wikipédia, tandis que Su Shi, artiste chinois du XIe siècle d'importance comparable (ses oeuvres sont les plus prisées et les plus chères au monde parmi les oeuvres asiatiques, c'est un polymathe célébré, poète, ingénieur, et personnalité politique), Su Shi n'est couvert dans 35 versions linguistiques de Wikipédia[8]. Toutes versions linguistiques confondues, il y a 5 fois plus d'articles Wikipédia sur les artistes occidentaux les plus notables (7808 au total) que sur les artistes non-occidentaux d'importance équivalente (1 621), et 16 fois plus d'articles Wikipédia sur les chefs-d'œuvre occidentaux (2 570) que sur les chefs-d'oeuvre les non-occidentaux (165)[8]. La disproportion est encore plus accentuée si l'on prend en considération le volume de texte - les pages sur les artistes occidentaux sont plus plus longues[8]. À titre de comparaison le biais géographique est moins marqué dans Wikidata que dans Wikipédia, mais plus marqué dans Wikimedia Commons que dans Wikipédia[8].

Différences entre les versions linguistiques modifier

Comparaisons entre versions européennes et asiatiques modifier

Une étude de 2023 centrée sur les déséquilibres dans la couverture des arts visuels dans Wikipédia montre que Wikipédia (comme Wikimedia Commons et Wikidata) favorise très largement l'art occidental[8]. Mais elle montre aussi que les versions linguistiques européennes de Wikipédia sont généralement plus occidentales dans leur couverture, tandis que les versions linguistiques asiatiques sont plus mondiales[8]. Deux exceptions notables, cependant : la version anglophone de Wikipédia est une des plus "globales" dans sa couverture des arts visuels, tandis que la version en thai est, de loin, la plus occidentale [8].

Les auteurs de l'étude produisent une mesure du biais en divisant la couverture des artistes occidentaux dans chaque version linguistique Wikipédia par la couverture des artistes non occidentaux dans cette même version linguistique[8]. Il apparaît que les versions en ourdou, bengali, indonésien, ont les couvertures les plus mondiales (indices respectifs 0,5 ; 1,7 ; 3,3), suivies par la version anglophone (indice 3,9), tandis que les versions en italien, en polonais, en hongrois, se concentrent tout particulièrement sur l'art occidental (indices respectifs : 13,7 ; 11,7 ; 10,1). La version francophone de Wikipédia a un indice de 7,1[8].

Contenus produits par des pays à faible revenu modifier

On constate que les wikipédistes des pays à faible revenu contribuent souvent au déséquilibre géographique en écrivant davantage sur les pays à revenu élevé que sur les leurs[9].

Causes modifier

Préjugés culturels modifier

Les préjugés des wikipédistes peuvent expliquer les déséquilibres de contenus ; ils s'enracinent, selon des spécialistes, dans «des systèmes d'hégémonie et d'oppression comme l'impérialisme» ; il s'agit souvent de biais typiques d'une époque postcoloniale, analysés notamment par Edward Saïd[8]. Les échanges entre régions du monde qui ont accompagné la mondialisation se sont révélés déséquilibrés, plus favorables à la culture occidentale dominante qu'aux autres cultures[8].

Rôle de l'identité culturelle des wikipédistes modifier

Une étude réalisée en 2016 par David Laniado et Marc Miquel Ribé confirme empiriquement que l'identité culturelle est un facteur de motivation inconscient important pour les contributeurs de Wikipédia affectant leurs travaux dans des domaines pouvant être associés à leur identité, en particulier dans les catégories Wikipédia « Culture » et « Géographie »[10]. Une conclusion similaire avait été tirée en 2010 par Hecht et Gergle : les Wikipédiens ont tendance à travailler sur des sujets liés aux lieux proches[11].

Solutions modifier

Laniado et Ribé suggèrent que pour surmonter le déséquilibre résultant des identités culturelles, Wikipédia doit promouvoir des éditeurs de Wikipédia de différentes langues pour propager leurs identités culturelles dans d'autres Wikipédias. À cette fin, les outils de traduction et de recommandation d'articles développés par la Wikimedia Foundation peuvent être utiles en offrant des options pour sélectionner un contenu préférentiel en fonction des mots-clés liés à l'identité culturelle[10].

Voir aussi modifier

Références modifier

  1. Pablo Beytía, "The Positioning Matters. Estimating Geographical Bias in the Multilingual Record of Biographies on Wikipedia", SSRN Electronic Journal, 2020
  2. Mark Graham, « Wikipedia's known unknowns », The Guardian.co.uk, (consulté le )
  3. (en) Livingstone, « Let's Leave the Bias to the Mainstream Media: A Wikipedia Community Fighting for Information Neutrality », M/C Journal, vol. 13, no 6,‎ (DOI 10.5204/mcj.315, lire en ligne Accès libre)
  4. Simonite, « The Decline of Wikipedia », MIT Technology Review, (consulté le )
  5. Greig, « For Wikipedia's 20th anniversary, students across Africa add vital information to site », TechRepublic, (consulté le )
  6. En 2011, une répartition par langues (arabe, arabe égyptien, anglais, français, hébreu, persan, swahili) a été rapportée par l'OII. Graham a signalé des modèles inattendus dans les distributions. Par exemple, Wikipédia en swahili contient un nombre inhabituel d'articles géolocalisés en Turquie. Graham explique cela et des artefacts similaires par des éditeurs dédiés créant de nombreuses ébauches d'articles dans les domaines qui les intéressent, Simon Rogers, « The world of Wikipedia's languages mapped », The Guardian,‎ (lire en ligne)
  7. Graham, M., Straumann, R., Hogan, B. 2015. "Digital Divisions of Labour and Informational Magnetism: Mapping Participation in Wikipedia". Annals of the Association of American Geographers. 105(6) 1158-1178. DOI 10.1080/00045608.2015.1072791 (free pre-publication version)
  8. a b c d e f g h i j et k Waqās Ahmed et Martin Lewis Poulter, « Representation of Non-Western Cultural Knowledge on Wikipedia: The Case of the Visual Arts », Digital Studies / Le champ numérique, vol. 13, no 1,‎ (ISSN 1918-3666, DOI 10.16995/dscn.8078, lire en ligne, consulté le )
  9. James Temperton "Wikipedia's world view is skewed by rich, western voices", Wired, September 15, 2015
  10. a et b David Laniado, Marc Miquel Ribé, "Cultural Identities in Wikipedias", SMSociety '16, July 11 - 13, 2016, London, United Kingdom, DOI 10.1145/2930971.2930996
  11. Hecht, B.J. and Gergle, D. 2010. "On the localness of user-generated content." Proc. CSCW

Bibliographie modifier

  • Les références suivantes se trouvent dans l'article de Beytía :
    • Graham, M., Hogan, B., Straumann, RK & Medhat, A. Géographies inégales des informations générées par les utilisateurs : modèles de pauvreté informationnelle croissante. Annales de l'Association des géographes américains, 104, 746-764 (2014).
    • Graham, M. Géographies de l'information et géographies de l'information. Nouvelles géographies (2015).
    • Roll, U. et al. Utilisation des pages vues de Wikipedia pour explorer l'importance culturelle des reptiles mondiaux. Conservation biologique, 204, 42–50 (2016).
    • Overell, SE & Rüger, S. Vision du monde selon Wikipedia : Sommes-nous tous des petits Steinberg ? Journal of Computational Science, 2, 193–197 (2011).
    • Graham, M., Hale, SA & Stephens, M. Géographies de la connaissance mondiale. (2011).
    • Graham, M., De Sabbata, S. & Zook, MA Vers une étude des géographies de l'information : des augmentations (im)mutables et une cartographie des géographies de l'information. Géo : Géographie et environnement, 2, 88–105 (2015).