Utilisateur:Assassas77/Signpost 2018-04-26

en:Wikipedia:Wikipedia_Signpost/2018-04-26/Blog

Why the world reads Wikipedia: What we learned about reader motivation from a recent research study

Pourquoi le monde lit-il Wikipédia : les motivations des lecteurs selon une étude récente

Par Florian Lemmerich, Bob West, and Leila Zia — 15 mars 2018

La mission de Wikimedia est de fournir du contenu éducatif et de le diffuser. Pour cela, il est nécessaire de comprendre les besoins et les motivations des personnes qui consultent Wikipédia. Dans ce billet du blog Wikimedia, nous discuterons des motivations et des besoins des lecteurs de 14 versions linguistiques de Wikipédia grâce à une étude récente.

« [Pourquoi lisez-vous cet article aujourd'hui ?] لماذا تقرأ هذه المقالة اليوم؟", "আপনি কেন এ নিবন্ধটি আজ পড়ছেন?", "為什麼你今天會讀這篇條目？", "Waarom lees je dit artikel vandaag?", "Why are you reading this article today?", "Warum lesen Sie diesen Artikel gerade?", "?למה אתה קורא את הערך הזה היום", "यह लेख आज आप क्यों पढ़ रहे हैं?", "Miért olvasod most ezt a szócikket?", "あなたは今日何のためにこの項目を読んでいますか？", "De ce citiți acest articol anume astăzi?", "Почему вы читаете эту статью сегодня?", "Por qué estas leyendo este artículo hoy?", "Чому Ви читаєте цю статтю сьогодні? »

C'est la question que nous avons posé à un échantillon de lecteurs de Wikipédia dans 14 langues (l'allemand, l'anglais, l'arabe, le bengali, le chinois, l'espagnol, l'hébreu, le hindi, le hongrois, le japonais, le néerlandais, le roumain, le russe et l'ukrainien) en juin 2017^[1]. Nous avions deux objectifs à l'esprit : acquérir une meilleure compréhension des besoins, des motivations et des caractéristiques de nos lecteurs à travers les versions linguistiques de Wikipédia, et vérifier la robustesse des résultats que nous avions observé en 2016 dans la Wikipédia anglophone. Avec l'aide de bénévoles wikipédiens, nous avons collecté plus de 215 000 réponses durant cette étude de suivi, et dans cet article, nous partagerons avec vous ce que nous avons appris de la première phase d'analyse des données.

Tout d'abord, pourquoi est-il important de comprendre les besoins des lecteurs ?

Chaque seconde, 6 000 personnes consultent des articles Wikipédia à travers le globe. Chaque jour, Wikipédia satisfait des besoins en information très différents. Malgré cela, nous en savons très peu sur les motivations et les besoins des utilisateurs qui forment un groupe très hétérogène : pourquoi viennent-ils sur Wikipédia ? Comment utilisent-ils le contenu ? Qu'apprennent-ils ? En savoir plus sur leur utilisation du site nous permet de nous assurer que nous remplissons leurs besoins et développons des produits et des services qui nous permettent d'accomplir notre mission.

Pourquoi n'avons-nous pas étudié la question plus tôt ?

C'est incroyablement difficile de recueillir ce genre de données à cette échelle et nous avons dû développer notre capacité à collecter ce type de données. Au cours des dernières années, nous avons préparé le terrain pour conduire ce type de recherche. À partir de 2015, l'équipe Wikimedia Analytics a rendu possible le stockage et l'analyse des journaux de requêtes web. Ces journaux, stockés pendant 90 jours, offrent l'opportunité de réaliser des analyses approfondies du comportement des lecteurs. Toutefois, analyser les actions peut être difficile sur un site de la taille de Wikipédia. Chaque seconde, nous recevons jusqu'à 150 000 requêtes lors du chargement des pages. Si l'on ne sait pas ce que l'on cherche ou ce qu'on souhaite savoir de nos lecteurs, l'analyse des journaux de requêtes web s'apparente à rechercher une aiguille dans une botte de foin. La clef du puzzle nous est parvenue en 2015, avec l'arrivée de l'outil de micro-sondage QuickSurveys de la Fondation Wikimedia. Nous pouvions alors créer une structure pour interagir avec les personnes utilisant Wikipédia. Pour cette étude, nous avons combiné des sondages qualitatifs (grâce à QuickSurveys) avec une analyse de données quantitatives (grâce au journal des requêtes web) pour comprendre les besoins et les caractéristiques de nos lecteurs.

Ce que nous appris :

En 2016, nous avons construit la première taxonomie des lecteurs de Wikipédia, évalué la fréquence de différents cas d'utilisation de la Wikipédia anglophone et acquis une compréhension approfondie des profils de comportement des lecteurs dans chacun de ces cas. (Les détails sur la méthodologie sont décrits dans notre publication sur le sujet, revue par des pairs.) Un an après, quand nous avons répliqué cette étude et étendue celle-ci à d'autres versions linguistiques, nous avons posé les mêmes questions à ces lecteurs. Plus précisément, nous les avons interrogés sur :

leurs besoins en informations (vérifiaient-ils une information en particulier ou recherchaient-ils une réponse courte ? cherchaient-ils à avoir un aperçu du sujet ? ou une compréhension approfondie ?) ;
leur familiarité avec le sujet (avaient-ils des connaissances préalables sur le sujet ?) ;
leur motivation pour consulter l'article sur lequel il leur était proposé de répondre au sondage (était-ce une raison personnelle ? ou bien est-ce à cause d'un média, d'une conversation, d'un évènement, d'une contrainte liée à l'école ou au travail, ou quelque chose d'autre ?).

Voici ce que nous avons appris jusque-là.

(Note : tous les résultats ci-dessous ont été corrigés grâce à la méthode décrite dans l'annexe de notre étude précédente pour limiter divers biais de représentations éventuels dans l'échantillon de personnes interrogées.)

Besoins en information

« Je lis cet article pour (choisir une proposition parmi) vérifier une information spécifique ou obtenir une réponse rapide [fact] / avoir un aperçu du sujet [overview] / avoir une compréhension approfondie du sujet [in-depth]. »

Les graphiques ci-contre résument le besoin en information des utilisateurs dans les 14 versions linguistiques étudiées^[2].

À partir de ces graphiques, nous voyons que :

environ 35 % des utilisateurs de Wikipédia dans ses différentes versions linguistiques viennent pour vérifier une information spécifique ;
33 % souhaitent avoir un aperçu ou un résumé du sujet ;
et 32 % recherchent un article approfondi sur le sujet.

Il y a des exceptions significatives à cette observation globale qui méritent une enquête plus poussée :

la part d'utilisateurs hindiphones souhaitant vérifier une information spécifique [fact] ou cherchant à avoir un aperçu du sujet [overview] est la plus basse parmi tous les groupes d'utilisateurs étudiés (à 20 % et 10 % respectivement) ;
tandis que la recherche d'un article approfondi [in-depth] est le plus élevé (environ 70%) ;
on peut aussi noter que les lecteurs de la Wikipédia en hébreu ont le taux le plus élevé en « aperçu du sujet » [overview] (environ 50 %).

Familiarité

« Avant de consulter cet article, (choisir une proposition parmi) je connaissais déjà le sujet [familiar] / je ne connaissais pas le sujet et je m'informais pour la première fois [unfamiliar]. »

Nous avons reproduit le même type de graphique que ci-dessus, mais, cette fois, nous les avons interrogé sur leur familiarité avec le sujet de l'article qu'ils consultaient à ce moment-là.

La familiarité moyenne avec le sujet de l'article était de 55 % :

les utilisateurs de la Wikipédia en bengali et en chinois ont signalé une plus faible familiarité avec le sujet (environ 40 %) ;
tandis que les utilisateurs néerlandophones, magyarophones et ukrainophones ont signalé une très grande familiarité (au dessus de 65 %).

Une étude plus poussée est nécessaire pour comprendre si ce sont des différences fondamentales dans le comportement des lecteurs de ces langues ou si ces différences sont le résultat de différences culturelles dans cette auto-évaluation.

Motivation

« Je lis cet article car (cocher toutes les propositions correspondantes) j'ai un travail scolaire ou lié à mon emploi [work/school] / j'ai besoin de prendre une décision personnelle sur ce sujet [personal_decision] (par exemple, lire un livre ou choisir une destination de voyage) / je veux en savoir davantage sur un évènement en cours [current_event] (une compétition de football, un tremblement de terre récent, la mort d'une personne) / le sujet a été évoqué dans un média [media] (par exemple, la télévision, la radio, un article de journal, un film, un livre) / le sujet a été abordé au cours d'une conversation [conversation] / je m'ennuie ou j'explore au hasard Wikipédia pour me distraire [bored/random] / ce sujet est important pour moi et je souhaite en savoir plus [intrinsic_learning'] (par exemple, découvrir une culture) / autre [other]. »

Enfin, nous étudions les sources de motivation conduisant les utilisateurs à consulter des articles sur Wikipédia.

Voici les résultats :

Parmi les 7 motivations proposées,

la plus grande motivation des lecteurs est une volonté d'apprentissage intrinsèque [intrinsic_learning] ;
suivi par l'envie d'en apprendre plus sur un sujet évoqué dans un média (livres, films, radio, etc.) [media] ;
et dans une conversation [conversation].

Il y a quelques exceptions :

pour les hispanophones, l'apprentissage intrinsèque est suivi par les travaux scolaires / lié à leur emploi [work/school] ;
pour les bengalophones, ce sont les conversations et les évènements en cours [current_event] ;
les médias ont le plus bas score chez les hindiphones (10 %) ;
l'apprentissage intrinsèque a le plus haut score chez les bengalophones.

Que pouvons-nous conclure de cette étude ?

Nous avons encore besoin de temps pour approfondir l'analyse des données, ainsi que comprendre et comparer les comportements d'utilisateurs à partir des réponses ci-dessus. Nous favorisons un examen prudent des résultats ci-dessus, en évitant les conclusions que l'analyse ne pourrait confirmer. En se basant sur les résultats ci-dessus, nous pouvons affirmer avec certitude plusieurs choses.

Les résultats de l'étude sur la Wikipédia anglophone sont cohérents avec les résultats de 2016 (ouf !). Cela signifierait que les résultats pour les autres versions linguistiques dans l'étude de 2017 sont aussi cohérents dans le temps. Des études de suivi seront nécessaire pour valider ceci.
En moyenne, 32 % des lecteurs de Wikipédia recherchent une lecture approfondie, 35 % souhaitent apprendre intrinsèquement quelque chose, et ces deux nombres peuvent monter jusqu'à 55 % pour certaines langues. Wikipédia est un endroit unique d'Internet où les gens peuvent plonger dans le sujet, lire et apprendre, avec pour seul objectif d'apprendre, et ce, sans interruption. Il est important que les développements ultérieurs de contenus et de produits tiennent compte de cette raison et reconnaissent le besoin des utilisateurs d'apprendre pour l'envie d'apprendre.
Les médias comme les livres, la radio, les films et les programmes télévisés jouent un rôle important dans l'afflux de lecteurs sur Wikipédia.
Nous constatons effectivement des différences majeures dans les besoins en information et les motivations parmi les locuteurs de langues différentes, en particulier dans le cas des lecteurs hindiphones. Des études plus poussées sont nécessaires pour comprendre et expliquer de telles différences.
Les différences de familiarité concernant le contenu pour la Wikipédia en néerlandais, en hongrois et en ukrainien pourraient s'expliquer par des différences fondamentales dans les besoins et le comportement des lecteurs de ces langues, ou des différences culturelles dans l'auto-évaluation de leur familiarité. Des études plus poussées sont nécessaires pour nous éclairer sur ces différences.

Quelle est la prochaine étape et comment pouvez-vous nous aider ?

Nous avons débuté la seconde phase d'analyse pour certaines langues. Si vous observez des tendances intéressantes dans les données de ce billet et que vous pensez que nous devrions en être informé pour étudier cela plus en détail, signalez-vous. Si vous pouvez nous proposer des hypothèses pour expliquer certaines des tendances observées, dites-le nous. Bien que nous ne puissions pas forcément tester toutes les hypothèses ou comprendre toutes les tendances observées, plus nous aurons d'yeux rivés sur les données, plus il sera facile pour nous de trouver un sens à tout cela. Nous espérons pouvoir vous informer sur cette seconde phase d'analyse dans un futur proche. Entre-temps, gardez votre calme et poursuivez vos lectures [keep calm and read on] !

Florian Lemmerich, Université technique de Rhénanie-Westphalie à Aix-la-Chapelle et GESIS – Institut Leibniz de sciences sociales

Bob West, École polytechnique fédérale de Lausanne (EPFL) et chercheur associé de la Fondation Wikimedia

Leila Zia, chercheuse scientifique senior de la Fondation Wikimedia

Remerciements

Cette étude est le résultat d'un immense effort de bénévoles de Wikipédia, de chercheurs, et d'ingénieurs pour traduire, vérifier, collecter et analyser des données qui nous permettent de comprendre les personnes qui se cachent derrière le compteur de vues des articles et leurs besoins. Nous souhaitons en particulier remercier les volontaires wikipédiens qui nous ont servi de points de contact pour ce projet et qui nous ont aidé dans la traduction des sondages dans leurs langues, qui ont franchi avec nous les étapes de vérification, et qui ont tenu informé leur communauté de cette étude.

Notes

↑ Le choix des langues pour cette étude est le résultat des considérations suivantes : nous souhaitions idéalement avoir au moins une langue de chaque famille linguistique dans cette étude, et nous souhaitions trouver des langues dont les communautés accueilleraient favorablement cette étude et nous soutiendraient. Nous avons choisi les langues suivantes : l'arabe (s'écrivant de droite à gauche et englobant une grande partie du Moyen-Orient et de l'Afrique du Nord), le néerlandais (à la demande de Wikimedia Pays-Bas), l'anglais (pour répliquer les résultats de l'étude initiale), le hindi (à la demande de l'équipe New Readers), le japonais (une des langues CJKV dont nous savons peu de choses malgré l'importance du trafic qu'elles apportent aux projets Wikimedia), l'espagnol (une langue romane qui nous aide à comprendre les utilisateurs sud-américains et leurs besoins dans une large mesure) . 2. Toutes les autres langues ont été ajoutées après qu'une personne de leur communauté a répondu avec intérêt à notre appel dans la liste de diffusion Wikimedia-l.
↑ Les codes de langue utilisés dans le graphique sont : ar (arabe), bn (bengali) , zh (chinois), nl (néerlandais), en (anglais), de (allemand), he (hébreu), hi (hindi), hu (hongrois), ja (japonais), ro (roumain), ru (russe), es (espagnol), uk (ukrainien).

[1] Le choix des langues pour cette étude est le résultat des considérations suivantes : nous souhaitions idéalement avoir au moins une langue de chaque famille linguistique dans cette étude, et nous souhaitions trouver des langues dont les communautés accueilleraient favorablement cette étude et nous soutiendraient. Nous avons choisi les langues suivantes : l'arabe (s'écrivant de droite à gauche et englobant une grande partie du Moyen-Orient et de l'Afrique du Nord), le néerlandais (à la demande de Wikimedia Pays-Bas), l'anglais (pour répliquer les résultats de l'étude initiale), le hindi (à la demande de l'équipe New Readers), le japonais (une des langues CJKV dont nous savons peu de choses malgré l'importance du trafic qu'elles apportent aux projets Wikimedia), l'espagnol (une langue romane qui nous aide à comprendre les utilisateurs sud-américains et leurs besoins dans une large mesure) . 2. Toutes les autres langues ont été ajoutées après qu'une personne de leur communauté a répondu avec intérêt à notre appel dans la liste de diffusion Wikimedia-l.

[2] Les codes de langue utilisés dans le graphique sont : ar (arabe), bn (bengali) , zh (chinois), nl (néerlandais), en (anglais), de (allemand), he (hébreu), hi (hindi), hu (hongrois), ja (japonais), ro (roumain), ru (russe), es (espagnol), uk (ukrainien).

[1]

[2]