Wikipédia:RAW/2024-03-01

Malgré le seum - L'édito de PAC2

Le mois de février a été éprouvant sur Wikipedia en français. Voir la communauté francophone se diviser sur un sondage est particulièrement douloureux. On se sent assez vite impuissant et comprendre qui a dit quoi et qui a enfreint les règles est épuisant. Surtout la confiance dans la capacité de la communauté à se réguler intelligemment vacille.

Malgré tout, ce numéro de RAW s'est construit au fil du mois avec quelques brèves, un tuto, un tout petit focus, etc. Chaque mois, on repart d'une page blanche et le brouillon se remplit plus ou moins rapidement.

Je suis heureux ce mois-ci parce qu'il y a de nouveaux contributeurs ou contributrices et parce que les brèves concernent une grande variété de projets, de Lingua Libre à Wikimedia Commons en passant par Wikisource.

Bonne lecture à toutes et tous.

La section focus est consacrée à des travaux originaux publiés dans RAW.

En février, le sondage Mention du nom de naissance pour les personnes trans a largement mobilisé la communauté Wikipédia.

Pour mesurer cette mobilisation, on peut comparer quelques indicateurs sur l'ensemble des sondages de la Wikipedia francophone. L'interface de programmation de l'outil xtools permet de récupérer pour chaque page Wiki le nombre de contributions et le nombre de contributeurices.

Aussi bien en terme de nombre de contributions que de nombre de contributeurices, le sondage sur le morinom se place deuxième derrière le sondage sur l'écriture inclusive (2020).

Classement des sondages de la Wikipédia francophone par nombre de contributeurices[1]
Classement des sondages de la Wikipédia francophone par nombre de contributions[1]

Brèves modifier

Lancement de RuwikiVladimir Medeyko (d) Voir avec Reasonator a démissionné de ses fonctions de directeur de Wikimedia RU (d) Voir avec Reasonator à l'été 2023 pour fonder RuWiki, une alternative à Wikipédia en russe. La nouvelle encyclopédie a été officiellement lancée le 15 janvier 2024[2].

« Ruwiki est un fork de Wikipédia, ce qui signifie qu’il est une copie du site originel. Ainsi, la quasi-totalité des articles présents sur la plateforme participative se trouve sur son clone russe, à l’exception de quelques-uns.

L’article sur l’invasion russe de l’Ukraine n’existe pas sur Ruwiki, tout comme l’article sur la guerre russo-ukraine ou celui dédié à la rébellion d’Evgueni Prigojine de juin 2023 (bien que celle-ci soit brièvement mentionnée sur les pages de l’ex-chef de Wagner et de l’organisation paramilitaire).[2]. »

En décembre 2023, Stanislav Kozlovski (d) Voir avec Reasonator, qui avait pris la succession de Medeyko à la tête de l'association Wikimedia RU, a annoncé la dissolution de l'association suite à des pressions politiques[2].

Le ministère de la justice russe ajoute Stanislav Kozlovski à la liste des « agents étrangers »[3].

Sondage sur le morinom — Le sondage sur la mention du morinom pour les personnes trans, lancé le 12 février, a profondément divisé la communauté de la Wikipédia francophone et suscité de nombreuses réactions hors de la communauté.

Pour Numérama, Aurore Gayte a tenté de résumer les enjeux et le débat[4].

« Il est important de rappeler que l’utilisation du deadname n’est pas un acte anodin : il s’agit d’une expérience douloureuse pour les personnes trans, qui se retrouvent renvoyées à leur ancien nom, et au genre qui leur a été assigné à la naissance. »

Aurore Gayte souligne que « d’autres commentaires laissent entrevoir une méconnaissance du sujet de la transsexualité de la part de certains contributeurs. « Pourquoi différencier le cas des transgenres (sic) avec les autres cas de changement de nom ? », demande un contributeur. « La page Johnny Hallyday ne s’appelle pas Jean-Philippe Smet, toutefois le nom de naissance/état civil est mentionné dans le [résumé introductif] », soulève un autre. »

L'autrice rappelle qu'une tribune avait déjà épinglé la transphobie sur Wikipédia en français[5].

« Dans une tribune parue dans L’Obs, une quarantaine de personnalités, trans ou non, critiquaient « le traitement que réserve Wikipédia aux personnes trans, non binaires et intersexes ». Elles expliquaient ainsi avoir « relevé au sein de Wikipédia la répétition de comportements stigmatisants, soit par ignorance, soit par réelle volonté de nuire », tels que du « mégenrage [ne pas utiliser les bons pronoms, ndlr], du deadnaming et le maintien de portraits photos pré-transition. » »

France Inter revient aussi sur le sondage et s'appuie sur l'expertise du sociologue Arnaud Alessandrin.

« Selon le sociologue Arnaud Alessandrin, ce débat "s’inscrit dans un moment particulier" : "Ce sondage, comme cette controverse, apparaît dans un moment où la transphobie n'a jamais été aussi forte, et où les arguments naturalistes à l'encontre des droits des personnes trans n'ont jamais été aussi forts". "On ne peut pas extraire cette controverse du moment de l'instant social et politique dans lequel elle naît, à savoir un moment de renouveau de la transphobie", souligne Arnaud Alessandrin[6]. »

Sur son blog, l'autrice Lizzie Crowdagger revient sur l'affaire et souligne la contradiction entre le principe de transparence et la volonté d'entre-soi.

« La recommandation actuelle sur Wikipédia est de décourager tout appel sur les réseaux sociaux à participer à un sondage, au point de demander des sanctions contre les « wikipédien·ne·s » l’ayant fait. Cette limitation de circulation de l’information aux contributeurs les plus réguliers entre quelque peu en contradiction avec le fait que toutes ces discussions et décisions… sont visibles par tout le monde, compte Wikipédia ou pas, avec un encadré sur la page du sondage rappelant, non pas qu’il faut éviter de diffuser celle-ci, mais que « la présente page est publique et susceptible d’être très consultée, voire médiatisée »[7]. »

Réconcilier Openstreetmap et Wikidata — Le projet OSM Wikidata link permet d'apparier les données de Wikidata et d'OpenStreetMap pour détecter d'éventuelles incohérences et améliorer la qualité des deux bases de données. On peut par exemple regarder l'appariement pour Libreville[8].

Flickypedia — La fondation Flickr développe Flickypedia, un outil qui permet d'exporter des photos de Flickr vers Wikimédia Commons[9].

« Nous avons présenté la version initiale à GLAM Wiki 2023 en Uruguay, et maintenant que nous avons intégré certains commentaires utiles de la communauté Wikimedia, nous sommes prêts à la lancer. Flickypedia est désormais disponible à l'adresse https://www.flickr.org/tools/flickypedia/, et nous sommes très satisfaits du résultat. Notre objectif était de créer des enregistrements de meilleure qualité sur Wikimedia Commons, avec des données mieux connectées et des informations descriptives, et de permettre aux photographes de Flickr de voir plus facilement comment leurs photos sont utilisées[10]. »

Logo de la Lingua Libre

Le biais de genre se niche aussi sur Lingua LibreLingua Libre est un projet de corpus audio et vidéo collaboratif et multilingue. Concrètement, il permet d'enregistrer en série rapide la prononciation de mots ou d'expressions, pour en documenter la prononciation, l'accent régional et la voix individuelle. Comme souvent sur internet, on retrouve des disparités dans la répartition des contributeurs et contributrices. En français, 23 400 enregistrements ont été réalisés par des femmes contre 347 000 par des hommes.

La bibliothèque libre s'enrichit — Le 6 février, la bibliothèque Wikisource francophone a franchi la barre des 5 000 index entièrement validés[note 1],[11].

Beau bilan pour le sourçage — Près de 20 % des articles sans aucune source ont été corrigés par les participants du Mois du sourçage ainsi que du projet Articles sans sources.

Robert Badinter, juriste, avocat et ancien ministre de la justice français est décédé en février 2024

Décès de Robert Badinter — Le célèbre ex-ministre de la Justice français Robert Badinter, décédé en début de mois, a permis la création en 5 langues de son article[12]. Quant aux articles existants, on peut citer la Wikipédia anglophone où la taille de l'article a augmenté de moitié[13].


Réconcilier le catalogue des archives et des manuscrits de l'enseignement supérieur en France avec Wikimédia Commons — Le blog Punktomoto revient sur les enjeux de la réconciliation du catalogue en ligne des archives et des manuscrits de l'enseignement supérieur (Calames) en France avec Wikimédia Commons. Techniquement, l'Agence bibliographique de l'enseignement supérieur s'appuie sur le plugin Pattypan[14] pour exporter les métadonnées de Calames vers Commons.

« Il est donc désormais possible – en quelques minutes voire secondes – d’exporter les données Calames puis d’importer dans Wikimedia Commons, d’une part, le tableau des données descriptives, d’autre part, les fichiers numériques des documents. »

Sur le site de l'ABES, on en apprend plus sur l'origine du projet.

« Le projet d’articuler Calames et Wikimedia Commons est né en 2022 du constat que cette plateforme permet de valoriser les fonds numérisés décrits dans Calames tout en préservant la richesse descriptive produite par les établissements du réseau. Seule condition : les fichiers numériques doivent être placés sous licence ouverte, CC-BY, Etalab 2.0 ou CC-BY-SA étant les seules licences acceptées sur la plateforme Wikimedia Commons. »

Tuto du mois modifier

Cette section est rédigée à la première personne par PAC2 (d · c · b)

Depuis quelques années, je partage régulièrement des notebooks Observable. Personnellement, la découverte d'Observable a libéré ma créativité. Je vous propose un tutoriel pour que chacun puisse faire ses propres notebooks.

Observable est une plate-forme commerciale de visualisation de données créée par Melody Meckfessel et Mike Bostock. Mike Bostock est connu dans la communauté de la visualisation de données depuis le début des années 2010. Il a développé la bibliothèque logicielle de d3.js. Il a également travaillé au sein de l'équipe infographique du New York Times où il a, avec d'autres, largement développé le journalisme de données et les infographies interactives.

Autour d'Observable, on retrouve tout un écosystème qui développe des logiciels open source de manipulation et de visualisation de données. L'Interactive Data Lab de l'université de Washington[15] développe la bibliothèque de visualisation de données Vega-Lite[16] et la bibliothèque de manipulation de données Arquero[17]. Nicolas Lambert développe les outils de manipulation de données géographiques comme geotoolbox[18] et de cartographie comme Bertin.js[19] et Geoviz.js[20]. Enfin, Mike Bostock et Philippe Rivière développent la bibliothèque de visualisation de données Observable's Plot[21].

Concrètement, Observable permet de créer des notebooks en combinant du texte au format markdown et du code informatique en langage JavaScript. Cela permet de créer des applications interactives assez facilement sans aucun effort de déploiement puisque le notebook est public dès le début. Les notebooks peuvent être dupliqués, puis adaptés facilement.

Se créer un compte

Sur Observable, on peut se créer un compte gratuit. Le compte gratuit permet de créer des notebooks sans limitation dès lors qu'ils sont publics. Le compte payant donne accès à des fonctionnalités avancées et notamment les notebooks privés.

Créer un notebook

Au moment de la création d'un Notebook, l'interface d'Observable propose un certain nombre de modèles (templates). Je recommande plutôt de partir d'un notebook vierge (blank).

Créer la première cellule

La première cellule contient forcément du texte au format markdown. Concrètement, elle a généralement un titre précédé du signe dièse et elle peut contenir du texte.

# Titre 
## Sous-titre

Blabla blabla
Choisir une requête SPARQL

Je propose de prendre la liste des éléments Wikidata baignés par (propriété P206) la Seine avec leur géo-localisation (propriété P625)[22].

#defaultView:Map
#title: Carte des lieux baignés par la Seine 
SELECT ?item ?itemLabel ?coord
WHERE {
?item wdt:P206 wd:Q1471;
      wdt:P625 ?coord;
      rdfs:label ?itemLabel . 
  FILTER(LANG(?itemLabel) = "fr") 
}
Cliquez pour essayer !
Écrire la requête dans Observable

On crée une cellule JavaScript et on enregistre la requête en lui donnant le nom de query :

query = `
SELECT ?item ?itemLabel ?coord
WHERE {
?item wdt:P206 wd:Q1471;
      wdt:P625 ?coord;
      rdfs:label ?itemLabel . 

  FILTER(LANG(?itemLabel) = "fr") 
} `
Écrire l'URL De la requête

On crée une nouvelle cellule JavaScript et on utilise la fonction encodeURIComponent pour encoder ou convertir la requête dans une chaîne de caractères qui puisse être intégrée à une URL.

Par ailleurs, on utilise la syntaxe ${} pour intégrer une variable dans une chaîne de caractères.

url = `https://query.wikidata.org/sparql?query=${encodeURIComponent(query)}`
Récupérer les données

On crée une cellule JavaScript et on utilise la fonction fetch pour récupérer les données en interrogeant le service query.wikidata.org.

On lit les données au format JSON.

data = fetch(url,
  { headers: { accept: "application/sparql-results+json" } }
).then((d) => d.json())
Mettre en forme les données

Une fois qu'on a récupéré les données, on peut faire un petit travail de mise en forme pour créer un tableau de données (array en JavaScript). Les données qui nous intéressent sont contenues dans data.results.bindings. On cherche à récupérer seulement les valeurs pour item, itemLabel et coord. On utilise la fonction map pour récupérer chacune de ces trois colonnes dans un tableau.

array = data.results.bindings.map((d) => ({
  item: d.item.value,
  itemLabel: d.itemLabel.value,
  coord: d.coord.value
}))
Afficher les résultats dans un tableur.

On peut désormais afficher les données dans l'interface en utilisant Inputs.table().

Inputs.table(array)
Convertir au format geoJSON

Pour représenter les données sur une carte, on peut convertir les données au format geoJSON en utilisant la bibliothèque geotoolbox développée par Nicolas Lambert.

Pour cela, on importe d'abord la bibliothèque geotoolbox.

 geo = require("geotoolbox@2")

On peut ensuite convertir le tableau au format geoJSON. Notons qu'il faut utiliser l'option reverse: true pour ne pas intervertir latitude et longitude.

geoarray = geo.coords2geo(array, {
  coords: "coord",
  reverse: true
})
Représenter les données sur une carte

Pour représenter les données sur une carte, on utilise la bibliothèque Geoviz développée par Nicolas Lambert.

On importe dans un premier temps la bibliothèque.

viz = require("geoviz@0.4.4")

On importe aussi les fonctions de projection cartographique de la bibliothèque D3js.

d3 = require("d3@7", "d3-geo-projection@4")

On peut commencer par créer un conteneur. On ajoute l'option zoomable: true et on utilise la projection cartographique de Mercator.

{
  // Container
  let svg = viz.create({
    zoomable: true,
    projection: d3.geoMercator()
  });

  return svg.render();
}

Dans une deuxième étape, on ajoute un fond de carte avec la fonction svg.tile().

{
  // Conteneur
  let svg = viz.create({
    zoomable: true,
    projection: d3.geoMercator()
  });
  
  // Fond de carte
  svg.tile();

  // Rendu
  return svg.render();
}

Enfin, on ajoute les points sur la carte avec svg.circles. On peut préciser le rayon des cercles avec r et la couleur avec fill. L'option dodge: true permet d'éviter que les points se chevauchent. L'option tip permet de choisir l'affichage d'un texte lorsqu'on passe sur un point.

{
  // Conteneur
  let svg = viz.create({
    zoomable: true,
    projection: d3.geoMercator()
  });
  
  // Fond de carte
  svg.tile();

  // Points
  svg.circle({
    data: geoarray,
    r: 6,
    fill: "#365486",
    dodge: true,
    tip: "$properties.itemLabel"
  });

  // Render
  return svg.render();
}

La première carte est réalisée 👏👏👏 !

Rendre la carte interactive

En l'état, cette carte n'apporte pas beaucoup plus que la carte proposée par query.wikidata.org. En revanche, on peut facilement ajouter de l'interactivité avec les fonctions Inputs.

Par exemple, on peut laisser l'utilisateur ou l'utilisatrice choisir n'importe quel élément Wikidata en rentrant un identifiant (Q id). Pour cela, on utilise Inputs.text().

viewof qid = Input.text({value: "Q1471", label: "Choisir l'identifiant Wikidata d'un cours d'eau"})

Ensuite, on peut alors changer la cellule query en utilisant qid comme une variable avec la syntaxe ${}.

query = `
SELECT ?item ?itemLabel ?coord
WHERE {
?item wdt:P206 wd:${qid};
      wdt:P625 ?coord;
      rdfs:label ?itemLabel . 

  FILTER(LANG(?itemLabel) = "fr") 
} `

On a maintenant un notebook interactif 🎉🎉🎉.

Pour aller plus loin

Apprendre à coder, c'est comme apprendre une langue étrangère. Ça prend du temps et ça demande de pratiquer souvent. Observable offre un environnement propice à l'apprentissage. Chaque fois qu'on parcourt un notebook, on peut explorer le code source en cliquant sur le menu à gauche de chaque cellule. Par ailleurs, on peut très facilement dupliquer un notebook que l'on trouve intéressant pour l'adapter et le modifier pour son propre besoin.

En recherchant les mots clés Wikipedia[23] et Wikidata[24], on peut trouver plein de notebooks inspirants.

Événements modifier

Ailleurs dans le Wikiverse modifier

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat modifier

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Le tuto Observable est tellement bien conçu qu'il donne vraiment envie de s'y mettre (dommage que je manque trop de temps ces jours-ci). Bravo @PAC2 et merci ! – Swa cwæð Ælfgar (discuter) 1 mars 2024 à 10:07 (CET)[répondre]

Merci PAC2 (discuter) 3 mars 2024 à 07:23 (CET)[répondre]

 –
Rédigé/traduit par PAC2, Athozus, Yug, Hugo en résidence
Citations originales
Notes
  1. Une page d'index est une « page d'accueil d'un livre » ; plus d'informations sur la page dédiée
Références
  1. a et b https://observablehq.com/@pac02/sondages-wpfr
  2. a b et c « Ruwiki : l’alternative russe à Wikipedia », Le Grand Continent,‎ (lire en ligne)
  3. (en) « Russia’s Justice Ministry updates ‘foreign agent’ list to include Memorial co-founder Oleg Orlov and Russian Wikimedia director Stanislav Kozlovsky, among others — Meduza », Meduaza,‎ (lire en ligne).
  4. Aurore Gayte, « Une question sur le deadname des personnes trans divise Wikipédia », Numerama,‎ (lire en ligne).
  5. « « Nous dénonçons le traitement que réserve Wikipédia aux personnes trans, non binaires et intersexes » », L'Observateur,‎ (lire en ligne).
  6. https://www.radiofrance.fr/franceinter/mentionner-ou-non-l-ancien-nom-de-personnes-trans-le-debat-agite-wikipedia-8562090
  7. https://crowdagger.fr/wikipedia-et-le-necronyme-des-personnes-trans-linsoutenable-neutralite-du-point-de-vue/
  8. https://osm.wikidata.link/matcher/relation/2804109
  9. https://glammr.us/@flickrfdn/111132871987178681
  10. « We demoed the initial version at GLAM Wiki 2023 in Uruguay, and now that we’ve incorporated some useful feedback from the Wikimedia community, we’re ready to launch it. Flickypedia is now available at https://www.flickr.org/tools/flickypedia/, and we’re really pleased with the result. Our goal was to create higher quality records on Wikimedia Commons, with better connected data and descriptive information, and to make it easier for Flickr photographers to see how their photos are being used. »
  11. Index terminés sur Wikisource
  12. be, br, fi, frp et no
  13. « Robert Badinter » sur Wikipédia anglophone
  14. https://github.com/Wikimedia-Sverige/pattypan/releases
  15. Pour en savoir plus sur l'équipe de l'interactive data lab http://idl.cs.washington.edu/about
  16. https://observablehq.com/@uwdata/introduction-to-vega-lite
  17. https://observablehq.com/@uwdata/arquero
  18. https://observablehq.com/@neocartocnrs/hello-geotoolbox
  19. https://observablehq.com/collection/@neocartocnrs/bertin
  20. https://observablehq.com/@neocartocnrs/geoviz
  21. https://observablehq.com/plot/
  22. https://wikis.world/@pac2/111886782779009132
  23. https://observablehq.com/search?query=wikipedia&onlyOwner=false
  24. https://observablehq.com/search?query=wikidata&sort=relevance&direction=desc&useES=true
  25. https://techblog.wikimedia.org/2023/11/22/wikimedia-hackathon-2024-is-here-mark-your-calendar-%f0%9f%8e%89/