Utilisateur:Hexasoft/wikidata

Wikidata se développe. Il est déjà utilisé pour les interwikis et l'on parle de plus en plus de son intégration dans les infobox (entre autre), ainsi que dans les taxobox.

Possibilités modifier

Wikidata permet d'associer à des « entités » (je n'ai sans doute pas le bon vocabulaire) un certain nombre d'informations, dont certaines peuvent être utilisées dans les articles et/ou les taxobox.

Prenons un exemple avec Lion : voici sa page sur wikidata : Q140. On y trouve (entre autre) les informations suivantes :

  • nom scientifique (Panthera leo) ainsi que auteur (Carl von Linné), date (1758)
  • rang (espèce)
  • taxon supérieur (Panthera)
  • image
  • carte de répartition
  • identifiants divers (ITIS, MSW…)

Le fonctionnement courant pour les infobox est le suivant : les différentes informations peuvent venir de wikidata (lorsqu'elles existent) ou de l'infobox, en définissant en général une priorité à l'info locale (il me semble).

Les problèmes que j'y vois (actuellement) modifier

Je vois pour ma part plusieurs problèmes ou limitations à l'utilisation de wikidata. Je les expose ici en les classant par « type ».

Problèmes d'ergonomie pour les rédacteurs modifier

C'est compliqué modifier

Quand on arrive ici difficile pour le rédacteur habitué à wikipédia de savoir comment modifier, comment connaître les éléments qui existent.

Les discussions sont en anglais modifier

Même s'il y a de nombreux français, les discussions techniques sont en anglais, langue qu'on n'est pas supposé maîtriser pour contribuer sur wikipédia en français (même si c'est personnellement mon cas).

Problème de suivi des modifications modifier

Jusqu'à l'arrivée de wikidata pour les interwikis on était informé par sa liste de suivi de toutes les modifications, y compris les changements d'interwikis. Ce n'est plus le cas actuellement, et sauf mécanisme inconnu de ma part ce ne sera donc plus le cas non plus pour toute information issue de wikidata.
Ceci me semble un obstacle réel au suivi, puisque ces informations font aussi partie du champs rédactionnel (bien plus d'ailleurs que les interwikis qui ne sont là que pour le « confort » mais n'influencent pas le contenu).

Problème du morcellement des éditions modifier

Puisque toutes les informations ne sont pas représentables / utilisables dans wikidata un contributeur voulant modifier en profondeur un taxon (suite à un changement de classification par exemple) va se retrouver à devoir éditer pour partie ici et pour partie sur wikidata. Il va lui falloir :

  1. identifier que des données viennent de wikidata
  2. identifier lesquelles (sur WP) et où elles se trouvent sur wikidata (quand il s'agit de données directes, dans l'élément, c'est simple, mais lorsqu'il s'agit de données dérivées ça l'est moins − par ex. l'abréviation d'un auteur qu'on trouve sur l'élément de l'auteur, pas l'élément du taxon)
  3. modifier les valeurs concernées sur wikidata, avec la question abordé ci-dessous de comment représenter une nouvelle classification (comment on fait techniquement, ou se trouve la documentation…)
  4. modifier les valeurs concernées sur wikipédia

Incomplétude de représentation de certaines informations modifier

La représentation utilisée pour certaines informations sur wikidata ne permet pas de retrouver l'ensemble des informations nécessaires à certains affichage.
Pour prendre l'exemple qui m'a sauté aux yeux en zoologie, même si on a bien l'auteur et la date on n'a pas l'information des éventuelles parenthèses autour, qui sont pourtant porteuses de sens (et obligatoires si l'on suit les conventions de l'ICZN, ce qui est le cas sur le projet biologie).
Ainsi toujours pour Lion on a comme information d'auteur : Carl von Linné + 1758. Et il faut afficher : ([[Carl von Linné|Linnaeus]], [[1758]]). Les difficultés :

  • comment trouver "Linnaeus" ? Il y a bien sur la fiche pour Linné les abréviations en botanique et en zoologie (en fait en "non botanique" ?!), mais justement on en trouve deux : Linnaeus et Linné → comment je détermine automatiquement laquelle utiliser ?
  • comment savoir qu'il faut mettre des parenthèses ici ?

Et si on regarde les zones auteur en botanique on perd encore plus d'information (mais aussi certains cas de zoologie). Exemples :

  • J.V. Lamouroux ex Dumortier, 1822
  • Duméril in Duméril & Duméril, 1851
  • (Pascher) Korshikov ex H. Ettl

Comment retrouver les in, ex (et autres, plus rares) ainsi que l'usage précis fait des parenthèses ?

Problème des divergences des classifications modifier

Afin d'avoir des sources à la base de nos classifications de nombreux projets de biologie ont choisi de suivre tout ou partie de classifications reconnues dans le domaine. Comment gérer la coexistence de choix différents ?
Prenons un exemple toujours sur Lion. Si on remonte l'entrée "taxon supérieur" à partir de Q140 on arrive à la famille des Felidae qui a pour taxon supérieur la super-famille des Feloidea. Sauf que sur notre taxobox de Lion au dessus de la famille des Felidae on trouve le sous-ordre des Feliformia.
Mon propos n'est pas de savoir qui a raison ou tord. Là n'est pas la question, on est face à un choix éditorial : notre taxobox indique qu'elle suit MSW et c'est bien les Feliformia que donne MSW…

Comment résoudre ce problème ? Il semble qu'on peut attacher des valeurs différentes à des sources différentes. Peut-être, mais comment je trouve la documentation pour faire précisément ça ? De quelle façon ? En justifiant comment ?

Voir à ce propos la section « Exemples concrets » pour d'autres problèmes pratiques qui peuvent se poser à cause de ces divergences.

Problème de jonction des classifications modifier

Par ailleurs de nombreuses classifications ne traitent les taxons que jusqu'à un certain rang (par exemple ReptileDB ne monte pas au dessus des sous-classes). Comment gérer la jonction entre de multiples classifications et leurs rangs supérieurs dans d'autres classifications, en sachant qu'en plus selon les classifications certains taxons existent ou pas, n'ont pas forcément le même rang ou se "rattachent" de façon différente.
Note : ce problème est complexe et n'est globalement pas résolu sur wikipédia en français…

Problème des rangs intermédiaires modifier

Lorsqu'un article parle d'un taxon on aborde tous les taxons inférieurs. Toutefois on ne détaille pas forcément tous ces taxons intermédiaires dans les taxobox (avoir mention de l'infra-classe Xxxx dans la taxobox de l'espèce Gggg eeee peut alourdir grandement la taxobox qui devient parfois plus longue que l'article…)
Comment représenter ce genre de chose ? S'il faut tout indiquer dans l'article / la taxobox quel intérêt d'avoir wikidata ?

Problème « philosophique » modifier

Jusqu'à présent l'indépendance éditoriale des wikipédia a été présenté comme une base non négociable. Les règles et usages des autres projets ne peuvent impacter notre fonctionnement (sauf bien sûr qu'on a tout à fait le droit de reprendre une idée ou de s'en inspirer, il ne s'agit pas de se croire supérieur mais seulement indépendant).

Or ici avec wikidata on se trouve dans une situation où du contenu éditorial (c'est-à-dire de l'information voire de la structuration − exemple de la classification) est hébergé ailleurs mais affiché directement dans nos articles. Comment gérer alors les conflits ?
Wikipédia possède de nombreuses règles, recommendations, prises de décisions, usages… ainsi que des instances pour aider à résoudre les conflits (ou les punir). Sont-ils opérants sur wikidata ? La réponse est non.
Pour prendre un exemple : la prise de décision (sur WP.fr) concernant l'orthographe pré/post 1990. Il a été décidé qu'on ne devait pas changer le choix du premier rédacteur de l'article, et que les deux étaient admissibles. Que faire si un pro- (ou anti-) orthographe pré-1990 décide de modifier les données en français sur wikidata ? De quel droit pourrait-on faire valoir une prise de décision ici pour annuler voire sanctionner un utilisateur sur un autre projet ? Et les exemples sont nombreux, il suffit de s'inspirer des conflits récents : translitération des noms étrangers (macrons…) ; orthographe pré/post 1990 ; rattachement à un pays d'une personne/colonie/territoire ; nom « principal » en français (exemple célèbre : endive / chicon)…

Plus généralement ça donne pour le moment l'impression d'une intégration dans le sens contraire : un autre projet, avec des règles, recommendations et usages différents − même si des francophones y participent − va avoir une influence directe sur du contenu ici, contenu qui peut être régit par nos propres règles, recommendations et usages.

Reps classiques : possibilité extrême : effacer l'infobox comme on efface une image et la remplacer par une autre. Rep moins extrême: les valeurs des paramètres passées explicitement aux infoboxes ont priorité sur les valeurs récupérées de Wikidata. Mais bon ça fait juste depuis le début qu'on en parle /o\ — TomT0m [bla] 25 août 2015 à 15:26 (CEST)
La question n'est pas là. La question de fond est que wikidata gère des données, mais que toutes ces données ne sont pas indépendantes de l'éditorial (même si c'est le cas de certaines). Or jusqu'à présent l'éditorial relève de chaque projet, et il me paraît difficile de dire que toute donnée dans une langue sur WD doit répondre aux règles/recommendations du wikipédia correspondant. La conséquence est bien un déplacement de questions éditoriales hors de la sphère de contrôle directe des projets.
Qu'ensuite on puisse « ignorer » telle ou telle valeur ou même l'infobox n'est pas à mon sens une solution, juste un pis-aller. Je trouve plus pénible qu'autre chose d'avoir une infobox dont les données sont éparpillées : ça nécessite de trouver la place de chaque info (local, dans le modèle, dans un autre modèle, dans WD, dans un autre élément de WD) et ça multiplie les éditions. Hexasoft (discuter) 25 août 2015 à 15:52 (CEST)
Tu pars du principe qu'il y a un problème éditorial qui ne soit pas réglable sur Wikidata, il est loin d'être dit que ce soit le cas nominal. À mon avis c'est très très marginal même. D'une part parce qu'on garde la maîtrise des infoboxes et qu'on peut donc coder certaines règles éditoriales dedans, et d'autre part parce que les sujets polémiques (en taxonomie je sais pas) sont rares. Et puis comme Wikidata, en cas de pluralité de points de vue taxonomique, permet de tous les mettre, il y a toujours la possibilité d'afficher des alternatives dans l'infobox. Alors oui c'est une solution de pis aller, mais oui c'est une solution de pis aller :) Et puis pour les sujets vraiments polémiques reste toujours la possibilité que vous reveniez à la joie du maintiens manuel des vieilles infobox ... — TomT0m [bla] 25 août 2015 à 16:43 (CEST)
Franchement on a clairement une approche de wikipédia incompatible.
Autant j'aime bricoler des modèles, des modules et des bots de mon coté, autant quand il s'agit d'éditer sur WP ça doit être pour moi à travers un ensemble d'outils cohérents.
Wikidata sera peut-être un jour intégré comme l'est quasiment commons maintenant mais quand je vois tous les doutes et questionnements qui existent ("il est loin d'être dit que", "à mon avis c'est marginal", "on peut", "possibilité de"…) sans parler de l'absence quasi-totale de documentation et d'orientation c'est loin d'être le cas.
Qu'on fasse des tests et essais sur des domaines ciblés, ou hors espace encyclopédique (c'est ce que je fais chaque fois que j'ai créé de nouveaux modules) c'est très bien, et important pour faire avancer les choses.
Mais en ce moment franchement ça fait vraiment « on fonce on fonce et on verra bien au fur et à mesure comment gérer les problèmes ».
Depuis 10 ans (je parle de ce que j'ai vu depuis mon arrivée) la biologie s'est construite de façon assez cohérente, elle a évolué − à mon sens − en volume et en qualité globale. Tout ça sans wikidata. Elle peut donc prendre son temps et survivre encore quelques temps sans WD déployé à tous les étages tout en réfléchissant aux vraies questions.
Les vraies questions sont pratiques, et pas théoriques. Il y a une section "Exemples concrets (en biologie)" plus loin. Indique-moi la réponse à ces questions, ou bien où se trouve la doc pour trouver la réponse.
Si maintenant la réponse c'est "il faut en parler sur telle page de WD" ma réponse est : trouve quelqu'un (d'autre) pour le faire.
À l'heure actuelle si je prends une taxobox standard elle contient :
  • un titre (le nom scientifique) → peut venir de WD mais il faut pouvoir conditionner ça à la classification suivie (le nom scientifique d'un même taxon peut changer) ⇒ pourquoi pas mais comment ?
  • une image → présente sur WD. Mais voir la section "Impact sur le(s) taxon(s) de rang(s) supérieur(s)" ⇒ même chose que ci-dessus
  • une légende → d'après ce que tu dis n'a pas sa place sur WD ⇒ donc reste sur WP
  • une classification supérieure → idem, comment je sélectionne la classification, et comment je la crée sur WD ? ⇒ même chose que plus haut
  • le nom scientifique + auteur + date → nom scientifique évoqué pour le titre, auteur + date d'après toi on ne peut représenter facilement les infos associées pour respecter les normes de l'ICZN ⇒ même chose que plus haut
  • les statut CITES et UICN → probablement simple à mettre en place (il manque certaines données sur WD mais c'est assez simple de les ajouter, j'ai un bot qui gère ça)
  • d'autres choses moins consensuelles et plus rare : carte de répartition, taxons de rang inférieur, synonymes, autres images+légendes…
Donc sur une taxobox "basique" il y a potentiellement 2 infos venant de WD (CITES et UICN), le reste je n'ai aucune idée de comment le mettre en œuvre (c-à-d comment trouver l'information sur WD de façon à pouvoir faire ce que nous voulons en terme éditorial).
Franchement pas de quoi casser 3 pattes à 1 canard…
Si par contre demain on m'indique comment représenter une classification et la sélectionner (en ayant accès aux informations dont nous avons besoin) tu auras 3 ou 4 domaines de la zoologie sur WD dans le mois qui suit Émoticône sourire. Hexasoft (discuter) 25 août 2015 à 17:20 (CEST)
C'est pas avec moi qu'il faut discuter des problèmes de taxonomies, c'est avec les taxonomistes de Wikidata, Tinm a commencé à discuter là bas. Sinon voilà la taxonomie sur Wikidata va évoluer sans vous :) Les taxonomistes de là bas connaissent l'UICN aussi bien que vous. Sinon voilà oui il y a pleins de questions pour gérer les changement de classification : déprécation des anciennes déclarations, création d'un nouvel élément, ... sinon comment on sélectionne les différent POV qu'on pourrait avoir : chaque source à (peut avoir) un identifiant "Q424..." sur WIkidata. En lua on peut filtrer les déclaration en ne gardant que celle qui sont sourcée par "Q424..." mais c'est juste une idée comme ça. Après voilà tes exemples sont peut être concrêts mais ils restent abstraits tant que tu n'as pas essayé de le faire et que tu t'es pas entretenu avec les taxonomistes de là bas, c'est une collaboration internationale, les décisions se prennent pas toutes seules. — TomT0m [bla] 25 août 2015 à 17:53 (CEST)
Je note aussi qu'un n'est dans la section "philosophie", c'est pas trop pour les questions concrêtes gratgrat ? — TomT0m [bla] 25 août 2015 à 17:55 (CEST)
"Sinon voilà la taxonomie sur Wikidata va évoluer sans vous" : heu, sauf que je suis sur wikipédia, pas sur wikidata, et qu'on ne m'a jamais demandé mon avis (lire : celle de la communauté) avant de changer la gestion des interwikis ou de commencer à mettre à la chaîne des infobox utilisant wikidata à coup de robot… C'est mon plus gros reproche : non pas ce que ça peut faire ou pas, mais la façon dont ça se fait. Et ça rejoint le problème de base évoqué ici : c'est la première fois qu'un projet externe à WP touche à du contenu (commons n'est en aucune façon dans ce cas). Selon moi ça mérite plus de maturité : que les WDiens travaillent sur la qualité (en ciblant quelques domaines spécifiques avec des volontaires motivés, comme ça a été fait avec les interwikis) plutôt que sur la quantité…
Par ailleurs je l'ai déjà dit aussi je trouve inacceptable sur des projets centrés sur la langue de devoir interagir sur un projet externe qui n'est pas strictement francophone (se faire traduire les discussions n'est pas très efficace). Ça revient en gros à laisser de coté un bon paquet de contributeurs (oui, un jour la doc et tout le reste sera sans doute accessible à tout le monde, mais ils n'auront pas eu la possibilité de discuter des structures à mettre en place…). Pour ma part je parle anglais mais je suis bien plus à l'aise en français pour discuter.
À noter aussi : nous n'utilisons pas de modèle monolithique pour les taxobox. Donc par ex. pour UICN ou CITES il faudra de toute façon un modèle, vide de paramètre ou pas. Hexasoft (discuter) 25 août 2015 à 18:43 (CEST)
Ben c'est un projet international, c'est forcément pas strictement francophone ... Et la doc, elle sera d'autant plus complète que des Wikipédiens "normaux" auront tenté l'aventure et documentés leurs soucis :) Perso je fais ce que je peux pour traduire les pages d'aides et écrire de la doc à l'occasion. C'est fait pour mutualiser les données, ça part d'une bonne intention, je comprend pas une telle réticence. La communauté n'a pas été forcée d'utiliser les interwikis que je sache, ce fut relativement consensuel et un problème de gestion de longue date que des bots étaient obligé de pallier, si on en revient là dessus on est pas rendu. La fondation Mediawiki est libre de lancer les projets qu'elle veut, elle le fait quand elle pense qu'un projet pourra apporter quelque chose, et Wikidata est un projet du genre unique en son genre et innovant, qui a des avantages indéniables. Oui l'utiliser implique de changer des choses, sinon ça servirait à rien :) Sinon j'en ai un peu raz le bol de répéter la même chose en boucle aux mêmes choses, donc j'arrête là, si tu veux pas, tu veux pas. J'ai plutôt l'impression que les autres contributeurs s'y mettent sans trop de problèmes et découvrent certains outils de Wikidata comme autolist2 qui permet de manipuler des éléments par gros paquets et qui sont donc efficaces. On obtient la puissance de feu d'un bot en bien plus accessible au novice parce qu'il n'y a pas du tout besoin de savoir coder ... En combinant tous les contributeurs de toutes les nationalités, ça va donner quelque chose de chouette, grâce à Wikidata. Faut pas en avoir peur et surtout ne pas voir une collaboration internationale comme dangereuse, c'est crier avant d'avoir mal. — TomT0m [bla] 25 août 2015 à 19:10 (CEST)
Décidément on n'a vraiment pas la même vision des choses. D'un point de vue personnel j'adore me plonger dans des développements nouveaux (j'ai été dans les premiers sur Lua, et j'ai rédigé la première version française du "Reference Manual" associé). Mais je différencie clairement mon plaisir de l'expérience de contributeur de mes co-biologistes, qui ne sont pour la plupart ni informaticiens ni spécialement technophiles.
Pour les interwikis tu sembles manquer d'information Émoticône sourire. Une prise de décision a débuté ici à ce propos, et a été abandonnée car la fundation a décidé de basculer « d'autorité » les interwikis sur WD. Il n'y a eu aucune concertation par projet (note que j'étais pour ma part pour ce genre de chose, ça fait partie selon moi des données qui en sont réellement, c'est-à-dire des choses non reliées à des considérations éditoriales locales).
Et encore une fois tu sembles incapable de comprendre la différence qu'il y a entre un technicien qui veut bien utiliser WD sur notre WP et quelqu'un qui est prêt à investir du temps sur un projet externe à WP pour mettre au point les fonctionnalités. Je veux bien être le premier mais pas le second, pour des questions de goût et de temps.
Sauf que tu reviens à la charge à toute occasion pour mettre WD en avant, alors que ce projet n'est pas mature à mon sens, en tout cas pas pour la biologie, ou seulement pour une petite sous-partie de celle-ci.
Je n'ai pas peur de WD, mais « j'en ai un peu raz le bol » de voir mettre WD en avant de partout alors que ce projet n'est pas capable de prendre en compte les subtilités éditoriales, ni même (semble-t-il) de reconnaître qu'il y a un champs éditorial dans certaines données ne relevant que des wikipédias. Oui l'idéal serait d'aller s'investir là-bas. Mais la notion de « bénévole » prend tout son sens ici : j'ai choisi de m'investir sur fr.WP (et je l'ai largement fait depuis 10 ans) et n'ai aucune envie d'aller me bagarrer dans une langue étrangère sur un projet externe qui ne me donne même pas des documentations et guides pour savoir quoi faire… Ceci n'est pas une question de devoir ou de pouvoir, mais de vouloir.
Quand WD sera un minimum mature je serai aux premières loges pour l'exploiter. En attendant je suis aux premières loges pour dire qu'il est urgent d'attendre : de la documentation, de la maturité, du recul… Hexasoft (discuter) 25 août 2015 à 21:49 (CEST)

Exemples concrets (en biologie) modifier

Quelques exemples (plus ou moins) concrets de problèmes qui se posent de part les divergences entre les classifications. Ceci est basé sur de vrais problèmes rencontrés dans de vrais articles, je le précise. Ce ne sont pas des cas théoriques.

Un même taxon mais un nom (scientifique) différent modifier

Il arrive que le nom spécifique change, typiquement pour corriger des fautes d'accord en latin (-us devient -a et autres). Les classifications suivent ou pas les changements (parfois par choix, parfois par manque de temps ce n'est pas (encore) traité).
Il faut (faudrait) donc supporter plusieurs noms scientifiques liés aux classifications.

Un même taxon mais un nom différent modifier

Idem mais l'espèce a changé de genre pour certaines classifications. Non seulement le nom scientifique change, mais aussi (éventuellement) la présence de parenthèses ainsi que le taxon supérieur.

Impact sur le(s) taxon(s) de rang(s) supérieur(s) modifier

Prenons l'exemple d'une espèce et de ses sous-espèces (mais on peut le transposer avec un genre et ses espèces…). On trouve en gros les 4 cas suivants :

  • une nouvelle sous-espèce apparaît pour prendre en compte une "variante" locale
  • une sous-espèce disparaît car elle n'est au final pas différente d'une autre sous-espèce
  • une espèce autre est renommée en sous-espèce de cette espèce (c'était une espèce distincte à tord)
  • une sous-espèce est promue au rang d'espèce

En dehors du fait qu'on va avoir des taxons qui n'existent que dans certaines classifications ça pose un problème avec les données du taxon supérieur (ici l'espèce) qui représentent en réalité tout le "groupe". Exemples :

  • la photo de l'espèce représente une sous-espèce qui n'est pas "dans" cette espèce pour certaines classifications, elle ne peut donc servir à l'illustrer dans ces cas (exemple réel : Uroplatus sikorae dont la photo sur wikidata est celle d'un Uroplatus sameiti, anciennement sous-espèce de la première)
  • la carte de répartition devient fausse s'il manque la répartition d'une nouvelle sous-espèce ou si elle contient la répartition d'une sous-espèce qui n'en fait plus partie

Note : à ce propos il eu peut-être été plus pertinent de lister des pays / régions… pour les répartitions, on aura peut-être un jour des générateurs de carte de répartition… De plus ça permet d'avoir des noms de pays, de connaître les endémismes, et de fusionner facilement les répartitions des rangs inférieurs pour en faire une répartition pour le taxon supérieur.

Apparté : comparaison avec commons modifier

J'ai lu par endroits que des pro-wikidata comparaient ça à commons, en disant que c'est déjà comme ça que ça marche (de déporter du contenu sur un autre projet). Or même si commons regroupe les médias pour tous les wikis il ne fixe en aucun cas leur utilisation : c'est bien le contributeur ici sur wikipédia qui choisi le média à insérer → en gros c'est comme les liens externes, mais « en ligne » dans les articles. De plus à ma connaissance un média n'est jamais remplacé par un média différent (avec le même nom) sauf pour des actions de retouche/recadrage/amélioration, il n'y a donc pas de risque d'un changement externe ayant un impact interne.

En comparaison de commons la situation est donc différente : si une image dans un article ne convient pas pour des raisons éditoriales − que ces raisons soient liées à des règles/recommendations ou simplement suite à discussion entre contributeurs − on modifie l'image utilisée (ou on n'en utilise pas), sans impacter les autres projets. Si cette image vient de wikidata la situation est différente : 1. l'image est changée sur WD et ça impacte tous les wikipédia 2. chaque wikipédia en désaccord décide de forcer une valeur locale 3. WD trouve un moyen pour que chaque information « éditoriale » puisse être conditionnée au wikipédia (une valeur pour fr, une valeur pour en, une valeur pour de…).

Mon avis sur la question modifier

Pour moi wikidata − en tant que source de données − peut servir en biologie pour :

  • fournir le nom scientifique + auteur + date dans la taxobox
  • fournir une image représentant le taxon (au fait, quid de la légende ? Faudra-t-il aller voir l'image pour rédiger sa propre légende ? Surveiller que l'image n'a pas changé sinon la légende devient fausse ?)
  • fournir la classification au dessus du taxon dans la taxobox
  • fournir une carte de répartition (dans la taxobox ou dans le texte)
  • fournir une liste de taxons inférieurs (question : peut-on trouver tous les items qui ont l'item courant comme "taxon supérieur" ? Dans la classification utilisée ?)
  • fournir des identifiants vers les sources de données (NCBI, MSW, ReptileDB, ITIS, CITES, UICN…)
  • fournir des liens vers des projets frères (commons, interwikis (ça c'est déjà le cas), wiktionnaire…)
  • d'autres ? Pourquoi pas les portails associés (peut-on faire des champs spécifiques à un wikipédia ?) ? Ou même les catégories (même remarque) ?

Mais quand je vois les divergences entre les classifications utilisées (en pratique, sur les différents wikipédias) et leurs conséquences en terme de nom scientifique, auteur, image, carte de répartition… il me semble impératif de résoudre toutes ces questions avant d'envisager autre chose que du test préparatoire sur notre wikipédia.

Pour que ces problèmes puissent trouver une solution il faudrait au préalable (à mon sens) :

  • que wikidata améliore son ergonomie générale
  • que wikidata améliore ses documentations et l'orientation des nouveaux
  • qu'on trouve un moyen de ne pas exclure les contributeurs (tout à fait légitimes) de wikipédia en français ne parlant pas l'anglais
  • qu'on trouve un moyen pour connaître sur wikipédia en français les modifications de wikidata qui impactent effectivement le résultat des articles qu'on a dans nos listes de suivi

Ensuite il faudra donc s'attaquer à la question de comment représenter les classifications différentes et sélectionner leurs informations. Ça pose des questions pratiques :

  • faut-il "dumper" sur wikidata toutes les classifications utilisées, même quand il y a doublon (certaines classifications se recoupent) ?
  • faut-il faire au coup par coup ?
  • que fait-on des taxons qui deviennent synonymes (nom plus utilisé dans certaines classifications) ?

Remarque opératoire modifier

En tant que dresseur de bot très actif sur wikipédia, je suis en mesure de « nourrir » wikidata à grande échelle à partir de données présentes dans les classifications ou sur nos articles. Il faudrait toutefois que :

  • je regarde pour adapter le code de mon bot pour interagir avec wikidata
  • que je sache comment / quoi mettre sur wikidata ce qui nécessite de répondre aux autres questions avant Émoticône sourire

Avis ? modifier

Ceci n'est évidemment que mon avis sur la question. C'est toutefois l'avis d'un « vieux » contributeur qui connaît bien la biologie sur wikipédia en français, qui a créé ou modifié la plupart des modèles et modules utilisés aujourd'hui par la biologie, et qui connaît bien les problèmes pratiques des divergences entre classifications.
Toutefois mon avis ne fait pas loi, et j'ai toujours suivi les décisions communautaires même lorsqu'elles ne vont pas dans le sens que je préfère. Vous êtes donc très fortement invités à donner votre avis, que ce soit pour indiquer une réponse à certaines de ces questions, pour en poser d'autres, ou pour pondérer/modifier/annuler certaines de ces questions (on ne voit pas forcément tout).

Cordialement, Hexasoft (discuter) 28 juillet 2015 à 18:16 (CEST)

TomT0m, 29 juillet 2015 modifier

Alors, mon avis : c'est illusoire de résoudre tous les problèmes avant d'essayer de tenter timidement de faire quelque chose. C'est un gros changement, et toutes les réflexions du monde ne suffiront pas à tout anticiper.

  • Une migration peut se faire petit à petit, par exemple le plus simple semble être de faire l'équivalent de ce qui s'est fait avec le modèle {{Autorité}} et d'utiliser Wikidata pour les identifiants des taxons dans les bases de données, le passage à Wikidata d'Autorité s'est fait sans douleur dans l'indifférence générale et très rapidement après la mise en place de Wikidata, qui est particulièrement adapaté à ce genre de cas.
  • Un autre exemple à l'extrême inverse : les images et les légendes. Effectivement Wikidata n'est pas particulièrement adapté pour les légendes par son aspect centré sur les concepts et pas sur la langue, c'est un projet multilingue, et tout ce qui est purement phrase en français est aussi bien sur le Wiki francophone, le choix de l'image également : quand on rédige une légende, c'est sans douleur de choisir la bonne image sur le Wiki, et ça évite les problèmes de désyncro. Le problème de la description des images c'est pour un futur projet : les données structurées pour Commons (une instance de Wikibase dédiée à commons) et là normalement ils seront outillés pour décrire les images avec des propriétés de manière indépendante de la langue (genre Lieux de la prise de vue, sujet de l'image, ...)

De la même manière, le soucis de langues ne peut se régler sans plonger dans la tour de Babel : Sur Wikidata oui les discussions se font principalement en anglais, mais il n'est interdit nulle part de déposer des messages en français ou dans n'importe quelle langue et ça arrive régulièrement, j'ai déjà pingé les russophones que je connais pour traduire un message rédigé en Russe en anglais, avec succès. On peut traduire les pages à l'aide de l'extension translate, ou avec les modèle adhoc translate this, ou en faisant références à des propriétés ou à des éléments qui ont des intitulés en français et qui donc sont naturellment traduits dans les discussions en utilisant les modèles comme {{Q}}, etc. De manière générale la communauté Wikidata est sensible à ces problèmes, et on essaye de faire au mieux avec les moyens dont on dispose. Si il y a plus de francophones qui arrivent sur le projet, ça fera plus de traductions et de ressources disponibles, plus on pourra expliquer le tenant et les aboutissants et plus l'ensemble sera agréable pour les francophones ... Mais encore une fois c'est pas sur une page comme celle ci en faisant des discussions théoriques qu'on y arrivera, c'est en mettant les mains dans le cambouis :)

Sur les questions précises: il y en a un certain nombre qui ne sont pas vraiment dépendantes de Wikidata comme le choix d'une classification, je dirai même qu'elles sont dépendantes de principes généraux des projets Wikimédia comme la neutralité de point de vue. Il s'agit de travailler en bonne intelligence avec les taxonomistes des autres versions linguistiques, et pourquoi pas de choisir des règles un peu objectives, comme par exemple présenter les classifications les plus récentes en premier ? Wikidata propose des mécanismes comme les rangs pour mettre en avant certaines déclarations et "en arrière" certaines autres.

Je répond pas sur les questions de parenthèses parce qu'à titre personnel je suis très peu sensible à ce genre de détails, qui me semblent être une manière de coder des informations qui ne correspondent mais alors pas du tout à l'esprit de projets comme Wikidata ou informatiques en général qui codent les mêmes informations de manière complètement différentes et un tel fossé culturel m'a l'air complique à combler:) — TomT0m [bla] 29 juillet 2015 à 10:14 (CEST)

Quels points :
  • sur le attendre que ce soit prêt / avancer petit à petit : tout dépend de l'impact. Oui les données CITES/UICN/ReptileDB/MSW/… peuvent éventuellement être simples à gérer. Encore que nous les utilisons comme références dans les articles. En l'absence de suivi local des changements sur wikidata on ne saura donc pas quand il faut aller vérifier que le texte et infos présentées correspondent toujours… (il arrive plusieurs fois par an qu'on ait des changements dans les identifiants, UICN et COI récemment, par ex.)
  • images, légendes, cartes… : donc ça reste en local, visiblement
  • la langue : oui on peut demander des traductions, passer par des intermédiaires… Mais ça reste un mode de discussion "externe" pour beaucoup de gens. Je maîtrise très bien l'anglais, mais je comprends parfaitement que de nombreux rédacteurs francophones soient / seront rebutés par ces contraintes et n'interagiront jamais là-bas. Pour prendre un autre exemple, commons est bien plus fréquenté depuis qu'on peut déposer une image sans même se rendre compte qu'on est "ailleurs", mais la plupart n'interagissent jamais là-bas ni même ne lisent leurs pages de discussion.
  • classifications : c'est peut-être pas dépendant de wikidata, mais la question reste posée : comment je fais pour "enregistrer" la classification (par ex.) ReptileDatabase alors qu'il y a des taxons en communs identiques, d'autres (plus ou moins) différents, d'autres qui n'existent que d'un coté ou de l'autre ? C'est bien beau mais en pratique j'ignore totalement comment faire et où trouver l'information (si elle existe)
  • parenthèses : tu utilises un mot qui montre que tu ne comprends pas du tout cette partie des choses : « détail ». Ce n'est pas un détail, c'est une norme issue des instances internationales de zoologie et de botanique, suivie par quasiment toutes les classifications et bases de données du vivant ainsi que par quasiment tous les auteurs dans le domaine. Par ailleurs c'est un choix éditorial (de respecter les conventions internationales) qui ne doit pas être réduit par un élément externe. Choix que suivent la plupart des grands wikipédia, d'ailleurs.
  • pour le cambouis : je suis éventuellement d'accord pour mettre des données sur wikidata. Mais pas pour le reste. Je suis occupé IRL, je m'occupe des modèles de la biologie, j'ai mon bot, je me suis beaucoup investi sur Lua pour WP, je n'ai pas l'intention (pour ma part) d'aller discuter de la pertinence de changer la tête de delco ou autres travaux cambouesques Émoticône sourire
Hexasoft (discuter) 29 juillet 2015 à 11:20 (CEST)
«je suis éventuellement d'accord pour mettre des données sur wikidata. Mais pas pour le reste. Je suis occupé IRL, je m'occupe des modèles de la biologie, j'ai mon bot, je me suis beaucoup investi sur Lua pour WP, je n'ai pas l'intention (pour ma part) d'aller discuter de la pertinence de changer la tête de delco ou autres travaux cambouesques Émoticône sourire»
C'est là ou on peut voir qu'on est vraiment pas sur la même longueur d'onde tous les deux : moi je lis ça comme "Hexasoft est la personne idéale pour mettre les mains dans le cambouis" : tu as toutes les compétences et connaissances requises. Tu as juste besoin de te familiariser avec Wikidata, et les APIS wikitext et scribunto associées à la récupération de données Wikidata. Commencer par un cas simple est idéal.
  • Sur le suivi : j'ai un peu l'impression d'avoir répondu pleins de fois à cette question, donc j'avoue que ça m'agace un peu : Il y a une case à cocher dans ses préférences : https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Pr%C3%A9f%C3%A9rences#mw-prefsection-watchlist "Voir les modification de Wikidata" ... Je ne sais pas dans quelle mesure le suivi concerne actuellement uniquement les changements qui ont un impact sur les articles suivi ou si ce sont tout les changements, mais je sais que l'équipe de dev a réfléchi à la question. J'ai personnellement fait plusieurs fois passé des liens vers https://www.wikidata.org/wiki/Wikidata:Watchlist_integration_improvement_input pour faire remonter les demandes de Wikipédiens, et j'ai aussi remonté des trucs vers Lydia ... Après ça prend du temps à être implémenté. La question est donc plus "quand" que "comment", et je n'ai pas de réponse précise à donner et je ne sais pas trop ou ils en sont là dessus. On peut suivre le développement sur phab:T90435 manifestement.
  • Sur les identifiants, je trouve bizarre d'avoir des identifiants instable déjà, c'est dû à quoi ? Des changements de classification ? Il y a surement un point à creuser :) Ensuite je vois pas le problème d'avoir des données d'infobox plus à jour que les données des articles, c'est manifestement un signe que l'article lui même doit être mis à jour non ? Entre avoir des données incohérentes mais dont certaines sont à jour, et des données cohérentes mais toutes obsolètes, il s'agit de choisir le moins pire des deux maux.
  • «parenthèses : tu utilises un mot qui montre que tu ne comprends pas du tout cette partie des choses : « détail ». Ce n'est pas un détail, c'est une norme issue des instances internationales de zoologie et de botanique, suivie par quasiment toutes les classifications et bases de données du vivant ainsi que par quasiment tous les auteurs dans le domaine. Par ailleurs c'est un choix éditorial (de respecter les conventions internationales) qui ne doit pas être réduit par un élément externe. Choix que suivent la plupart des grands wikipédia, d'ailleurs.» Non je sais ça très bien, c'est juste que ce n'est pas le genre de choses auxquelles je suis personnellement sensible. Pour tout dire ça m'ennuie et je trouve pas ça intéressant, mais c'est juste MON opinion et MON ressenti :). Pour être un peu plus objectif et constructif : je ne pense pas que ça pose vraiment problème dans le cadre de Wikidata, ou alors il faut me l'expliquer.
  • «comment je fais pour "enregistrer" la classification (par ex.) ReptileDatabase alors qu'il y a des taxons en communs identiques, d'autres (plus ou moins) différents, d'autres qui n'existent que d'un coté ou de l'autre ? C'est bien beau mais en pratique j'ignore totalement comment faire et où trouver l'information (si elle existe)»
Il faut en parler avec les autres taxonomistes de Wikidata, c'est tout, ça se passe sur d:Wikidata:WikiProject Taxonomy. Tu exposes ton problème, tu vois si ils ont déja réfléchi à une solution, ou si il y a déja une page d'aide là dessus. Il s'agit aussi d'écrire/traduire des pages d'aides sur les différents cas à traîter. Exactement comme ici, mais sur Wikidata, qui est un projet multilingue et collaboratif. J'ai bien un ou deux avis mais ce sont juste les miens et l'important c'est surtout que les différentes solutions mises en places soient relativement homogènes et cohérentes.
Par exemple une solution dans le cadre de Wikidata, ou le paradigme est "1 élément pour un concept" serait de créer un élément pour chaque définition du taxon. Et d'avoir un élément pour le concept plus ou moins vernaculaire qui serait relié à chaque définition par une propriété, de manière analogue à la structure "page d'homonymie/pages précises". Mais c'est peut être pas la meilleure solution dans ce cas. et quand la définition évolue on peut aussi l'exprimer avec des déclarations, et passer les déclarations des classification anciennes en rang obsolète (par exemple si un taxon change carrément de taxon parent dans une classification récentes). Mais on ne peux pas régler ces questions dans notre coin ici sous peine de se mettre potentiellement en porte à faux avec d'autres projets qui feraient de manière différentes et donc rendraient caduque la mutualisation du travail qui est un des gros intérêts de Wikidata ... (par exemple si on conçoit l'infobox de manière à utiliser une convention et que les autres ne la suivent pas, ben ... l'infobox ne marchera pas quand ce sera une autre convention utilisée). — TomT0m [bla] 29 juillet 2015 à 12:31 (CEST)
  • "Hexasoft est la personne idéale pour mettre les mains dans le cambouis" → je suis peut être bien placé pour faire ça mais je n'ai clairement pas le temps, et certainement pas envie de prendre ce temps sur ce que je peux conserver d'éditeur pour wikipédia.
  • suivi : je vais tester. Tu indiques l'avoir déjà dit. Sans doute (j'me rappelle plus), mais où se trouve l'info ? Aide:Wikidata n'aborde pas la question (ou alors j'ai mal lu).
  • identifiants : on n'est pas responsable des remaniements des sites externes. Ce n'est pas lié à des changements de classification mais à des changements de structuration de l'information. Pour le reste je suis mitigé : avoir des affirmations sourcées dont les sources ne disent pas la même chose, perso je déteste.
  • parenthèses : "je ne pense pas que ça pose vraiment problème dans le cadre de Wikidata" → wikidata ne code pas cette partie de l'information. Il n'est donc pas possible d'utiliser wikidata pour afficher l'auteur d'un taxon dans le respect des conventions (et ça ne sera jamais possible, semble-t-il). C'est en ce sens que j'insiste toujours sur l'aspect éditorial : les choix de wikidata ne doivent pas restreindre nos choix éditoriaux (ici de suivre la convention internationale à ce sujet).
Hexasoft (discuter) 29 juillet 2015 à 12:50 (CEST)
  • «je suis peut être bien placé pour faire ça mais je n'ai clairement pas le temps, et certainement pas envie de prendre ce temps sur ce que je peux conserver d'éditeur pour wikipédia.» On en a déja parlé, mais justement, vu que tu passes déja pas mal de temps sur ton bot ben … ça ne te prendrait pas plus de temps. C'est juste que tu ferais les même choses en un peu différent, c'est tout.
  • «identifiants : on n'est pas responsable des remaniements des sites externes. Ce n'est pas lié à des changements de classification mais à des changements de structuration de l'information. Pour le reste je suis mitigé : avoir des affirmations sourcées dont les sources ne disent pas la même chose, perso je déteste.» ah OK ce ne sont donc pas des idetifiants :/ En même temps avvoir des liens morts je voi pas bien l'intérêt. En tout cas il y a une solution : générer les liens des sources par des modèles qui vont piocher dans Wikidata, genre {{lien UICN}} par exemple. On aurait le meilleur des deux mondes et des mises à jour centralisées donc simplifiées.
  • «parenthèses» Si les règles sont standards et déterministes, on dévrait pouvoir les coder en Lua :) la question devient donc : est-ce qu'on est vraiment en présence d'un standard ? Il manquerait quelles infos dans Wikidata pour calculer ce nom ? (bon, c'est peut être un standard très chiant à coder …) Après tout se dicute, vous pouvez relancer la discussion là dessus sur Wikidata, mais c'est pas en restant ici à râler que les lignes bougeront, c'est certain :) Reste enfin la solution de garder le paramètre de l'infoboîte. Vu que c'est pas une information qui bouge beaucoup à priori c,est peut êtse pas utile de la stocker sur Wikidata. On est pas dans le tout ou rien. — TomT0m [bla] 29 juillet 2015 à 13:15 (CEST)
Si ça me prendrait plus de temps. En dehors d'adapter les codes à wikidata ça demande (justement) à participer aux discussions là-bas pour tout ce qui n'existe pas encore, existe mais ne fait pas ce qu'on voudrait… Ici sur wikipédia j'ai 10 ans d'expérience pour m'y retrouver rapidement.
Pour les identifiants comme je l'ai dit c'est assez simple à mettre en œuvre. C'est plus la problématique des changements non visibles ici qui me dérange (on ne sait pas que quelque chose a changé là-bas donc qu'il faut corriger ici).
Pour les parenthèses oui il y a des règles. Mais il faut les infos pour ça… La forme utilisée explique des choses, mais si tu fais le chemin dans l'autre sens (partir du nom + date) il te faut ces infos pour générer le résultat. Être standardisé ne veut pas dire être bijectif. Je trouverai ceci dit plus que dommage d'avoir une entité "taxon" et de ne pouvoir piocher que quelques éléments dedans. Pour une taxobox c'est même pire : une partie stockée ici, une partie là-bas, 2 actions de modification pour mettre à jour, avec un système de suivi pas au point en prime…
À ce propos j'ai testé le suivi : soi j'ai raté quelque chose soit ça ne marche pas. Les Infobox Biographie2 utilisent wikidata. J'ai vu l'ajout sur ma liste de suivi. J'ai modifié une donnée wikidata associée, attendu, et aucune notification ici (j'ai bien l'option de cochée, j'ai même ajouté sur wikidata l'élément dans ma liste de suivi).
Hexasoft (discuter) 29 juillet 2015 à 14:14 (CEST)
Oui le suivi est encore en chantier, mais ça avance. Ils ont notamment mis en place un suivi de l'utilisation des données par les articles pour permettre l'utilisation des données d'un élément arbitraire dans un article, ce qui était indispensable pour mettre en place des options de suivi utile. Ca devrait bouger rapidement donc.. Pour les parenthèses, oui c'est évident, mais le truc c'est que Wikidata a déja pleins d'informations en plus de la date … D'ou ma question : il manque quoi dans les données d'un taxon ? Je suis pas très sûr de partager tes craintes sur les discussions sur Wikidata, en dehors des problèmes qui sont déjà de base difficiles à résoudre ici (ou pas vraiment résolu) genre les changements de classifications ça ne m'a pas l'air d'être chronophage. Et pour ces trucs là Wikidata est qund même bien équipé, avec les déclarations dépréciées, préférées, la possibilité de mettre plusieurs déclarations même si elles sont contradictoires et l'intégration des sources dans les déclarations … Le fait de profiter du travail des autres dresseurs de bots, … Donc voilà, le problème du suivi sera résolu, c'est certain, à relativement brève échéance (au doigt mouillé), et il y a quand même des cerises à cueillir à peu de frais. Perso je peux servir de relai pour les discussions par exemple. — TomT0m [bla] 29 juillet 2015 à 14:49 (CEST)

┌─────────────────────────────────────────────────┘
Le fonctionnement utilisable d'un suivi depuis les wikipédia est effectivement à mon sens un préalable absolu pour que les gens l'utilise.

Pour les parenthèses et autres c'est excessivement complexe. Pas trop en zoologie, encore : en gros à 99% des cas ce sont les () qui indiquent que l'auteur n'a pas nommé le taxon comme ça, ainsi que les subtilités de type in et ex. En botanique c'est complexe car la suite de noms et de parenthèses décrit "l'histoire taxinomique".

Pour les changements de classifications il y a du pareil, du plus simple et du plus compliqué selon les cas. Si un taxon change de nom scientifique c'est pareil. S'il change de taxon supérieur c'est plus simple (on change 1 fois, au lieu de le faire sur chaque article de rang inférieur). S'il y a un remaniement plus profond de la classification c'est plus compliqué (N pages wikidata potentiellement concernées).

Par contre je trouve qu'il serait excessivement dommage d'avoir des infos éclatées entre wikidata et wikipédia dans la "même entité", comme par exemple la taxobox. Si pour renommer un taxon il faut éditer l'article puis des entrées sur wikidata c'est quand même lourd.

Hexasoft (discuter) 29 juillet 2015 à 17:19 (CEST)

Alors pour les noms, si l'histo des noms est enregistré sur Wikidata, ce qui pourrait être le cas, on devrait pouvoir en tirer la suite des parenthèses puisqu'on peut garder les noms obsolètes sur Wikidata en déclarations "dépréciées".
Les changements de classifications, c'est effectivement probablement plus problématique et ça nécessite d'être un peu étudier pour trouver les moins mauvaises solution (j'aime bien l'exemple des planètes du système solaire qui changent de définition, ou on a déja plusieurs manières de faire quand Pluton sort de l'ensemble des planètes : soit on garde l'ancienne définition de planète, on renomme l'élément "Planète du sytème solaire (définition pré 21ème siècle)" et Pluton reste une planète de l'ancienne définition, et on crée un nouvel élément pour la nouvelle définition, dont Pluton n'est plus instance, soit on garde le même élément et on change la définition et on déprécie la déclaration "Pluton instance de planète du système solaire". Pour la classification biologique c'est pareil en bien pire :)
Si pour renommer un taxon il faut éditer l'article puis des entrées sur wikidata c'est quand même lourd. Ben j'ai un peu l'impression que si l'article se résume pas à une simili taxobox en phrase, ça change un peu tout de changer la classification du taxon : des organismes qui étaient dans le taxon peuvent en sortir et inversement, et on change carrément son ascendance ... ça nécessite de toute façon des changements dans l'article non ? Je me rend pas trop compte mais j'ai l'impression qu'on peux difficilement passer au travers d'une édition de l'article quoi qu'il arrive. — TomT0m [bla] 30 juillet 2015 à 19:41 (CEST)

Tinm, le 25 août 2015 modifier

Pour vous tenir au courant... Émoticône J'ai toujours en tête de faire des propositions quant à ce qu'il serait possible de faire avec Wikidata, mais pour l'instant j'ai encore besoin de les mûrir sinon ce sera n'importe quoi. En attendant, comme l'a déjà dit TomT0m tout à l'heure, je traine régulièrement sur Wikidata pour comprendre petit à petit son fonctionnement.

Une chose qui est très claire est que la situation sur Wikidata n'est pas du tout assez avancée pour qu'on base les taxobox dessus ; on en est encore à discuter des points fondamentaux comme “comment gérer les synonymes ?” ou “comment gérer les noms vernaculaires ?” — la construction des mentions d'auteur à associer aux noms scientifiques ou la gestion des subtilités liées aux sous-espèces, n'en parlons même pas. En outre la plupart des items/éléments ne sont pas correctement wikifiés et enfreignent une ou plusieurs des pourtant rares conventions qui ont été établies.

Sur les identifiants par contre, y'a sans doute matière à réflexion, tout en sachant qu'il y a un gros travail de bottage à faire au préalable, sur Wikidata.

Tinm, le 25 août 2015 à 21:00 (CEST)

Oui, ils sont peu à bosser sur le projet. Et il y a un problème d'oeuf et de poule : tant qu'il n'y aura pas d'infobox sur les wikipédias, les données ont peu de chances de s'améliorer évidemment, sauf à avoir des imports massifs à partir de Wikipédia ... C'est là que le robot d'hexasoft pourrait s'avérer intéressant puisqu'il manipule déja les données. — TomT0m [bla] 25 août 2015 à 22:04 (CEST)
Cette procédure impliquerait de renoncer à la qualité de Wikipédia pendant plusieurs mois, ce qu'une large majorité de contributeurs ne sont pas prêts à faire, donc c'est même pas la peine d'y penser. C'est même pas dit que ça marcherait. Pour te donner mon idée en termes généraux : le moyen compte souvent autant que la fin. Trouve un autre moyen de sortir du cycle, parce qu'à argumenter dans ce sens, tu perds ton temps. D'autre part comme le dit Hexasoft, l'intégration de données Wikidata bien que (sans doute) souhaitable à terme n'est pas une priorité majeure ; le système actuel fonctionne bien. Pas la peine de s'affoler dans ce sens, donc.
S'il s'agit simplement que la fondation Wikimedia soit « à l'avant-garde » en matière de données structurées, s'investir dans Wikidata suffit, indépendamment de la connexion avec Wikipédia.
Tinm, le 25 août 2015 à 22:43 (CEST)
Euh non, de toute façon il n'y a pas besoin d'infobox pour importer les données. Mais les communautés hors importation ne s'intéresseront pas à Wikidata avant que les donnée y soient. C'est pour ça que je disais que le robot d'hexasoft était intéressant : il est déja capable d'analyser les infobox, donc c'est probablement relativement simple pour lui d'importer les données dans l'élément Wikidata au passage. Mais je ne suggérai pas de remplacer les infobox par des infobox wikidata qui n'existent de toute façon pas. Avant très récemment j'imaginai pas du tout la migration comme elle s'est produite par l'introduction d'infobox purement Wikidata dans les articles qui n'en ont pas, plutôt par la migration progressive des paramètres qui prendraient les valeurs dans Wikidata quand il n'y a rien d'explicitement passé au modèle. Ça rend la migration plus douce et un contributeur peut comparer le "avant/après" en supprimant lui même tous les paramètres, éventuellement en corrigeant Wikidata au passage :) Par contre il faut reconnaître que la migration récente a donné un coup de pied dans la fourmilière relativement intéressant qui a eu le mérite de faire bouger la communauté du business as usual. Sinon non, il ne s'agit pas que la fondation soit à l'avant garde, je m'en fous, c'est le projet qui m'intéresse et son potentiel de lien avec des tas d'autres projets, avec son approche communautaire/non lucrative qui est unique. Je m'intéresse depuis très longtemps à certains sujets comme celui du web sémantique et des données, et quand j'ai vu que des gens essayaient de croiser Wikipédia et ces trucs là, j'ai tout de suite fashé sur le concept. Beaucoup ne croyaient pas au web sémantique ou à ce genre de chose en pensant que personne ne ferait le boulot. Le travail qu'une communauté peut faire, notamment sur les infobox ou la catégorisation des articles me laissent penser le contraire. Alors si la communauté peut le faire avec des bidouilles en Wikitext et un système de catégorisation un peu bancal et des listes maintenues à la main, que peut-elle faire avec un Wikidata conçu pour ça, des requêtes et des outils adaptés ? Surtout en abaissant au max la barrière de la langue pour faire collaborer les différentes communautés linguistiques et que les communautés puissent profiter les unes du travail des autres ... — TomT0m [bla] 25 août 2015 à 23:28 (CEST)
Désolé si je t'ai mal compris, TomT0m. (« tant qu'il n'y aura pas d'infobox sur les wikipédias »... j'ai cru que c'était ton objet.)
J'ai l'impression qu'Hexasoft t'a répondu assez clairement sur ce point : «en tant que dresseur de bot très actif sur wikipédia, je suis en mesure de « nourrir » wikidata à grande échelle à partir de données présentes dans les classifications ou sur nos articles. Il faudrait toutefois que (...) je sache comment / quoi mettre sur wikidata ce qui nécessite de répondre aux autres questions avant » et « Pour le cambouis : je suis éventuellement d'accord pour mettre des données sur wikidata. Mais pas pour le reste. » (citations de bouts de cette page). Alors est-ce que Wikidata est prêt à héberger des données à très grande échelle dans une optique d'exhaustivité ? Mon avis (personnel) est que non, et que la priorité est de se taper les débats wikimédiens nécessaires pour arrêter des solutions définitives sur les problèmes que j'ai mentionnés ci-dessus, entre autres la gestion des synonymes. Pour la classification c'est la même chose, on en est pas encore à un modèle bien arrêté. Hexasoft dit qu'il sera là quand les choses seront carrées, c'est une réponse qui me convient, et de toute façon je pense pas qu'on puisse le faire changer d'avis. Émoticône
Tinm, le 25 août 2015 à 23:59 (CEST)
Ah mais moi si j'ai réagi sur cette page c'était pour répondre aux objections "philosophiques" qui ne me semblaient pas pertinentes /o\ Après la conversation s'est emballée /o\. — TomT0m [bla] 26 août 2015 à 08:18 (CEST)
@Tinm : oui, je serai là pour remplir les données (quand j'aurai un modus operandis pour le faire Émoticône sourire). Je pourrai sans doute même déjà le faire pour UICN et CITES (puisque là la structuration de l'information semble choisie et simple sur WD). Pour le reste je n'ai pas assez de temps pour faire ce que je veux faire… donc effectivement je ne compte pas ajouter encore autre chose (ni n'ai envie d'en laisser pour libérer du temps).
@TomT0m : pour la « philosophie » il convient d'être prudent. De nombreux wikipédien sont fortement attachés à l'indépendance éditoriale des projets et ce genre de problèmes a conduit par le passé au boycot pur et simple de wikispecies par plusieurs wikipédias. Peu de données sont neutres, et puisque WD ne fournit pas (encore) assez de "contexte" autour des données pour pouvoir extraire "neutrement" ça viendra forcément sur le tapis. Et pour beaucoup le fait que WD pourrait le faire n'est qu'une raison pour attendre, pas pour l'utiliser Émoticône sourire.
Un exemple très simple : ici on a tranché (après une guerre aussi énorme que ridicule) que l'endive est titré "Endive" avec redirection depuis "Chicon". Sur WD on trouve la même chose (nom = Endive, alias = Chicon). Si je vais là-bas pour inverser ça que se passe-t-il ?
Bien sûr ça ne changera pas le titre de l'article. Mais ça pourrait changer (à terme, avec une intégration plus poussée de WD) le nom affiché dans certaines listes (par ex. liste de plantes de France), dans le titre de la taxobox (même si actuellement on a choisi de mettre le nom scientifique)…
C'est bien sûr un exemple très limité mais il montre le principe : même un libélé n'est pas forcément neutre et actuellement : 1. rien ne permet de connaître le contexte de ce libélé (afin de choisir le POV qu'on veut) et 2. rien sur wikidata ne réglemente ça par rapport à nos règles ici.
Je ne pense pas qu'actuellement ça pose de réel problème − d'ailleurs probablement que la plupart des infos sont issues des wikipédias. Mais ça en posera quand WD ne sera plus un monde de "spécialistes". Hexasoft (discuter) 26 août 2015 à 09:05 (CEST)
J'ai tendance à pas trop prendre au sérieux les problèmes styles "pain au chocolat ou chocolatines" :) La plupart de ceux qui y prennent part ne le sont pas vraiment non plus. Mais j'ai envie de dire que la neutralité a été prévue à la conception de Wikidata, donc c'est une simple question de gestion communautaire ... qui se règlera assez facilement si la communauté prend en charge la gestion du projet, comme elle l'a été sur Wikipédia, vu que les bases sont saines de ce côté là. Après il ne faut pas non plus laisser un apprenti dictateur s'amuser à reverter tout ce qui passe, mais ça ça passe par une communauté élargie et pas un nombre restreint de Wikidata-iens qui ne pourront pas tenir la charge. Donc l'approche "j'attend" me semble finalement plus contre productive qu'autre chose en laissant de l'espace à ce type d'individus et les laisser prendre leurs aises et les laisser installer leur pouvoir de nuisance. Dans le logiciel libre ce genre de choses, quand le développeur historique devient gênant pour les autres en bloquant des contributions utiles, ça se règle par un fork et beaucoup d'amertume. — TomT0m [bla] 26 août 2015 à 09:19 (CEST)
Attention je n'ai pas dit prendre ça au sérieux ! Mais d'autres le font, hélas, contrairement à ce que tu sembles penser. Il suffit de regarder les conflits de très longue durée qui ont existé et existent encore. Les exemples les plus récurrents sont l'orthographe pré/post 1990 (même aujourd'hui il y a des contributeurs qui connaissent les décisions à ce propos et qui font des guerres d'édition à ce sujet), les translitérations (langues asiatiques, cyriliques… ça s'est calmé coté Asie mais ça continu sur d'autres fronts), les termes locaux (changer le nom d'une commune par son nom en langue locale reste fréquent), et les nationalités (de personnes, de zones ou de mouvements, lorsque ça correspond à des périodes de transition, d'occupation, de colonie…). En tant qu'admin je vois régulièrement passer des guerres d'édition sur de tels sujets, il serait pour le moins naïf de croire que les pénibles ne trouveront jamais le chemin de wikidata Émoticône sourire.
Le problème que je vois sur wikidata c'est qu'il n'y a pas de règles et recommendations en vigueur (pas sur le contenu) ni de règle indiquant qu'on suit les règles du wikipédia dont la langue est concernée par l'édition. Donc en cas de conflit (guerre d'édition sur Endive alias Chicon plutôt que Chicon alias Endive) qui a légitimité pour trancher ?
D'ailleurs sur cet exemple on ne peut pas mettre plusieurs noms et trier : pour "Français" c'est 1 nom et des alias, il me semble. Sinon on pourrait mettre "Endive (plus fréquent)" + "Chicon (moyen fréquent + Belgique + Nord de la France)" + "witloof (peu fréquent)" et là on aurait une neutralité de l'information (encore que certains viendraient passer Chicon à très fréquent…). Hexasoft (discuter) 26 août 2015 à 09:48 (CEST)
Alors oui, je pense qu'il y en a qui prennent ça au sérieux, mais je pense aussi que c'est une aubaine pour les trolls (plus ou moins sympathiques). Conclusion, tant que le problème se présente pas, on utilise le sens commun et on évite de créer des règlements pour des problèmes qui n'existent pas sinon on s'en sort pas, voire on crée des débats pénibles pour rien. Sur le fond les dénominations, c'est pas trop le problème de Wikidata mais le problème du Wiktionnaire. Il est prévu d'avoir le pendant structuré du wiktionnaire pour lier les dénominations aux concepts, mais c'est pour plus tard :) Là on pourra faire des choses comme tu le suggère, avec des propriétés idoines, d'ici là c'est pas le problème. — TomT0m [bla] 26 août 2015 à 09:55 (CEST)
Je laisse tomber. Nos visions des choses sont incompatibles. Que tu ne penses que certaines choses ne sont pas un problème c'est une chose, mais visiblement tu refuses de comprendre que ce sont des problèmes pour d'autres. Par ailleurs il semble que ta façon de « défendre » wikidata exaspère certaines personnes, il serait peut-être pertinent que tu prennes un peu de recul avec ça…
Pour ma part je ne discuterai plus avec toi au sujet de wikidata, c'est totalement vain (note : que ceci n'empêche pas des discussions sur d'autres sujets, hein… Émoticône sourire). Hexasoft (discuter) 26 août 2015 à 10:12 (CEST)
PS: je vais regarder ces docs. Hexasoft (discuter) 26 août 2015 à 10:12 (CEST)
Héhé, j'ai bien compris qu'on fonctionnait pas du tout de la même manière, c'est l'approche globale contre l'approche locale :) Les gens avec ces deux modes de pensée ont souvent du mal à s'entendre. Pour lancer un projet comme Wikidata cependant, l'approche locale ne fonctionne à mon avis pas. Si tu essayes de régler tous les détails avant de te lancer, tu ne t'en sors jamais. D'ou la nécessité d'avoir une vision approximative d'ou ça va pour avancer et ne pas être bloqué quand une question n'est pas réglée dans les moindres détails en supposant que soit les choses vont naturellement pas trop mal se passer sans nécessité de creuser trop la question soit qu'il doit bien exister une solution satisfaisante et qu'on la trouvera en temps voulu. Mais dans ces approches, il est nécessaire d'avoir des versions imparfaites dans un premier temps pour isoler les vrais problèmes et une idée des ingrédients nécessaires pour que la chose prenne :) Un esprit un peu aventurier quoi. — TomT0m [bla] 26 août 2015 à 10:24 (CEST)
Sauf que quand tu n'as rien demandé et que tu gères (en tant que projet) plus de 100000 articles, tu t'inquiètes des problèmes qui pourraient te retomber dessus Émoticône sourire.
Ce que je reproche n'est pas de tester / avancer, mais que ça semble se faire sans réelle concertation sur wikipédia. Le passage de ce bot est clairement problématique en ce sens.
Pour la biologie par exemple je ne serai pas opposé à tester ça sur un petit domaine. Par exemple les geckos représentent ~1100 articles, j'ai l'intégralité de la classification dans mon ordinateur, on pourrait faire des tests à ce niveau. Ça permet de voir ce que ça donne, ça n'impacte pas tout et n'importe quoi, et tous les articles sont suivis et gérés par un (ou des) volontaires à ce sujet qui peuvent détecter, corriger ou annuler au fur et à mesure.
Entre l'aventurier qui saute à pieds joints et le casanier qui n'avance pas, il y a aussi ceux qui avancent un pas après l'autre Émoticône. Hexasoft (discuter) 26 août 2015 à 10:37 (CEST)
Certes. Sur le bot récent je suis pas du tout au courant de l'histoire mais j'ai une certitude : personne ne sait tout ce qui se passe sur Wikipédia. Je crois comprendre qu'il y a eu une demande de bot, que la demande à été acceptée, c'est tout. À partir de là il y a deux ou trois hypothèse : la "naïve" : le lanceur du bot était un simple contributeur ignorant des arcanes qui a trouvé que ce serait une bonne idée. La "moins naïve", il avait conscience que s'il lançait une consultation communautaire ça allait être pénible et il ne l'a pas fait sciemment, et la "machiavélique" : il voyait que ça avançait pas sur le front de Wikidata et Wikipédia et il a voulu créer un électrochoc en profitant de l'introduction de arbitrary access pour secouer la communauté en minimisant l'aspect procédural de la chose. Mais quelle que soit la vraie raison c'est souvent comme ça que les choses avancent sur ce genre de projet communautaire, il est illusoire de croire que tout est contrôlé par qui que ce soit (pour le meilleur ou pour le pire comme le lobbying bien masqué et le pourissage d'article d'ailleurs). Mais la communauté s'adaptera de toute façon. — TomT0m [bla] 26 août 2015 à 11:03 (CEST)
Voilà, je regarde pas trop ce genre de page d'habitudes parce que ça m'intéresse pas vraiment, mais la version actuelle de d:Help:Label/fr dit ça encore mieux que moi :) — TomT0m [bla] 26 août 2015 à 10:08 (CEST)

Cas simple : les identifiants modifier

Un cas simple évoqué plus haut correspond aux identifiants externes variés. Exemple pour Lion :

  • 6353, identifiant CITES
  • 15951, identifiant UICN
  • 14000228, identifiant MSW
  • 4195, identifiant CITES fr

Sur la page wikidata pour Lion on trouve les identifiants ITIS et MSW.
Première question opératoire : comment je fais pour trouver la propriété (mettons) qui correspond à "identifiant CITES" si elle existe ? Sinon comment je fais pour la créer ? Faut-il faire une demande, se coordonner quelque part (afin par ex. d'éviter les doublons…) ? Quand j'ajoute (dans Q140) comment j'associe la "source" et sa date de consultation ?

Prenons le cas MSW qui est présent. On affiche ceci avec un modèle : {{MSW|14000228|Panthera leo|Linnaeus, 1758|consulté le=7 janvier 2015}} qui donne : (en) Référence Mammal Species of the World (3e  éd., 2005) : Panthera leo Linnaeus, 1758 (consulté le ). Comme la propriété wikidata semble contenir une date de consultation ou pourrait donc récupérer "14000228" et "7 janvier 2015" là-bas.

Je vois deux points pouvant poser problème, un "technique" et un "éditorial".
Technique : les bases n'ont pas forcément le même nom scientifique (courant chez CITES, UICN…). Si − pure fiction ici − MSW référence ce taxon sous le nom Panthera lea, avec éventuellement un autre auteur, peut-on étendre les méta-informations de l'entrée MSW pour inclure le "nom scientifique utilisé", voire le "auteur associé" ?
Éditorial : nous utilisons des références vers ces modèles comme source des données du texte. Par exemple la description des menaces sur une espèce est souvent sourcé à partir de UICN et/ou CITES. Quand le statut d'une espèce change il faudrait changer le texte. Avec le fonctionnement wikidata le lien va changer (et sera correct) mais comment le savoir ? Actuellement quand un humain change ces infos soit il fait les autres modifications nécessaires soit les rédacteurs qui ont la page en suivi peuvent regarder le changement et corriger ce qui doit l'être.

Pour proposer une propriété, c'est sur d:Wikidata:Property proposal/Natural science, il y a une section sur la taxonomie. Les Wikidataiens ou Médiawikien donnent leur avis, et si un consensus est trouvé pour la création un Wikipédien qui en a le droit crée la propriété. Une solution alternative est parfois décidée. Ca peut prendre un certain temps par contre, ou aller très vite.
on peux chercher une propriété existante comme on cherche une page Wikipédia, simplement avec la recherche standard, il y a une page wiki par proprété, elles sont dans l'espace de nom «Property». Les projets thématiques recensent aussi les propriétés pertinentes pour le domaine d'application.
Technique: Oui. Les propriétés peuvent être utilisées comme qualificateur sur les déclarations ou pour sourcer. L'autre possibilité est de créer un élément pour l'artice UICN et d'y stoccker toutes les méta infos sur l'article sans soucis.
éditorial : c'est en cours d'implémentation par l'équipe de dev (cf. le ticket sur le «phabricator» que j'ai posté au dessus). — TomT0m [bla] 29 juillet 2015 à 15:10 (CEST)
J'appuie globalement ce qu'a dit TomT0m. La suggestion technique est facile à faire (techniquement) mais pas en place actuellement et ça demanderait une discussion préalable pour voir si les gens sont intéressés, et du bottage préalable. (Les Wikipédias anglais, allemand et espagnols ne sont pas aussi au taquet que nous sur les BDD externes mais le cas échéant ils lient également avec un hyperlien portant le nom du taxon, donc convaincre la communauté sur ce point me paraît envisageable.) La suggestion technique est en place. Sur la question éditoriale, le suivi est un des sujets très discuté et quelques outils sont en place. Cela dit ça reste à ma connaissance expérimental. — Tinm, le 25 août 2015 à 21:23 (CEST)