Utilisateur:Zolo/Infobox Wikidata

Wikidata a été conçue pour servir deux objectifs : le stockage centralisé des données brute utiles aux projets Wikimedia, et la mise en disposition de tous d’une base de connaissances libre et ouverte. Appelons-les logique du back office et logique de la base sémantique. C’est certainement la seconde qui intéresse le plus les gros contributeurs de Wikidata[1]. Il parait difficile de penser la structuration des données de Wikidata en fonction des objectifs de Wikipédia. Il y a eu des tentatives pour mettre en relation propriété Wikidata et champ d’infobox, mais il est difficile d’aller plus loin. Il faudrait tenir compte des particularités intellectuelles et méthodologiques de chaque version linguistique, et à l’intérieur de chaque version linguistique, de chaque projet individuel, et se trouver vite tiraillé entre exigences contradictoires. Les propriétés le plus utiles sur Wikidata (nature de l’élément ou même localisation territoriale n’ont guère d’équivalent dans les modèles de Wikipédia. Cette relative indépendance de Wikidata, nécessaire je pense, complique la tâche de Wikipédia. En particulier, impose un travail beaucoup plus fin sur les modèles en charge de la récupération et de la mise en forme des données. Des choses ont déjà été faites, bien d’autres restent à accomplir.

Dans la pratique, une autre distinction pourrait-être plus déterminante pour les infobox basées utilisant Wikidata : celle de la logique de l’élément et de la logique de la série : Dans la logique de l’élément, on remplit le plus complètement possible un élément de Wikidata donné : par exemple on prend l’élément Serge Haroche et on ajoute le plus possible d’informations pertinentes. C’est l’approche qui permet d’obtenir les infobox les plus convaincantes. Dans la logique de la série, on prend un fait donné, et on essaye de l’ajouter au maximum d’éléments. Par exemple, on récupère une liste des décorés de la légion d’honneur, et on cherche à l’utiliser pour ajouter « distinction : officier de la légion d’honneur » au plus possible d’éléments Wikidata. Cette manière de faire se prête souvent à un travail automatisé mais rigoureux, qui permet d’ajouter beaucoup de données sans sacrifier la fiabilité. Dans d’autres cas, elle se fait à partir de supposition sur les catégories sur Wikipédia, et le résultat n’est pas toujours idéal. Il faut plus largement reconnaitre que cette approche n’est pas toujours adaptée aux besoins de Wikipédia. Si quelqu’un a réussi à importer la liste des officiers de la légion d’honneur, mais pas celle des prix nobel, une {{Infobox Biographie2}} apposée à Serge Haroche afficherait par défaut « distinction : officier le la légion d’honneur » mais omettrait de signaler qu’il a le prix Nobel.


Tout cela ne vise pas à décourager le développement des fonctionnalités Wikidata des infobox,loin de là : la pratique seule permettra de faire avancer les choses, mais il faut reconnaitre qu’il faudra du temps avant de parvenir à un système entièrement satisfaisant[2]

  1. Deux exemples d’importantes contributions à Wikidata sans application Wikipédia directe :
    • la création par un laboratoir de bioinformatique américain d’un élément pour chaque gène humain, et pour chaque protéine qu’il code
    • l’import massif par user:Multichill de bases d’éléments sur les œuvres présentes dans les bases de données de musée.
  2. Concrètement, sur {{Infobox Biographie2}} : les données sur les dates et lieux de naissance, et la liste de fonctions politiques me paraissent tout à fait pertinentes, les données sur la nationalité et le métier, souvent bancales, et nécessitant au moins des raffinements, peut-être une désactivation partielle ou totale.