Utilisateur:Erkethan/Proposition de bot

Proposition de bot pour l'actualisation de la population dans les modèles des communes de France.

Ce bot a été développé en Java via le Java Wiki Bot Framework.

Cette présentation concerne le bot tel qu'il est présentement développé et fonctionnel.


Fonctionnement du bot modifier

  • Point d'entrée : une catégorie regroupant des communes fournie en paramètre (exemple : Commune dans la Côte-d'Or) et de l'année d'actualisation (exemple: 2009)
  • Pour tout les articles de la catégorie :
  • Infobox
    • Parsing des modèles et sections de texte ;
    • Recherche du modèle Infobox Commune de France (et de sa redirection Infobox Communes de France, qui sera alors corrigé) ;
    • Recherche du code INSEE présent dans l'infobox ;
    • Vérification sur le site de l'INSEE de l'existence du code récupéré ;
    • Récupération sur le site de l'INSEE de la population à l'année concernée ;
    • Application (si nécessaire) des modifications à l'infobox, champs sans et date-sans.
  • Démographie
    • Recherche du modèle Démographie ou Démographie2 ;
      • Si l'un des deux modèle est trouvé, vérification (et correction éventuelle) du formatage des valeurs des années précédentes avec {{formatnum:}} ;
      • Ajout (ou correction éventuelle) de l'année concernée en fin des données années, avec {{formatnum:}}.
  • Histogramme
    • Détection d'un marqueur <timeline>.
  • Journal
    • Écriture au journal (dans l'espace utilisateur du bot) des modifications effectuées ou erreurs rencontrées (voir exemple).
  • Boucle
    • Mise en sommeil pour 30 secondes ;
    • Si la page d'arrêt (page de l'espace utilisateur du bot) n'a été modifiée par personne, traitement d'un nouvel article.


Opérations réalisées modifier

Le bot réalise les opérations suivantes :


Exemple de journal modifier

basé sur des simulations

Modifié Titre de l'article Message Infobox Démographie Démographie2 Histogramme
Beaune présent
Liste des communes de la Côte-d'Or Modèle {{Infobox Commune de France}} non trouvé
Agencourt
Dijon présent
Semur-en-Auxois présent


Commentaires modifier

Le principe fondateur de ce bot est une modification des pages comme le ferait un humain, c'est à dire sans appel à des modèles de BDD (unifiés ou non) ou via des outils externes (Excel, etc). Cela dans l'optique d'une évolution pour facile, et une collaboration plus facile avec des contributeurs de tout bords, expérimentés ou non. En outre, la philosophie du bot, comme expliqué plus haut, n'est de modifier que ce dont il est sûr, et de notifier le reste en journal.

Ce bot se base sur le code INSEE de l'Infobox de la commune, et réalise son édition d'article en une fois par article. Cette tentative d'édition est abandonnée dès qu'une erreur est rencontrée, et est inscrite au journal. Les erreurs conduisant à l'abandon peuvent être l'absence d'infobox identifiables (pour passer simplement les articles qui ne sont pas des communes), un code INSEE faux ou introuvable, un site de l'INSEE injoignable ou sans données compréhensible, etc.

La modification des modèles de démographie fonctionne sur le même principe, à la différence que l'abandon de leur modification n'annule pas l'édition de l'article. Si ces modèles ne sont pas trouvés, rien n'est modifié de plus que ce qui aurait pu l'être dans l'Infobox.

Enfin, l'histogramme est seulement détecté et non modifié, en raison des trop grandes variation d'utilisation qui existent, et l'absence de modèle unifié. En revanche, la détection de l'utilisation d'une <timeline> permet d'identifié rapidement les articles qui nécessiteront une mise à jour de leur histogramme après passage du bot ; d'autant que ces articles sont la minorité la plus maintenue de l'ensemble des articles de communes de France.


Pages connexes modifier