Utilisateur:MisterMatt Bot/Fonctionnement
Cette page explique le fonctionnement de certains modules du bot.
Catégorisation des ébauches
modifierMisterMatt Bot regarde si une ébauche appartient à une catégorie spécifique qu'il reconnait. Si oui, il change le {{ébauche}} en {{ébauche le thème particulier}}.
Il utilise deux méthodes différentes pour voir à quel type d'ébauche correspond l'article :
- une recherche utilisant les expressions régulières (regexp)
- une recherche exhaustive sur un certain nombre d'article
Avec les expressions régulières
modifierSi le titre d'une catégorie commence, finit ou tout simplement contient certains mots, alors le bot associe le type d'ébauche adéquat.
Une table de correspondance entre les types d'ébauches et les expressions régulières est donc nécessaire. Ce genre de table ressemble à cela :
tableRegexp = { "religion" => [ /Théologien(.*?)/i ], "art" => [ /^Peintre (.*?)/i, /^Sculpteur (.*?)/i ], "informatique" => [ /(.*?)Informatique(.*?)/i, /(.*?)Internet(.*?)/i, /(.*?)Linux(.*?)/i, /(.*?)email(.*?)/i ] }
Avec la recherche exhaustive
modifierLe bot regarde si le titre exacte d'une catégorie de l'ébauche correspond à une entrée dans une table de correspondance entre les différents types d'ébauches et les catégories.
Cette table de correspondance ressemble à cela :
tableCat = { "religion" => ["Religion","Pape"], "sport" => ["Sport","Football"] }
Dans ce cas de figure, après le passage du bot, les ébauches de Catégorie:Wikipédia:ébauche étant dans les catégories Catégorie:Religion ou Catégorie:Pape iront dans Catégorie:Wikipédia:ébauche religion.
Remarques
modifier- L'ordre des lignes dans les tables est important. En effet, les dernières lignes ont le dernier mot. Autrement dit, si une ébauche appartient à deux catégories différentes, elle sera classée dans le type d'ébauche défini en dernier.
- La recherche avec les expressions régulières est réalisée avant la recherche exhaustive donc cette dernière, jugée plus fiable, aura le dernier mot.