Discussion Projet:Correction syntaxique/Analyse 559
Dernier commentaire : il y a 21 heures par FDo64 dans le sujet Corrections à ajouter
Autres discussions [liste]
- Admissibilité
- Neutralité
- Droit d'auteur
- Portail de qualité
- Bon portail
- Lumière sur
- À faire
- Archives
- Commons
Corrections à ajouter
modifierBonjour NicoV .
Je travaille sur ce sujet depuis quelques temps et j'ai donc l'occasion de corriger des cas que tu ne sembles pas encore traiter.
Je te donne donc les regex que j'utilise à toutes fins utiles :
(ref|/)> *<sup> *(,|;|\.|'|\-|et) *</sup> *(<ref|{{)
ref{{,}}ref
>{{·}}<ref
> *[,'’\-]+ *<ref
</ref> *(,|;|\.)+<ref
ref> *et *<ref
/> *(,|;|\.|'|-|et)+ *<ref
> *\[\[,\]\] *<
J'enlève également les séparateurs superflus, sans doute laissés après la suppression d'une référence :
([a-z0-9\]']+) *{{,}}
(après un texte)*{{ *, *}} *\.
(en fin de ligne)
Remarque : je traite le cas des balises <ref>
et également des modèles du type {{sfn}}.
Regex telles que je les ai écrites au fur et à mesure des cas que j'ai rencontré. Donc perfectibles et parfois complémentaires !
Bon courage et n'hésite pas si tu as besoin d'explications ! FDo64 (discuter) 11 juin 2024 à 12:30 (CEST)
- Salut @FDo64.
- Ces regex, c'est pour détecter d'autres cas ou corriger ceux déjà détectés par WPCleaner ? Parce que je ne les vois pas dans ceux détectés (il reste surtout les cas avec un marqueur d'italique/gras casé entre 2 références) NicoV (discuter) 11 juin 2024 à 21:38 (CEST)
NicoV : Je n'utilise pas WPCleaner mais AWB, donc ces regex sont pour corriger les cas que je trouve via des recherches du style :
insource:/ref\> *(,|;|\.|'|-|et) *\<ref/
insource:/ef\> *\<sup/
insource:/\/\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
insource:/ef\> *\<sup>\./
insource:/\/\> *(,|;|\.|'|-|et) *\<ref/
insource:/ref\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
insource:/ef\> *\<sup>,/
- Si ça peut t'inspirer pour tes recherches et corrections... --FDo64 (discuter) 11 juin 2024 à 22:27 (CEST)
- Bonsoir NicoV
. Comme j'ai découvert un nouveau cas, l'utilisation de « & », je récapitule et simplifie ce qui précède.
- L'idée est de détecter et remplacer :
- Sans oublier les séparateurs superflus (voir premier message).
- En espérant que ce soit plus clair... --FDo64 (discuter) 13 juin 2024 à 00:05 (CEST)
- Salut @FDo64.
- J'ai pris en compte les séparateurs et les modèles de références normalement, la liste devrait être mise à jour dans les prochains jours.
- Je regarderais plus tard pour les autres suggestions. NicoV (discuter) 13 juin 2024 à 21:17 (CEST)
- Salut @FDo64. Détection effectuée, on va voir ce qu'il corrige automatiquement. NicoV (discuter) 14 juin 2024 à 19:02 (CEST)
- Merci NicoV
. Je vois que dans la liste il y a des mises en italique ou en gras qui sont mal placés, entre deux références. Je suppose que ce sera à corriger manuellement ? --FDo64 (discuter) 14 juin 2024 à 19:18 (CEST)
- Oui @FDo64, WPCleaner ne sait pas corriger les italiques/gras mal placés. J'y pense, mais jamais trouvé le temps de le faire... NicoV (discuter) 14 juin 2024 à 20:02 (CEST)
- Autres cas :
- --FDo64 (discuter) 14 juin 2024 à 23:06 (CEST)
- Merci.
- J'ai ajouté le modèle, c'est juste de la configuration.
- Je regarde pour les balises, un peu plus de boulot... NicoV (discuter) 15 juin 2024 à 11:26 (CEST)
- Salut @FDo64.
- Normalement, c'est bon pour les balises aussi, à vérifier lors de la prochaine analyse de dump, dans environ 1 semaine. NicoV (discuter) 15 juin 2024 à 12:38 (CEST)
- Salut @FDo64.
- La liste a été mise à jour.
- J'ai fait une amélioration pour corriger les {{'}}, mon bot est en train de tourner. NicoV (discuter) 23 juin 2024 à 13:34 (CEST)
- Salut @FDo64.
- La liste a été mise à jour et mon bot a traité ce qu'il a pu. Il reste principalement 2 types de problèmes :
- Les gras/italiques mal positionnés
- Les références utilisées dans des modèles (mon bot ne les traite pas pour éviter des erreurs dans des modèles comme {{Références}})
- NicoV (discuter) 29 juin 2024 à 09:36 (CEST)
- Merci NicoV
, je vais les corriger.
- Comme je ne sais pas si tu as traité tous les cas que je t'ai signalé, je te liste quelques trouvailles du jour :
ref><sup>,</sup><ref
: 23 cas, dont Jérôme Guedj ou Te souviens-tu, Marianne ?ref>'<ref
: 21 cas, dont Emmanuel Mounierref> et <ref
: 2 cas, dont Coupe d'Afrique du Nord de football 1937-1938/><sup>,</sup><ref
: 5 cas, dont Parc de l'Arrou
- Je te laisse regarder et ne les corrige donc pas. --FDo64 (discuter) 1 juillet 2024 à 18:47 (CEST)
- Bonsoir NicoV
. J'ai traité la totalité de la liste que tu avais générée le 29 juin.
- Avant cela, j'ai corrigé toutes les occurrences que j'ai trouvées de références inclues dans des balises
<sup>
ou<small>
. Plusieurs centaines. - Je vois que dans la liste que tu viens de générer il n'y a pas encore les cas que je t'ai signalé lundi. Je reviendrai donc une fois que tu auras trouvé du temps pour les regarder.
- Encore merci ! --FDo64 (discuter) 5 juillet 2024 à 23:19 (CEST)
- Salut @FDo64.
- Pour les balises sup, c'est parce que j'avais pris en compte sub au lieu de sup... ça devrait être traité au prochain passage.
- Pour les apostrophes et le "et", ça devrait être traité automatiquement. J'ai l'impression que mon bot n'a pas fini son précédent passage (nouveaux cas détectés, mais pas corrigés et page pas remise à jour), peut-être un redémarrage intempestif sur toolforge : à surveiller sur le prochain passage. NicoV (discuter) 7 juillet 2024 à 16:33 (CEST)
- Salut @FDo64. Mon bot est passé, la liste s'est réduite à 4 articles. Tu vois encore des cas pas détectés ou pas corrigés ? NicoV (discuter) 8 juillet 2024 à 15:39 (CEST)
- Merci NicoV
. Les recherches suivantes trouvent encore quelques pages :
insource:/\/\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
(2 pages)insource:/ref\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
(7 pages, dont Zhang Zhijie)insource:/ref\> *(,|;|\.|'|-|et) *\<ref/
(20 pages)
- Dans la plupart des cas, ce sont des modifications qui ont été faites après le 1er juillet.
- --FDo64 (discuter) 8 juillet 2024 à 23:08 (CEST)
- Bonsoir @FDo64.
- Si elles datent d'après le 1er juillet, c'est normal, la liste est mise à jour à partir du dump du 1er juillet. Par exemple, Zhang Zhijie est détecté et corrigé.
- J'ai regardé quelques-unes des pages de la dernière regexp, elles semblent être détectées et corrigées aussi. NicoV (discuter) 10 juillet 2024 à 22:14 (CEST)
- Merci NicoV
. C'est parfait, donc je ne reviendrai ici que si je trouve de nouveaux cas.
- Pour information, je corrige aussi plein de commentaires mis en dur entre deux références au lieu d'utiliser un modèle de révision. Pas automatisable.
- --FDo64 (discuter) 10 juillet 2024 à 22:24 (CEST)
- Merci NicoV
- Merci NicoV
- Salut @FDo64. Mon bot est passé, la liste s'est réduite à 4 articles. Tu vois encore des cas pas détectés ou pas corrigés ? NicoV (discuter) 8 juillet 2024 à 15:39 (CEST)
- Bonsoir NicoV
- Merci NicoV
- Oui @FDo64, WPCleaner ne sait pas corriger les italiques/gras mal placés. J'y pense, mais jamais trouvé le temps de le faire... NicoV (discuter) 14 juin 2024 à 20:02 (CEST)
- Merci NicoV
- Salut @FDo64. Détection effectuée, on va voir ce qu'il corrige automatiquement. NicoV (discuter) 14 juin 2024 à 19:02 (CEST)
- Bonsoir NicoV