Discussion Projet:Correction syntaxique

Dernier commentaire : il y a 10 heures par Edddddfr dans le sujet Noms de rues
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Portail de qualité
  • Bon portail
  • Lumière sur
  • À faire
  • Archives
  • Commons

2008 • 2009 (1er2e3e4e)
20102011201220132014
20152016201720182019
202020212022

(en) WikiProject Check Wikipedia

Taxobox modifier

Ne pas archiver.

Bonjour FDo64. En parlant de maintenance de l’espace modèle, est-ce que tu saurais comment corriger les missing-end-tag (les premiers dans la liste) liés aux modèles du groupe {{Taxobox}} ? --NicoV (discuter) 8 juin 2020 à 10:04 (CEST)Répondre

Notification NicoV : C'est un sujet que je connais bien, on parle quand même de 116 000 erreurs !
J'ai même développé la solution : l'{{Infobox Taxon}} qui en plus de corriger les problèmes de LINT est compatible avec l'éditeur visuel. Je l'ai proposée à diverses reprises au Projet:Biologie :
  1. Projet:Biologie/Le café des biologistes/Archives/Septembre-octobre 2018#Erreurs de Lint dans les taxobox (du 13 septembre 2018 au 21 décembre 2018)
  2. Projet:Biologie/Le café des biologistes/Archives/Mars-avril 2019#Refonte des Taxobox (du 26 mars 2019 au 6 mai 2019)
  3. Projet:Biologie/Le café des biologistes/Archives/Mars-avril 2019#Nouvelle Infobox Taxon (du 25 avril 2019 au 3 mai 2019)
  4. Projet:Biologie/Le café des biologistes/Archives/Juillet-août 2019#Mise en place de l’Infobox Taxon (du 10 juillet au 12 juillet 2019)
Il m'avait été demandé d'attendre, du coup je suis parti sur d'autres projets. De plus, je comptais sur Notification Hexasoft pour développer le bot, puisqu'il connait particulièrement bien le sujet, mais ses soucis perso (auxquels je compatis pleinement) m'ont freiné au moment où je voulais relancer cette migration. À moins qu'un autre dresseur ne se sente apte et suffisamment disponible pour s'y attaquer, je vais devoir patienter.
--FDo64 (discuter) 8 juin 2020 à 13:11 (CEST)Répondre

Inclusions de pages qui ne sont pas dans l'espace modèle modifier

Surpris de constater qu'il n'y a pas de détection des pages utilisateurs dans les articles (ce que ne fait pas l'erreur 95 qui ne s'intéresse qu'aux liens) j'ai effectué une recherche et corrigé tous les cas sauf deux :

J'ai ensuite recherché des pages d'autres espaces de noms. Si on exclus l'espace Wikipédia qui appelle 387 pages de type Wikipédia:Thèmes de qualité/Propositions, et si on exclus l'espace MediaWiki qui appelle 383 fois MediaWiki:Toc qui ne sert qu'à afficher "Sommaire" (donc totalement inutile et à remplacer, à mon avis), il en reste quelques dizaines des espaces Portail et Projet. Peut-être qu'au final c'est un faux problème (hors espace Utilisateur qui devrait être interdit).

Par extension, j'ai ensuite recherché des bacs à sable de modèles et j'en vois 19 actuellement. Là aussi, je pense qu'on devrait l'interdire et donc le détecter.

Des avis ? FDo64 (discuter) 9 novembre 2022 à 23:13 (CET)Répondre

Bonjour @FDo64. Bien vu, je pense qu'il serait approprié d'avoir ce type de détections en effet, y compris pour les bacs à sable.
Je viens de remplacer le modèle de @Poudou! par le modèle utilisé par les autres pôles de la page (rendu identique, avec des liens en plus).
Pour le cas des sorcières, il semblerait que le modèle de @Touam soit une adaptation allégée de Projet:Les sans pagEs/Carte des sorcières notoires/carte. Il faudrait sans doute voir avec le projet s'il convient de mettre à jour la carte existante ou d'en créer une nouvelle. --Golmote (discuter) 10 novembre 2022 à 07:44 (CET)Répondre
Bonjour. Oui c'est une erreur manifeste, que j'avais complètement oubliée. Merci FDo64 Émoticône. Cela date d'une époque où je collaborais avec les sans pages, mais quelques désaccords généraux apparaissaient ici et là Émoticône sourire. Ça n'est évidemment pas une raison valable, ce projet continue de faire des choses super bien, mais je n'y participe plus. Aujourd'hui je ne sais plus trop ce qu'il faut faire avec cette page. Savoir ce qu'elles en pensent aux sans pages serait très bien, peut-être peut-on attendre leur avis ? Touam (discuter) 10 novembre 2022 à 09:22 (CET)Répondre
Je viens de la laisser un message sur la PDD du projet pour les inviter à venir discuter ici. --Golmote (discuter) 10 novembre 2022 à 12:41 (CET)Répondre
Non ce n'est pas une erreur manifeste c'est une version de la carte qui marche. Au fur et à mesure qu'on a inclue des données dans wikidata la carte est devenue trop lourde à charger pour Wikipédia. Je n'arrive pas à résoudre autrement le problème d'affichage. Peut-être faut-il juste bouger le brouillon ailleurs ?Hyruspex (discuter) 10 novembre 2022 à 19:06 (CET)Répondre
Bonjour @Hyruspex, mon interrogation était de savoir s'il était préférable de mettre à jour Projet:Les sans pagEs/Carte des sorcières notoires/carte avec le contenu allégé ou s'il valait mieux conserver deux cartes distinctes. Et dans ce deuxième cas, est-ce qu'il vaut mieux bouger le brouiller dans le Projet LSP ou directement dans l'espace Modèle ? --Golmote (discuter) 11 novembre 2022 à 11:05 (CET)Répondre
Il y en a une nouvelle qui fait apparaitre les genres ici https://www.wikidata.org/wiki/User:Ainali/WitchMapQuery Natacha LSP (discuter) 12 novembre 2022 à 14:55 (CET)Répondre
@FDo64, @Touam, @Hyruspex et @Natacha LSP J'ai mis à jour la carte de Liste de victimes de chasses aux sorcières en me basant sur la requête SPARQL proposée ci-dessus par Natacha LSP. Je ne l'ai pas extraite dans un modèle, ça pourra toujours être fait plus tard si on le souhaite. --Golmote (discuter) 13 novembre 2022 à 16:06 (CET)Répondre
C'est parfait, merci. Touam (discuter) 13 novembre 2022 à 19:17 (CET)Répondre
@FDo64 Effectivement, ça pourait être une bonne idée d'inclure quelques cas. Le projet qui produit les listes est en mode maintenance, donc peu de chances que ce soit ajouté. Côté WPCleaner, je peux toujours l’ajouter, mais pas trop de temps dispo (ticket dans Phabricator ?). --NicoV (discuter) 10 novembre 2022 à 15:46 (CET)Répondre
Pour WPCleaner la page d'explications pour l'installation sur Linux est difficile à comprendre. J'ai heureusement reçu l'aide de @Pintoch mais je ne suis pas sûre de pouvoir expliquer moi-même :/ Natacha LSP (discuter) 12 novembre 2022 à 14:57 (CET)Répondre
@FDo64 La page Projet:Correction syntaxique/Analyse 095 devrait lister les inclusions de pages provenant de l’espace Utilisateur. Ce sera disponible après la prochaine analyse de dump par WPCleaner.
@Natacha LSP et @Pintoch N'hésitez pas à me dire ce qui n’est pas clair pour que je le change, ou n’hésitez pas à changer la page d'aide à l’installation de WPCleaner. --NicoV (discuter) 13 novembre 2022 à 21:23 (CET)Répondre
@NicoV je fais suite séparément pour pouvoir discuter plus à l'aise :) − Pintoch (discuter) 17 novembre 2022 à 08:52 (CET)Répondre

Bonjour @FDo64 et @Golmote
Merci bien pour la détection et la correction de mon étourderie. J'avais en début d'année développé dans mon espace brouillon plusieurs modèles et des articles qui les utilisaient. Avant de basculer les articles des brouillons vers le main, je remplaçais les modèles, mais certains appels ont échappé à ma vigilance. J'essaie pourtant de faire gaffe car je sais que la gestion des modèles est une chose délicate. --Poudou! (discuter) 10 novembre 2022 à 16:06 (CET)Répondre

Détection de modèle appelé plusieurs fois modifier

Bonjour, est-il possible de détecter les articles dans lesquels certains modèles sont appelés plusieurs fois, par exemple {{titre en italique}} ou {{voir homonymes}} (un exemple : [1] ? -- Speculos 13 décembre 2022 à 12:49 (CET)Répondre

Salut @Speculos, cherches-tu toujours une solution/liste ? LD (d) 28 juin 2023 à 11:07 (CEST)Répondre
Notification LD : oui si c'est possible; je n'ai pas eu à ce jour de réponse à la question ci-dessus (mais c'est pas spécialement urgent...). -- Speculos 28 juin 2023 à 11:14 (CEST)Répondre
J'ai lancé un script pour lister les pages avec au moins un doublon pour les modèles cités. Cela devrait prendre un peu de temps (~50 000 pages à analyser).
Est-ce qu'il y a d'autres modèles que tu souhaiterais voir ? Je lancerais après-coup.
On pourrait tabler sur les modèles de Catégorie:Modèle de bandeau renvoyant vers des homonymes, ce qui représente ~687 0000 pages à analyser, mais plus on ajoute des modèles plus la démarche est pertinente : souvent les pages qui utilisent un modèle en utilise un autre. LD (d) 28 juin 2023 à 12:13 (CEST)Répondre
Merci pour cette première analyse; on pourrait aussi détecter les doublons d'appels des modèles {{Liens}}, {{Langue du titre}}, {{Titre mis en forme}}, {{coord}}, dans un deuxième temps. -- Speculos 28 juin 2023 à 12:23 (CEST)Répondre
C'est noté.
En principe la liste des pages à traiter ne sera pas très longue ; sur env. 25.000 articles, seuls 6 ont des doublons de modèle (ex. Bettencourt-Saint-Ouen) et pas de doublons de paramètres en vue mais la tendance peut toujours s'inverser, qui sait. LD (d) 28 juin 2023 à 13:36 (CEST)Répondre
Utilisateur:LD/Brouillon/Liste/Modèle Doublon <= Hop-là. Je mettrai le reste à la suite quand ce sera terminé. LD (d) 28 juin 2023 à 16:47 (CEST)Répondre
Merci, je regarde ça. J'ai trouvé un autre cas de figure : plusieurs modèle {{ébauche}}, comme par exemple dans cet article, à rechercher à l'occasion -- Speculos 28 juin 2023 à 18:03 (CEST)Répondre
J'ai mis {{Coord}} de côté puisque Modèle:Infobox Pays appelle le paramètre coordonnées_capitale qui nécessite ledit modèle, et le modèle figure en haut de la page. Idéalement, il faudrait que je parvienne à exlure l'infobox voire d'autres (Modèle:Infobox Localité), histoire de ne pas faire tourner pour rien. Sinon, je peux recenser ceux qui ont trois fois le modèle dans l'article, en tablant que ce soit une erreur. LD (d) 28 juin 2023 à 20:03 (CEST)Répondre
En fait pour {{Coord}} ce n'est pas pertinent, il existe pas mal d'articles qui donnent des listes de coordonnées, comme par exemple Liste de cratères d'impact sur Terre ou Liste des îles de Singapour, donc pas la peine de rechercher des doublons de Coord à mon avis.-- Speculos 28 juin 2023 à 20:43 (CEST)Répondre
Il y a déjà Catégorie:Page avec des balises de coordonnées mal formées qui recense plus de 9000 pages. FDo64 (discuter) 29 juin 2023 à 12:15 (CEST)Répondre
Salut. Je n’avais pas vu la demande… Est-ce intéressant si je rajoute ça à WPCleaner, avec une génération à chaque analyse de dump ? --NicoV (discuter) 28 juin 2023 à 21:19 (CEST)Répondre
Salut @NicoV. Je dirais plutôt non.
Toutefois, il peut être intéressant d'avoir une suggestion de correction dans WPCleaner dès lors qu'un des modèles est appelé deux fois et avec au moins un paramètre identique. Le plus souvent il est possible de fusionner. La correction en elle-même n'est pas prioritaire : cela change d'avantage l'aspect visuel que le comportement de la page.

A la rigueur, plutôt oui si cela revient à lister ces modèles ({{Méta bandeau de note}}) lorsque qu'ils sont en-dehors de l'en-tête ; appeler de styles dont border-bottom est àmha inutile, alors que des alternatives existent ("amorce" de {{article détaillé}} par exemple). LD (d) 29 juin 2023 à 07:12 (CEST)Répondre
Bonjour. Ce type de recherche est également intéressant pour des modèles du type {{Palette}}, {{Portail}}, {{Succession/Début}} (et sa redirection {{Début dynastie}}) et {{Autres projets}}. Je n'ai jamais trouvé la regex magique pour les trouver.
Par contre, il doit y avoir des exceptions.
--FDo64 (discuter) 29 juin 2023 à 12:27 (CEST)Répondre
@FDo64, j'utilise un algorithme impératif (python) : je capture {{\s*(<model>)\b[^\n{}]*\s*}}, enregistre les occurences dans une variable puis je compte le nombre de fois où $1 est identique, si >= 2, alors c'est un doublon et je fais en sorte de le lister. Inconvénient de la méthode : lenteur d'exécution. Avantage : modulable.

Je pourrais dresser la liste après. Je me suis pas soucié des redirections de modèle, car il faudrait que je fasse un dictionnaire / une table d'équivalence, mais c'est aussi faisable.

Veux-tu que j'adapte un peu le code et te l'envoie (ça pourrait te servir ultérieurement) ? LD (d) 29 juin 2023 à 13:16 (CEST)Répondre
Notification LD : Je veux bien. Tu peux mettre ces listes dans Utilisateur:FDo64/Liste3. --FDo64 (discuter) 29 juin 2023 à 21:37 (CEST)Répondre
Salut. Bon, j’ai quand même rajouté ce type de détection à WPCleaner, la liste des modèles est configurable, et une liste sera générée à chaque analyse de dump. Je suis en train de récupérer le dernier dump, donc la liste sera probablement initialisée aujourd'hui. --NicoV (discuter) 2 juillet 2023 à 15:29 (CEST)Répondre
Merci NicoV Émoticône. Une liste de plus dans ma LDS ! --FDo64 (discuter) 2 juillet 2023 à 20:29 (CEST)Répondre
La liste est générée. J'ai l'impression qu'il faut que j'enlève {{Succession/Début}} de la liste des modèles concernés, et j’ai des doutes sur {{Palette}}, {{Voir homonymes}}… Il faut que je regarde plus en détail, mais n’hésitez pas à commenter. --NicoV (discuter) 3 juillet 2023 à 07:52 (CEST)Répondre
Notification Speculos, LD et FDo64 : Bonsoir. Je vais enlever {{Palette}} aussi, il y a trop de faux positifs avec des cas comme (117) Lomia, où le modèle Palette est aussi utilisé pour des successions. Je vais aussi ajouter quelques corrections automatiques, mais je pense qu'il restera beaucoup de cas à corriger manuellement. --NicoV (discuter) 3 juillet 2023 à 22:11 (CEST)Répondre
Notification NicoV : Ce cas reste une anomalie pour moi puisqu'au lieu d'avoir
{{Palette
|Succession astéroïdes | avant = [[(116) Sirona]] | après = [[(118) Peitho]]
}}
{{Palette|Petits corps du Système solaire|Système solaire}}
Il est mieux d'avoir
{{Palette
|Succession astéroïdes | avant = [[(116) Sirona]] | après = [[(118) Peitho]]
|Petits corps du Système solaire|Système solaire
}}
À la rigueur, ignorer dans un premier temps les palettes avec des paramètres, ce qui permettrait de corriger des milliers d'articles.
--FDo64 (discuter) 3 juillet 2023 à 22:57 (CEST)Répondre
+1.
Salut et merci. De mémoire la configuration est éditable par regex, donc si jamais on peut toujours exclure des cas peu pertinents, non ?
Sinon, c'est infinément plus rapide que ma méthode, je ne vais probablement pas finir mon script prochainement (mais je le ferais car il pourra servir d'appoint entre dumps). LD (d) 3 juillet 2023 à 23:01 (CEST)Répondre
Pour les {{Succession/Début}}, il ne faut regarder que ceux sans paramètres, comme dans André de Frédol. Et même avec cette restriction, il y aura plein d'exceptions, comme dans Bernard Grandmaître. Je vais donc regarder au cas par cas.
--FDo64 (discuter) 3 juillet 2023 à 23:11 (CEST)Répondre
Notification FDo64 : En fait, si on regroupe les palettes, ça change pas mal le rendu (succession masquée par défaut), et le nouveau rendu semble incorrect car ça donne l'impression que les 2 dernières palettes font partie de la succession. Mais je vais regarder pour ignorer les palettes avec paramètres nommés. --NicoV (discuter) 4 juillet 2023 à 11:21 (CEST)Répondre
Notification NicoV : Bonsoir ! Les modèles Succession servent à la navigation est sont un cas particulier de palettes. Cela ne m'a donc jamais choqué de les regrouper avec les autres palettes.
Et pour revenir sur ton « impression », je pense qu'on doit avoir la même avec d'autres palettes à paramètres ou avec une mise en forme atypique.
Pour ce qui est de ta liste, elle reste très intéressante, mais moins pour moi sans les palettes. J'ai donc éplucher la première que tu as générée et en ne traitant que les cas simples il y a potentiellement une centaine de Succession et 1300 Palette à regrouper.
Au final, je ne vois d'automatisable que des Palettes sans paramètres qui se suivent.
--FDo64 (discuter) 4 juillet 2023 à 20:37 (CEST)Répondre
Notification FDo64 : J'ai ajouté une option pour détecter le cas de modèles qui n'ont pas de paramètres nommés, ça devrait remettre dans la liste tous les cas de {{Palette}} sauf les successions. Je verrais aussi pour faire des corrections automatiques (le regroupement des paramètres de certains modèles, les modèles en double…). Je vais regénérer la liste. --NicoV (discuter) 4 juillet 2023 à 21:29 (CEST)Répondre
Notification Speculos, LD et FDo64 :. J'ai intégré quelques corrections automatiques à WPCleaner, et recréé la liste ce matin après les corrections automatiques. Il reste encore ~1300 pages dans la liste.
Je me demande si on ne devrait pas ignorer certains cas, au risque d'en rater : exemple, dans 2006 en sport, ça me semble OK d'avoir 2 appels au modèle {{Palette}}. Qu’en pensez-vous ?
A voir aussi si WPCleaner devrait corriger automatiquement des cas comme 1954 en Suisse, où la même palette est utilisée à 2 endroits. Mais pour ce modèle, il faut peut-être privilégier la deuxième palette, non ?
Pour {{Liens}}, il faudrait aussi que je ne détecte que les cas où les modèles sont identiques pour ignorer des cas comme Acheloma.
Il faut peut-être aussi que je configure le regroupement pour {{Confusion}}
Voilà… Si vous avez des commentaires ou idées, n'hésitez pas. --NicoV (discuter) 6 juillet 2023 à 09:32 (CEST)Répondre
Merci, ok pour ignorer les éphémérides ; pour les regroupements, je dirais que le plus sûr est de le faire quand deux modèles sont séparés par \n, et penser aux paramètres doublons (ex. William Walling (écrivain): {{homonyme|Walling|William Walling}}, {{Voir homonymes|Walling}}).
Sinon, Sport en France et d'autres utilisent des Palettes dans le corpus, bien qu'il soit recommandé de les placer en bas de l'article. Mais ça reste à traiter au cas par cas à mon avis ; puisque souvent il faudrait « rédiger » plutôt que d'effacer. Ou bien des spécificités comme Modèle:Palette MK qui est verticale dans SpectroMagic.
Donc pas de nouvelles idées ou commentaires Émoticône LD (d) 6 juillet 2023 à 13:45 (CEST)Répondre
Merci NicoV Émoticône.
Pour Palette, je reprécise ce que j'indiquais précédement. Je propose de ne détecter et de ne corriger qu'à deux conditions :
  1. Aucun paramètre
  2. Les deux appels se suivent (avec ou sans saut de lignes entre les deux)
J'ai aussi regardé les Succession/Début, que tu ne cherches plus à priori. Là il n'y aurait qu'une condition : aucun paramètre. Il y a des cas où c'est voulu qu'il y ait des répétitions afin de faire plusieurs palettes. Par exemple, pour séparer différentes disciplines sportives. Dans ce cas, chaque palette devrait avoir un titre, ce qui permettrait de les exclure de la recherche.
--FDo64 (discuter) 6 juillet 2023 à 22:41 (CEST)Répondre

Paramètres traceurs sur URL modifier

Bonjour, serait-il possible de mettre en place une détection et une suppression de paramètres traceurs sur les URL des liens externes, du type gclid (Google), fbclid (Facebook), msclkid (Microsoft) ou dclid (Doubleclick) ? -- Speculos 28 juin 2023 à 09:13 (CEST)Répondre

Bonjour, je signalerais l'existence des dépôts open-source de Adguard dont les listes permettent a minima d'identifier de nombreux problèmes d'URL, sinon de réutiliser leurs filtres et expressions régulières.
Il y a aussi le cas des régies publicitaires comme Adwords (exemple), pas vu si c'était pris en charge par Adguard mais je pense que oui ; sinon, il existe aussi la question des ports (répétitifs dans le meilleur des cas 80 => http ; 443 => https) et le fait de transiter vers https quand c'est possible.
En théorie, c'est automatisable, en pratique il faut du temps. Irønie peut être d'une aide précieuse, son CodexBot travaille déjà sur des URLs. LD (d) 28 juin 2023 à 10:38 (CEST)Répondre
Merci. Il y a aussi les liens Google Books mentionnés dans le Bistro, et les liens dpgmedia: https://fr.wikipedia.org/w/index.php?go=Lire&search=dpgmedia&title=Sp%C3%A9cial:Recherche (ces derniers causent en plus l'apparition d'info non pertinente quand on utilise {{lien web}}), peut-être aussi des liens Twitter, Facebook... trop longs (ça peut aussi être traité manuellement par la patrouille RC) Philippe Depesch (discuter) 28 juin 2023 à 15:47 (CEST)Répondre
Si il y a une liste facilement compilable de paramètres traceurs, ça pourrait être ajouté dans WPCleaner. --NicoV (discuter) 28 juin 2023 à 21:21 (CEST)Répondre
Il faudrait veiller à ne le faire que si le lien est fonctionnel. Si un lien est mort mais a été archivé, changer les paramètres risque d'empêcher l'accès à la version archivée. Orlodrim (discuter) 28 juin 2023 à 22:13 (CEST)Répondre
Ca va être beaucoup plus compliqué à automatiser alors. --NicoV (discuter) 28 juin 2023 à 22:25 (CEST)Répondre
Il est peut-être possible de ne traiter que les liens récents (cas apparus dans le dernier dump) ?
Ironiquement, le fait que les contributeurs insèrent des liens en laissant des paramètres de tracking est sans doute plutôt nuisible pour les sites qui font du tracking : si le but est de savoir que X a cliqué sur le lien depuis la page Y, publier un lien avec un tel paramètre dans une page Wikipédia fait que le lien est visité par plein d'autres personnes dans un contexte totalement différent, ce qui diminue la qualité des données collectées Émoticône.
Orlodrim (discuter) 28 juin 2023 à 22:41 (CEST)Répondre
Il leur reste le referrer pour savoir d'où vient le clic. Philippe Depesch (discuter) 29 juin 2023 à 06:44 (CEST)Répondre
@NicoV : celles-ci me semblent utiles, sinon ce projet en a fait un .json (même s'il date de 7 mois, l'essentiel doit y être).
Je dirais même qu'il faut vérifier que le lien est fonctionnel et que le lien transformé le sera aussi ; en pratique des librairies comme Apache HttpClient mâche le travail.
Vu le second projet cité, ça peut être appelé en librairie sous python pour un bot, c'est assez simple en théorie. LD (d) 29 juin 2023 à 07:32 (CEST)Répondre

On en parle dans le Bistro: Wikipédia:Le Bistro/14 juillet 2023#Reprise d'une vieille bataille contre le « traçage de la navigation ». Philippe Depesch (discuter) 14 juillet 2023 à 16:59 (CEST)Répondre

Suggestion de détection : « Catégorisation technique indue dans le code » modifier

Bonjour. On peut constater la présence indue en dur, dans le code de certaines pages, de catégorisations techniques qui devraient normalement être introduites exclusivement par des modèles appelés. Il s'agit généralement de catégories cachées, catégories de maintenance ou d'information technique, dont les suivantes :

Petite analyse des causes de ces présences :

  • des choses qui ressemblent à des substitutions (involontaires ?) de modèles. Exemple : Spécial:Diff/172917575. Solution dans ce cas : réintroduire les appels des modèles, si ces derniers ne sont pas déclarés obsolètes. Attention à vérifier les changements effectués sur cette partie depuis la modification "fautive".
  • la présence dans le code dès la création par traduction mw:Content translation/V2. Exemple : Spécial:Diff/205139224. Les deux catégories techniques ajoutées en dur correspondent à deux catégories dont faisait partie l'article en langue italienne, version Wikipédia sur laquelle elles n'étaient pas alimentées depuis une occurrence en dur dans le code de l'article mais via un modèle automatique.

Ideawipik (discuter) 6 août 2023 à 18:08 (CEST)Répondre

Suggestion de détection : « Classe CSS inexistante » modifier

De nombreux articles sollicitent dans leur code des classes CSS qui n'existent pas sur la Wikipédia francophone. Ces présences sont souvent des résidus de traduction depuis une autre version linguistique. Serait-il opportun de retirer massivement ces éléments superflus ? Voici quelques exemples :

  • hintergrundfarbe1 à hintergrundfarbe11 près de 1 000 articles (recherche) ;
  • près de 600 prettytable dont 40 class="prettytable sortable" et un class="prettytable centered" (recherche)
  • class="nfvtTitleSTop", class="nfvtL" et class="nfvtR" (32 articles)
  • certains dans seulement une dizaine d'articles (ou modèles) environ :
    • class="t_nihongo_kanji", class="t_nihongo_help noprint" class="t_nihongo_icon", class="t_nihongo_comma", class="t_nihongo_romaji", class="t_nihongo_justif" (17 articles)
    • class="Person" (14 articles)
    • class="corpslibc", class="txtv", class="txtw"
    • class="BoxenVerschmelzen"
    • class="tracklist"
  • ou encore plus marginalement :
    • class="boilerplate metadata"
    • class="heat" et class="finals"
    • class="xl24"
    • class="texte-table" et class="titre-table"
    • class="stillactive"
    • class="tablegraph"
    • class="#FF0000" (erreur manifeste)
  • un doute pour class="table-na" et polytonic, cette dernière semblant obsolète sur Mediawiki.

Cette détection serait similaire à la numéro 112, intitulée « Attribut CSS incorrect ou obsolète ». En ce qui concerne les cas les plus courants, serait-il possible de demander à des bots qui retouchent déjà des éléments liés à la traduction, comme ceux de Framawiki ou JackPotte, de les retirer en même temps que leur action courante ?

Enfin, pas d'erreur, mais les références COinS (class="Z3988") pourraient être remplacées par des modèles : lire Wikipédia:Le Bistro/23 septembre 2010#Génération automatique des modèles {{Ouvrage}} et {{Article}}. De même, les <span class="reference-accessdate"> sont souvent associés à des bugs de traduction et devraient être remplacés en utilisant les modèles bibliographiques adéquats. — Ideawipik (discuter) 6 août 2023 à 18:08 (CEST)Répondre

Effectivement, merci pour cette info, je vais essayer d'ajouter ça à mon script qui nettoie les traductions quotidiennes. Cordialement, -Framawiki 6 août 2023 à 18:42 (CEST)Répondre
j'ai corrigé les cas les plus courants, et ils seront pris en charge si ils sortent de l'outil de traduction. Mais j'ai l'impression que c'est en majorité des copié-coller de wikipedia en allemand (hintergrundfarbe est dans leur Common.css) ou de sites externes (nfvtTitleSTop est uniquement dans les tableau d'investisseurs de sociétés). Cordialement, -Framawiki 7 août 2023 à 14:11 (CEST)Répondre
Merci Framawiki. La liste n'était pas exhaustive, on pourrait analyser un dépôt des articles pour lister davantage de cas.
Note : la section relative aux catégories, juste au-dessus, concerne aussi des traductions, notamment quant aux « Page utilisant P… », elle pourrait intéresser ton bot Émoticône. — Ideawipik (discuter) 7 août 2023 à 17:14 (CEST)Répondre
L'idéal serait de trouver un moyen de lister toutes les classes valides, pour fonctionner par liste blanche plutôt que par liste noire.
La règle 112 « Attribut CSS incorrect ou obsolète » ne prend en charge que quelques classes connues (dont une résultante d'un bug de l'outil de trad). Cordialement, -Framawiki 7 août 2023 à 17:52 (CEST)Répondre

Faux positifs pour l'erreur 513 « Lien interne dans un lien externe » modifier

Bonjour NicoV. Par défaut, le modèle {{Date}} ne génère plus de lien interne, sauf dans certaines conditions :

  • s'il y a une thématique valide explicitement donnée, en paramètre 2 ou 4 selon la syntaxe adoptée ; exemples :

{{Date|3 janvier 2020|en sport}} ou {{Date|3|janvier|2020|en sport}} ;

  • si le modèle contient un paramètre liens à une valeur positive telle « oui », « yes », « 1 », « o », « y » et variantes de casse comme « OuI » ; exemple : {{Date|3 janvier 2020|liens=oui}}.

Pour éviter les faux positifs, je propose dans un premier temps de retirer le Date|date-|true de la configuration de la détection 513. Cette page concerne WPCleaner. Je ne crois pas que la détection des erreurs de Lint en dépende, mais je me trompe peut-être. Par ailleurs, Check Wikipedia ne contient pas cette détection.

Qu'en penses-tu ? Ensuite, il sera idéalement bien de réintroduire cette détection pour le modèle Date, en considérant les spécificités listées plus haut. — Ideawipik (discuter) 6 août 2023 à 18:08 (CEST)Répondre

Bonjour Ideawipik. Ol pour retirer la ligne dans la configuration de WPCleaner. A voir plus tard si je peux compléter WPCleaner pour gérer ce cas. --NicoV (discuter) 7 août 2023 à 06:54 (CEST)Répondre
Merci NicoV. La ligne sera retirée. Je me pose aussi la question du destin de {{Date rapide}}, sur Discussion modèle:Date rapide#Retrait des liens internes non thématiques ?. — Ideawipik (discuter) 7 août 2023 à 17:14 (CEST)Répondre

Espaces insécables modifier

Bonjour, quelle est la règle concernant &nbsp;, faut-il les laisser sous cette forme ou les remplacer par des espaces insécables lors du passage de nos bots? AWB en ajoute [2], il me semblait pourtant que les codes HTML n'ont pas à être dans le wikicode. Cordialement, -Framawiki 7 août 2023 à 13:11 (CEST)Répondre

Bonjour Framawiki. A choisir entre un &nbsp; et un vrai espace insécable, personnellement je préfère le code HTML (qui est visible lors de l’édition). Mais dans la majorité des cas, je pense qu'il vaut mieux utiliser un modèle qui le fera (genre {{Unité}} pour l'exemple avec AWB). Mon bot vire un certain nombre d'espaces insécables quand ils sont inutiles. --NicoV (discuter) 7 août 2023 à 14:55 (CEST)Répondre
Idem. Ou pour des cas plus généraux, purement techniques, {{nobr}}. — Ideawipik (discuter) 7 août 2023 à 17:14 (CEST)Répondre

Fausses listes à puces modifier

Bonsoir, je travaille actuellement à supprimer dans les articles les modèles de puces qui sont obsolètes et qui posent des problèmes d'accessibilité.

C'est l'occasion de redécouvrir que certains bricolent des listes à puces à l'aide de balises <br> et de •.

Cela contrevient complètement à Wikipédia:Atelier accessibilité/Bonnes pratiques#Listes à puces et listes numérotées (de priorité élevée).

Une recherche de insource:/\<br *\/?\> *"•"/ trouve 2 833 résultats.

Serait-il possible d'ajouter leur détection et leur correction dans WPCleaner ?

Le seul piège que je connaisse est l'utilisation d'une telle astuce dans la légende des images. Dans ce cas, il faut utiliser {{Liste pour légende}}.

Une recherche avec un tiret trouve 6 000 résultats. Par contre, ça me semble plus compliqué à traiter automatiquement puisque le tiret est parfois utilisé pour un nombre négatif.
FDo64 (discuter) 14 septembre 2023 à 23:49 (CEST)Répondre

Bonjour FDo64. Je suis tombé sur ce message et j'ai fait quelques essais.
Il semble qu'on ait principalement deux cas :
  1. des fausses listes à puces dans des titres de vignettes (qu'on peut remplacer par {{Liste pour légende}})
  2. des fausses listes à puces dans des infoboxes (qu'on peut remplacer par des vraies, il suffit de sauter des lignes dans les valeurs des paramètres)
Je n'ai pas trouvé d'autres cas pour le moment.
Pour les vignettes, ça ne semble pas poser de problème, mais je viens de tomber sur Guerre d'Irak, où l'infobox à des puces et des drapeaux qui servent de puces... Donc on ne peut pas traiter les infoboxes de manière automatique, sinon on va avoir des listes brisées, ou plutôt des listes entrecoupées.
Je suis en train de regarder pour une regex qui fonctionne uniquement à l'intérieur des vignettes, mais c'est compliqué car il y a parfois des liens internes dans leurs titres, et je ne suis pas très fort en regex.
Aussi, pour les tirets servant de signe moins, il ne peut y avoir qu'un chiffre après, pas une lettre.
Sinon, j'ai regardé les listes d'articles avec AWB et les auteurs dans l'historique avec WikiBlame, puis j'ai recoupé leurs contributions et les articles à fausses listes à puces avec le comparateur de listes, et j'ai repéré certains utilisateurs qui ont l'habitude d'utiliser cette technique de fausses listes à puces, certains sur des centaines d'articles. Les prévenir serait une bonne chose, mais ce genre de recherche prend du temps.
Cordialement, Şÿℵדαχ₮ɘɼɾ๏ʁ 8 janvier 2024 à 11:29 (CET)Répondre
Bonsoir SyntaxTerror Émoticône et merci de t'intéresser à cette demande.
Je veux bien faire ma part du travail pour les cas non automatisables, donc si tu as des listes, tu peux me les partager.
Pour ce qui est des infobox, il y a des cas ou il faudra réduire la marge pour une question de présentation. On y travaille avec Notification Od1n.
--FDo64 (discuter) 8 janvier 2024 à 18:46 (CET)Répondre
Bonjour FDo64.
J'ai fais des listes avec plusieurs cas et regardé un peu comment les choses se passent (aller sur Utilisateur:SyntaxTerror/Fausses listes).
Je peux déjà dire qu'un traitement automatique semble vraiment complexe, mais avec les bonnes regexes, on peut faire un traitement semi-auto relativement rapide, à part dans les cas bizarres, mais il n'y en pas beaucoup à mon avis pour les « fausses puces ».
Cordialement, Şÿℵדαχ₮ɘɼɾ๏ʁ 8 janvier 2024 à 21:16 (CET)Répondre

Liens interlangue déguisés en liens internes modifier

Ne pas archiver.

Bonjour

Il faudrait ajouter un modèle similaire à {{lien à corriger}} qui catégorise pour les liens de type [[:en:Thing|Chose]].

Après une discussion sur le Bistro, on est arrivé à la conclusion qu'un remplacement automatique par bot n'est pas possible dans la plupart des cas, les différents types de liens et ce qui les entoure dans le texte étant trop variés.

J'ai déjà fait une liste des pages de l'espace principal et modèle à partir du dump du 20 novembre 2023 et l'on trouve 36 727 articles et 363 modèles.

Notification NicoV qui s'occupe déjà de {{lien à corriger}} et de la Catégorie:Article avec un lien à corriger.

Notification Orlodrim dont OrlodrimBot (d · c · b) remplace les {{lien}} en lien internes et qui pourrait aider dans certains cas si les articles existent déjà sur wp.fr.

icône « fait » Fait. Je vais essayer de vérifier les modèles, peut être avec l'aide de FDo64 qui s'est proposé sur le Bistro. Je vais déjà retirer de ma liste les modèles qui ne sont pas utilisés dans l'espace principal, ou dont le lien est dans leur documentation (la liste est ici : Utilisateur:SyntaxTerror/Brouillon/6).

J'ai vérifié la liste des modèles, il y en a 167 qui posent problème, surtout des palettes. La liste est sur Utilisateur:SyntaxTerror/Brouillon/6, vous êtes les bienvenus pour les corriger.

Cordialement, Şÿℵדαχ₮ɘɼɾ๏ʁ 29 novembre 2023 à 04:02 (CET)Répondre

Bonjour SyntaxTerror Émoticône.
J'ai l'impression que c'est assez difficile de déterminer automatiquement si un lien pose problème ou non. Par exemple sur la liste de modèles :
J’ai peur qu'il y ait de nombreux faux positifs (et pleins de cas différents), donc il va falloir faire attention aux actions automatiques, même pour simplement poser un modèle comme {{lien à corriger}}. --NicoV (discuter) 29 novembre 2023 à 07:41 (CET)Répondre
Bonjour NicoV : j'ai fait ça relativement vite, après, je ne dis pas que tout est corrigeable, mais pas mal le sont, notamment les palettes.
Par contre, il faut corriger au mieux ces modèles, car ils touchent potentiellement plus d'un article, et on ne peut décemment pas ajouter de modèle ni les catégoriser.
Je pense qu'il faut déjà modifier ce qui est facile, et on verra ensuite pour les cas les plus compliqués, et pour les modèles, on ne peut rien faire automatiquement, mais il n'y en a pas tant que ça.
Concernant les articles, je pense qu'on peut tout catégoriser, je ne vois vraiment pas quel lien vers un Wikipédia en langue étrangère pourrait être pertinent dans un article. Il faut soit le remplacer par un modèle {{lien}}, soit par l'article en français qui a été créé depuis, soit l'effacer (je pense notamment à des liens vers des catégories d'autres Wikipédias, qui n'ont rien à faire sur wp.fr).
Aussi, si un lien mène à un article qui n'est visiblement pas admissible sur wp.fr, il n'a rien à faire dans les articles. Şÿℵדαχ₮ɘɼɾ๏ʁ 29 novembre 2023 à 08:36 (CET)Répondre
@NicoV : au fait, {{lien à corriger}} ne sert que pour les années ? Si c'est le cas, il serait bien de le renommer en {{lien année à corriger}} par exemple, qu'on puisse le distinguer de {{lien interlangue à corriger}}.
Je peux me charger d'écrire la page d'aide liée comme je l'avais fait pour Aide:Lien à corriger (qu'il faudra renommer également, ainsi que la Catégorie:Article avec un lien à corriger). Şÿℵדαχ₮ɘɼɾ๏ʁ 29 novembre 2023 à 08:45 (CET)Répondre
Bonjour. Il me semble très difficile d'agir de façon automatisée sur ce point : il y a des cas où, en notes, on a « Voir l'article en anglais … [lien souvent ancré] », que ce soit celui correspondant à l'article concerné ou un autre ; il y a des « Cet article est partiellement ou en totalité issu [ou traduit] de l'article … » écrit en dur au lieu d'utiliser le modèle {{Traduction/Référence}} ; il y a des cas où l'article serait de toute évidence non admissible en français donc l'usage du modèle Lien ne serait pas approprié ; des fois on a, accolés, un lien vers l'article en français et un lien vers l'article dans une autre langue, auquel cas on peut supprimer le second ; etc. Un exemple pour lequel la version anglaise de mots est présentée ; pas sûr que ce soit pertinent ici, mais dans certaines situations, ça doit l'être. Dans l'espace des articles, il y a aussi des cas similaires à ceux relevés par NicoV. Exemple dans l'article Ukraine : « Ces pourcentages sont issus de l'article en anglais : United Nations General Assembly Resolution 68/262 » ; la solution dans ce cas serait d'introduire dans l'article en français les sources contenant les chiffres présentés. Autres exemples : insource:/\[\[:en:Wikipedia/.
Parfois, le remplacement n'est pas évident. Ainsi, il peut arriver que la cible du lien ait été modifiée avec le temps sur l'autre Wiki ou supprimée. Par exemple la page it:Mihai Albu est devenue une page d'homonymie (pour information le bot qui remplace les modèles Lien n'effectue pas la conversion en lien interne dans ce cas, laissant le soin à un humain de vérifier). Il est même possible que la cible n'ait jamais existé. Pendant un temps, un bot qui traduisait des palettes insérait le modèle Lien pour des liens rouges sur la Wikipédia d'origine. En outre, deux articles de même titre sur deux versions linguistiques peuvent traiter de deux sujets homonymes différents.
Notons aussi qu'on a des liens légitimes vers le Wiktionnaire ou vers Wikisource ([[:en:wikisource:…|sur Wikisource]]).
L'intérêt d'un modèle introduit dans les articles ne me semble pas évident. En revanche, une liste de détection associée à une grosse liste blanche, peut éventuellement servir pour une maintenance ciblée, directe. — Ideawipik (discuter) 1 décembre 2023 à 01:13 (CET)Répondre
Bonjour @SyntaxTerror. Je vois que j'avais zappé ta question...
Oui, WPCleaner ne pose le modèle {{lien à corriger}} que pour les années car c'est le seul cas qu'il peut détecter de façon à peu près fiable.
Pas de soucis pour renommer le modèle, il faudra par contre modifier la configuration de WPCleaner dans Projet:Correction syntaxique/Traduction#Erreur 526. NicoV (discuter) 9 janvier 2024 à 18:45 (CET)Répondre

Traitement du caractère � modifier

De nombreuses occurrences de ce caractère de remplacement , notamment dans les refs. Elle proviennent typiquement d'erreurs d'encodage par rapport aux pages web servant de source.

Faudrait des corrections humaines ou assistées par un bot. Le plus souvent, � correspond à un caractère accentué à,é,è… ou un guillemet '"‘’. Quelques exemples ici (long et incomplet).

Voir Discussion modèle:Lien web#Caractère/encodage qui casse le modèle Irønie 9 janvier 2024 à 00:32 (CET)Répondre

Bonjour @Irønie. Je dois pouvoir facilement ajouter la détection dans WPCleaner comme une nouvelle erreur. Pour les corrections, à première vue ça semble compliqué en automatique. Peut-être des possibilités d'assistance en allant chercher le titre de la page web pour remplacer celui mis dans le modèle. NicoV (discuter) 9 janvier 2024 à 08:56 (CET)Répondre
Bonjour @Irønie. J'ai rajouté la détection dans WPCleaner, la liste sera générée dans Projet:Correction syntaxique/Analyse 582. Je verrais plus tard si il y a moyen que WPCleaner fournisse de l'aide ou puisse faire des corrections automatiques. NicoV (discuter) 9 janvier 2024 à 17:22 (CET)Répondre

Lien interne avec cible identique au texte, mais texte en italique modifier

Bonjour,

Je débarque tout juste sur cette page, je vois que ça parle de script en Perl, n'ai pas du tout la foi de me lancer dans l'exploration de cela et ne sais pas du tout quelle méthode est utilisée pour effectuer les corrections, mais je me permets d'intervenir à la suite de ce changement effectué par Notification Lomita qui comporte une erreur, puisque le rendu du texte initialement en italique passe injustement en caractères romains. Il doit donc y avoir un ou plusieurs bricolages à faire quelque part.

Bonne suite à tous,

CaféBuzz (d) 18 avril 2024 à 22:43 (CEST)Répondre

Noms de rues modifier

Bonjour les correcteurs, administrateurs et tous les gnomes !

J'aimerais lire vos remarques sur cette discussion que j'ai ouverte, Discussion_catégorie:Cacographie_(trait_d'union)#prénom_nom_ou_nom_composé_-_noms_de_rues avant de donner un peu de temps et surtout avant ne m'y prendre comme un manche.

En effet, même si je fais le gnome depuis belle lurette sans être connecté, je n'ai ni la fine connaissance ni la science infuse pour continuer sans vos directives. Et pas idée de comment procéder si vous êtes unanimes à m'encourager de modifier...ces centaines de pages ! Edddddfr (discuter) 26 avril 2024 à 12:13 (CEST)Répondre

Revenir à la page « Correction syntaxique ».