Guillaume Cabanac

informaticien français

Guillaume Cabanac, né en 1982, est un professeur des universités en informatique, spécialisé dans la détection automatique de publications scientifiques suspectées de fraude.

Biographie

modifier

Guillaume Cabanac effectue un DUT d'informatique de gestion et effectue un stage de programmation auprès d'un doctorant de l'Université Paul-Sabatier de Toulouse. Il soutient une thèse sur l’activité d’annotation collective de textes numériques[1].

Il enseigne l'informatique[2] dans cette même université[3], et travaille à l’Institut de recherche en informatique de Toulouse depuis septembre 2008[4].

Il publie en 2015 un article sur Library Genesis, moteur de recherche d'articles scientifiques piratés[2]. L'année suivante, il soutient une habilitation à diriger des recherches intitulée « Interroger le texte scientifique »[1].

Guillaume Cabanac obtient avec ses collègues un financement du Conseil européen de la recherche en 2021, au sein du projet européen NanoBubbles[5], afin d'étudier l'évolution des corrections et des actions prises par les éditeurs après la découverte d'articles incriminés[2]. Plusieurs éditeurs scientifiques souhaitent intégrer son système de détection dans leurs outils de sélection de publications[1].

Il est spécialisé dans la recherche de « phrases torturées » présentes dans les publications, qui transforme par exemple de manière maladroite le terme d'« intelligence artificielle » en « conscience contrefaite »[2].

Projets

modifier

Problematic Paper Screener

modifier

Avec l’informaticien grenoblois Cyril Labbé et le mathématicien russe travaillant pour Yandex Alexander Magazinov, ils créent le logiciel Problematic Paper Screener. L'outil vise à lister les articles utilisant abondamment de paraphrases et synonymes, afin de contourner la détection du plagiat. Les tournures de phrases illogiques les plus régulièrement utilisées sont listées par une cinquantaine de chercheurs et amateurs, qui en informent Guillaume Cabanac pour qu'elles soient ajoutées dans le système de détection[1].

En analysant deux fois par semaine les dernières publications scientifiques, via la plateforme Dimensions, l'outil recherche l'utilisation de formulations connues pour être des expressions torturées. Les résultats sont publiquement publiés sur son site. Neuf systèmes de détection permettent d'identifier les expressions torturées, des références problématiques, ou encore des auteurs ayant eu recours à des logiciels de génération de textes, tel que les LLM ou SCIgen.

Les articles suspects sont alors signalés sur le forum PubPeer.org[6]. Ce système a permis d'épingler plus de 14 000 articles[2], soit trois détections pour 10 000 articles ayant été évalués les pairs. Plusieurs ont été rétractées par leurs éditeurs[7], mais 80% des articles détectés restent accessibles sans avertissement dans les revues les ayants publiés[8].

Feet of Clay Detector

modifier

Guillaume Cabanac a développé l'outil « Feet of Clay Detector » (« Détecteur de pieds d’argile »), qui identifie les articles scientifiques ayant de nombreux articles rétractés parmi leurs sources. Ainsi, cet outil propose aux chercheurs un indice de la solidité des fondations sur lesquelles reposent leurs travaux. Certaines publications utilisent des sources déjà invalidées au moment de leur publication initiale, tandis que d'autres références peuvent être rétractées par la suite. Par exemple, l'outil a identifié un article de 2024 sur la détection des maladies par l'examen de l'œil citant 60 % de travaux rétractés[9],[10].

Vie privée

modifier

Guillaume Cabanac a trois enfants et est originaire de Martres-Tolosane[11].

Prix et distinctions

modifier

Liens externes

modifier

Notes et références

modifier
  1. a b c d e et f « Guillaume Cabanac, traqueur de fake science », sur CNRS Le journal (consulté le )
  2. a b c d e et f « Guillaume Cabanac, le Sisyphe de la dépollution de la science », Le Monde.fr,‎ (lire en ligne, consulté le )
  3. Valérie Ravinet, « Recherche. « Dans les égouts de la science, il existe un véritable business » », sur ToulÉco, (consulté le )
  4. « ORCID », sur orcid.org (consulté le )
  5. « Un nouvel outil pour traquer les articles scientifiques « bidons » écrits par des logiciels », Le Monde.fr,‎ (lire en ligne, consulté le )
  6. Paul Périé, « Fausses études scientifiques : le «détective» toulousain Guillaume Cabanac distingué par la revue «Nature» », sur leparisien.fr, (consulté le )
  7. (en) « Nature’s 10, Ten people who helped shape science in 2021: Guillaume Cabanac: Deception sleuth », sur www.nature.com (consulté le )
  8. Lucile Veissier, « G. Cabanac & C.Labbé « Si la détection de faux article est faite après leur publication, c’est trop tard » », sur TheMetaNews, (consulté le )
  9. Martin Clavey, « Recherche scientifique : un outil pour éviter les « colosses aux pieds d'argile » », sur Next, (consulté le )
  10. (en) Richard Van Noorden et Miryam Naddaf, « Exclusive: the papers that most heavily cite retracted studies », Nature,‎ (DOI 10.1038/d41586-024-02719-5, lire en ligne, consulté le )
  11. « Ce chercheur toulousain fait partie des 10 personnalités scientifiques mondiales de l'année », sur ladepeche.fr (consulté le )
  12. « Vidéo. Guillaume Cabanac, « dépollueur scientifique » », Le Monde.fr,‎ (lire en ligne, consulté le )
  13. Guillaume Cabanac, Curriculum Vitæ, (lire en ligne)