Data Management

Guillaume Cabanac : Le détective de la science face aux fraudes et à la "Dépollution" de la littérature scientifique


Jacqueline Sala
Lundi 30 Juin 2025


La science fait face à une crise d'intégrité : fraudes, fausses publications et manque de reproductibilité lié aux résultats négatifs. Guillaume Cabanac (détective de la tromperie) "dépollue" la littérature. Un effort collectif est importante pour restaurer la confiance.



Guillaume Cabanac : Le détective de la science face aux fraudes et à la "Dépollution" de la littérature scientifique

 

Dans le paysage scientifique actuel, confronté à des défis croissants en matière d'intégrité et de fiabilité, des figures comme Guillaume Cabanac émergent pour combattre la "mauvaise science". Professeur des universités en informatique à l'Université de Toulouse et membre du projet NanoBubbles de l'European Research Council, Guillaume Cabanac est un acteur clé de la "démarche de dépollution de la littérature scientifique". Son travail acharné lui a valu d'être reconnu par la prestigieuse revue Nature en 2021 comme l'une des dix personnalités qui ont marqué la science, étant surnommé le "détective de la tromperie".

Les Menaces sur l'Intégrité Scientifique L'ère numérique a transformé la diffusion des travaux scientifiques, offrant de nouvelles voies d'accès comme les archives ouvertes et les revues en libre accès. Cependant, cette évolution s'accompagne de difficultés croissantes pour le système traditionnel d'évaluation par les pairs (peer review), notamment en raison de l'inflation du nombre d'articles et de la pression sur les délais de relecture. Ces failles ont ouvert la voie à des pratiques douteuses et à des fraudes scientifiques.

Les problèmes incluent :
  • Revues prédatrices : Ces revues en libre accès sont principalement intéressées par le bénéfice financier et offrent de publier à bas coût sans garantie de peer review sérieux, parfois avec des comités éditoriaux fictifs.
  • "Moulins à papiers" (Paper Mills) : Des entreprises qui rédigent et vendent des manuscrits fabriqués de toutes pièces à des chercheurs, sans qu'aucun travail de recherche réel ne les sous-tende.
  • Fraude et méconduites scientifiques : Elles se manifestent par la fabrication de données (composition, enregistrement, présentation de données inventées), la falsification de données (manipulation de procédures ou transformation/omission de données), et le plagiat (appropriation d'idées, de résultats ou de mots sans crédit approprié). Des "pratiques de recherche contestables" (QRP) comme le "p-hacking" (modifier le plan de recherche pour obtenir des résultats significatifs) et le "HARKing" (formuler des hypothèses après avoir découvert les résultats) contribuent également à la crise de la reproductibilité.
  • L'Intelligence Artificielle Générative : L'émergence d'outils comme ChatGPT pose de nouvelles menaces, offrant la capacité de générer rapidement du texte et des images, ce qui peut intensifier le plagiat, la falsification, la fabrication de données et la désinformation massive.
Ces problématiques, exacerbées par la "pression à la publication" ("publish or perish"), compromettent la fiabilité des recherches et sapent la confiance du public dans la science.
 
Les Outils et Méthodes de "Dépollution" de Guillaume Cabanac Les travaux de Guillaume Cabanac se concentrent sur l'analyse quantitative de la science et la fouille de la littérature scientifique pour produire de nouvelles connaissances, en concevant des algorithmes qui examinent des millions d'articles. Il a développé des méthodes et des outils pour détecter ces fraudes et méconduites :
  • Le Problematic Paper Screener (PPS) : Ce logiciel, basé sur l'intelligence artificielle, est doté de neuf détecteurs qui parcourent la littérature scientifique toutes les nuits. Il permet de repérer des articles "dénués de sens" ou "problématiques", y compris ceux produits par des générateurs automatiques comme Scigen.
  • La traque des "expressions torturées" : Guillaume Cabanac a identifié 468 de ces expressions, qui sont des périphrases générées par des IA (par exemple, "déception du rein" pour "insuffisance rénale") utilisées pour contourner les détecteurs de plagiat. Ces expressions sont le symptôme d'une nouvelle forme de plagiat par "copier/paraphraser/coller". Ses recherches ont révélé la présence de ces expressions dans des milliers d'articles parus chez des éditeurs réputés, principalement en ingénierie et santé.
 
L'impact de ses travaux est significatif : en identifiant plus de 14 300 articles problématiques, ses efforts ont conduit à la rétractation de plus de 800 articles publiés par de grands éditeurs comme Elsevier et Springer. Cette "dépollution" est essentielle pour éviter que des résultats invalides ne soient exploités par d'autres chercheurs ou intelligences artificielles.
 
Une Responsabilité Collective et l'Avenir de l'Intégrité Scientifique Guillaume Cabanac souligne la nécessité d'une "routine d'hygiène numérique" pour les scientifiques, les encourageant à être vigilants quant à leur identité numérique, à vérifier les notifications de nouvelles publications en leur nom et à dialoguer en cas de citations inappropriées. Il insiste sur le fait que l'IA, bien qu'étant une menace, peut aussi devenir un "antidote", avec le développement d'outils de détection basés sur l'IA, comme Proofig pour les images frauduleuses.
 
La lutte contre la mauvaise science est un effort collectif. Des plateformes comme PubPeer, qui permet aux scientifiques de commenter et de signaler anonymement des articles douteux, et Retraction Watch, qui signale un nombre croissant d'articles rétractés (près de 14 000 en 2022 et plus de 50 000 à ce jour dans sa base de données), sont des ressources précieuses. Le COMETS du CNRS recommande d'ailleurs aux institutions de recherche de consulter ces réseaux sociaux scientifiques pour identifier les mauvaises pratiques.
 
En fin de compte, stopper la propagation de la mauvaise science exige de la responsabilité, des mesures préventives et une collaboration de toutes les parties impliquées pour maintenir la crédibilité de la recherche scientifique. Les travaux de Guillaume Cabanac sont un témoignage éloquent de cet engagement essentiel pour l'intégrité de la science.

Pour en savoir plus :

  • "Intégrité scientifique à l'heure de l'intelligence artificielle générative : ChatGPT et consorts, poison et antidote - Cairn"
  • "Chain retraction: how to stop bad science propagating through the literature - OPUS Project" (article de Guillaume Cabanac pour Nature)
  • "Comment dépolluer la science ? | Cairn.info" (entretien avec Guillaume Cabanac)
  • "Dissimuler ou disséminer ? Une étude sur le sort réservé aux résultats négatifs"
  • "Introduction à l'intégrité scientifique. - URFIST Rennes"
  • "L'économie à l'ère de la science ouverte : un nouvel élan pour la reproductibilité - Center for Environmental Economics - Montpellier"
  • "Nature's 10 : Guillaume Cabanac parmi les 10 personnalités qui ont marqué la science en 2021 - Université de Toulouse"
  • "PUBLICATIONS - Guides thématiques at Fondation Nationale des Sciences Politiques"
  • "Retractions Can't Travel at the Speed of Hype - ConscienHealth"
  • "« La science pâtit d'un manque de reproductibilité des résultats de recherche » - Polytechnique Insights"

Resume

Scientific integrity faces a crisis: soaring retractions (14,000 in 2022, >50,000 total), fraud (fabrication, falsification, plagiarism), and questionable practices (p-hacking, HARKing). Predatory journals and paper mills proliferate. The lack of reproducibility (1/3 social science results) and publication bias against negative findings (81% useful, 12.5% published) further undermine trust. AI is a dual-edged sword: enabling fake content yet providing detection tools like Guillaume Cabanac’s Problematic Paper Screener. Collective action by all stakeholders is crucial to uphold research credibility.
(traduction par Deepl)