Data Management

Data papers : un nouvel actif stratégique pour la recherche.


Jacqueline Sala
Mercredi 7 Janvier 2026


La donnée est devienue un levier de puissance scientifique, économique et politique, les data papers s’imposent comme un outil clé pour structurer, valoriser et sécuriser les jeux de données produits par la recherche. Le recueil dirigé par Christine Kosmopoulos et Joachim Schöpfel en dresse un panorama complet, révélant un écosystème encore instable mais stratégique pour les sciences humaines et sociales (SHS).



Source : Data & Corpus, 1 | 2025
Innovations méthodologiques et enjeux sociétaux

Ouvrage de référence : Publier, partager, réutiliser les données de la recherche : les data papers et leurs enjeux
Première édition. Lien. PUF
 

Un format éditorial au cœur de la science ouverte

L’ouvrage rappelle que les data papers — articles décrivant précisément un jeu de données, son contexte de production et ses conditions de réutilisation — constituent un format éditorial encore jeune, issu de la montée en puissance de la science ouverte. Définis par l’ISKO comme des articles scientifiques évalués par les pairs et citables, ils visent avant tout à rendre les données trouvables, accessibles, interopérables et réutilisables (FAIR).

Les contributions soulignent toutefois les défis propres aux SHS (Sciences Humaines et Sociales) : forte contextualisation, diversité extrême des formats, difficultés d’anonymisation. Les data papers y jouent un rôle de médiation, permettant de documenter les méthodes, d’assurer la reproductibilité et de favoriser la circulation des données. Mais ils restent souvent cités non pour leur contenu éditorial, mais pour les données qu’ils référencent.


Des retours d’expérience qui révèlent un chantier encore fragile

Pour aller plus loin...
Pour aller plus loin...

La seconde partie du volume met en lumière les pratiques concrètes d’écriture de data papers. Qu’il s’agisse de systèmes d’information géographique, de corpus linguistiques ou de données historiques, les auteurs décrivent les obstacles rencontrés : hétérogénéité des formats, lourdeur de la documentation, manque d’outils adaptés.

Ces retours montrent que la rédaction d’un data paper est autant un exercice technique qu’un travail de mise en récit. Elle nécessite une expertise hybride, mêlant compétences scientifiques, éditoriales et informationnelles. Les data journals jouent ici un rôle structurant, mais leur maturité reste variable selon les disciplines.


Un écosystème en construction, entre infrastructures et enjeux juridiques

La dernière partie explore les infrastructures qui soutiennent la production et la diffusion des données : Recherche Data Gouv, Huma-Num, Nakala, Isidore, Stylo, GitLab… Autant de briques qui composent un environnement socio-technique encore en consolidation. Les auteurs insistent sur la centralité de l’écriture à chaque étape du cycle de vie des données.

Les enjeux juridiques — licences, droit d’auteur, régulation européenne — apparaissent comme un autre point de tension. La FAIRisation des données exige des arbitrages complexes entre ouverture, protection et conformité. Les SHS, confrontées à des données sensibles ou qualitatives, sont particulièrement exposées.


Un outil stratégique mais encore sous-exploité

L'ouvrage montre que les data papers constituent un actif stratégique pour la recherche : ils valorisent le travail invisible de préparation des données, renforcent la transparence scientifique et facilitent la réutilisation. Mais leur adoption reste inégale, et leur potentiel encore largement sous-exploité, notamment en dehors des SHS.


Pour les acteurs de l’intelligence économique, ces travaux rappellent que la donnée n’est pas seulement une ressource : c’est un objet éditorial, juridique et stratégique, dont la maîtrise conditionne la capacité à produire, partager et capitaliser la connaissance.

A propos de...

Christine Kosmopoulos est ingénieure de recherche au CNRS et spécialiste reconnue de la science ouverte. Rédactrice en chef de la revue Cybergeo, elle œuvre à structurer, documenter et valoriser les données de recherche dans les sciences humaines et sociales.
 

En collaboration avec

Joachim Schöpfel est maître de conférences émérite en sciences de l’information à l’Université de Lille. Membre du laboratoire GERiiCO et ancien directeur de l’Atelier national de reproduction des thèses, il est spécialiste de la communication scientifique, de la science ouverte et de la littérature grise.