C’est quoi, une donnée scientifique ?
Selon l’OCDE (2007)
« […] enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. […] Ces Principes et Lignes directrices portent essentiellement sur les données de la recherche sur support numérique exploitable sur ordinateur. »
Voir le chapitre du livre :
BORGMAN, Christine L. 2. Qu’est-ce qu’une donnée ? In : Qu’est-ce que le travail scientifique des données ? Big data, little data, no data [en ligne]. Marseille : OpenEdition Press, 2020 (généré le 30 août 2021). Disponible sur Internet : ISBN : 9791036565410. DOI : https://doi.org/10.4000/books.oep.14732
Une entité ne devient une donnée que lorsqu’elle est utilisée pour mettre en évidence un phénomène à des fins de recherche.
Où déposer ses jeux de données ?
Il est recommandé de choisir, dans la mesure du possible, un entrepôt certifié, autrement dit un entrepôt validé par une organisation de certification qui garantit aux déposants que leurs données seront protégées et gérées de manière optimale. La référence : CoreTrustSeal.
En l’absence d’un entrepôt institutionnel ou thématique, Horizon Europe recommande d’utiliser l’entrepôt multidisciplinaire Zenodo.
Pour les sciences humaines, vous avez à votre disposition Nakala, l’entrepôt d’Huma-Num.
Depuis le 8 juillet 2022, à défaut d’un entrepôt institutionnel ou thématique, vous pouvez utilisez l’entrepôt national Recherche Data Gouv.
Le plan de gestion des données
Le Plan de gestion des données (PGD) ou Data Management Plan (DMP) est un outil de gestion qui permet d’expliciter le cadre de la collecte et de l’organisation des données, mais aussi de leur accès, leur partage et leur réutilisation, et ainsi d’anticiper les problèmes techniques ou juridiques.
Le Plan de gestion des données doit obligatoirement accompagner un projet de recherche financé par l’ANR ou Horizon Europe. Il est évolutif au cours du projet de recherche (au moins trois versions).
Il faut cependant distinguer la gestion des données de la question de l’ouverture des données qui doivent être « aussi ouvertes que possible, aussi fermées que nécessaire » selon les principes FAIR (Findable, Accessible, Interoperable, Reusable).
Vous pouvez aussi consulter le Guide des bonnes pratiques sur la gestion des données de la recherche.
DMP OPIDoR est l’outil français d’aide à la création en ligne de plans de gestion de données.
DMP Opidor propose désormais un modèle structuré : ce modèle, plus détaillé, rend votre PGD exploitable par les machines avec l’adjonction de référentiels qui sont importés au fur et à mesure des développements.
L’unique modèle structuré, pour l’instant, est celui de Science Europe. Vous pouvez aussi consulter le Guide pratique de Science Europe.
Par ailleurs, l’usage du PGD ne se limite plus aujourd’hui aux projets financés, d’où l’apparition d’un PGD dit “structure” en sus du PGD de projet. Il permet de décrire comment une structure (unité de recherche, infrastructure collective) gère ses données de recherche. Pour l’essentiel, ce type de PGD aura un périmètre plus large, pour une durée plus longue et sera organisé non pas par jeu de données mais plutôt par type de données ou type d’activités. Il est créé à l’initiative de la structure.
- Modèle de l’ANR (il existe aussi un modèle en anglais )
- Modèle HorizonEurope (mai 2021)
Pour aller plus loin…
- Auto-formation sur les questions de gestion et de partage des données de la recherche: Doranum
- Feuille de route 2021-2024 du MESRI : politique des données, des algorithmes et des codes sources
- Une BD proposée par l’Université de Guyane : On fait le point sur les données de la recherche avec Sorella
Répertoires pour sélectionner l’entrepôt adapté à vos besoins :
- Re3data (registry of Research data Repositories)
- OpenDOAR ( Directory of Open Access Repositories ) : annuaire mondial des entrepôts en libre accès
- Le guide des répertoires de la revue Nature
- CatOpidor, la liste des entrepôts français
Moteurs de recherche pour trouver des données :
Voir aussi : Portail de services aux données de l’European Open Science Cloud (EOSC) dont l’objectif est de relier les infrastructures de données scientifiques européennes existantes.
Outils d’aide à la décision et de contrôle :
- Arbre à décision sur la diffusion des données de la recherche
- Grille crée par le groupe RDA-SHARC pour évaluer la FAIRisation de ses données
- Le Costing data management tool : pour calculer le temps consacré à la curation des données
- Le Cost calculator de l’EPFL pour calculer les coûts de gestion des données
- Amnesia pour anonymiser ses données
Entrepôts de données :
- Recherche Data Gouv : entrepôt national pluridisciplinaire en complément des infrastructure nationales et européennes thématiques
- Zenodo : entrepôt international pluridisciplinaire créé par le CERN et recommandé par la Commission Européenne
- Data Terra : infrastructure du système Terre
- Nakala (Huma-Num) : entrepôt pour les sciences humaines et sociales
- Software heritage : entrepôt pour les logiciels
Pour vous aider à l’UBO
- Plan de gestion de données : vous souhaitez une aide pour la rédaction de votre PGD, contacter : donnees-recherche@univ-brest.fr
- SHS : vous souhaitez mieux gérer vos données (licence, format, dépôt dans un entrepôt…) la datalab organise des ateliers autour des données de recherche en SHS à destination des enseignant·es-chercheur·ses, doctorant·es et ingénieur·es. Informations et inscriptions ici.
- SHS : vous pouvez également contacter le datalab pour un accompagnement personnalisé de votre projet SHS sur le volet données : datalabs@mshb.fr ou caroline.terrier@univ-brest.fr
- Mer : vous pouvez consulter la documentation sur les données scientifiques de l’IUEM ici : https://www-iuem.univ-brest.fr/SIMI/accueil-gestion-donnees/documentation-donnees-scientifiques
Contacts :
- Pour toute question sur les données de recherche à l’UBO :
donnees-recherche@univ-brest.fr
- Pour toute question sur les données de recherche concernant la mer à l’IUEM :
donnees-iuem@univ.brest.fr