• Home
  • Données de la recherche : services support

Données de la recherche : services support

La 2e feuille de route science ouverte de Centrale Lyon a pour principal objectif la mise en place de services d’accompagnement à la gestion et au partage des données de la recherche produites et traitées au sein de l’établissement. Ces services support se déclinent sur l’ensemble du cycle de vie de la donnée et mobilisent différents acteurs des campus.

Des services tout au long du cycle de vie de la donnée

Un accompagnement à la gestion des données de la recherche est proposé aux différentes étapes du cycle de vie de la donnée.
 

Ce schéma fait apparaître les acteurs de l’Ecole susceptibles de vous accompagner dans la gestion de vos données, selon vos questions et vos besoins :

  • Les services de valorisation de la recherche : la Direction partenariat recherche et valorisation (DPRV) et Centrale Innovation
  • L’équipe des services à la recherche de la bibliothèque Michel Serres
  • L’équipe du Pôle de Calcul de Centrale Lyon, le PMCS2I
  • Le Fonctionnaire sécurité défense (FSD)
  • Le Délégué à la protection des données (DPO)

Plans de gestion de données

Le plan de gestion de données (PGD ou DMP – Data management plan) est le document central dans une démarche de gestion des données de la recherche.
Son objectif est de décrire comment les données de recherche générées et/ou réutilisées seront gérées pendant et après le projet de recherche. A ce titre, il couvre l’ensemble du cycle de vie de la donnée et aborde aussi bien les questions de collecte, de documentation, de stockage, de partage et d’archivage des données.

Il s’agit d’un livrable obligatoire dans la plupart des projets financés par de l’argent public : ANR, Horizon Europe, ADEME… car il permet de prévoir, dès le début d’un projet, les bonnes pratiques qui permettront de produire des données compréhensibles et réutilisables.

Nous vous proposons un accompagnement, quel que soit le contexte de votre recherche (projet ANR, européen, thèse, recherches partenariales…) :

  • Présentation générale des attendus d’un plan de gestion de données et des obligations éventuelles liées à un financement.
  • Rendez-vous personnalisés pour le remplissage des différentes rubriques du plan de gestion de données.
  • Relecture du plan de gestion de données.
  • Présentation de l’outil d’aide à la rédaction de plans de gestion de données DMP Opidor, qui permet d’afficher pour chaque question des recommandations spécifiques à Centrale Lyon.

FAIRisation des données

L’objectif des pratiques de gestion et de partage des données est de rendre celles-ci « FAIR », c'est-à-dire Faciles à trouver, Accessibles, Interopérables et Réutilisables. L’Urfist Méditerranée propose, sur le site Doranum, une description de ces quatre principes et des bonnes pratiques qu’ils recouvrent.

Parmi celles-ci, nous pouvons citer :

  • le choix et l’utilisation de métadonnées ;
  • le choix et l'utilisation de vocabulaires contrôlés pour décrire les données ;
  • la documentation du workflow de collecte, de traitement et d’analyse des données ;
  • le choix d’un entrepôt de données pour les diffuser ;
  • l’attribution d’un identifiant pérenne comme le DOI aux jeux de données ;
  • le choix d’une licence de réutilisation attribuée aux données.

Accompagnement juridique

Le partage et l’ouverture des données constituent le 2e axe du Plan national pour la science ouverte 2021-2024, qui vise notamment à « mettre en œuvre l’obligation de diffusion des données de recherche financées sur fonds publics ». La loi française est d’ores et déjà alignée avec cet objectif, puisque les données « achevées » produites par les établissements de recherche et d’enseignement dans le cadre de leur mission de service public sont considérées comme des documents administratifs et sont, à ce titre, soumises aux principes de diffusion en ligne par défaut et de liberté d’accès (cf le guide juridique disponible sur le site ouvrirlascience.fr). Ce principe général est soumis à des exceptions.

Celles-ci concernent notamment :

  • les données à caractère personnel ;
  • les données issues de zones à régime restrictif (ZRR) et les données relatives au potentiel scientifique et technique de la Nation ;
  • les données protégées par un droit d’auteur ou un droit de propriété intellectuelle ;
  • les données provenant d’un tiers ;
  • les données relevant du secret des affaires.

Il est capital de poser et traiter les questions de propriété et de partage des données dès le début du projet : ces questions doivent être réglées dans l’accord de consortium ou le contrat partenarial et être reportées dans le plan de gestion de données. Dès le lancement d’un projet impliquant un ou plusieurs partenaires, qu’ils soient académiques ou industriels, rapprochez-vous de la Direction Partenariat Recherche Valorisation de Centrale Lyon (DPRVsprv@listes.ec-lyon.fr) pour vous accompagner sur ces questions.

Infrastructures numériques mutualisées

Le stockage des données de recherche doit obéir à un certain nombre de principes et de règles :

  • Privilégier les solutions de stockage institutionnelles sécurisées (laboratoire ou établissement) ; évitez les solutions de stockage privées comme Dropbox ou Google Drive.
  • Appliquez la règle du 3-2-1 : 3 exemplaires de vos données stockées sur au moins 2 supports différents et avec une copie distante (ex. : serveur institutionnel), pour éviter la perte de données.
  • Les répertoires et fichiers doivent être clairement nommés et organisés en respectant les bonnes pratiques usuelles.
  • A l’issue d’un projet, trier les données : archiver celles qui sont destinées à une conservation à long terme et supprimer celles qui ne seront plus utiles.

 

L'Ecole Centrale de Lyon dispose d'espaces de stockage centralisés pour les projets de recherche. Pour y avoir accès, consultez le site du Pôle de Calcul PMCS2I. Vous pourrez y faire une demande de création de compte auprès du Pôle de Calcul. Vous serez alors en mesure de faire une demande de stockage via l'interface de tickets de Centrale Lyon.
Ces espaces de stockage, créés dans le cadre de la 2e feuille de route science ouverte de Centrale Lyon, sont destinés à compléter, dans le cadre de projets de recherche identifiés (ANR, Horizon Europe, ADEME, thèse…), l’offre de stockage disponible au sein des laboratoires.

Ils permettent, via la création de comptes, un accès partagé à des jeux de données, avec des collègues de Centrale Lyon ou des partenaires extérieurs.
Ces espaces sont alloués pendant la durée du projet ; à l’issue de ce dernier, les données à conserver devront être sélectionnées et archivées. Les autres seront supprimées.

Pour les codes et logiciels, Centrale Lyon met à la disposition des chercheurs un Gitlab. Celui-ci est accessible avec vos identifiants de Centrale Lyon.

Pour la simulation numérique, le traitement des données expérimentales ou numériques et la visualisation, Centrale Lyon met à votre disposition un Pôle de calcul mutualisé, le PMCS2I.
Celui-ci dispose de logiciels de traitement de données dont vous trouverez la liste ici.
 

Une fois les éventuels obstacles juridiques à la diffusion des données levés, il convient de choisir les modalités de leur ouverture :

  • Quel entrepôt de données choisir ?
  • Quelles modalités d’accès (libre ou restreint) ?
  • Quelle licence de réutilisation choisir ?
  • Quelles informations partager pour rendre ces données compréhensibles et réutilisables ?

 

Le site Doranum propose un certain nombre de réponses à ces questions sur les entrepôts de données, les licences de réutilisation, les moyens de faciliter l’accès à ses jeux de données ou encore les questions à se poser avant de partager ses données.

Dans le cas où il n’existe pas d’entrepôt thématique/disciplinaire adapté à votre besoin, il est recommandé de partager vos données via l’espace Data Centrale Lyon sur l’entrepôt Recherche Data Gouv. Ce dernier, créé dans le cadre du 2e Plan national pour la science ouverte, est une solution souveraine de publication pour le partage et l’ouverture des données. Il est destiné aux communautés de recherche ne disposant pas encore d’un entrepôt thématique reconnu.
La curation des jeux de données déposés est assurée par l’équipe des services à la recherche de Centrale Lyon - donnees-recherche@listes.ec-lyon.fr.

Il convient de distinguer le stockage des données « chaudes », pendant la durée du projet, et l’archivage à long terme des données « froides », à l’issue du projet.

Ainsi, le stockage n’est pas destiné à être pérenne, contrairement à l’archivage. A l’issue d’un projet de recherche, il convient donc de sélectionner les données destinées à être archivées, et celles qui, à l’inverse, peuvent être supprimées. Cette phase de tri et de sélection est d’autant plus importante que les enjeux de consommation énergétique liée au stockage des données rendent intenable une conservation systématique par principe.

Dans le cadre d’une collaboration avec le Centre de calcul de l’IN2P3, localisé à la Doua, le Pôle de calcul de Centrale Lyon propose aux chercheurs un archivage sur bandes magnétiques de leurs données stockées sur les espaces institutionnels.

Cette demande d’archivage peut être faite via l'interface de tickets de Centrale Lyon.

Besoin d'aide ?

Une seule adresse pour toutes vos questions sur les données de la recherche : donnees-recherche@listes.ec-lyon.fr