Aller au contenu principal

Gestion des données de recherche: Critères et licences

Ce guide propose des informations et ressources sur la gestion des données de recherche (GDR).

Critères et licences

 

Critères pour choisir un dépôt

Trois ensembles de questions à se poser lors du choix d'un dépôt.

 

1. Caractéristiques du dépôt 

  • Recommandation ou obligation d'un dépôt spécifique (par l'éditeur, par exemple)?
  • Dépôts disciplinaires incontournables?
  • Lieu de dépôt? (Canada ou États-Unis, idéalement)
  • Restrictions sur la provenance des données?
  • Coûts pour déposer?
  • Langues de description permise?
  • Statistiques de consultation et téléchargement?
  • Gestion des rôles = autorisations de l'équipe de recherche pour l'administration des données?
    • Éditer, publier
    • Consulter
  • Degré de concordance aux principes FAIR (plus de détails ci-dessous)

 

 2. Caractéristiques des données

  • Type / format données?
    • CSV, TXT, GPS, PNG…
    • Dépots généralistes = plus ouverts
    • Dépots disciplinaires = plus restrictifs
  • Taille des fichiers de données, limites pour un ensemble de données
  • Besoin de fonctionnalités de versionnage? 

 

 3. Type de diffusion et de partage

  • Quelle licence veut-on utiliser? Est-elle imposée? (Souvent Creative Commons)

Ce sont les licences qui permettent aux autres de savoir quelle est l'utilisation permise de vos données. En identifiant celle qui correspond le mieux à votre projet, vous pourrez y refléter adéquatement votre volonté tout en respectant les exigences des organismes subventionnaires, des revues et des dépôts de données avec lesquels vous pourriez avoir à faire. Voir plus bas, pour davantage de détails sur les licences.

  • Le dépôt permet-il un embargo?
  • Peut-il restreindre l'accès aux données? (notamment pour raisons éthiques)
  • Le chercheur veut-il que le dépôt offre un identifiant pérenne? Pour publication des données (DOI sur la page Web de l'article)
  • Métadonnées: schémas de métadonnées très spécifiques permettant partage et réutilisation

 

Ressources pour le choix d'un dépôt

 

 

Principes FAIR

Le choix d'un dépôt peut aussi être guidé par les principes FAIR (Findability, Accessibility, Interoperability, and Reuse of digital assets). Ces principes ont pour objectif d'améliorer la capacité des machines (ordinateurs) à trouver et accéder aux données afin qu'elles puissent être réutilisées par la communauté scientifique. Voici une brève description des quatre principes :

  • Faciles à trouver (être découvrable)

    • Les données sont assorties d’un identifiant persistent et unique, elle sont décrites au moyen de métadonnées riches et elles sont enregistrées et indexées dans une ressource recherchable

  • Accessibles

    • Les données sont repérables par leur identifiant au moyen d’un protocole de communication normalisé, ouvert, gratuit et universel. Les métadonnées sont accessibles, même quand les données ne le sont plus.

  • Interopérables

    • Les métadonnées utilisent un langage formel, accessible, partagé et utilisent des vocabulaires qui adhèrent aux principes FAIR. 

  • Réutilisables

    • Les données sont diffusées selon une licence d’utilisation claire et accessible. Les données sont associées à leur provenance. 

 

 

Licences

Ce sont les licences qui permettent aux personnes tierces de savoir quelle est l'utilisation permise de vos données. En identifiant celle qui correspond le mieux à vos besoins, vous pourrez y refléter adéquatement votre volonté tout en respectant les exigences des organismes subventionnaires, des revues et des dépôts de données avec lesquels vous pourriez collaborer. L'utilisation d'une licence qui permettra la réutilisation la plus large possible permettra d'augmenter l'utilisation de vos données par d'autres équipes et, par le fait même, leur visibilité. 

Il est à noter que seulement les titulaires des droits de propriété intellectuelle peuvent émettre une licence, il est donc essentiel de préciser à qui appartiennent ces droits. 

  • Il existe plusieurs types de licences standards mises à la disposition des chercheurs et chercheuses. Pour la plupart des ensembles de données, il est plus facile d'utiliser une licence standard plutôt que de concevoir une licence personnalisée.  
  • Veuillez noter que même si vous choisissez de rendre vos données publiques, il est préférable de l'indiquer de manière explicite en utilisant une licence telle que CC0 de Creative Commons.  

Certains dépôts exigent que les données et/ou métadonnées soient rendues publiques sous une licence Creative Commons permettant la réutilisation. Si c'est le cas, assurez-vous que la publication des données n'enfreint aucune loi ou condition contractuelle, et posez-vous les questions suivantes.