Utilisatrice:Madehub/Plan de gestion des données

Un plan de gestion des données ou PGD est un document officiel qui aide le chercheur ou le chargé de projet de la recherche à définir un plan pour gérer les données utilisées et générées dans le cadre de son activité. Initié au début du projet, son objectif d'englober les nombreux aspects de la gestion des données, des métadonnées : de la création et la préservation à l'analyse et la valorisation.

L'élaboration d'un plan de gestion des données garantit des données conservées et décrites dans des formats adéquats.[1] Cela permet d'économiser du temps dans le long terme, car il n'est pas nécessaire d'organiser à nouveau, re-formater, ou de se souvenir des détails. Il augmente également l'efficacité de la recherche depuis des entrepôts de données et d'autres chercheurs seront en mesure de comprendre et d'utiliser le jeu de données dans le futur. L'une des composantes d'un bon plan de gestion des données sont des données d'archivage et de conservation. [[ Des données conservées de manière F.A.I.R. (Findable, Accessible, Interoperable and Re-usable) permettent d'être partagées à la communauté scientifique.]]

Les Principaux Composants

modifier

Des informations sur les données et le format de données

modifier
  • Inclure une description des données produites par le projet.[2] Cela pourrait inclure (mais ne sont pas limités à) des données qui sont:
    • Expérimentale
    • Observation
    • Bruts ou dérivés
    • Collections physiques
    • Modèles
    • Des Simulations
    • Le matériel d'enseignement
    • Logiciel
    • Images
  • Comment les données seront acquises? Quand et où seront-ils acquis?
  • Après la collecte, comment les données seront-elles traitées? Inclure des informations sur
  • Décrire les formats de fichier qui sera utilisé, de justifier ces formats, et décrire les conventions de nommage utilisées.
  • Identifier l'assurance de la qualité et de contrôle de la qualité des mesures qui seront prises lors de la collecte des échantillons, l'analyse et le traitement.
  • Si les données existantes sont utilisées, quelles sont leurs origines? Comment les données collectées ne seront combinées avec les données existantes? Quelle est la relation entre les données recueillies et les données existantes?
  • Comment les données seront gérées dans le court terme? Considérez les points suivants:
    • Le contrôle de Version pour les fichiers
    • La sauvegarde des données et des produits de données
    • De sécurité et de protection de données et de produits
    • Qui sera responsable de la gestion de la

Les métadonnées de contenu et de format

modifier

Les métadonnées sont des descriptions contextuelles sur la données. Cela peut inclure des descriptions temporelles et spatiales, des détails, des instruments, des paramètres, des unités, des fichiers, etc. Les métadonnées sont communément appelées “données sur les données”.[3] et couvrent les questions suivantes :

  •  Quelles métadonnées sont nécessaires? Inclure tous les détails qui rendent les données significatives.
  • Comment les métadonnées seront créés et/ou capturés? Les exemples incluent laboratoire d'ordinateurs portables, GPS, les fichiers de sauvegarde automatique sur les instruments, etc.
  • Ce format sera utilisé pour les métadonnées? Chaque discipline scientifique utilise des normes propres et spécifiques de métadonnées. 

Les politiques pour l'accès, le partage et la réutilisation

modifier
  • Décrire les obligations qui existent pour le partage des données recueillies. Ceux-ci peuvent inclure des obligations de financement des organismes, des institutions, d'autres organisations professionnelles et des exigences légales.
  • Inclure des informations sur la façon dont les données seront partagées, y compris lorsque les données seront accessibles, combien de temps les données seront disponibles, la façon dont l'accès peut être acquise, et tous les droits que le collecteur de données réserves sur l'utilisation des données.
  • Adresse de toute éthique ou de la vie privée avec le partage de données
  • L'adresse de la propriété intellectuelle et le droit d'auteur des questions. À qui appartient le droit d'auteur? Ce sont les institutionnels, l'éditeur, et/ou de l'agence de financement des politiques liées à la propriété intellectuelle? Existe-il des embargos à des fins politiques, commerciales, ou d'un brevet raisons?
  • Décrire les futurs usages/utilisateurs pour les données
  • Indiquer comment les données doivent être citées par d'autres. Comment la question de la persistance de référence soient abordés? Par exemple, si les données vont être déposés dans des archives publiques, sera le jeu de données ont un identificateur d'objet numérique (DOI) qui lui est assignée?

Le stockage à long terme et la gestion des données

modifier
  • Les chercheurs devraient identifier des archives adéquates pour la préservation à long terme de leurs données. Par l'identification de l'archive au début du projet, les données peuvent être mises en forme, transformé, et documentés de façon appropriée pour répondre aux exigences de l'archive. Les chercheurs devraient consulter des collègues et des ordres professionnels dans leur discipline afin de déterminer le plus approprié de la base de données, et comprend une archive de sauvegarde dans leur plan de gestion des données dans le cas où leur premier choix en va de l'existence.
  • Dès le début du projet, le chercheur principal doit déterminer quels sont les données seront conservées dans les archives. Généralement, préservant les données dans sa forme la plus élémentaire est souhaitable, bien que les données des dérivés et des produits peut également être conservé.
  • Une personne doit être identifiée comme la première personne de contact pour les données archivées, et de s'assurer que les informations de contact soient toujours tenus à jour dans le cas où il y a des demandes.

La gestion des données et de la préservation des coûts peuvent être considérables en fonction de la nature du projet. En anticipant les coûts à l'avance, les chercheurs s'assurent que les données soient correctement gérées et valorisées. Les dépenses à prendre en compte sont les suivantes :

  • Les ressources humaines : temps du personnel pour la préparation des données, la gestion, la documentation et la préservation
  • Les ressources techniques : Matériels et/ou logiciels nécessaires pour la gestion des données, la sauvegarde, la sécurité, la documentation et la préservation
  • Les coûts associés à la soumission des données d'une archive dans un entrepôt.

Le plan de gestion des données devrait aborder la question des coûts et des dépenses.

Références

modifier
  1. http://libraries.mit.edu/data-management/plan/why/
  2. « Elements of a Data Management Plan », sur www.icpsr.umich.edu (consulté le )
  3. Michener,WK and JW Brunt. 2000.

Lectures complémentaires

modifier

Graham Pryor, Delivering research data management services, Facet Publishing, (ISBN 9781856049337)

Liens externes

modifier

[[Catégorie:Gestion des données]]