Salta al contenuto principale

Data Management Plan e data repository

Data Management Plan (DMP)

Contestualmente ai dati della ricerca viene consigliata, o talvolta richiesta, la redazione di un Data Management Plan (DMP), cioè di un piano di gestione dei dati.

Attraverso questo strumento i ricercatori pianificano la raccolta, conservazione, descrizione e disseminazione dei propri dati e metadati della ricerca secondo i cosiddetti Principi FAIR.

Consentendone tracciabilità, disponibilità, autenticità, citabilità e una conservazione appropriata, tenendo conto anche degli aspetti etici e legati alla sicurezza, ne assicurano e disciplinano gli usi successivi.

Il DMP è concepito come un living document perché segue l’intero ciclo di vita dei dati, permettendo attraverso la pianificazione di risparmiare tempo e risorse.

É importante che venga redatto in fase di avvio della ricerca e aggiornato, in versioni successive, nelle diverse fasi della ricerca nonché quando intervengano delle modifiche nella natura dei dati o nelle modalità di gestione.

Il DMP aiuta i ricercatori a gestire i propri dati, a soddisfare i requisiti del finanziatore e aiuta gli altri a utilizzare i dati se condivisi.

Solitamente il DMP viene redatto dal principal investigator.

Sono disponibili in internet numerosi modelli per la redazione del DMP, spesso però gli stessi programmi di finanziamento predispongono un template da compilare.

Generalmente si articola in più sezioni, ad esempio:

  • informazioni amministrative sul progetto di ricerca
  • descrizione dei dati di ricerca prodotti o riutilizzati nell'ambito del progetto
  • standard e metadati utilizzati nella raccolta e nella gestione dei dati
  • misure di sicurezza nel trattamento dei dati nel corso del progetto
  • gestione delle eventuali problematiche relative all'etica, alla gestione di dati personali e sensibili, a esigenze di confidenzialità e riservatezza
  • deposito e condivisione dei dati utilizzati nelle pubblicazioni scientifiche di progetto
  • archiviazione e accesso ai dati dopo la fine del progetto
  • gestione della documentazione relativa alla cura dei dati
  • identificazione delle responsabilità coinvolte nella produzione e gestione dei dati

E’ opportuno archiviare negli archivi o repository di dati istituzionali, laddove esistenti, in quelli disciplinari di riferimento in uso nelle diverse comunità scientifiche, o multidisciplinari come Zenodo gestito dal CERN, Dryad Figshare.

La maggior parte sono gratuiti fino a una certa dimensione del dataset, e attraverso banche dati come re3data.org e OpenDOAR è possibile individuare facilmente il repository di dati più appropriato.

 Occorre però verificare che il repository scelto rispetti alcuni requisiti, in particolare:

  • abbia una governance pubblica
  • garantisca la conservazione a lungo termine dei dati
  • supporti licenze aperte, come le Creative Commons
  • adotti metadati standard richiesti dagli aggregatori internazionali, come ad esempio OpenAIRE
  • attribuisca un identificatore persistente ai data set (DOI, Handle, URN)
  • consenta il cross-linking con le pubblicazioni scientifiche
  • gestisca il deposito di versioni aggiornate dello stesso data set collegate fra loro (versioning)

Oltre ai dati, è opportuno archiviare anche documentazione e spiegazioni (read-me file) facendo riferimento agli strumenti e ai software utilizzati per generare ed elaborare i dati.

I dati devono essere depositati completi dei seguenti metadati descrittivi:

  • autore/i e contributore/i
  • titolo
  • data di pubblicazione
  • abstract
  • riferimenti all'eventuale finanziamento
  • l'eventuale citazione delle pubblicazioni ai quali si riferiscono
  • la licenza di distribuzione
  • il livello di accesso
  • l’eventuale periodo di embargo.

Sarebbe buona norma depositare anche i software, ad esempio in GitHub, e i protocolli, ad esempio in Protocols.io.

Per i software è necessario utilizzare le licenze appropriate, ad esempio le Licenze GNU o la Licenza MIT.
Altre licenze sono disponibili sul sito della Open Source Initiative.