Ceļvedis "Pētniecības datu pārvaldība"

Nacionālais atvērtās piekļuves dienests un LU Bibliotēka ir izveidojusi ceļvedi, kurā apkopota informācija par pētniecības datu pārvaldību. Šo materiālu laika gaitā plānots papildināt ar jaunu informāciju.

Ierosinājumus un komentārus lūdzam sūtīt uz e-pastu: napd@lu.lv

Materiāls tapis ar ES pētniecības un inovāciju programmas "Apvārsnis 2020" projekta "OpenAIRE-Advance" (līguma nr. 777541) atbalstu. 

Pētniecības datu pārvaldība ietver procesus un darbības, kas vajadzīgas, lai pārvaldītu datus visa pētniecības dzīves cikla laikā, gan pašreizējiem, gan turpmākiem pētījumiem un interesentu vajadzībāmTās pamatā ir sagatavošanās datu pārvaldībai pētniecības projektā,  kā arī datu ilgtermiņa saglabāšanai un kopīgošanai. Pētniecības projekta darba grupai ir saistošas arī pētniecības finansētāju prasības rezultātu saglabāšanas un izplatīšanas kontekstā (piemēram, Eiropas Savienības pētniecības un inovāciju programmā Apvārsnis 2020). Datu pārvaldības plānošana sniedz iespēju pētniekiem un projekta darba grupai strādāt efektīvāk, identificēt prasības un pārvaldīt iespējamās problēmas, kā arī piemērot atbilstošus risinājumus. Ieteicams, ka katram pētniecības projektam, kurā notiek darbs ar datiem vai atkārtoti izmantotiem datiem, tiek izveidots datu pārvaldības plāns.

Datu pārvaldības plāns (DMP)

Datu pārvaldības plānošanas rīki

Datu analizēšana ir jebkuras pētniecības vissvarīgākā sastāvdaļa. Datu analīzes laikā tiek veikta savākto datu apkopošana. Tā ietver to datu interpretēšanu, kas iegūti, pielietojot analītisko un loģisko pamatojumu, lai noteiktu modeļus, attiecības un tendences. Datu analīzei ir  svarīga loma pētniecībā izvirzītā mērķa sasniegšanā un uzdevumu izpildē. Datu analizēšanas metodes variē no sekundāriem līdz primāriem, kā arī no kvalitatīviem līdz kvantitatīviem pētījumiem. Datu analizēšana attiecas uz procesiem, kas saistīti ar virspusīgām nozīmēm un izpratnēm no dažādām datu  kopām, kuras tikušas savāktas pētniecības projekta laikā kā bāze turpmākajām aktivitātēm un teorētisko nostādņu izvirzīšanai.

Datu analizēšanas laikā:

-savāktie dati tiek transformēti  informācijā un zināšanās par pētāmo objektu;

- tiek praktizēta dažādu datu kopu savstarpējā saderība;

- tiek interpretēta informācija un identificētas nozīmes.

Parasti nākamais solis datu analīzē ir datu interpretēšana. Tai raksturīga nozīmes un būtības piešķiršana, aprakstošo moduļu skaidrošana, saistību un attiecību veidošana starp aprakstošajām dimensijām. Kad šie procesi ir noslēgti, pētniekam ir iespēja ziņot par interpretāciju un izrietošajiem secinājumiem.

Ieteicams izmantot atvērtās programmēšanas valodas (piemēram, Python vai R), lai apstrādātu un analizētu datus, tam ir priekšrocības pret patentēto programmatūru, kā arī tiem ir augsta atkārtotas izmantošanas priekšrocība.

Lai nodrošinātu pētījuma projektā iesaistītajiem pētniekiem, kā arī citiem interesentiem iespēju orientēties pētījuma datos, ir nepieciešams domāt par datu kopu un citu ar tām saistīto objektu dokumentēšanu un metadatu (datu par datiem) pievienošanu.

Datu dokumentēšana

Metadati

Pētījumu datiem var būt ievērojami liela vērtība arī ārpus oriģinālā pētījuma projekta, tos atkārtoti izmantojot vai apvienojot ar citām datu kopām. Rezultātā Dalīšanās ar datiem var būt izdevīga gan oriģinālā pētījuma veicējiem, gan plašākai pētniecības kopienai.

Bieži sastopamas bažas par pētniecības datu apmaiņu ir šādas: risks zaudēt konkurences priekšrocības, bažas, ka citi nepareizi interpretēs vai nepareizi izmantos datus, un risks būt ļoti atvērti pieejamiem rūpīgai pārbaudei. Tomēr ir arī ieguvumi, ko var iegūt, kopīgojot datus, piemēram:

  • ļauj veikt neatkarīgu rezultātu novērtēšanu;
  • palielina pētījuma ietekmi un atpazīstamību;
  • dod iespēju racionāli izmantot ieguldītos resursus, izvairoties no dublēšanas;
  • rada jaunas sadarbības un partnerības;
  • sekmē pētniecību, apvienojot datu kopas jaunos un inovatīvos veidos.

Daudzi publiskie pētniecības finansētāji arvien vairāk pievēršas Ekonomiskās sadarbības un attīstības organizācijas jeb OECD (angliski - Organisation for Economic Co-operation and Development) norādījumiem un, kad vien iespējams, sagaida datu kopīgošanu. Par finansētāju atvērtās piekļuves un arhivēšanas prasībām informāciju var meklēt datubāzē Sherpa Juliet.

Ja pētījuma projektā tiek plānots dalīties ar datiem, ir labi jau projekta sākumā pārdomāt un izlemt, kādu piekļuves nodrošināšanas metode tiks piemērota.

 

Kā dalīties ar saviem datiem?

  • Datus var deponēt specializētos datu centros jeb arhīvos un repozitorijos, lai tie būtu plašāk pieejami.
  • Daudzos gadījumos ir iespējams iesniegt savus datus arī žurnālā kopā ar saistīto publikāciju.
  • Izvērtējot situāciju, atsevišķas datu kopas un informāciju var tikt ievietota un padarīta pieejama arī projekta tīmekļa vietnē.
  • Var būt gadījumi arī, kad pētnieki ar datiem dod iespēju iepazīties recenzentiem.

Digitālie materiāli var būt nestabili, pēc gadu desmitiem ilgas saglabāšanas tiem var būt sarežģīti piekļūt vai izmantot. Ilgtermiņa datu saglabāšanas stratēģija nodrošinās, ka dati arī turpmāk būs atrodami, saprotami, pieejami un izmantojami. Zinātniskās institūcijas un finansētāji var pieprasīt, lai pētniecības dati būtu pieejami konkrētu laika posmu pēc to publicēšanas.

Bez efektīvas ilgtermiņa saglabāšanas stratēģijas:

  • datnes var kļūt nesavietojamas ar jaunāko programmatūru un līdz ar to  - nepieejamas;
  • izmantojot jaunāku programmatūru datņu atvēršanai, datnes var mainīties un līdz ar to var kļūt nesaprotamas vai nederīgas turpmākai pētniecībai;
  • dati var pazust, ja uzglabāšanas ierīces sabojājas;
  • dati nav saprotami, ja nav saglabājusies pavaddokumentācija.

Veidojot, organizējot un saglabājot datus, var veikt vairākas darbības, lai dati arī turpmāk būtu izmantojami un saprotami:

  • veidot noderīgu dokumentāciju nākamajiem lietotājem, lai tie varētu izmantot jūsu paveikto darbu;
  • dublēt datus, izveidojot vairākas rezerves kopijas dažādās glabāšanas ierīcēs;
  • periodiski pārvietot datus uz jaunām glabāšanas ierīcēm;
  • kontrolēt piekļuvi datiem, lai datu pabeigto versiju nevarētu rediģēt;
  • migrēt datus uz jaunām programmatūras versijām vai izmantot universālos datņu formātus, kurus var viegli importēt uz dažādām programmatūrām.

Situācijā, kad atbildīgais par datu saglabāšanu maina darba vietu, dati jānodod kolēģiem vai jānorāda turpmākā kontaktinformācija datu piekļuvei.

Datu saglabāšana var būt dārga, laikietilpīga un prasīt noteiktu zināšanu līmeni, kas ne vienmēr ir pieejams, tādēļ var izmantot datu arhīvu vai centru pakalpojumus.  Datu centros/arhīvos tiek ievietoti un pārvaldīti pētniecības dati, tiek nodrošināta arī datu pieejamība lietotājiem ar piekļuves tiesībām. Dažkārt pētniecības finansētāji iesaka un prasa deponēt datus noteiktos datu centros ilgtermiņa glabāšanai.

Datu centri ir, piemēram, the UK Data Archive for Social SciencesArchaeology Data ServiceDryad Digital Repository and Visual Art Data Service (VADS).

Kas ir saglabājamo datu atlase?

Kur ilgtermiņā saglabāt datus?

Kā sagatavot sensitīvos datus ilgtermiņa saglabāšanai?

  1. Briney, Kristin. Data Management for Researchers: Organize, maintain and share your data for research success [online]. Pelagic Publishing, 2015. Available: http://ebookcentral.proquest.com/lib/lulv/detail.action?docID=2071180
  2. Can I reuse someone else’s research data? [online]. OpenAIRE, [2020]. Available: https://www.openaire.eu/can-i-reuse-someone-else-research-data
  3. Cox, Andrew; Verbaan, Eddy. Exploring Research Data Management. Facet Publishing, 2018. ISBN 9781783302802
  4. Data formats for preservation [online]. OpenAIRE, [2020]. Available: https://www.openaire.eu/data-formats-preservation-guide
  5. Formatting and organising research data [online]. University of Essex, [2014]. Available: https://www.ukdataservice.ac.uk/media/440281/formattingorganising.pdf
  6. Henshaw, Ian. Tim Berners-Lee’s 5-Star Open Data Scheme [online]. Slidesshare, 2014. Available: https://www.slideshare.net/TheODINC/tim-bernerslees-5star-open-data-scheme
  7. How to deal with non-digital data [online]. OpenAIRE, [2020]. Available: https://www.openaire.eu/non-digital-data-guide
  8. How to deal with sensitive data [online]. OpenAIRE, [2020]. Available: https://www.openaire.eu/sensitive-data-guide
  9. How to find a trustworthy repository for your data [online]. OpenAIRE, [2020]. Available: https://www.openaire.eu/find-trustworthy-data-repository
  10. Henshaw, Ian. Tim Berners-Lee’s 5-Star Open Data Scheme [online]. Slidesshare, 2014. Available: https://www.slideshare.net/TheODINC/tim-bernerslees-5star-open-data-scheme
  11. Informatīvs palīglīdzeklis "Zinātniskā publicēšanās" [online]. Latvijas Universitētes Bibliotēka, 2020. [skatīts 2020-10-21]. Pieejams: https://www.biblioteka.lu.lv/pakalpojumi/pakalpojumi-petniekiem/informativs-paliglidzeklis-par-zinatnisko-publicesanos/
  12. Managing and Sharing Research Data [online]. FOSTER, [2019]. Available: https://www.fosteropenscience.eu/learning/managing-and-sharing-research-data/#/id/5b2ccc7d7ce0b17553f69063
  13. Mantra: Research Data Management Training [online]. The University of Edinburgh, [2020]. Available: https://mantra.edina.ac.uk/
  14. Pryor, G., Jones, S., & Whyte, A. Delivering research data management services : Fundamentals of good practice / edited by Graham Pryor, Sarah Jones and Angus Whyte. Facet Publishing, 2014. ISBN 9781856049337
  15. Recommended formats [online]. UK Data Service, [2020]. Available: https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats
  16. Research data management [online]. University of Reading, 2020. Available: http://www.reading.ac.uk/RES/rdm/res-research-data-management.aspx
  17. Research data management [online]. University of Sussex, 2020. Available: https://www.sussex.ac.uk/library/researchdatamanagement/index
  18. Rice, Robin, and John Southall. The Data Librarian's Handbook. [online].  Facet Publishing, 2016. Available: http://ebookcentral.proquest.com/lib/lulv/detail.action?docID=4788049
  19. 5-Star Open Data [online]. 2015. Available: https://5stardata.info/en/