Open Access Otwarte dane badawcze (ORD)
Plan zarządzania danymi (DMP)


OTWARTE DANE BADAWCZE

Otwarte dane badawcze (ang. Open Research Data – ORD) stanowią element ruchu Open Access (OA), który jest realizowany poprzez stosowanie zasad otwartej nauki, otwartego publikowania i otwartej komunikacji naukowej. Idea ORD obejmuje dane badawcze, czyli wszelkie materiały pozyskane i/lub wytworzone w trakcie projektu badawczego, zmierzającego do otrzymania oryginalnych wyników naukowych. Aby dane badawcze były uznane za otwarte, muszą być publicznie dostępne (bez ograniczeń) oraz nadające się do dalszego wykorzystania i upowszechniania – w celu spełnienia tych warunków i utrzymania określonych standardów opracowane zostały cztery zasady FAIR Data:

[F] łatwe do odnalezienia (ang. findable)

[A] dostępne dla wszystkich (ang. accessible)

[I] interoperacyjne z innymi danymi i systemami (ang. interoperable)

[R] możliwe do ponownego wykorzystania (ang. reusable)

W rozumieniu powyższych zasad, ORD powinny być zdeponowane i udostępniane w otwartych repozytoriach danych (np. Zenodo lub RepOD) – przy wyborze odpowiedniego repozytorium warto skorzystać z wyszukiwarki Registry of Research Data Repositories. Inną praktyką jest zamieszczanie informacji o danych badawczych w tzw. Data Journals (np. Data in Brief lub Data), czyli recenzowanych czasopismach publikujących opisy zestawów danych badawczych (ang. Dataset). W obu formach udostępniania i informowania o posiadanych danych badawczych należy zastosować standard opisu metadanych (np. DataCite Metadata Schema lub DDI – Data Documentation Initiative), który służy scharakteryzowaniu oraz organizacji i identyfikacji zbioru danych wg konkretnego schematu uwzględniającego m.in. informacje o autorze, tytule, dacie powstania, projekcie badawczym, licencji na udostępnianie, dyscyplinie naukowej, itp. Przy wyborze standardu metadanych warto skorzystać z wyszukiwarki FAIRsharing lub Digital Curation Centre.

PLAN ZARZĄDZANIA DANYMI

W celu organizacji całego projektu badawczego tworzony jest plan zarządzania danymi (ang. Data Management Plan – DMP), polegający na zaplanowaniu procedur związanych z pozyskiwaniem, przetwarzaniem i udostępnianiem danych badawczych. Aktualnie DMP stanowi obowiązkowy element wniosku o finansowanie projektów badawczych składanych do Narodowego Centrum Nauki.

Kwestie i zagadnienia zawarte w DMP dla wniosków składanych do NCN:

1.    Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych

1.1.  Sposób wytwarzania lub pozyskiwania danych badawczych: dokumentacja ich pochodzenia; organizacja danych; zapisywanie (struktura katalogowa, nazewnictwo plików) i odczytywanie danych (oprogramowanie i narzędzia).

1.2.  Charakterystyka danych badawczych: dane cyfrowe czy analogowe; dane własne czy zamawiane; dane surowe czy przetworzone; rozmiary i formaty danych.

2.    Dokumentacja i jakość danych

2.1.  Informacje (metadane) o danych badawczych: metadane identyfikujące autora (np. ORCID ID) i projekt; schemat metadanych (np. DataCite, DDI); dokumentacja organizacji danych (np. plik README, książka kodowa).

2.2.  Wykazanie wysokiej jakości danych: procedury poprawności danych; procedury powtórzenia badań w celu weryfikacji; procedury zabezpieczenia danych przed obcą ingerencją.

3.    Przechowywanie i tworzenie kopii zapasowych podczas badań

3.1.  Dostęp do wyników badań: przechowywanie danych w bezpiecznych miejscach (ograniczonych dostępem i hasłem); tworzenie 2-3 kopii zapasowych – na innych nośnikach, tj. dysk, chmura (patrz: usługa Next Cloud na PŚ).

3.2.  Ochrona danych: procedury przy istnieniu danych wrażliwych; procedury na skutek zgubienia lub zniszczenia danych.

4.    Wymogi prawne, kodeksy postępowania

4.1.  Przetwarzanie danych osobowych: opis stosowanej polityki RODO, ale wyłącznie wtedy gdy badania tego dotyczą (patrz: zarządzenie w sprawie ochrony danych osobowych na PŚ).

4.2.  Własność intelektualna: kto ma prawo do danych, czy można je udostępniać i na jakich licencjach (patrz: regulamin zarządzania własnością intelektualną na PŚ; regulamin korzystania z infrastruktury badawczej PŚ); przy wyborze otwartego dostępu do danych zastosować otwarte licencje (np. CC – Creative Commons lub GNU General Public License).

5.    Udostępnianie i długotrwałe przechowywanie danych

5.1.  Udostępnianie danych: kiedy (np. w trakcie badań lub przed ukazaniem się publikacji), gdzie (repozytorium danych badawczych); jak długo (minimum 10 lat); czy są ograniczenia lub przeciwskazania (np. embargo, komercjalizacja badań).

5.2.  Repozytorium danych: wybór repozytorium za pomocą wyszukiwarki Registry of Research Data Repositories – dla danych badawczych tzw. nieprezentacyjnych (np. pomiary, pliki analityczne, widma, wydruki) można wskazać Zenodo; ewentualnie dla opracowanych publikacji i prezentacji multimedialnych (plików w formacie PDF) można wskazać instytucjonalne repozytorium publikacji pracowników Politechniki Śląskiej RePolis.

5.3.  Użytkowanie danych: stosowane metody i narzędzia; posiadanie licencji na oprogramowania.

5.4.  Identyfikacja danych: nadawanie w ramach repozytorium identyfikatorów DOI – zarówno Zenodo jak i RePolis.

6.    Zadania związane z zarządzaniem danymi oraz zasoby

6.1.  Data Steward (tzw. opiekun danych): kompetencje osoby odpowiedzialnej za dane pełni zazwyczaj Kierownik Projektu (lub inny wskazany uczestnik) – na PŚ nikt nie pełni tej funkcji.

6.2.  Koszty utrzymania danych: ewentualne wynagrodzenie dla opiekuna danych; opłaty za utrzymanie danych na serwerze (wziąć pod uwagę wielkość danych i czas archiwizacji); czy są w ogóle koszty?

MATERIAŁY UZUPEŁNIAJĄCE

Informacje dotyczące opracowania DMP udostępniane na stronie Narodowego Centrum Nauki:

Ø  wytyczne NCN w języku polskim i w języku angielskim

Ø  najczęściej zadawane pytania (FAQ)

Informacje udostępniane na stronach polskich uczelni:

Ø  Politechnika Gdańska – Centrum Kompetencji Otwartej Nauki

Ø  Uniwersytet Jagielloński – Centrum Administracyjnego Wsparcia Projektów

Ø  Uniwersytet Warszawski – Biblioteka Uniwersytecka

Kontakt w celu uzyskania konsultacji przy tworzeniu planu zarządzania danymi:

mgr Martyna Troszka

Biblioteka Politechniki Śląskiej // III piętro – pokój nr 317

44-100 Gliwice, ul. Kaszubska 23

tel. +48 32 237-14-34 // e-mail: martyna.troszka@polsl.pl

 
Admin © Politechnika Śląska
 
Całkowitą odpowiedzialność za poprawność, aktualność i zgodność z przepisami prawa materiałów publikowanych za pośrednictwem serwisu internetowego Politechniki Śląskiej ponoszą ich autorzy - jednostki organizacyjne, w których materiały informacyjne wytworzono.
Zasady wykorzystywania „ciasteczek” (ang. cookies) w serwisach internetowych Politechniki Śląskiej
Otwarte dane badawcze