Otwarte dane badawcze (ORD)
Plan zarządzania danymi (DMP)
Otwarte dane badawcze
Otwarte dane badawcze (ang. Open Research Data – ORD) stanowią element ruchu Open Access (OA), który jest realizowany poprzez stosowanie zasad otwartej nauki, otwartego publikowania i otwartej komunikacji naukowej. Idea ORD obejmuje dane badawcze, czyli wszelkie materiały pozyskane i/lub wytworzone w trakcie projektu badawczego, zmierzającego do otrzymania oryginalnych wyników naukowych. Aby dane badawcze były uznane za otwarte, muszą być publicznie dostępne (bez ograniczeń) oraz nadające się do dalszego wykorzystania i upowszechniania – w celu spełnienia tych warunków i utrzymania określonych standardów opracowane zostały cztery zasady FAIR Data:
[F] łatwe do odnalezienia (ang. findable)
[A] dostępne dla wszystkich (ang. accessible)
[I] interoperacyjne z innymi danymi i systemami (ang. interoperable)
[R] możliwe do ponownego wykorzystania (ang. reusable)
W rozumieniu powyższych zasad, ORD powinny być zdeponowane i udostępniane w otwartych repozytoriach danych (np. Zenodo lub RepOD) – przy wyborze odpowiedniego repozytorium warto skorzystać z wyszukiwarki Registry of Research Data Repositories. Inną praktyką jest zamieszczanie informacji o danych badawczych w tzw. Data Journals (np. Data in Brief lub Data), czyli recenzowanych czasopismach publikujących opisy zestawów danych badawczych (ang. Dataset). W obu formach udostępniania i informowania o posiadanych danych badawczych należy zastosować standard opisu metadanych (np. DataCite Metadata Schema lub DDI – Data Documentation Initiative), który służy scharakteryzowaniu oraz organizacji i identyfikacji zbioru danych wg konkretnego schematu uwzględniającego m.in. informacje o autorze, tytule, dacie powstania, projekcie badawczym, licencji na udostępnianie, dyscyplinie naukowej, itp. Przy wyborze standardu metadanych warto skorzystać z wyszukiwarki FAIRsharing lub Digital Curation Centre.
Plan zarządzania danymi
W celu organizacji całego projektu badawczego tworzony jest plan zarządzania danymi (ang. Data Management Plan – DMP), polegający na zaplanowaniu procedur związanych z pozyskiwaniem, przetwarzaniem i udostępnianiem danych badawczych. Aktualnie DMP stanowi obowiązkowy element wniosku o finansowanie projektów badawczych składanych do Narodowego Centrum Nauki.
Kwestie i zagadnienia zawarte w DMP dla wniosków składanych do NCN:
- Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
1.1. Sposób wytwarzania lub pozyskiwania danych badawczych: dokumentacja ich pochodzenia; organizacja danych; zapisywanie (struktura katalogowa, nazewnictwo plików) i odczytywanie danych (oprogramowanie i narzędzia).
1.2. Charakterystyka danych badawczych: dane cyfrowe czy analogowe; dane własne czy zamawiane; dane surowe czy przetworzone; rozmiary i formaty danych.
- Dokumentacja i jakość danych
2.1. Informacje (metadane) o danych badawczych: metadane identyfikujące autora (np. ORCID ID) i projekt; schemat metadanych (np. DataCite, DDI); dokumentacja organizacji danych (np. plik README, książka kodowa).
2.2. Wykazanie wysokiej jakości danych: procedury poprawności danych; procedury powtórzenia badań w celu weryfikacji; procedury zabezpieczenia danych przed obcą ingerencją.
- Przechowywanie i tworzenie kopii zapasowych podczas badań
3.1. Dostęp do wyników badań: przechowywanie danych w bezpiecznych miejscach (ograniczonych dostępem i hasłem); tworzenie 2-3 kopii zapasowych – na innych nośnikach, tj. dysk, chmura (patrz: usługa Next Cloud na PŚ).
3.2. Ochrona danych: procedury przy istnieniu danych wrażliwych; procedury na skutek zgubienia lub zniszczenia danych.
- Wymogi prawne, kodeksy postępowania
4.1. Przetwarzanie danych osobowych: opis stosowanej polityki RODO, ale wyłącznie wtedy gdy badania tego dotyczą (patrz: Zarządzenie w sprawie Polityki ochrony danych osobowych na Politechnice Śląskiej).
4.2. Własność intelektualna: kto ma prawo do danych, czy można je udostępniać i na jakich licencjach (patrz: Regulamin zarządzania własnością intelektualną na PŚ; Regulamin korzystania z infrastruktury badawczej PŚ); przy wyborze otwartego dostępu do danych zastosować otwarte licencje (np. CC – Creative Commons lub GNU General Public License).
- Udostępnianie i długotrwałe przechowywanie danych
5.1. Udostępnianie danych: kiedy (np. w trakcie badań lub przed ukazaniem się publikacji), gdzie (repozytorium danych badawczych); jak długo (minimum 10 lat); czy są ograniczenia lub przeciwskazania (np. embargo, komercjalizacja badań).
5.2. Repozytorium danych: wybór repozytorium za pomocą wyszukiwarki Registry of Research Data Repositories – dla danych badawczych tzw. nieprezentacyjnych (np. pomiary, pliki analityczne, widma, wydruki) można wskazać Zenodo; ewentualnie dla opracowanych publikacji i prezentacji multimedialnych (plików w formacie PDF) można wskazać instytucjonalne repozytorium publikacji pracowników Politechniki Śląskiej RePolis.
5.3. Użytkowanie danych: stosowane metody i narzędzia; posiadanie licencji na oprogramowania.
5.4. Identyfikacja danych: nadawanie w ramach repozytorium identyfikatorów DOI – zarówno Zenodo jak i RePolis.
- Zadania związane z zarządzaniem danymi oraz zasoby
6.1. Data Steward (tzw. opiekun danych): kompetencje osoby odpowiedzialnej za dane pełni zazwyczaj Kierownik Projektu (lub inny wskazany uczestnik) – na PŚ nikt nie pełni tej funkcji.
6.2. Koszty utrzymania danych: ewentualne wynagrodzenie dla opiekuna danych; opłaty za utrzymanie danych na serwerze (wziąć pod uwagę wielkość danych i czas archiwizacji); czy są w ogóle koszty?
Materiały uzupełniające
Materiały udostępniane przez Narodowe Centrum Nauki:
- serwis informacyjny Zespołu NCN ds. Otwartej Nauki: Otwarta nauka (ncn.gov.pl)
- wytyczne NCN w języku polskim i w języku angielskim
- najczęściej zadawane pytania (FAQ) nt. planu zarządzania danymi badawczymi i Open Access
- polityka NCN dotycząca otwartego dostępu do publikacji – Zarządzenie nr 38/2020 i instrukcja (wersja 2.0, grudzień 2024)
- webinarium pt. Otwarte dane badawcze w polityce i praktyce NCN (Kraków, dn. 31.05.2023 r.) – prezentacja i nagranie ze szkolenia
Serwisy internetowe:
- Biblioteka Uniwersytecka w Warszawie (BUW): Otwarte dane badawcze
- Centrum Administracyjnego Wsparcia Projektów – Uniwersytet Jagielloński (CAWP UJ): Dane badawcze
- Centrum Kompetencji Otwartej Nauki Biblioteki Politechniki Gdańskiej (CKON BPG): Otwarte dane badawcze
- Platforma Otwartej Nauki – Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego (PON – ICM UW): Research Data Management
- OD – Serwis Rzeczypospolitej Polskiej: Otwarte dane – portal z danymi publicznymi
Narzędzia i wyszukiwarki:
- Journal Checker Tool: https://journalcheckertool.org/
- Polityka czasopism: https://mostwiedzy.pl/pl/magazine/catalog
- Pomocnik prawny: http://pomocnik.pon.edu.pl/
- CC License Chooser: https://creativecommons.org/choose/ (BETA: https://chooser-beta.creativecommons.org/)
- Registry of Research Data Repositories: https://www.re3data.org/
- FAIRsharing: https://fairsharing.org/
- Szablony: DMPonline: https://dmponline.dcc.ac.uk/ ; DMPTool: https://dmptool.org/
Materiały ze szkolenia online dla pracowników i doktorantów Politechniki Śląskiej:
Kontakt w celu uzyskania konsultacji przy tworzeniu planu zarządzania danymi
mgr Martyna Troszka
Biblioteka Politechniki Śląskiej // III piętro – pokój nr 317
44-100 Gliwice, ul. Kaszubska 23