Data archiveren in EUR Yoda Vault

Wat is data archiveren en waarom is het vereist?

Het archiveren van data is de langetermijnopslag van onderzoeksgegevens, materialen en documentatie. Na afloop van het project moeten alle projectgegevens (meestal) minimaal 10 jaar worden bewaard. Dit is in overeenstemming met het RDM-beleid bij de EUR om de wetenschappelijke integriteit te waarborgen en het wordt ook vaak geëist door onderzoeksfinanciers. Archivering geeft de onderzoekers daarnaast de mogelijkheid om meer structuur aan te brengen in het datalandschap van hun onderzoek.

Wat is EUR Yoda Vault?

EUR Yoda Vault is een gegevensopslag waar een kopie van jouw data, bijbehorende materialen en documenten worden opgeslagen wanneer je besluit deze te archiveren. Bij het archiveren wordt een 'snapshot' van de data in een kluis geplaatst die op een later tijdstip kan worden opgehaald.

Hoe archiveer ik mijn onderzoeksproject?

Stap 1: verzamel en organiseer jouw data

Maak eerst een datapakket met de dataset(s) en alle relevante projectdocumentatie. Het wordt aangeraden om zowel ruwe als verwerkte datasets, hun documentatie (ten minste een README-bestand) en ander gebruikt onderzoeksmateriaal, zoals codeboeken, instrumenten, analysescripts, notities, enz. op te nemen. De projectdocumentatie moet bijvoorbeeld overeenkomsten, contracten, ethische goedkeuring, ondertekende formulieren voor informed consent, subsidieovereenkomsten en servicevoorwaarden voor software bevatten. Deze infographic geeft een goed overzicht van de elementen die nodig zijn voor archivering.

Het is belangrijk dat je datapakket wordt georganiseerd met een logische mappenstructuur, een consistente bestandsnaamgeving en dat je duurzame bestandsformaten gebruikt. Tips over datadocumentatie en -organisatie kun je hier en hier vinden. Indien nodig kan je facultaire Research Data Steward daar ook over adviseren.

Stap 2: vul het intakeformulier in

Terwijl je werkt aan de voorbereiding, kun je al vragen om een projectmap in Yoda op te zetten. Hiervoor vul je het intakeformulier in om basisinformatie over jouw project te verstrekken. Als er aanvullende informatie nodig is, zal je facultaire Research Data Steward contact met je opnemen. Anders ontvang je binnen enkele werkdagen een e-mailnotificatie om toegang te krijgen tot de projectwerkruimte.

De projectmap is de hoofdmap van je project en de naam begint altijd met 'research-'. Het is belangrijk te onthouden dat het verzoek om een projectmap aan te maken projectgebonden is. Als je betrokken bent bij meerdere onderzoeksprojecten, moet elk daarvan een aparte projectmap hebben en moet dus een aparte aanvraag worden ingediend.

Stap 3: log in op de EUR Yoda Vault

Om toegang te krijgen tot de EUR Yoda Vault dien je met het e-mailadres van jouw instelling in te loggen via SURFconext in het Yoda portal. Na het inloggen zie je een welkomstpagina met de tabbladen 'Research' en 'Vault' in de navigatiebalk.

EUR Yoda portal

Stap 4: upload je data

Nadat je op " Research" hebt geklikt, zie je een map "research-[naam-van-je-project]", waarin je mappen en bestanden kunt uploaden en opslaan.

Bestanden en (grote) datasets kunnen gemakkelijk via een browser worden geüpload. Als je besluit te uploaden via een netwerkschijf, is er een limiet van 4 GB in Windows. Met een aparte WebDAV-client zoals CyberDuck of YodaDrive is er geen enkele limiet.

Stap 5: archiveer je data

Om je gegevens te archiveren, ga je naar 'Research' in de navigatiebalk, en dan naar de map die je wilt archiveren. Dit wordt je archiefpakket. Zorg ervoor dat je in de map bent die je wilt aanleveren aan de kluis (de ‘Vault’).

Let op: het is mogelijk om het hele project aan het eind te archiveren of om subdelen van het project te archiveren terwijl het nog loopt.

1) Verstrek metadata

Het toevoegen van informatie over je archiefpakket is nodig om het terug te vinden in de EUR Data Vault, het EUR ondersteunend personeel te informeren over de bewaartermijn en details te geven over de inhoud. Het invullen van metadata op projectniveau is een verplichte stap, wanneer je jouw archiefpakket in de EUR Yoda Vault wilt deponeren. Het is een ingebouwde functie, die je kunt vinden in de rechterbovenhoek onder de knop Metadata.

 

Yoda metadata button

2) Controle op conformiteit (optionele stap)

EUR Yoda Vault biedt je de mogelijkheid om de bestandstypen extra te controleren. Je kunt dit doen door onder Actions te kiezen voor Check for compliance with policy. Dit zorgt ervoor dat Yoda Vault alle bestanden doorloopt om de bestanden te markeren die kunnen worden aangepast om de FAIRness van jouw data te verbeteren.

3) Dien je archiefpakket ter beoordeling in

Op dit punt is je archiefpakket klaar voor een laatste beoordeling voordat het in de Yoda Vault van de EUR wordt gedeponeerd. De beoordeling omvat een toetsing aan het EUR-beleid en andere relevante regelgeving, maar ook of het voor anderen duidelijk is. Jouw Research Data Steward of de Data Curator van de EUR Bibliotheek voert een eerste controle uit. Als er aanpassingen nodig zijn, krijg je daarvan bericht. Zodra je archiefpakket is goedgekeurd, ontvang je een bevestigingsmail.

Yoda submit button

Stap 6: Notificaties

Yoda gebruikt een notificatiesysteem om je op de hoogte te brengen van de status van een datapakket dat is ingediend voor archivering naar de kluis. Als je ongelezen meldingen hebt, staat er een bel naast je e-mailadres rechtsboven.

Yoda notifications image 1

Klik op de knop en vervolgens op "Notifications" om ze te bekijken. Als je e-mailmeldingen wilt configureren, klik je op Instellingen in het menu hierboven.

Yoda notifications image 2

Hoeveel tijd en moeite kost het om je gegevens te archiveren?

De tijd en moeite die nodig zijn om gegevens te archiveren, hangen vooral af van jouw niveau van RDM-kennis en datavoorbereiding. Het meest tijdrovende deel van het proces kan het voorbereiden van het archiefpakket zelf zijn, als er geen goed datamanagement heeft plaatsgevonden gedurende het project. Onvoldoende documentatie kan leiden tot verzoeken om aanpassingen (voordat het archiefpakket in de EUR Yoda Vault wordt opgenomen), waardoor het hele proces wordt vertraagd. Informatie over het archiefbeleid en een checklist voor curatoren worden binnenkort gepubliceerd.

Wat zijn de verschillen tussen archivering en publicatie van gegevens?

Storing data in an archive Storing data in a repository

Hieronder staan enkele verschillen tussen het opslaan van gegevens in een archief versus een repository:

  1. In een archief worden gegevens en materialen opgeslagen voor controles en verificatie van de wetenschappelijke integriteit. In een repository worden data en onderzoeksmaterialen gedeponeerd voor verder hergebruik door mensen en machines
  2. Archiefpakketten bevatten gewoonlijk alle gegevens (ruwe en verwerkte) en projectdocumentatie (bv. ethische goedkeuring, ondertekende formulieren met geïnformeerde toestemming, subsidieovereenkomsten), terwijl herbruikbare pakketten verwerkte datasets (bv. datasets zonder persoonsgegevens) en aanvullend materiaal in verband met wetenschappelijke publicatie bevatten.
  3. Het archiefpakket wordt doorgaans 10 jaar bewaard en is niet toegankelijk (behalve voor leden van de onderzoeksgroep). Afhankelijk van een repository kan het herbruikbare pakket toegankelijk blijven gedurende de levensduur van de repository.
  4. Het archiefpakket kan niet worden gewijzigd. Daarentegen kun je je materiaal in een repository meestal wel bijwerken.

Bij wie kan ik terecht voor ondersteuning?

Als je vragen hebt over het proces of hoe je je gegevens kunt voorbereiden op archivering, neem dan contact op met je facultaire Research Data Steward.

Deze pagina is voor het laatst bijgewerkt in juli 2023. Heb je niet-werkende links of (schijnbaar) onjuiste informatie gevonden? Stuur dan een e-mail met de titel 'Website content' naar datasteward@eur.nl.

Vergelijk @count opleiding

  • @title

    • Tijdsduur: @duration
Vergelijk opleidingen