Gegevens documentatie

Invoering

Datadocumentatie is zowel een product als een proces. Als proces is het de actieve en continue registratie van relevante informatie over de verzamelde of verwerkte gegevens gedurende de onderzoekscyclus. Als product is datadocumentatie een overkoepelende term voor meerdere categorieën feiten en details over uw onderzoeksdata. Deze kunnen zijn:

  • Documentatie over data-objecten of datasets, bijvoorbeeld: de formaten van de data, de software die nodig is om ze te lezen, codeboeken en de betekenis van codes en/of variabelen.
  • Documentatie over het proces van gegevensverzameling, bijvoorbeeld: labjournaals, vragenlijsten, handleidingen, dagboek, etc.
  • Administratieve metadata: informatie die de oorsprong, het doel, de tijd, de geografische locatie, de maker, de toegang en de gebruiksvoorwaarden van datasets beschrijft. Deze informatie wordt gebruikt om gegevens in repository of archieven op te halen of te indexeren.

Voordelen

Gegevensdocumentatie brengt verschillende voordelen met zich mee. De belangrijkste zijn:

  • Helpt alle details over uw gegevens te onthouden.
  • Verhogen van de reproduceerbaarheid van uw onderzoek.
  • Helpen bij het produceren van hoogwaardige gegevens.
  • Uw medewerkers gemakkelijker maken om de gegevens te gebruiken tijdens samenwerkingsprojecten.
  • Het vergroten van de vindbaarheid en zichtbaarheid van uw data in repositories.
  • Dient als een sterk bewijs van wetenschappelijke integriteit.

Datadocumentatie of metadata?

Een term die vaak wordt gebruikt in verband met datadocumentatie is metadata, of 'data over data'. In de praktijk worden deze termen vaak door elkaar gebruikt. Wel is het nuttig onderscheid te maken tussen ongestructureerde en gestructureerde documentatie/metadata.

Ongestructureerde documentatie of metadata omvat alle informatie over de onderzoeksgegevens die onderzoekers willen verstrekken als context voor hun dataset en is leesbaar voor mensen. Dit kunnen algemene README-bestanden zijn met gedetailleerde informatie over het gehele onderzoeksproject, inclusief onderzoeksvragen en methodologie, maar ook gedetailleerde informatie over data-objecten, zoals interviews of veldwerknotities. 

Gestructureerde documentatie of metadata is een speciaal type metadata-object dat zowel in gewone taal als in .xml kan worden geschreven en een reeks informatievelden bevat die een bepaalde waarde aannemen (bijvoorbeeld temperatuur: 30 °C). Als zodanig zijn gestructureerde metadata computerleesbaar en worden ze gebruikt voor het indexeren of ophalen van datasets in repositories of archieven, net zoals metadata in een bibliotheekcatalogus u helpen de boeken die u nodig hebt uit de bibliotheekzoekmachine te halen. Gestructureerde metadata worden gecreëerd in overeenstemming met metadatastandaarden.

Deze pagina is voor het laatst bijgewerkt in januari 2023. Heb je niet-werkende links of (schijnbaar) onjuiste informatie gevonden? Stuur dan een e-mail met als titel 'Website content' naar datasteward@eur.nl.

Vergelijk @count opleiding

  • @title

    • Tijdsduur: @duration
Vergelijk opleidingen