Een data beschikbaarheidsstatement is een korte verklaring die beschrijft hoe, waar en onder welke voorwaarden de data beschikbaar, toegankelijk is. Alle datasets zouden een data beschikbaarheidsstatement moeten bevatten, zelfs als er nog geen data is gekoppeld, omdat dit een belangrijke stap is in het geven van erkenning aan datamakers en in het ondersteunen van de reproduceerbaarheid.
In publicaties voor bladen en kranten staat de data beschikbaarheidsstatement meestal aan het einde van een artikel, vóór het gedeelte ‘referenties’. De auteur(s) van het artikel schrijven de data beschikbaarheidsstatement en deze verklaring moet altijd opgenomen voordat er publicatie plaats vind.
De data beschikbaarheidsstatement geeft duidelijke informatie over waar de data toegankelijk is en of de toegang tot de data open is of op een of andere manier beperkt is. Het moet ook een digitale referentie of link bevatten naar waar de data online te vinden is.
Bij het verzamelen of produceren van nieuwe gegevens, moet je deze gegevens uploaden naar een geschikte online gegevensopslagplaats. Alle gegevens moeten samen worden opgeslagen als één dataset, idealiter in een domeinspecifieke opslagplaats. In je verklaring over de beschikbaarheid van gegevens noem je vervolgens de opslagplaats waar de gegevens zich bevinden. Als er sprake van hergebruik van gegevens is die door een derde partij zijn verzameld of geproduceerd, moet je informatie verstrekken over waar deze gegevens te vinden zijn.
Idealiter moet je een persistente identificatie (PID) opgeven die een langdurige digitale verwijzing is naar een document, bestand, webpagina of ander object online, en stabieler is dan een URL. Wanneer je een persistente identificatie opgeeft, zoals een DOI-nummer, is het voor iedereen veel gemakkelijker om de gegevens online te vinden. Meestal wordt er een unieke en persistente identificatie aan de dataset toegewezen zodra je de gegevens uploadt naar een datarepository en op de knop ‘publiceren’ klikt. Het is belangrijk om een persistente identificatie op te nemen in de verklaring over de beschikbaarheid van gegevens, omdat dit helpt de exacte dataset te vinden waarnaar wordt verwezen.
Het is belangrijk om een licentie toe te passen op de gegevens, omdat dit duidelijk maakt wat iemand anders met deze gegevens mag doen. Datarepositories vragen vaak om te kiezen uit een reeks Creative Commons-licentieopties. Als je bijvoorbeeld anderen in staat wilt stellen om de data te gebruiken, aan te passen of erop voort te bouwen, terwijl de juiste credits voor de gegevens worden weergegeven, bij Creative Commons Naamsvermelding (CC-BY)-licentie toepassen. Als je anderen in staat wilt stellen om de gegevens te gebruiken, maar niet wilt dat deze commercieel worden gebruikt, kunt je een Creative Commons Niet-commercieel (CC BY-NC)-licentie toepassen. Voor de volledige lijst met opties voor het licenseren van data, zie de Creative Commons licentie-opties.
Data is openbaar beschikbaar in een repository die geen DOI’s uitgeeft. Gegevens zijn meestal afkomstig van bronnen in het publieke domein.