Het concept van een gegevensdelen kan verwarrend zijn omdat het meerdere doeleinden kan dienen. Het kan een platform zijn voor het vinden van datasets via een directory of catalogus, of een platform voor het delen van data-assets, of zelfs een bestemming voor het publiceren van data of dataproducten.
We slaan enorme hoeveelheden gegevens op: gemiddeld enkele petabytes, of het equivalent van ongeveer 500+ miljard pagina’s of meer aan tekst. Dit maakt data tot het meest omvangrijke en waardevolle bezit.
Gezien de toegenomen focus en het belang van data is het effectief verwerven van data van cruciaal belang om ervoor te zorgen dat deze niet alleen op de juiste manier worden ingezet, maar ook worden gedemocratiseerd om de inherente waarde van data te maximaliseren.
Het belang van gegevensdelen kunnen in twee reden worden verdeeld. Eén daarvan is de manier waarop er samengewerkt wordt met het grotere data-ecosysteem als een systeem dat rijke metagegevens verzamelt, die worden beheerd, de data vindbaar en toegankelijker maakt.
De tweede reden is de interactie die we gebruiken, omdat het data democratiseert voor research en hergebruik.
Een data-uitwisseling gaat ook hand in hand met het vermogen om data te gelde te maken voor zowel interne als, in sommige gevallen, externe consumptie. Soms wordt er ook wel gesproken van een ‘datamarktplaats’ of een ‘datashare’. Het doel ervan is om een alomvattend beeld te geven van de data-sets die eigendom zijn van de organisatie, bedrijf of overheid.
Een alomvattend beeld dat betrekking heeft op de inhoud, die gegevens echt begrijpelijk maakt voor de betrokkenen. Aanvullende context naast onbewerkte schema-informatie en hostingsysteeminformatie zou het volgende moeten omvatten:
Context van de gegevens. Waar wordt het voor gebruikt?
Informatie over de eigenaar/beheerder waaraan we vragen kunnen stellen of diepere toegang kunnen aanvragen.
Transparantie is van cruciaal belang en er moet worden gezorgd voor vertrouwen voor de algehele kwaliteit van de gegevens.
Een deel van de gegevens is beheerst en wordt in hoge mate beheerd. Andere gegevens kunnen door de gebruiker aangeleverd en experimenteel zijn, maar dat doet niets af aan de potentiële waarde ervan.
Afstamming en connectiviteit helpen gebruikers te bepalen hoe de gegevens zijn samengesteld.
Toegangsmethoden om gebruikers inzicht te geven in de verschillende manieren waarop de gegevens toegankelijk zijn. Sommige gegevens zijn ongestructureerd, zoals onderzoeksrapporten, en vereisen mogelijk toegang tot een BI-platform. Andere gegevens zijn toegankelijk via een SQL-query of een API.
Een uitwisseling is een belangrijke maatregel die de volwassenheid weergeeft. Er zijn verschillende kerncomponenten die het ontsluiten van een data-uitwisseling mogelijk maken, waaronder:
1. Wendbaarheid
Zowel dataproducenten als consumenten passen zich aan aan veranderingen in de manier waarop zij met de data omgaan. Producenten denken er niet alleen over na om de data voor hun relevante branche te gebruiken, maar beginnen ook na te denken over hoe ze de data kunnen openstellen waarvoor ze niet de financiering hebben om waarde te ontginnen.
Consumenten kunnen daarentegen ontdekken wat er al in hun ecosysteem bestaat en dat kunnen ze gebruiken voordat ze op pad gaan om een op maat gemaakte dataset te bouwen.
2. Het stimuleren van datageletterdheid
Een van de belangrijkste doelstellingen is het mogelijk maken van datageletterdheid. Wat is de dataset, waar kan ik deze vinden en hoe kan ik deze gebruiken? Kan ik op basis van deze gegevens een profiel samenstellen? Dit zijn enkele van de vragen die door de Data deling kunnen worden beantwoord.
Als er bovendien expertise op het gebied van data-analyse bestaat, kan het toevoegen van nieuwe datasets of het delen van updates over bestaande datasets, gebruikers aan te moedigen om samen na te denken over problemen en oplossingen.
Data moeten een bezit zijn, die door het begrip bezit kan worden gedeeld. De hulpbron kan in silo’s bestaan, maar zodra we een dataproduct als een data-
set labelen, betekent dit dat dit wordt geproduceerd met deelbare attributen in gedachten.
Dit houdt ook in dat gegevens die op de uitwisseling worden gedeeld, het juiste beheer hebben, zoals rechten, beveiliging en gestandaardiseerde contracten. Elk data-item dat zichtbaar is via een contract omvat ingebouwde betrouwbaarheid, zoals operationele uptime.
Het hebben van een data-uitwisseling en het kunnen beschikbaar stellen vanaf een centrale locatie voorkomt duplicatie van datasets en bespaart kosten. Het ondersteunt ook het hebben van minder, betekenisvollere datasets en minder eigendom, waardoor het gemakkelijker wordt om de juiste eigenaren te vinden en wijzigingsverzoeken in te dienen. Het kan een gemakkelijke afstamming bieden en het gemakkelijker maken om gegevensafwijkingen te vinden en op de hoogte te stellen van afwijkingen.