Gegevensbeheer is het proces van het opnemen, opslaan, organiseren en onderhouden van de gegevens die zijn aangemaakt en verzameld. Effectief gegevensbeheer is een cruciaal onderdeel van het inzetten van de IT-systemen die applicaties uitvoeren en analytische informatie leveren om de operationele besluitvorming en strategische planning door gebruikers te stimuleren.
Het gegevensbeheer omvat een combinatie van verschillende functies die er gezamenlijk op gericht zijn ervoor te zorgen dat de gegevens in systemen nauwkeurig, beschikbaar en toegankelijk zijn. Het meeste van het vereiste werk wordt gedaan door IT- en gegevensbeheerteams, maar gebruikers nemen doorgaans ook deel aan sommige delen van het proces om ervoor te zorgen dat de gegevens aan behoeften voldoen en om anderen aan boord te krijgen met het beleid dat het gebruik ervan regelt.
Gegevens worden steeds meer gezien als een middel dat kan worden gebruikt om beter geïnformeerde beslissingen te nemen, campagnes te verbeteren, de bedrijfsvoering te optimaliseren en kosten te verlagen, allemaal met als doel het verhogen van de omzet en winst. Maar een gebrek aan goed databeheer kan organisaties opzadelen met incompatibele datasilo’s, inconsistente datasets en datakwaliteitsproblemen die hun vermogen beperken om business intelligence (BI) en analysetoepassingen uit te voeren of, erger nog, leiden tot foutieve bevindingen.
Gegevensbeheer is ook belangrijker geworden nu we worden onderworpen aan een toenemend aantal nalevingsvereisten, waaronder wetten inzake gegevensprivacy en gegevensbescherming, zoals de AVG. Bovendien leggen we steeds grotere hoeveelheden gegevens en een grotere verscheidenheid aan gegevenstypen vast, beide kenmerken van de big data-systemen die velen hebben ingezet. Zonder goed gegevensbeheer kunnen dergelijke omgevingen log en moeilijk te navigeren worden.
De afzonderlijke disciplines die deel uitmaken van het algehele gegevensbeheerproces omvatten een reeks stappen, van gegevensverwerking en gegevensopslag tot het beheer van de manier waarop gegevens worden opgemaakt en gebruikt in operationele en analytische systemen. Het ontwikkelen van een data-architectuur is vaak de eerste stap, zeker in grote organisaties die veel data te beheren hebben. Een gegevensarchitectuur biedt een blauwdruk voor het beheren van gegevens en het implementeren van databases en andere gegevensplatforms, inclusief specifieke technologieën die geschikt zijn voor individuele toepassingen.
Databases zijn het meest gebruikte platform om gegevens op te slaan. Ze bevatten een verzameling gegevens die zo is georganiseerd dat ze toegankelijk, bijgewerkt en beheerd kunnen worden. Ze worden gebruikt in zowel transactieverwerkingssystemen die operationele gegevens creëren, zoals klantrecords en verkooporders, als datawarehouses, die geconsolideerde datasets van systemen opslaan voor BI en analyse.
Dat maakt databasebeheer tot een kernfunctie voor gegevensbeheer. Zodra databases zijn opgezet, moeten prestatiebewaking en afstemming worden uitgevoerd om aanvaardbare responstijden te handhaven op databasequery’s die gebruikers uitvoeren om informatie te krijgen uit de gegevens die erin zijn opgeslagen. Andere administratieve taken zijn databaseontwerp, configuratie, installatie en updates; dataveiligheid; back-up en herstel van databases; en toepassing van software-upgrades en beveiligingspatches.
Een enterprise datawarehouse bevat gegevens van systemen binnen een organisatie. Datamarts zijn een andere opslagoptie: het zijn kleinere versies van datawarehouses die subsets van de gegevens van een organisatie bevatten voor specifieke afdelingen of groepen gebruikers. Bij één implementatiebenadering wordt een bestaand datawarehouse gebruikt om verschillende datamarts te creëren; in een andere worden de datamarts eerst gebouwd en vervolgens gebruikt om een datawarehouse te vullen.
Datameren daarentegen slaan pools van big data op voor gebruik in voorspellende modellering, machine learning en andere geavanceerde analytische toepassingen. De gegevens kunnen worden verwerkt voor analyse wanneer ze worden opgenomen, maar een data lake bevat vaak onbewerkte gegevens die zijn opgeslagen zoals ze zijn. In dat geval doen datawetenschappers en andere analisten doorgaans hun eigen gegevensvoorbereidingswerk voor specifieke analytische toepassingen.
Er is ook een derde platformoptie ontstaan voor het opslaan en verwerken van analytische data: de data lakeho gebruiken. Zoals de naam al aangeeft, combineert het elementen van datalakes en datawarehouses, waarbij de flexibele dataopslag, schaalbaarheid en lagere kosten van een datalake worden gecombineerd met de querymogelijkheden en de meer rigoureuze databeheerstructuur van een datawarehouse.
Een goed uitgevoerde datamanagementstrategie kan organisaties op verschillende manieren ten goede komen:
Het kan helpen een potentiële concurrentievoordelen te behalen ten opzichte van hun rivalen, zowel door de operationele effectiviteit te verbeteren als door betere besluitvorming mogelijk te maken.
Organisaties met goed beheerde gegevens kunnen wendbaarder worden, waardoor het mogelijk wordt om markttrends te herkennen en sneller actie te ondernemen om te profiteren van nieuwe kansen.
Effectief gegevensbeheer kan bedrijven ook helpen datalekken, misstappen bij het verzamelen van gegevens en andere gegevensbeveiligings- en privacykwesties te voorkomen die de reputatie zouden kunnen schaden, onverwachte kosten met zich mee zouden kunnen brengen en een juridisch gevaar zouden kunnen brengen.
Uiteindelijk kan een solide benadering van gegevensbeheer zorgen voor betere prestaties door te helpen bij het verbeteren van strategieën en processen.