Verwerking/strategie.

Databewerkingen en Datastrategie: zijn niet één en hetzelfde

In het competitieve datalandschap van vandaag correleert het hebben van een goede strategie met betere data intelligentie en data optimalisatie binnen een organisatie. Het doorbreken van het gebruik van data silo’s en het mogelijk maken van datademocratisering voor een betere flexibiliteit en schaalbaarheid. Maar de datastrategie als methodologie moet niet worden verward met databewerkingen, waarmee organisaties de waarde van de data die ze bezitten en de infrastructuur die deze ondersteunt, kunnen maximaliseren om de doelstelling voor het bereiken van volledig gerealiseerde data-empowerment te versnellen. Dat wil zeggen, de mogelijkheid om data te gebruiken om te transformeren en alles te kunnen veranderen.

Maar om de kansen die data ons bied volledig te begrijpen, moeten we eerst herkennen waar datastrategie en alle andere strategieën kritieke processen kunnen versterken, en begrijpen hoe de belangrijkste strategieën dienovereenkomstig passen in de adoptie van datastrategieën.

Datastrategie versus databewerkingen wat is het verschil?

Datastrategie is het samenvoegen van verschillende datastromen voor gegevensbeheer die is gericht op het verbeteren van de communicatie, integratie en automatisering van gegevensstromen voor gegevensbeheerders en consumenten binnen een organisatie. Het doel van datastrategie is om sneller waarde te genereren door voorspelbare toelevering en wijzigingsbeheer van gegevens, gegevensmodellen en gerelateerde objecten te creëren. Datastrategie gebruikt technologie om het ontwerp, de implementatie en het beheer van datastromen te automatiseren met de juiste beveiligingsnormen voorgeschreven in de wetgeving, en het gebruikt metadata om de bruikbaarheid en waarde van data in een dynamische omgeving te verbeteren.

Datastrategie, op zich bestaat al enkele jaren, en is nog steeds een evoluerend concept. Uit een recent onderzoek bleek dat een mix van handmatige en geautomatiseerde processen bij minder dan de helft van alle organisaties reeds de praktijk is, maar dat er ruimte is om meer automatisering in gegevensverwerking op. Daarbij was bijna elk organisatie dat deelnam aan het onderzoek het eens. Als dit goed wordt gedaan, kan datastrategie zorgen voor data-analyseteams die datastromen lokaliseren en de algehele samenwerking tussen organisatie onderdelen verbeteren. Dat is datastrategie in een notendop, maar dataverwerking is veel meer dan dat.

Wat gegevensverwerking anders doet, is rekening houden met de bredere kijk op de gegevens, die in een hybride infrastructuur aanwezig zijn. Met meer aandacht voor welke gegevens er zijn, waar de gegevens zich bevinden en de operationele behoeften van gegevens en prestaties om het potentieel te maximaliseren. Als de kennis over gegevensverwerking niet aanwezig is, kunnen echt innovatieve gegevensbewerkingen niet worden gerealiseerd. In wezen is het alleen mogelijk door de integratie van een volledig geoptimaliseerde datastrategie, met een degelijke gegevensverwerkingsplan, kan data-intelligentie kan worden bereikt.

Gegevensverwerking lijkt een cruciale pijler voor het realiseren van vertrouwen data gegenereerde beslissingen.

Samen met data wetgeving en gegevensbescherming spelen datastrategie en dataverwerking een essentiële rol bij het democratiseren van data die ons in staat te stellen de volledige mogelijkheden van data te realiseren; met als einddoel datavolwassenheid. Als we over data beschikken, zijn we beter in staat om data te benutten om operationele en strategische beslissingen te stimuleren, naleving van de regelgeving te monitoren en groei te stimuleren.

Naarmate het bewustzijn en acceptatie van datastrategieën steeds weer een stukje groter wordt, zal het interessant zijn om te zien welke strategieën het volgende middelpunt worden binnen onze samenleving. En hoe we de te volgen strategie kunnen uitleggen aan iedereen die er een onderdeel van is.

Data-analyse

Data-analyse is de verwerking van onbewerkte gegevens tot nieuwe en nuttige inzichten die bedrijven kunnen helpen transformeren, innovatie versnellen en toekomstige resultaten voorspellen.

Data-analyse kan ons helpen het verleden te begrijpen en de toekomst te vormen, zo dan niet te bepalen. Met andere woorden, een goede data-analyse kan het verschil zijn tussen succes en een gemiste kans.

Hoewel het concept van data-analyse al bestaat sinds de jaren veertig van de vorige eeuw, technologische ontwikkelingen hebben in de afgelopen decennia geleid tot een exponentiële toename van het genereren van gegevens, of het nu gaat om internet, of de snelle opkomst van slimme technologie binnen of buiten ons huis. Wat overblijft zijn virtuele bergen van gegevens die wachten om verwerkt te worden.

Hoe interpreteren we de vele vormen van data, en met behulp van welke methoden zoals datamining, databeheer en statistische analyse gaan we werken. Het rigoureuze extraheren en scrubben van gestructureerde, semi-gestructureerde en ongestructureerde gegevens. Om inzichten te ontdekken die klaar zijn om te delen, en bevindingen in de vorm van datavisualisatie, waardoor we de nieuwe informatie gemakkelijk kunnen verwerken.

Elke stap van het proces speelt een cruciale rol bij het creëren van betekenisvolle nieuwe richtingen en innovaties.

Hoewel de exacte methode van data-analyse verschilt van applicatie tot applicatie, vallen ze elk in een of meerdere categorieën: prescriptief, diagnostisch, beschrijvend, voorspellend en cyber.

Prescriptieve analyse: helpt bij het identificeren van de best mogelijke aanbeveling voor een scenario in realtime, net als een kortetermijnversie van voorspellende analyses.

Diagnostische analyse: bepaalt waarom iets is gebeurd, met behulp van technieken zoals datamining, drill-downs en correlaties om trends te identificeren en beslissende acties te ondernemen.

Beschrijvende analyse: net als diagnostische analyse, kamt historische gegevens uit om een ​​nieuw perspectief te vinden. Maar in plaats van te beantwoorden waarom iets is gebeurd, geeft beschrijvende analyse meer details over wat er is gebeurd, met behulp van tactieken zoals statistieken, clustering en segmentatie.

Voorspellende analyse: zoals de naam al aangeeft, voorspelt deze techniek toekomstige resultaten op basis van statistieken, modellering, datamining, machine learning en andere vormen van gegevens.

Cyberanalyse: een van de nieuwste vormen van analyse, deze methodologie combineert aspecten van cyberbeveiliging en datawetenschap om potentiële kwetsbaarheden en bestaande cyberbedreigingen te identificeren.

Wat er ook gebeurt, we gebruiken de methode die zal helpen de vraag die we proberen te beantwoorden, te ontrafelen, met behulp van een willekeurig aantal analytische tools en platforms die vandaag beschikbaar zijn.

Moderne data-analyse kan een gemist potentieel omzetten in krachtige inzichten. Door diepgaande data-analyse kunnen we de wereld om ons heen beter begrijpen, inclusief onze eigen interne werkomgeving. Gegevens zijn zelfs een van de belangrijkste redenen waarom we zinvolle, geïnformeerde acties kunnen ondernemen en innovatieve producten kunnen lanceren, vaak in een versneld tempo. Tegenwoordig is data-analyse altijd in beweging, waarbij op elk moment een verscheidenheid aan menselijke en technologische bronnen wordt gecombineerd.

Door gedrag van mensen in een willekeurig aantal bronnen in kaart te brengen, kunnen we potentiële en bestaande relaties van dichterbij bekijken, wat kan leiden tot meer gepersonaliseerde ervaringen in digitale en traditionele wereld. Deze ervaringen kunnen vrijwel van alles zijn, van gerichte e-mail- en sociale campagnes tot zorgvuldig vervaardigde winkeldisplays en bewegwijzering tot relevantere productaanbevelingen. Inzichten kunnen zelfs leiden tot nieuwe producten en diensten.

Het is echter belangrijk om te onthouden dat niet alle gegevens van mensen afkomstig zijn, het kan ook worden verzameld vanuit een willekeurig aantal andere bronnen. Het Internet of Things (IoT) en machine learning maken het mogelijk om petabytes aan onbewerkte gegevens te verzamelen van externe sensoren die overal ter wereld zijn geplaatst, van de rand van een thermische geiser tot een slimme thermostaat voor in huis.

Opendata

Open data zou gestructureerde, leesbare data moeten zijn die vrijelijk gedeeld, gebruikt en samengesteld kan worden zonder beperkingen of kosten.

Maar bezoek een Open Data Portal van de stad, gemeente of overheidsdienst om de beschikbare open data gratis te downloaden. En ondervind dat er aan veel open data voorwaarden worden gesteld die de bruikbaarheid inperken.

Instanties zullen proactief datasets op hun Open Data Portal blijven publiceren en het publiek kan soms ook suggesties doen over datasets die als open data kunnen worden vrijgegeven. Deze programma’s zullen doorlopend en binnen de bestaande middelen worden uitgevoerd.

Echter heeft deze manier van werken een nadeel zodra meer mensen gebruik maken stijgen de kosten voor het beschikbaar maken van data. Dit zorgt ervoor dat er beperkingen worden ingesteld om de kosten binnen de bestaande middelen te laten vallen.

Open data met een licentie die weinig beperkingen kent, zodat de data eenvoudig hergebruikt kunnen worden. Lijkt dus nu nog een utopie door de beperkte beschikbaarheid ingegeven door de kosten die worden gemaakt om data beschikbaar te stellen.

Datasets die als open data worden vrijgegeven, worden geleverd zoals ze zijn verzameld, tenzij privacy-, contractuele, beveiligings-, privilege- of andere beperkingen de vrijgave van alle of delen van de data in de dataset beperken.

De afgelopen jaren hebben ontwikkelaars die open data van stad, gemeente of overheidsdienst gebruikt om gratis web- of mobiele applicaties te ontwikkelen, zoals verkeersveiligheid-apps, meldingen over bouwvergunningen in de buurt, parkeer-apps, inspectie-apps, monitoren van waterkwaliteit, plattegronden, enz.

Voorstanders en organisaties zoals het Global Open Data initiatief willen dat gegevens van overheden openbaar toegankelijk zijn, aangezien publiek geld werd gebruikt om deze gegevens te verzamelen. De open data-beweging wint wereldwijd aan terrein en open data  door steeds meer door steden, gemeenten of overheidsdiensten geadopteerd.

Burgers, organisaties en bedrijven willen dat steden, gemeenten of overheidsdiensten die over open data beschikken deze beschikbaar stellen omdat zij kunnen profiteren van de informatie en er waarde aan kunnen toevoegen.

Daarbij kan Open Data de transparantie en verantwoordingsplicht verbeteren;

Vertrouwen opbouwen tussen de steden, gemeenten of overheidsdiensten en de burgerij;

De betrokkenheid van burgers bevorderen en hen in staat te stellen beter geïnformeerde input te leveren aan de steden, gemeenten of overheidsdiensten;

De effectiviteit en efficiëntie van de steden, gemeenten of overheidsdiensten verbeteren;

Het verbeteren van de communicatie en het delen van gegevens met andere steden, gemeenten of overheidsdiensten gelijke toegang bieden;

De waarde van data vergroten door er waarde aan toe te laten voegen; en

bijdragen aan innovatie en economische groei.

Open data transformeert steden, gemeenten of overheidsdiensten van dienstverleners naar organisaties die groei stimuleren en inspireren. Open data wordt daarmee een waardevolle hulpbron van deze eeuw.

Ook al zullen Privacy, beveiliging en juridische implicaties altijd een overweging blijven. Het vrijgeven van datasets moet voldoen aan de vereisten van de Wetgeving op het gebied van de privacy en alle andere toepasselijke wetgeving. Datasets die persoonlijk identificeerbare informatie bevatten of onderworpen zijn aan enige privacy-, veiligheids-, wettelijke of andere beperkingen kunnen niet worden vrijgegeven als open data.

De steden, gemeenten of overheidsdiensten kunnen ook contractuele of andere verplichtingen hebben, die beschikbaar stellen van de gegevens kunnen beperken die op het Open Data Portal kunnen worden gepubliceerd. Wanneer een dataset niet kan worden vrijgegeven als zodanig vanwege beperkingen, zullen de steden, gemeenten of overheidsdiensten moeten evalueren of een aangepaste versie van de dataset kan worden vrijgegeven die aan alle vereisten zou kunnen voldoen.

“Open Data als standaard ” is het eerste principe van het G8 Open Data Handvest, die reeds in 2013 werd aangenomen.

Diversiteit

Gelijkheid bij het verzamelen van gegevens verbetert de nauwkeurigheid van onderzoek, beleidsevaluatie en daaropvolgende beleidsvorming

Onze economieën en samenlevingen staan ​​bol van raciale en etnische ongelijkheden, van welvaarts- en inkomensverschillen tot ongelijkheden op het gebied van gezondheid en welzijn, onderwijs en werkgelegenheid.

Deze verschillen zijn alleen maar groter geworden tijdens de recessie en te midden van de aanhoudende pandemie. Met obstakels om de diversiteit van de economieën zo goed mogelijk weer te geven. Deze uitdagingen beperken niet alleen de reikwijdte van datagestuurd onderzoek, maar verdoezelen ook de bevindingen ervan.

Om de kwaliteit en bruikbaarheid van het verzamelen en analyseren van gegevens te vergroten. Moeten we beter gaat inspelen op de diversiteit en zorgen dat we alle onderdelen van de samenleving gelijk behandelen.

Tevens moeten we oversampling voorkomen, een methode waarbij bepaalde groepen met hogere frequentie worden onderzocht. Oversampling kan de homogeniteit van gegevens verstoren. Hierdoor is de nauwkeurigheid en generaliseerbaarheid van de resultaten niet met zekerheid vast te stellen.

Geaggregeerde datapunten en statistieken, zoals het bruto binnenlands product of het werkloosheidscijfer, zijn een ontoereikende weergave van de huidige economische situatie. Omdat we daarbij alles op één hoop gooien en een gemiddelde berekenen. In werkelijkheid doen verschillende groepen en subgroepen het anders in de economie en in de samenleving, waardoor gemiddelden onnauwkeurige weergaven zijn van de ervaringen van de meeste mensen.

Om goed te kunnen meten hoe alle mensen het doen op de arbeidsmarkt, of hoe het beleid hun leven beïnvloedt, is het daarom essentieel om gegevens uit te splitsen.

Wanneer we brede categorieën gebruiken om de resultaten te analyseren, krijgen we in wezen alleen het gemiddelde en verliezen we veel nuance die ongelooflijk waardevol zijn bij onderzoek en bevindingen.

Het is geen geheim dat dingen als beroep en vakgebied in het algemeen een diversiteitsprobleem heeft. We worden immers vaak geconfronteerd met ongelooflijk hoge drempels voor toegang tot gegevens, die beschikbaar zijn in bepaalde onderdelen van onze samenleving, beroepsklassen en overheden.

Dit diversiteitsprobleem gaat verder dan wie studeert of onderwijst aan de volgende generatie. Het is één van de vele valkuilen die we hebben in veel van de huidige datasets, waardoor veel toekomstige onderzoek en beleidsbeslissingen zouden kunnen worden beïnvloedt.

Uitgebreide gegevens kunnen hun licht werpen op de effecten van een universeel basisinkomen en op onder meer de arbeidsparticipatie of armoedecijfers, maar niemand praat er echt over of besteedt er aandacht aan.

Ondanks dat we ervan kunnen profiteren en leren lijken we diversiteit niet als speerpunt te zien bij het verzamelen van data. Waardoor we grote groepen uitsluiten en niet leren van hun langdurige ervaringen en het effect wat ze hebben in onze samenleving..

Waarschijnlijk zijn er nog veel meer dingen waarvan zowel academici als beleidsmakers zich niet realiseren dat ze ontbreken vanwege een gebrek aan diversiteit in datasets. Diversiteit lijkt een onontgonnen gegevensgebied met data die vaak alleen bekend is bij de gemeenschappen waarin ze wordt gegenereerd, wat betekent dat ze zonder onderzoek waarschijnlijk ongebruikt zullen blijven.

Dit diepgaande gebrek aan diversiteit in datasets beperkt niet alleen de reikwijdte van onderzoek en beleidsevaluatie, maar belemmert ook de effectiviteit en creativiteit van de beleidsvorming zelf, evenals het vermogen om effectieve economische en sociale programma’s op te zetten.

Beleidsmakers hebben tegenwoordig een unieke kans om levensveranderende en essentiële besluiten te nemen die ons in staat stellen om betere economische en sociale resultaten te behalen.

Maar om de impact volledig te begrijpen, hebben we uitgesplitste gegevens nodig die een licht te werpen op hoe verschillende mensen worden beïnvloed, we hebben daarvoor alle achtergronden nodig om deze gegevens te analyseren en te evalueren. Niet alleen toekomstig generaties zullen ervan profiteren, maar ook de huidige.