Data gestuurd.

De afgelopen jaren hebben digitale technologieën de economie en de samenleving getransformeerd, waardoor alle activiteitensectoren en het dagelijks leven van ons allemaal beïnvloed. Data staan centraal in deze transformatie en er zal nog meer volgen. Datagestuurde innovatie zal enorme voordelen opleveren, bijvoorbeeld door verbeterde gepersonaliseerde geneeskunde en nieuwe mobiliteit. In een samenleving waarin individuen steeds grotere hoeveelheden gegevens zullen genereren, moet de manier waarop de gegevens worden verzameld en gebruikt de belangen van het individu voorop stellen, in overeenstemming met onze waarden, fundamentele rechten en regels.

We zullen datagestuurde innovaties alleen vertrouwen en omarmen als we er zeker van zijn dat het delen van persoonlijke gegevens onderworpen zal zijn aan volledige naleving van de strikte regels voor gegevensbescherming. Tegelijkertijd zal het toenemende volume aan niet-persoonlijke industriële data en publieke data, gecombineerd met technologische veranderingen in de manier waarop de data worden opgeslagen en verwerkt, een potentiële bron van groei en innovatie vormen die moet worden aangeboord.

Daarbij moeten we de mogelijkheid krijgen om betere beslissingen te nemen op basis van inzichten uit niet-persoonlijke gegevens. En die data moeten voor iedereen beschikbaar zijn: publiek of privaat, groot of klein, start-up of reus. Dit zal de samenleving helpen het maximale uit innovatie en concurrentie te halen en ervoor te zorgen dat iedereen profiteert van een digitaal dividend. Dit digitale tijdperk moet het beste van onze samenleving weerspiegelen: open, eerlijk, divers, democratisch en zelfverzekerd.

En kan een toonaangevend rolmodel worden voor een samenleving die door data in staat wordt gesteld betere beslissingen te nemen – in het bedrijfsleven en de publieke sector. Om deze ambitie waar te maken moeten we kunnen voortbouwen op een sterk juridisch kader – op het gebied van gegevensbescherming, grondrechten, veiligheid en cyberbeveiliging – en op een interne markt met concurrerende bedrijven van elke omvang en met een gevarieerde industriële basis. Als we een leidende rol in de data-economie wil verwerven, moet we nu actie ondernemen en op een gecoördineerde manier problemen aanpakken die variëren van connectiviteit tot de verwerking en opslag van gegevens, rekenkracht en cyberbeveiliging. Bovendien zal het land zijn bestuursstructuren voor de omgang met gegevens moeten verbeteren en de verzamelingen kwaliteitsgegevens die beschikbaar zijn voor gebruik en hergebruik moeten vergroten.

Uiteindelijk willen we de voordelen benutten van een beter gebruik van data, waaronder een grotere productiviteit en concurrerende markten, maar ook verbeteringen op het gebied van de gezondheid en het welzijn, het milieu, transparant bestuur en handige openbare diensten. Een alomvattende aanpak van de data-economie die tot doel heeft het gebruik van en de vraag naar data en data-ondersteunde producten en diensten in de hele eengemaakte markt te vergroten.

Een strategie voor beleidsmaatregelen en investeringen om de data-economie voor de komende vijf jaar mogelijk te maken. Deze datastrategie en een Witboek over kunstmatige intelligentie, waarin wordt aangegeven hoe we de ontwikkeling en toepassing van kunstmatige intelligentie willen ondersteunen en bevorderen.

De hoeveelheid data die in de wereld wordt geproduceerd groeit snel, van 33 zettabytes in 2018 naar een verwachte 175 zettabytes in 2025 1 . Elke nieuwe golf van gegevens biedt grote kansen. Bovendien zal de manier waarop gegevens worden opgeslagen en verwerkt de komende vijf jaar dramatisch veranderen. Tegenwoordig vindt 80% van de verwerking en analyse van gegevens plaats in datacentra en gecentraliseerde computerfaciliteiten, en 20% in slim verbonden objecten, zoals auto’s, huishoudelijke apparaten of productierobots, en in computerfaciliteiten dicht bij de gebruiker (‘edge computing’). ‘). Tegen 2025 zullen deze verhoudingen waarschijnlijk omgekeerd zijn 2 . Naast de economische en duurzaamheidsvoordelen die deze ontwikkeling met zich meebrengt, opent het extra mogelijkheden voor bedrijven om tools te ontwikkelen waarmee dataproducenten de controle over hun eigen data kunnen vergroten.

Data soevereiniteit

De strategie voor data is erop gericht de mens op de eerste plaats te zetten bij de ontwikkeling van technologie, en de Europese waarden en rechten in de digitale wereld te verdedigen en te bevorderen.

Data zijn een essentiële hulpbron voor economische groei, concurrentievermogen, innovatie, banencreatie en maatschappelijke vooruitgang in het algemeen. In de toekomst zal de ontwikkeling van datagestuurde toepassingen zowel burgers als bedrijven verschillende voordelen opleveren:

de gezondheidszorg verbeteren

veiligere en schonere transportsystemen te creëren

nieuwe producten en diensten genereren

de kosten van openbare diensten verlagen

verbetering van de duurzaamheid en energie-efficiëntie

De Europese strategie voor data is gericht op het creëren van een interne markt voor data die het mondiale concurrentievermogen en de datasoevereiniteit van Europa zal waarborgen. Dit zal leiden tot de creatie van gemeenschappelijke Europese dataruimten. Ze zullen ervoor zorgen dat er meer data beschikbaar komen voor gebruik in de economie en de samenleving, terwijl de bedrijven en individuen die de data genereren de controle behouden.

Om het leiderschap van de EU in de mondiale data-economie verder te verzekeren, wil de Europese datastrategie:

wetgevingsmaatregelen goed te keuren op het gebied van databeheer, toegang en hergebruik. Bijvoorbeeld voor het delen van gegevens tussen bedrijven en overheden voor het algemeen belang;

gegevens breder beschikbaar maken door hoogwaardige openbare datasets in de hele EU open te stellen en gratis hergebruik ervan mogelijk te maken;

€ 2 miljard investeren in een Europees project met hoge impact om infrastructuren voor gegevensverwerking, instrumenten voor het delen van gegevens, architecturen en bestuursmechanismen te ontwikkelen voor een bloeiende gegevensuitwisseling en om energie-efficiënte en betrouwbare cloudinfrastructuren en aanverwante diensten te bundelen;

toegang tot veilige, eerlijke en concurrerende clouddiensten mogelijk maken door het opzetten van een aanbestedingsmarktplaats voor gegevensverwerkingsdiensten te vergemakkelijken en duidelijkheid te scheppen over het toepasselijke regelgevingskader voor cloudregels.

De Europese Commissie heeft een rapport gepubliceerd over het delen van data tussen bedrijven en overheden (B2G). Het rapport is afkomstig van een deskundigengroep op hoog niveau en presenteert een reeks beleids-, juridische en financieringsaanbevelingen gericht op het faciliteren van de schaalvergroting, verantwoorde en duurzame implementatie van het delen van B2G-gegevens in het publieke belang binnen de EU.

Er zijn twee cruciale stukken wetgeving ingevoerd om de rechten en belangen van burgers te beschermen en tegelijkertijd de industriële en technologische ontwikkeling te bevorderen. Ze spelen een cruciale rol bij het leggen van de basis voor het bereiken van de doelstellingen die zijn uiteengezet in de Europese datastrategie:

De Data Governance Act (DGA) is een alomvattend instrument dat is ontworpen om toezicht te houden op het hergebruik van openbare of beschermde gegevens in verschillende sectoren. Het heeft tot doel het delen van gegevens te vergemakkelijken door nieuwe entiteiten, bekend als data-tussenpersonen, te reguleren en het delen van gegevens om altruïstische redenen te bevorderen. De DGA heeft betrekking op zowel persoonsgegevens als niet-persoonlijke gegevens, waarbij de Algemene Verordening Gegevensbescherming (AVG) van toepassing is wanneer het om persoonsgegevens gaat. Het opnemen van ingebouwde waarborgen, naast de AVG, is bedoeld om het vertrouwen in het delen en hergebruiken van gegevens te vergroten. Dit opbouwen van vertrouwen is cruciaal voor het vergroten van de beschikbaarheid van data op de markt.

Op 11 januari 2024 is de Datawet in werking getreden. Het is een pijler van de Europese datastrategie. Het belangrijkste doel is om van Europa een leider in de data-economie te maken door het potentieel van de steeds groter wordende hoeveelheid industriële data te benutten, ten behoeve van de Europese economie en samenleving.

Datawet

De nieuwe regels definiëren de rechten op toegang tot en gebruik van gegevens die in de EU zijn gegenereerd in alle economische sectoren en zullen het gemakkelijker maken om gegevens te delen, met name industriële gegevens.

De Europese Datawet treedt in werking en introduceert nieuwe regels voor een eerlijke en innovatieve data-economie

De Datawet zal zorgen voor eerlijkheid in de digitale omgeving door te verduidelijken wie waarde kan creëren uit data en onder welke voorwaarden. Het zal ook een concurrerende en innovatieve datamarkt stimuleren door industriële data te ontsluiten en door juridische duidelijkheid te bieden over het gebruik van data.

Er is nu een belangrijke mijlpaal in ons digitale transformatietraject. Door middel van goed gedefinieerde wetgeving op het gebied van data geven we de gebruiker de controle over het delen van data die door zijn verbonden apparaten worden gegenereerd, terwijl we tegelijkertijd de bescherming van bedrijfsgeheimen en het Europese fundamentele recht op privacy waarborgen.

De inwerkingtreding van de Datawet is een belangrijke mijlpaal om de digitale ruimte vorm te geven. Het zal een bloeiende Europese data-economie bevorderen die innovatief en open is – onder onze voorwaarden. Europese burgers en bedrijven zullen profiteren van de rijkdom aan industriële data die beschikbaar komt, waardoor nieuwe datagestuurde toepassingen ontstaan, met name op het gebied van kunstmatige intelligentie.

Maatregelen om de data-economie van de EU te stimuleren

De afgelopen jaren is er een snelle groei geweest van het aantal verbonden apparaten op de Europese markt. Het gebruik van verbonden objecten (ofwel het Internet of Things) genereert steeds grotere hoeveelheden data. Dit vertegenwoordigt een enorm potentieel voor innovatie en concurrentievermogen in de EU.

De nieuwe regels stellen gebruikers van verbonden producten in staat toegang te krijgen tot de gegevens die door deze apparaten worden gegenereerd, en deze gegevens met derden te delen. Zo zal de eigenaar van een connected car of de exploitant van een windturbine de fabrikant kunnen verzoeken bepaalde gegevens die gegenereerd worden door het gebruik van deze connected producten te delen met een reparatiedienst naar keuze van de eigenaar. Dit zal consumenten en andere gebruikers van verbonden producten meer controle geven en de aftermarketdiensten en innovatie stimuleren. De prikkels voor fabrikanten om te investeren in datagenererende producten en diensten zullen behouden blijven, en hun bedrijfsgeheimen zullen beschermd blijven.

Publieke lichamen zullen toegang kunnen krijgen tot gegevens die in het bezit zijn van de particuliere sector en deze kunnen gebruiken om te helpen reageren op publieke noodsituaties zoals overstromingen en bosbranden, of bij het uitvoeren van een wettelijk mandaat waarbij de vereiste gegevens niet direct op andere manieren beschikbaar zijn.

De Datawet beschermt Europese bedrijven ook tegen oneerlijke contractuele voorwaarden in contracten voor het delen van gegevens die de ene overeenkomstsluitende partij eenzijdig aan de andere partij oplegt. Dit zal met name het midden- en kleinbedrijf (MKB) in staat stellen actiever deel te nemen aan de datamarkt.

Bovendien zorgt de Datawet ervoor dat klanten naadloos (en uiteindelijk kosteloos) kunnen overstappen tussen verschillende cloudaanbieders. Deze maatregelen zullen de concurrentie en de keuze op de markt bevorderen en tegelijkertijd de lock-in van leveranciers voorkomen. Elke Europese onderneming zou bijvoorbeeld datadiensten van verschillende cloudproviders kunnen combineren (“multi-cloud”) en kunnen profiteren van de enorme kansen op de EU-cloudmarkt. Het zal ook de kosten voor bedrijven en overheden drastisch verlagen als ze hun gegevens en applicaties naar een andere cloudprovider verhuizen.

De Datawet omvat ook waarborgen tegen onwettige verzoeken van autoriteiten van derde landen om niet-persoonlijke gegevens die in de EU worden bewaard, over te dragen of er toegang toe te krijgen, waardoor een betrouwbaardere en veiligere gegevensverwerkingsomgeving wordt gewaarborgd.

Ten slotte introduceert de Data Act maatregelen om de ontwikkeling van interoperabiliteitsnormen voor het delen van gegevens en voor gegevensverwerkingsdiensten te bevorderen, in lijn met de standaardisatiestrategie van de EU.

Bedrijf starten

Een essentieel onderdeel van het starten van uw bedrijf is het hebben van een duidelijk gedefinieerd bedrijfsplan.

Het starten van een bedrijf brengt altijd een zekere mate van risico met zich mee. Het is echter geen verstandige zet om tijd, geld en moeite in een nieuw bedrijf te steken zonder zorgvuldige overweging.

Hoewel het hebben van een bedrijfsplan een geweldige eerste stap is, is het essentieel dat dat plan nauwkeurig is en gericht is op het verminderen van risico’s. Eén effectieve strategie om dit doel te bereiken is het integreren en benutten van data.

Het opstellen van een bedrijfsstrategie heeft onmiskenbare waarde en brengt duidelijke voordelen met zich mee.

In het huidige bedrijfslandschap is data een van de, zo niet de krachtigste, katalysatoren voor weloverwogen besluitvorming, strategische planning en voor het floreren in een zeer competitieve (en vaak verzadigde) markt.

Vooral in de handel vormt data de ruggengraat van elk goed geïnformeerd bedrijfsplan vanwege het intrinsieke vermogen om kritische inzichten te bieden die betere besluitvorming stimuleren.

Gegevens spelen een fundamentele rol bij het begrijpen van de meeste facetten van een nieuw bedrijf, waardoor een eenvoudiger en nauwkeuriger bedrijfsplan ontstaat.

Ten eerste zijn datagestuurde inzichten van groot belang bij het identificeren en begrijpen van voorkeuren en -gedrag.

Deze informatie vormt de basis voor een gerichte strategie, waarbij producten of diensten efficiënt worden afgestemd op de vraag.

Door deze gegevens te integreren, worden de risico’s beperkt door initiatieven te vermijden die mogelijk geen weerklank vinden.

Het bevordert ook het aanpassingsvermogen door je toe te rusten om snel te reageren op zich ontwikkelende markttrends. Zo wordt een bedrijf opgebouwd dat de tand des tijds en trends doorstaat en de nodige flexibiliteit biedt om effectief door veranderingen te kunnen navigeren.

Deze aanpak zorgt voor de juiste speelruimte, waardoor aanpassingen mogelijk zijn om in lijn te komen met verschuivingen en tegelijkertijd de stabiliteit en duurzaamheid op de lange termijn te behouden.

Een groot deel van uw bedrijfsplan bestaat uit het om ons heen kijken, en niet alleen naar wat we zelf willen. Door middel van data worden concurrentieanalyses en trendvoorspellingen – twee essentiële componenten van een alomvattend bedrijfsplan – eenvoudig gemaakt.

Door de strategieën van de grote databedrijven te volgen, kunnen we potentiële marktlacunes, opkomende kansen en gebieden voor innovatie identificeren.

Deze proactieve aanpak, ondersteund door op data gebaseerde inzichten, stelt ons in staat voorop te blijven in een snel evoluerende markt en vormt een solide strategische basis voor een bedrijfsplan.

Natuurlijk zijn er nog duizend redenen waarom data de sleutel is tot een succesvol bedrijfsplan en gedurende de hele levensduur van het bedrijf.

Er is een overvloed aan gegevens beschikbaar die we kunnen gebruiken bij het plannen van een bedrijf.

Sentiment: Dit gegevenstype omvat het beoordelen van de houding, meningen en emoties die worden geuit via kanalen zoals sociale media en recensies. Het biedt waardevolle inzichten in markttrends en klanttevredenheidsniveaus. Door sentimentgegevens te integreren, kunnen we ons aanbod en marketingstrategieën afstemmen op de voorkeuren van klanten en de marktvraag.

Populariteit: Het gebruik van populariteit als proxy voor bezoekersaantallen biedt inzicht in het gedrag en de voorkeuren. Het helpt bij het optimaliseren van de locatieselectie, het identificeren van piekbezoektijden en het begeleiden van gerichte marketinginitiatieven.

Point of Interest (POI)-gegevens: POI-gegevens maken een uitgebreide analyse van elke locatie op een kaart mogelijk, rekening houdend met zowel kwantitatieve als kwalitatieve perspectieven. Waardevolle inzichten zijn onder meer het beoordelen van het waarderingsniveau voor elke POI. Het benutten van POI-gegevens helpt bij locatieselectie, concurrentieanalyse en het begrijpen van marktsegmenten op basis van specifieke locaties.

Het verweven van sentimentanalyses, populariteitsgegevens en POI-gegevens in een bedrijfsplan zal de diepgang, nauwkeurigheid en strategische besluitvorming vergroten, waardoor afstemming op marktsentimenten, trends en potentieel gedrag wordt verzekerd.

Kunstmatig?

Wat zijn de verschillen tussen generatieve kunstmatige intelligentie en grote taal-modellen? Hoe zijn deze twee spraakmakende technologieën met elkaar verbonden?

Om het concept te helpen uitleggen, vraag ik ChatGPT om me een aantal analogieën te geven waarin generatieve kunstmatige intelligentie werd vergeleken met grote taal-modellen (LLM’s), en als vervanging voor generatieve kunstmatige intelligentie probeerde ChatGPT op zichzelf te reflecteren. Er werd bijvoorbeeld gesuggereerd: “Generatieve kunstmatige intelligentie is de babbelkous op de cocktailparty die het gesprek op gang houdt met anekdotes, terwijl taal-modellen te vergelijken zijn met nauwgezette bibliothecarissen die elk woord catalogiseren dat ooit op is gesproken.” Ik bedoel, wie klinkt leuker? Nou, de grap is dat, ChatGPT, zonder taal-modellen niet zou bestaan.

Tekstgenererende kunstmatige intelligentie-tools zoals ChatGPT en taal-modellen zijn onlosmakelijk met elkaar verbonden. Taal-modellen zijn de afgelopen jaren exponentieel in omvang gegroeid en voeden generatieve kunstmatige intelligentie door de gegevens te leveren die taal-modellen nodig hebben. In feite zouden we niets hebben zoals ChatGPT zonder gegevens en de modellen om deze te verwerken.

Er vallen drie belangrijke dingen op als je generatieve kunstmatige intelligentie en taal-modellen met elkaar vergelijkt.

Niet alle generatieve kunstmatige intelligentie-tools zijn gebouwd op taal-modellen, maar alle taal-modellen zijn een vorm van generatieve kunstmatige intelligentie.

Generatieve kunstmatige intelligentie is een brede categorie voor een type kunstmatige intelligentie, verwijzend naar elke kunstmatige intelligentie die originele inhoud kan creëren. Generatieve kunstmatige intelligentie-tools zijn gebouwd op onderliggende kunstmatige intelligentie-modellen, zoals een groot taalmodel (LLM). Taal-modellen zijn het tekstgenererende deel van generatieve kunstmatige intelligentie.

Taal-modellen kunnen alleen tekstuitvoer maken, en voorheen konden ze ook alleen tekstinvoer accepteren. Toen OpenAI ChatGPT in 2022 voor het eerst werd uitbracht, was het gebouwd op een taal-model met alleen tekst, GPT-3. Maar nu, met de ontwikkeling van ‘multimodale’ taal-modellen, kunnen deze taal-modellen audio, beeldmateriaal, enz. als input accepteren. De volgende iteratie van OpenAI, GPT-4, is een voorbeeld van een multimodale taal-modellen.

Zowel generatieve kunstmatige intelligentie als taal-modellen zullen een revolutie teweegbrengen, maar ze zullen dit op verschillende manieren doen. Generatieve kunstmatige intelligentie kan de manier veranderen waarop we 3D-modellering uitvoeren, video-uitvoer genereren of stemassistenten en andere audio maken. Taal-modellen zullen zich meer richten op het creëren van op tekst gebaseerde inhoud, maar hebben nog steeds andere belangrijke toepassingen (en kunnen een rol spelen in bredere generatieve kunstmatige intelligentie-opties zoals stemassistenten).

Taal-modellen bestaan al sinds begin 2010, maar werden populairder toen krachtige generatieve kunstmatige intelligentie-tools zoals ChatGPT en Google’s Bard werden gelanceerd. Een van de redenen dat 2023 zo’n exponentiële groei kende, de uitbreiding van parameters in grote taal-modellen is, waarbij GPT-4 meer dan 175 miljard parameters heeft.

Samenvattend: wat is het verschil tussen taal-modellen en generatieve kunstmatige intelligentie? Generatieve kunstmatige intelligentie is een categorie die een groot aantal tools bevat die zijn gebouwd om informatie van taal-modellen en andere soorten kunstmatige intelligentie-modellen te gebruiken die machine learning gebruiken om nieuwe inhoud te genereren, terwijl een taal-modellen een soort kunstmatige intelligentie-model is dat machine learning gebruikt, gebouwd op miljarden parameters om tekst te begrijpen en aan te leveren.

Dus heeft ChatGPT gelijk wat betreft de babbelkous versus de bibliothecaris?

Om dit concept verder uit te werken, zullen we enkele voorbeelden bekijken die de wisselwerking tussen generatieve kunstmatige intelligentie en taal-modellen beschrijven.

Zo merken we dat we data en kunstmatige intelligentie als met elkaar verweven hebben beschreven. Dat komt omdat ze dat onlosmakelijk zijn. Dus als voor het operationeel maken van kunstmatige intelligentie beginnen we met privacy.

Een klant stelt een vraag over zijn probleem. In plaats van elk e-mail-, document- en chattranscriptie te doorzoeken om een antwoord te vinden, vragen we een groot taalmodel om een samenvatting te geven van de gegevens die verband houden met de vraag. Het taal-model biedt een tekstueel overzicht van de belangrijkste informatie, punten uit de casus en voorgestelde volgende stappen. In dit scenario had de klant ook technische problemen bij het uploaden van documenten. Daarom gebruiken we een door generatieve kunstmatige intelligentie-aangedreven tool voor het maken van video’s om hem een video-walkthrough van het proces te sturen.

Een marketeer wil via generatieve kunstmatige intelligentie een synthetische doelgroeppersona creëren. Ze stellen een taal-model voor met vragen als “Waar haalt mijn doelgroep hun nieuws?” of “Hoe wordt er graag met mijn doelgroep gecommuniceerd?” en gebruik de reacties om een verhaal over de doelgroep te maken. Als ze klaar zijn, nemen ze die informatie en vraag een generatieve kunstmatige intelligentie-tool om afbeeldingen te maken die die doelgroep vertegenwoordigen.

Een analist neemt een gegevensbestand en uploadt dit naar een taal-model. Ze vragen de tool om de gegevens te analyseren en trends te geven. De analist onderzoekt de trends en gebruikt zijn kennis van de context van de gegevens om alleen de trends te selecteren en te bewerken die zinvol zijn. Vervolgens gebruiken ze een generatieve kunstmatige intelligentie-tool om grafieken te maken die de trendgegevens weergeven.

Zoals je kunt zien is generatieve kunstmatige intelligentie een grote, brede categorie die meerdere modellen omvat. Taal-model is er één van die veel aandacht heeft gekregen (en LLM’s zijn zeker veelzijdig), maar ze zijn slechts één type generatieve kunstmatige intelligentie.