Differentiële privacy

Leer machines leren en AI-technieken toe te passen op gegevens en ontdek hoe ethische kaders u kunnen helpen voorkomen dat u uw machines slechte gewoonten aanleert

Er zijn veel toepassingen waarin machine learning de samenleving ten goede zou kunnen komen als de privacy van gegevens kon worden gegarandeerd. 

Er is een enorm potentieel voor het verbeteren van of het vinden van patronen, bijvoorbeeld als we machine learning-systemen zouden kunnen trainen om patronen te herkennen in grote databases met gegevens.

Iets wat tegenwoordig in wezen onmogelijk is omdat methoden voor gegevensprivacy nog niet schaalbaar zijn.

Met behulp van Differentiële privacy kan een kleine samenvatting van een enorme database met gevoelige records worden gemaakt.

Deze samenvattingen zijn veilig en kunnen openbaar beschikbaar worden gemaakt voor algoritmen die het gebruiken als een van de basisbouwstenen van machine learning, en voor machine learning-programma’s die algemene taken uitvoeren zoals classificatie, rangschikking en regressieanalyse. Het zou ons in staat stellen om zo de vruchten te plukken van grootschalige, gedistribueerde machine learning als een rigoureuze vorm van gegevensprivacy, differentiële privacy genaamd, te handhaven.

Differentiële privacy, die door meer dan één technologiegigant wordt gebruikt, is gebaseerd op het idee om willekeurige ruis toe te voegen om individuele informatie te verduisteren.

Er zijn tegenwoordig elegante en krachtige technieken om te voldoen aan de verschillende privacynormen, maar geen een daarvan is schaalbaar.

De computationele overhead en de geheugenvereisten groeien exponentieel naarmate gegevens meer dimensionaal worden.

Gegevens worden steeds hoger-dimensionaal, wat betekent dat ze zowel veel waarnemingen als veel individuele kenmerken van elke waarneming bevatten.

De samenvattingen die via Differentiële privacy zijn gemaakt, zijn klein en de reken- en geheugenvereisten om ze te maken, zijn ook gemakkelijk te spreiden.

Bedrijven moeten tegenwoordig kiezen ofwel hun budget of de privacy van hun gebruikers opofferen als ze grote hoeveelheden data willen gebruiken, verandert de welwillendheid rond het vrijgeven van hoogdimensionale informatie met differentiële privacy.

Dan is het eenvoudig, snel en 100 keer goedkoper om te gebruiken dan bestaande methoden.

Dit is de nieuwste innovatie, en de talloze algoritmische strategieën hebben het in zich om verder te ontwikkelen, om zo machine learning en datawetenschap sneller en schaalbaarder te maken.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.