Een 4-delige blogserie over privacy.

Dataverzameltaks

Door H!GHGuY op maandag 24 augustus 2015 14:00 - Reacties (23)
CategorieŽn: Maatschappij, Privacy, Technologie, Views: 3.286

Daarpas was ik bij het nemen van een bad diep in gedachten verzonken (en gelukkig enkel in gedachten) over een Facebook/Google-taks. Hoe zou je deze mammoeten eerlijk kunnen belasten?

We weten immers allemaal dat ze naast reclameboodschappen vooral profiel-informatie als product hebben. Deze informatie is over het internet verzameld en zou je vanaf dan even goed kunnen vergelijken met zeewater. Het stroomt overal naar toe, hoogste bieder eerst en vooral niet meer in het land waar de data is verzameld. Eigenlijk is het gewoon kapitaal.

Bij het lezen van het artikel http://tweakers.net/nieuw...datacenter-in-belgie.html viel de puzzel in elkaar.

Het doel van de belasting

Belasten doe je namelijk niet omdat het kan. Je doet het om iets te bereiken. Brandstof belast je omdat het vervuilend is, roken omdat het ongezond is, werken omdat... Hmm, uitzondering op de regel zullen we maar aannemen voor iemand anders wel 10 redenen bedenkt :+)

Persoonlijke gegevens zou je dus moeten belasten om het ongebreideld verzamelen en stockeren ervan te ontmoedigen. Dus een taks op kwantiteit lijkt op z'n plaats: je belast elk bedrijf dat gegevens bijhoudt uit het land op de hoeveelheid gegevens die ze bijhouden.

Enkele zaken dienen natuurlijk vrijgesteld:
  • NAW gegevens in het geval er een betalend product/dienst geleverd wordt aan de consument (dus bvb bol.com/spotify-betalend betaalt deze niet, facebook of spotify-free wel)
  • verkoophistorieken voor een maximum opgelegde termijn (of gekozen door de klant)
  • gegevens die nodig zijn om producten of diensten te leveren en dit met dezelfde uiterlijke termijn als hierboven
  • een andere mooie uitzondering zou kunnen bestaan wanneer de data in het bezit van zijn eigenaar blijft, door het ofwel daar op te slaan of door het te encrypteren met een key die enkel de eigenaar heeft (en zelf kan delen met 3rde partijen).
Er zullen er nog wel zijn, maar je begrijpt het punt al wel...

Hoeveel betalen we dan?

Je zou 2 belastingscurves kunnen hanteren: data die door het bedrijf in kwestie te herleiden is tot individuen (of kleine groepen, <50p ?) en data die anoniem is.
Dus als google jouw naam+adres weet en daar een uitgebreid profiel bij heeft dan betalen ze de volle pot. Als jouw kapper om de hoek bijhoudt wat jouw snit de afgelopen maanden was zodat je bij een volgend bezoek de vraag krijgt of het "zoals gewoonlijk" mag, dan betalen ze niks.

Ik sprak over curves omdat belastingen typisch progressief zijn. Ook hier is dat geen slecht idee. Grote hoeveelheden data zijn exponentieel meer waard dan kleine hoeveelheden data. Je zou zelfs een forfait kunnen hanteren zodat de kleine MKB/KMO toch enigszins vrijgesteld wordt voor beperkte hoeveelheden...
Exacte getallen, daar moeten economen en politici zich maar over buigen. Dan moet je namelijk gaan schatten hoeveel de data waard is en hoeveel je ze wil belasten.

Vermogensbelasting of vermogenswinstbelasting?

De eeuwige vraag komt ook hier terug: moeten we belasten op het bezit van de data of op het verhandelen van de data? Als het gaat over kapitaal ben ik een andere mening toegedaan (kapitaal dat stilzit op je bankrekening brengt nauwelijks op, big data in je cloud wel), maar hier zou ik zeggen: beide.

Zowel het stockeren als het verhandelen van data dienen belast te worden. Maak verhandelen gratis en iedereen zal continue de nodige data naar elkaar streamen (lees: huren) in plaats van verkopen. Maak verhandelen te duur en iedereen begint te hamsteren en zelf te verzamelen - tot vervelens van de gebruiker toe.

Formaliteiten

De overheid moet natuurlijk de beschikking krijgen over voldoende informatie om de belastingen te innen. Bedrijven die data verzamelen dienen dit dus gewoon te melden. Voor binnenlandse bedrijven gaat dit tijdens de normale belastingafrekening, buitenlandse bedrijven dienen 1 maal per jaar aangifte te doen.

Een formulier zou er zo kunnen uitzien:
[x] ik verzamel persoonsgegevens van inwoners van <...>
Ik stockeer [..1..]units aan niet-geanonimiseerde data over [10^x tot 10^x+1] inwoners van <...>.
Ik stockeer [..2..]units aan geanonimiseerde data over de inwoners van <...>.
Ik stockeer [..3..] units aan geanonimiseerde data waarvan de nationaliteit onbekend is.

[x] ik heb het afgelopen jaar data verhandeld
Ik heb data verkocht aan volgende bedrijven: [..4..] voor een geaggregeerd totaal van [..5..]units.
Ik heb data aangekocht voor een geaggregeerd totaal van [..6..]units.


Hoeveelheden 1 en 2 gaan gewoon de berekeningsmolen in met belastingscurves, 3 wordt eerst statistisch verrekend met het aandeel nationale versus wereldwijde internetgebruikers, met een kleine marge in het voordeel van het bedrijf.

Het aantal inwoners bij 1 en 4, 5 en 6 zijn om traceerbaarheid in te bouwen en 6 wordt ook gewoon linea recta via de belastingschaal verrekend. Er wordt met een eenvoudige grootteorde gewerkt (bvb 10.000 tot 100.000, zodat het bedrijf enkele interne cijfers niet zomaar op straat moet gooien).
Verkopers hebben dus meldingsplicht, aankopers hebben belastingplicht!

Units,... Vager maak je het niet.

En wat is een unit dan? Op T.net moet je ook niet zijn om mensen een briljant oor met gaten aan te naaien... O-) Het antwoord is... complex. Je mag namelijk niet vergeten dat je een bende techneuten aan het belasten bent. Wie de database-term 'normalisatie' kent weet al waar de klepel hangt. Bytes zijn het ook niet, want dan passen ze compressie toe.
Wat denk je van "niet-geaggregeerde doorzoekbare unit aan data":
  • niet-geaggregeerde: persoon X volgt op FB personen A,B,C is 3 units voor X
  • doorzoekbare: alle data die doorzoekbaar/oplijstbaar/opvraagbaar is
Een ideale definitie komt eigenlijk uit op wat je in een kolom zou stoppen bij een genormaliseerde RDBMS.

Je zou kunnen proefdraaien met meldingsplicht en bedrijven toestaan om voorbeelden aan te dragen die ze problematisch ervaren of die ze toch graag als 1 unit zien, net zoals je nu ook de belastingsdienst op voorhand kunt contacteren voor 'speciale gevalletjes'.

Controle

Geen belasting zonder controle natuurlijk. En om de belastingdienst te ontlasten is er in de 21ste eeuw een fantastische uitvinding gedaan: crowdsourcing. Enkele gegevens worden namelijk gepubliceerd en doorzoekbaar gemaakt (grappig, toch?):
  • Een schatting van het gemiddeld aantal niet-geanonimiseerde units per persoon; Dus het totaal aantal units gedeeld door het bereik van het aantal inwoners. Bijvoorbeeld: 1miljoen units op 10.000-100.000 inwoners = 10-100 units data per persoon.
  • idem dito voor het aantal geanonimiseerde units
  • het bedrijf verkoopt gegevens
  • het bedrijf koopt gegevens aan van derden
Bedrijven krijgen dan een URL die ze kunnen linken op hun website om aan te tonen dat ze hun verzameling netjes rapporteren (mooi handelskeurmerk trouwens).

Gebruikers hebben dus de mogelijkheid om voor ze ergens gegevens afstaan:
  • het bedrijf op te zoeken (en rapporteren als ze niet gevonden worden)
  • zich een beeld te vormen van de verzameldrang van het bedrijf
  • een idee te krijgen of het bedrijf data aankoopt/verkoopt
Gebruikers hebben na en tijdens het afstaan van de gegevens de mogelijkheid om het gemiddeld aantal units te vergelijken met wat ze zelf denken achter te laten. Wanneer ze denken dat de aantallen gerapporteerde units niet overeenstemmen met de realiteit kunnen ze dit gewoon melden.

Bij controle na melding controleert de overheid ter plaatse met technici en de kost daarvan wordt bij overtreding buiten een toelaatbare marge gedragen door de overtreder. Bij spontane controles betaalt de belastingbetaler.

De overheid kan trouwens ook het web sluiten van verhandelende bedrijven. Als ze weten dat bedrijf X data verkocht aan bedrijf Y, weten ze ook dat bedrijf Y dit moet melden. Het legale circuit wordt dus heel snel zichtbaar door zowel het crowdsourcen als door het volgen van datastromen.

Gevolgen

Bedrijven zullen dus waarschijnlijk enkele aanpassingen willen of moeten doen:
[list]
• boekhouding van data (in hoeverre verschilt dit van het gewone boekhouden?) om aan de meldingsplicht en belastingplicht te voldoen. Anderzijds: dit is voor die bedrijven de kern van hun businessmodel, dus zo moeilijk mag het niet zijn. Voor kleine bedrijven kun je een forfait of een vrijstelling invoeren (bvb. X units per persoon)
• Van zoveel mogelijk gebruikers proberen achterhalen of ze in een land wonen met belastingplicht of niet
• harder filteren en anonimiseren als ze hun aandeelhouders tevreden willen houden

Voor ons, lopend wild, wordt de situatie ook beter: we krijgen dan misschien geen controle over onze gegevens (tenzij ze ook echt in ons bezit blijven en dus vrijgesteld worden), we weten wel dat bedrijven er belasting over betalen en we er collectief dus ook iets voor terugkrijgen. We weten dat bedrijven hun best zullen doen om nutteloze en oude data te verkopen en/of verwijderen. Tegelijk zal de prijs voor data stijgen aangezien er ook kosten aan vast hangen.

Politici in de zaal, laat maar komen die taks.

Privacy(4): Hoe moet het wel?

Door H!GHGuY op donderdag 7 november 2013 20:00 - Reacties (6)
Categorie: Privacy, Views: 3.010

Ik probeer al een tijdje om bewust met mijn privacy om te gaan. De reeks onthullingen over de NSA, de vele beveiligingslekken die dagelijks gefixed worden, de hacks die dagelijks gebeuren (en onder de mat geschoven worden) en alle gerelateerde events scherpen dat extra zintuig nog wat aan.

Lees verder »

Privacy(3): Big Data

Door H!GHGuY op dinsdag 5 november 2013 20:00 - Reacties (13)
Categorie: Privacy, Views: 6.322

Ik probeer al een tijdje om bewust met mijn privacy om te gaan. De reeks onthullingen over de NSA, de vele beveiligingslekken die dagelijks gefixed worden, de hacks die dagelijks gebeuren (en onder de mat geschoven worden) en alle gerelateerde events scherpen dat extra zintuig nog wat aan.

Lees verder »

Privacy(2): Kennis is macht

Door H!GHGuY op zondag 3 november 2013 20:00 - Reacties (10)
Categorie: Privacy, Views: 4.120

Ik probeer al een tijdje om bewust met mijn privacy om te gaan. De reeks onthullingen over de NSA, de vele beveiligingslekken die dagelijks gefixed worden, de hacks die dagelijks gebeuren (en onder de mat geschoven worden) en alle gerelateerde events scherpen dat extra zintuig nog wat aan.

Lees verder »

Privacy(1): Waarom?

Door H!GHGuY op vrijdag 1 november 2013 20:00 - Reacties (13)
Categorie: Privacy, Views: 4.170

Ik probeer al een tijdje om bewust met mijn privacy om te gaan. De reeks onthullingen over de NSA, de vele beveiligingslekken die dagelijks gefixed worden, de hacks die dagelijks gebeuren (en onder de mat geschoven worden) en alle gerelateerde events scherpen dat extra zintuig nog wat aan.

Lees verder »