over mij

Server-side tagging als oplossing voor Schrems II + GA

23 August 2022 | 6 minuten lezen | Deel dit blog viaFacebook,LinkedIn,Twitter,WhatsApp
De nasleep van de uitspraak Schrems II houdt de gemoederen al even bezig. De afgelopen periode stond in het teken van de 101 klachten van NOYB over Google Analytics (en het Facebook Pixel). De Oostenrijkse, Franse, Italiaanse en Europese toezichthouders oordeelden allemaal dat het gebruik van Google Analytics niet is toegestaan. De Franse toezichthouder komt met een oplossing waarmee het gebruik van Google Analytics nog wel mogelijk is: een proxyserver die gegevens filtert voordat ze naar Google (in de VS) gaan.
n juni kwam de Franse toezichthouder met een mogelijke oplossing waarmee het gebruik van Google Analytics nog wel mogelijk is: een proxy-server die gegevens filtert voordat ze naar Google (in de VS) gaan.
Foto van Arthur Osipyan (Unsplash)

CNIL: Maatregelen van Google (en website) zijn niet voldoende

In een eerder blog schreef ik al dat bij het gebruik van Google Analytics de doorgifte van gegevens naar de VS onvermijdelijk is. De CNIL (Franse toezichthouder) kwam in februari tot een vergelijkbare conclusie. In de uitspraak stelt de toezichthouder het volgende vast:
  1. Dat de website eigenaar 'verwerkingsverantwoordelijke' is wanneer hij voor webanalyse en -optimalisatie Google Analytics implementeert. Dit is belangrijk omdat de verwerkingsverantwoordelijke kan worden aangesproken op niet naleving van de AVG.
  2. Online-identifiers zoals het IP-adres, het door Google gegenereerde user-id en andere interne-id’s (bijv. CRM id) zijn herleidbaar naar een websitebezoeker. Het zijn dus persoonsgegevens waarop de AVG van toepassing is.
  3. Los van de online id's onder 2 is de combinatie van andere met Google gedeelde gegevens (browser, besturingssysteem, herkomst-url etc.) ook herleidbaar naar een individu (ook wel ‘device fingerprinting Bekijk op deze website hoe uniek jouw apparaat is.’). Als een gebruiker bij Google is ingelogd dan kan er bovendien nog meer informatie worden gedeeld.
  4. De gegevens onder 2 en 3 worden (onder meer) in de VS opslagen. Er is dus sprake van doorgifte. Dit betekent dat een doorgifte-mechanisme vereist is.
  5. Op de doorgifte zijn de 'standard contractual clauses' (SCC's) van toepassing.
    Zie ook mijn eerder blog over doorgifte in de cloud, waarin ik de contractuele relatie met Google uitvoeriger beschrijf: "De verwerkersovereenkomst (‘Google Ads Data Processing Terms’) maakt (na acceptatie in het account) onderdeel uit van de overeenkomst. In de verwerkersovereenkomst staan alle afspraken over de rol van Google als verwerker... Voor de VS en andere landen baseert Google zich op de standard contractual clauses."
    Uit Schrems II volgt dat bij het gebruik van de SCC's voor doorgifte naar de VS technische maatregelen noodzakelijk zijn om tot een ‘passend beschermingsniveau’ te komen. Wat zegt de CNIL hierover?
  • Doel: Het doel van die maatregelen is voorkomen dat Google LLC (in de VS) toegang heeft tot de leesbare gegevens (al dan niet via cryptografische sleutels), want anders hebben de Amerikaanse overheidsinstanties (middels wetgeving aldaar) ook toegang tot de informatie.
  • Maar: Er kan bij gebruik van Google Analytics niet sprake kan zijn van effectieve pseudonimisering, omdat de gegevens onder 2 en 3 herleidbaar zijn. De gegevens zijn dus zelfs herleidbaar bij gebruik van Google Analytics in overeenstemming met de handleiding van de Autoriteit Persoonsgegevens. Bij het toepassen van de zogenaamde anonimiseringsfunctie is het bovendien niet duidelijk of het laatste octet van het IP-adres al voor doorgifte naar de VS wordt gemaskeerd, of pas op een server in de VS.
  • Conclusie: De (door Google) genomen maatregelen zijn niet effectief. Er is dus niet sprake van een 'passend beschermingsniveau'.
De CNIL stelt in feite dat aanvullende maatregelen door Google of de websitehouder vereist zijn. Die laatste is uiteindelijk verantwoordelijk voor de juiste implementatie. Er is echter wel wat maatwerk vereist om Google Analytics te blijven mogen gebruiken…

Server-side tagging (‘proxyserver’) als ‘technische maatregel’

In juli kwam de CNIL met een voorstel voor een maatregel die mogelijk wel voldoet: een proxyserver waar de gegevens eerst naartoe gaan, voordat deze naar de Google Analytics servers worden verstuurd. Op de proxyserver worden de gegevens zoveel als mogelijk van herleidbare elementen ontdaan. Er blijft dan een pseudonieme dataset over. De gegevens zijn in handen van Google niet herleidbaar naar individuele websitebezoekers. Dit ziet er visueel als volgt uit:
franksblog.nl - Een weergave van de CNIL waarin ze de reguliere implementatie van GA en die met een proxyserver vergelijken. De proxy komt als een filter tussen de website en de server van Google in te staan.
Een weergave van de CNIL waarin ze de reguliere implementatie van GA en die met een proxyserver vergelijken. De proxy komt als een filter tussen de website en de server van Google in te staan.
Mijn inschatting is dat de server-side oplossing van Google Tag Manager
De logica van verschillende tags verplaats je met 'server-side tagging' van de browser (client) naar een server. Dit heeft een aantal voordelen. Google beschrijft server-side GTM als volgt:"Server-side tagging allows you to move measurement tag instrumentation from your website or app to a server-side processing container on Google Cloud Platform (GCP), or any other platform of your choosing. Server-side tagging offers a few advantages over client-side tags:
  • Improved performance: Fewer measurement tags in your website or app means less code to run on the client side.
  • Better security: Visitor data is better protected and more secure when collected and distributed in a customer-managed server-side environment. Data is sent to a cloud instance where it is then processed and routed by other tags."
(GTM) als zo'n proxyserver kan functioneren. Als ik let op de hoge lat van de CNIL, dan vermoed ik echter dat ‘GTM off-the-shelf’ niet de oplossing kan zijn. Standaard wordt GTM namelijk op Google Cloud Platform (GCP) gehost. Bij het gebruik van GCP bestaat daarom altijd nog de mogelijkheid voor Google (LLC) om de gegevens in leesbare tekst in te zien. Google beheert immers de servers en cryptografische sleutels. Het is daarom noodzakelijk om een andere hosting provider te gebruiken. Bij voorkeur zelfs een Europese en één zonder Amerikaans moederbedrijf (zie ook deze publicatie van het NCSC). Google stelt gelukkig een Docker image beschikbaar waarmee je de containerversie van GTM op een ‘eigen’ server kan hosten.
Wil je een andere optie in plaats van een eigen GTM server? Die zijn er uiteraard ook. Je zou ook met het Google Analytics Measurement Protocol aan de slag kunnen gaan. Ook zijn er meer kant en klare oplossingen beschikbaar, zoals bijvoorbeeld TraceDock. Genoeg mogelijkheden in ieder geval.Dan heb je in feite stap één voltooid: een eigen ‘proxyserver’ waarmee je überhaupt gegevens kan filteren voordat deze naar Google gaan. Om te voldoen aan de eisen van de CNIL moet je het volgende resultaat bereiken:"(1) the absence of transfer of the IP address to the servers of the analytics tool. If a location is transmitted to the servers of the measurement tool, it must be carried out by the proxy server and the level of precision must ensure that this information does not allow the person to be re-identified (for example, by using a geographical mesh ensuring a minimum number of Internet users per cell);(2) the replacement of the user identifier by the proxy server. To ensure effective pseudonymisation, the algorithm performing the replacement should ensure a sufficient level of collision (i.e. a sufficient probability that two different identifiers will give an identical result after a hash) and include a time-varying component (adding a value to the hashed data that evolves over time so that the hash result is not always the same for the same identifier) ;(3) the removal of external referrer information from the site;(4) the removal of any parameters contained in the collected URLs (e.g. UTMs, but also URL parameters allowing internal routing of the site);(5) reprocessing of information that can be used to generate a fingerprint, such as user-agents, to remove the rarest configurations that can lead to re-identification;(6) the absence of collection of cross-site or lasting identifiers (CRM ID, unique ID);(7) the deletion of any other data that could lead to re-identification."Onder deze voorwaarden mag je volgens de CNIL Google Analytics blijven gebruiken, maar dat betekent dat je een niet ‘off-the-shelf’ oplossing moet implementeren en je er minder nauwkeurige datapunten voor terugkrijgt.

Conclusie

NOYB houdt behoorlijk huis met z’n klachten. Google Analytics is ‘as-is’ volgens toezichthouders niet rechtmatig te gebruiken, omdat er niet sprake zou zijn van een ‘passend beschermingsniveau’ zodra persoonsgegevens in de VS terechtkomen.De CNIL komt nu met een technische maatregel welke het rechtmatig gebruik van Google Analytics mogelijk maakt. Dit is een zogenaamde eigen proxyserver tussen de website en de servers van Google, welke gegevens filtert tot een pseudonieme dataset. Een dergelijke server kan je bijvoorbeeld inrichten met een eigen gehoste versie van GTM. Dit betekent wel dat je details in je dataset en daarmee analyses moet weglaten. Dit doet de vraag rijzen of het nog wel loont om Google Analytics boven Europese alternatieven te verkiezen? Ik ga de Google Analytics (v4) implementatie op deze site in ieder geval door wat anders vervangen …

Meer lezen?

Bekijk mijn andere blogs.

© 2021 Frank de Vries. Alle rechten voorbehouden
Privacy
RSS Feed