Sep 21 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Analytics risolve il suo problema con la Germania

autore: Marco Cilia categoria: generale

Quasi due anni fa, a novembre 2009, la Germania iniziò una procedura per dichiarare illegale il tracciamento dei dati tramite Google Analytics. Una delle necessità ribadite dal governo tedesco era la possibilità di evitare il tracciamento, e a quello Google rispose quasi subito con un sistema di opt-out in forma di plugin per browser, ma la questione era ancora aperta.

Dico “era” perché in questo post del conversion room tedesco (in tedesco, traduzione automatica piuttosto pessima) si annuncia la fine della diatriba, e che le autorità di Amburgo hanno dato il via libera all’uso di GA sui siti senza rischio di multe. Per essere aderenti è necessario indicare chiaramente nella privacy policy del sito che si usa GA, implementare la funzione anonimizeIp() che maschera l’ultima parte dell’indirizzo IP dei visitatori e informare i visitatori circa la possibilità di scaricare il plugin per browser che evita il tracciamento.

Tutto è bene quel che finisce bene si dice in questi casi, no?


Jan 16 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

In Germania Google Analytics potrebbe diventare illegale

autore: Marco Cilia categoria: generale

Bandiera tedescaCirca un anno fa intitolai un post “Che cosa è illegale in Germania?” poiché le autorità avevano iniziato un processo di accuse vero il noto sistema di web analytics made in Google. La mia tesi era che il problema del tracciamento non ce lo aveva solo GA, ma era un problema tipico di tutti i sistemi di web analytics, ma evidentemente aveva invece ragione Stefano Gorgoni che nei commenti diceva

google […] in quanto è in grado di tracciare troppe informazioni grazie a google analytics (+ tutte le altre cose messe assieme).

Evidentemente in Germania possono rendere illegale solo Google Analytics (si ipotizzano multe di 50.000 euro a chi lo utilizzerà dopo l’eventuale divieto) e non toccare Adobe Sitecatalyst e tutti gli altri programmi. (alcune fonti in inglese: searchenginewatch e thelocal.de). Questo sulla base generica del fatto che “Google raccoglie anche altri dati tramite altri servizi”.

Allora chiariamo un attimo una cosa prima di andare avanti: io per primo sono uno che non ha mai negato che Google “guadagna” in informazioni invece che in termini monetari se noi usiamo Google Analytics (ecco un post, ad esempio). Ma lo dico sulla base di un ragionamento costi/benefici astratto e sulla base di supposizioni generiche. Quando provo a rispondere concretamente alla domanda “come fa?” non trovo risposte tecnicamente sostenibili. E dubito le possano trovare anche le autorità tedesche. Proviamoci un attimo insieme, e come sempre se avete cose da aggiungere i commenti sono lì ad aspettarvi:

– Una persona naviga su siti che usano Google Analytics, e non usa nessun altro servizio Google. Cosa potrà mai sapere Google di lui? nulla. Saprà che il cookie __utma relativo al sito visitato è alla prima o ennesima visita, che in precedenza ha visto o no questo sito e quando e tutto il resto delle informazioni che sappiamo. Di tutti i siti? NO, SOLTANTO DEL SITO IN QUESTIONE! vi ricordo infatti (e potete verificarlo da soli) che esiste un cookie utma per ogni sito visitato, e che il secondo gruppo di numeri nel contenuto – quelli che identificano univocamente il visitatore – sono differenti per ogni set di cookie. Ammettendo per assurdo che invece Google sia in grado di riunire queste informazioni, avrebbe l’elenco di tutte le visite a tutti i siti di un solo indirizzo IP

– Una persona naviga su siti che usano Google Analytics, e nel contempo sta usando Gmail, Calendar e tutti gli altri servizi. Dentro a Gmail c’è nome e cognome e un sacco di altre cose, diciamo che diamo per buona l’associazione Gmail = Nome e Cognome, in quel caso allora Google saprebbe (meglio: potrebbe ricavare) che Marco Cilia sta guardando la pagina X del sito Y nel dato momento del tale giorno. Ma se invece fossi iscritto a Gmail ma non l’avessi aperta in quel momento, cioè se i cookie e l’ip che sto usando non possano essere associati a Gmail per quel periodo? allora non si potrebbe fare nulla. L’associazione varrebbe solo nel caso di utilizzo contemporaneo delle due applicazioni.

– Una persona naviga su siti che usano Google Analytics, e nel contempo sta usando Gmail e il resto, mentre è all’interno di una rete aziendale da 5000 client. Guardando la cosa dal “lato Google”, Marco Cilia e altre – ipotizziamo – 348 persone (precisi a livello do nomi e cognomi) sono perfettamente pronte ad essere associate ai siti che si stanno navigando. Arrivano migliaia di informazioni tramite Google Analytics, ma l’IP registrato è sempre e soltanto quello del proxy aziendale. Nei cookie di GA, lo ripeto, non c’è nè nome e cognome, nè l’associazione a Gmail. Come può Google attribuire correttamente le 18 pagine visitate nel secondo 31 del minuto 14 delle quattro del pomeriggio a 18 delle 348 persone che lui sa essere online in quel momento?

Per associare due informazioni – e questa è informatica, non Google Analytics – serve un dato comune alle due informazioni: che sia un ID di una tabella di relazione di database, una chiave univoca, un tag testuale o un cookie, senza questa relazione l’associazione è impossibile: poiché voi potete benissimo sapere che cosa inviate a Google tramite Analytics (vi ricordo che questo sito ha un tutorial) potete anche guardarle e provare a capire se e come si potrebbe risalire alle vostre informazioni personali. Se lo capite, ne parliamo nei commenti.

Altrimenti, dire “Google Analytics viola la tua privacy perché traccia anche l’IP e Google sa tante cose di te” lascia piuttosto il tempo che trova 🙂

[photo credit: francescomucio on flickr]