Aug 02 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Non ti funzionano più i filtri IP? colpa del garante :)

autore: Marco Cilia categoria: codice di monitoraggio

Una delle azioni che praticamente tutti si sono prodigati a mettere in atto, per trasformare il cookie di Google Analytics da profilazione terza parte a tecnico secondo le indicazioni del garante, è stata quella di anonimizzare l’invio dell’indirizzo IP completo ai server di Google. Io stesso sulle prime ho risposto a chi mi chiedeva quali fossero le conseguenze con un laconico “perdi un po’ di precisione nei report geografici, ma niente altro”.

Al fine di salvaguardare l’impegno preso Google invece procede ad eliminare l’ultimo ottetto degli indirizzi IP ricevuti insieme ai dati di GA prima possibile, in modo da ridurre praticamente a zero le possibilità di registrarlo da qualche parte. Con “prima possibile” purtroppo si intende PRIMA dell’elaborazione, quindi anche prima dell’applicazione dei filtri.

La cosa (“in nessun momento viene scritto su disco l’indirizzo IP completo“) è chiarita in modo limpido in questa pagina dell’help:

Ad esempio, l’indirizzo IP 12.214.31.144 potrebbe essere modificato in 12.214.31.0. Se l’indirizzo IP è un indirizzo IPv6, gli ultimi 80 bit dei 128 vengono impostati su zero. Solo al termine di questo processo di anonimizzazione la richiesta viene scritta su disco per l’elaborazione. Se viene utilizzato il metodo di anonimizzazione IP, in nessun momento viene scritto su disco l’indirizzo IP completo, in quanto tutta l’anonimizzazione avviene nella memoria quasi istantaneamente dopo che la richiesta è stata ricevuta.

Se quello fosse proprio l’indirizzo IP dei dipendenti di un’azienda che prima dell’anonimizzazione era filtrato da un normale filtro IP, di colpo il 144 non viene più trovato (è sostituito da 0) e il filtro smette di funzionare.

La soluzione “cambio 144 con 0 nel filtro” sarebbe praticabile, ma escluderebbe anche altri 255 indirizzi IP validi. Al momento vedo alcune altre soluzioni percorribili, ma quelle più solide comportano un discreto sviluppo per comprendere anche i casi più difficili (configurazioni di rete particolarmente complesse in aziende medio-grandi). Ovviamente il TagManager ci può venire in aiuto, ma è basato su javascript e javascript non conosce l’indirizzo IP del client dove gira, quindi serve comunque uno sviluppo più o meno complesso, sempre a seconda della complessità in gioco.
Per tutto il resto, prendetevela col garante 😀


Sep 21 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Analytics risolve il suo problema con la Germania

autore: Marco Cilia categoria: generale

Quasi due anni fa, a novembre 2009, la Germania iniziò una procedura per dichiarare illegale il tracciamento dei dati tramite Google Analytics. Una delle necessità ribadite dal governo tedesco era la possibilità di evitare il tracciamento, e a quello Google rispose quasi subito con un sistema di opt-out in forma di plugin per browser, ma la questione era ancora aperta.

Dico “era” perché in questo post del conversion room tedesco (in tedesco, traduzione automatica piuttosto pessima) si annuncia la fine della diatriba, e che le autorità di Amburgo hanno dato il via libera all’uso di GA sui siti senza rischio di multe. Per essere aderenti è necessario indicare chiaramente nella privacy policy del sito che si usa GA, implementare la funzione anonimizeIp() che maschera l’ultima parte dell’indirizzo IP dei visitatori e informare i visitatori circa la possibilità di scaricare il plugin per browser che evita il tracciamento.

Tutto è bene quel che finisce bene si dice in questi casi, no?


May 26 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Dati più inaccurati, in nome della privacy

autore: Marco Cilia categoria: codice di monitoraggio

Con un post sul blog ufficiale, Amy Chang ha informato il mondo della disponibilità del famoso plugin per evitare di essere tracciati da Google Analytics.
Installando sul proprio browser (per adesso soltanto Firefox 3.5 e superiori, Google Chrome 4 e superiori e Internet Explorer 7 e 8) il plugin disponibilie alla pagina http://tools.google.com/dlpage/gaoptout si diventerà completamente invisibili al sistema di web analytics di Google (e solo a quello. Per altri sistemi cosiddetti di opt-out vi rimando all’apposita raccolta di link del world privacy forum). Ne consegue che dal punto di vista di chi le statistiche le guarda, cioè il nostro, la fetta di utenti che installeranno questo plugin diverrà completamente invisibile ai nostri occhi, esattamente come coloro che non hanno javascript abilitato sul browser.

Mi sembra una scelta coraggiosa, che eleva ancora di un gradino la serietà del prodotto: potenzialmente questo plugin è in grado di azzerare completamente i dati dentro a GA, nell’iperbolica ipotesi in cui sia adottato dal 100% dei navigatori.

L’altra novità del giorno è l’introduzione di un metodo per ridurre l’accuratezza delle informazioni geografiche sui visitatori: il metodo si chiama anonimizeIp() e serve ad eliminare dall’ip del visitatore l’ultima parte dell’indirizzo. Un indirizzo come 213.145.23.78 verrebbe trasmesso a GA come 213.145.23.???
Da un lato questo non cambia assolutamente la precisione del riconoscimento del visitatore unico, perché basato su cookie rilasciato sul computer del visitatore, ma dall’altro lato costringe Google Analytics ad essere meno accurato quando calcola la provenienza geografica del visitatore (con l’operazione di geolocalizzazione degli ip).

Nel codice di tracciamento standard il metodo andrebbe chiamato prima della creazione dell’oggetto, così:


<script type="text/javascript">
var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");
document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));
</script>
<script type="text/javascript">
try{
_gat._anonymizeIp();
var pageTracker = _gat._getTracker("UA-xxxxxx-x");
pageTracker._trackPageview();
} catch(err) {}</script>

Vi potete rendere conto del funzionamento usando un tool per vedere gli header HTTP e controllando che nella richiesta che viene inviata ai server di Analytics sia presente il parametro &aip=1. Non sono ancora riuscito a far funzionare il metodo col nuovo codice asincrono (ovviamente senza iniettare la vecchia funzione, cosa sempre possibile).

L’ultima “novità”, positiva o negativa dipende dai punti di vista, è che da qualche giorno Google permette di effettuare ricerche tramite SSL (Secure Sockets Layer), o se preferite visitando httpS://www.google.com.
In questo caso la connessione tra l’utente e il server è protetta, ma a noi fino a qui interessa poco: Analytics interviene se e solo se poi un utente trova il vostro sito e fa click sul risultato mostrato nel motore. Ecco, se la cosa avviene sul Google “classico” Analytics vede che il referrer è www.google.com, quindi assegna la visita al traffico organico, estrae la keyword usata, la mette nel report delle keyword e così via. Se la ricerca è fatta sulla versione SSL di Google, il referrer non viene passato, e Analytics (ma in reatà qualsiasi sistema di web analytics) sarà costretto ad assegnare la visita al traffico diretto.