Aug 05 2014
Ora si possono filtrare i bot. Nel senso, meglio di prima!
Con un annuncio sul G+ ufficiale, Google Analytics annuncia la nuova possibilità di filtrare bot e spider direttamente con un’opzione nella vista. La cosa ha generato un po’ di confusione, per cui mettetevi comodi e leggete.
Google Analytics, da sempre, è un sistema di web analytics basato su una libreria javascript e sui cookies. Javascript è una tecnologia che funziona sui browser degli utenti, per cui il sistema raccoglie informazioni e poi le invia ai server di Google, che le analizzano. La prima conseguenza di questa affermazione – che resta vera – è che chi non esegue javascript non esegue nemmeno il codice di Google Analytics.
Quindi se io disattivo javascript, GA non mi vede. I bot, da che mondo e mondo, non sono progettati per eseguire javascript e accettare i cookie. Questo però non vieta a nessuno di progettarne uno che invece lo faccia, è già capitato in passato e ancora può capitare. Quindi l’affermazione corretta è “Google Analytics non traccia la maggior parte dei bot”.
Recentemente è stato introdotto anche il Measurement Protocol, ovvero la possibilità di inviare dati ai server Google senza l’uso di javascript. In questo caso ovviamente i bot sono SEMPRE inclusi nel traffico. Ho testato in prima persona una soluzione che addirittura include solo il traffico dei bot in una property Google Analytics. Se invece abbiamo una property “normale” che invia parte o tutti i dati tramite Measurement Protocol, la possibilità di filtrare i bot e gli spider con una spunta è molto comoda.
La cosa era diventata praticamente necessaria anche in virtù delle complessità sempre maggiori in gioco: più i siti diventano interattivi e più gli spider devono diventare “umani” per capire cosa contengono. Questo include anche la possibilità di eseguire javascript per attivare funzioni e contenuti altrimenti inaccessibili. Ultimamente aveva fatto molto scalpore il caso AdRoll, di cui potete leggere in questo post su seroundtable. Un altro caso simile e recente è quello di semalt.
Ovviamente la nuova opzione non è risolutiva nel 100% dei casi: affinché un bot sia escluso deve fare parte della lista ufficiale IAB di bot e spider riconosciuti. La lista non è pubblica perché IAB la fa pagare agli iscritti, quindi presumo non la vedremo mai. La feature non è retroattiva, per cui dovrete tenerne conto in fase di analisi, ma avevo letto un post – che non ritrovo – che diceva che nei primi giorni l’impatto era di circa il 3% di un sito piccolo e ancora meno in un sito grande. Chiaramente dipende dal business, dal settore e da molti altri fattori. Se ritrovo il link aggiornerò il post.