Nov 09 2009
Google Analytics non ti dice il tempo sull’ultima pagina
Quelli tra di voi che mi leggono da più tempo forse si ricorderanno del post “comprendere appieno il tempo sul sito“. Oggi ci ritorniamo per via di un post di metà ottobre di Brian Clifton, che ho avuto modo di leggere solo nel weekend: Brian prende di mira un post del blog ufficiale di Clicktale, che racconta come Clicktale sia più accurato di Google Analytics nel conteggio del tempo sul sito e sulla pagina.
Come ho esplicitato nel mio post passato, il modo per calcolare il tempo sulla pagina è quello di sottrarre il timestamp della pagina successiva da quello della pagina precedente (nel caso del tempo sul sito ovviamente la sottrazione avverrà tra il timestamp dell’ultima pagina della sessione e quello della prima).
Questo porta a tre “problemi”: il primo è che non si può conoscere il tempo sull’ultima pagina, il secondo è che il tempo totale sul sito manca del tempo trascorso sull’ultima pagina, il terzo è che le visite di una sola pagina (i bounce) hanno tempo zero. Cose che ormai conosciamo, ma non solo: questo è esattamente il comportamento tipico dei sistemi di Web Analytics, ed è lo stesso che possiamo trovare nell’ultima versione del documento degli standard della Web Analytics Association (pagina 17).
Come faccia Clicktale a calcolare il tempo sull’ultima pagina non lo so, posso solo azzardarlo da un punto di vista tecnico: deve essere presente un javascript che invia un segnale “hey, sono ancora qui” al server di Clicktale, ogni secondo, per tutte le pagine viste che contengono il suo script. Non può trattarsi di un evento javascript scatenato perché l’uscita dal sito può avvenire in più modi: cambio di URL, tramite digitazione o bookmark, chiusura della scheda, chiusura del browser, spegnimento del PC, e non tutti questi possono generare una chiamata javascript.
E’ conveniente dal punto di vista tecnico? forse se non hai un grosso volume di traffico si, ma se tutte le pagine che contengono il codice di GA facessero una chiamata al secondo come “ping” il sistema collasserebbe all’istante. Ma questo sarebbe eventualmente un problema che dovrebbe risolvere Google; il vero problema è che includere il tempo trascorso sull’ultima pagina porterebbe forse più danni che benefici.
Se guardo tre pagine e sto su ognuna 50 secondi, avere un tempo sul sito di 150 secondi è sicuramente più corretto che averne uno di 100, come invece ci direbbe GA. Ma questo vale solo nel caso in cui i tempi siano all’incirca tutti uguali. Se sto 50 secondi sulle prime due e poi 2000 secondi sulla tre, perché magari mi sono sono andato a bere un caffè e ho chiuso il browser solo al mio ritorno, porta ad avere un tempo totale di 2100 secondi e un tempo medio per pagina di 700 secondi. E vi garantisco che navigare con molte schede aperte (e molte dimenticate aperte) è ormai la norma, specie in ambito lavorativo.
Il sistema che usa Google Analytics e molti altri rinomati sistemi di WA non è il più accurato possibile, ma è il più vicino possibile a quello reale tenuto conto dei vincoli tecnologici odierni.
Come corollario al suo post, Brian dice che il blog di Clicktale usa per monitorare gli accessi anche Google Analytics (il che non è un problema, il detto dice “conosci il tuo nemico”
), ma che violano i termini del servizio perché includono informazioni personali (nome, cognome ed email) nei loro tracciamenti, informazioni che sono in grado di far risalire puntualmente a chi ha visto cosa e quando. Operazione che è espressamente vietata dalla TOS di Google Analytics.
Google Analytics esporta sempre i file dei report in formato inglese (anche se usate l’interfaccia in italiano), quindi usa i punti per separare i decimali, ma fortunatamente non le virgole per le migliaia. Importare direttamente tutto in un Excel “europeo” fa risultare il tempo medio (e in generale le cifre relative al tempo) in un numero come quello indicato da Elisabetta.
Appena ho iniziato a fare prove per rispondere a Elisabetta ho preso un grosso abbaglio. Mi sono detto “come è possibile che Google Analytics conosca il tempo medio sulla pagina preciso fino al microsecondo?” (tra l’altro sbagliando, perché guardando il valore esatto nella barra della formula, non troncato dalla visualizzazione, sarebbe preciso oltre il picosecondo, 10-12). Ovviamente la risposta è “non la conosce, ma essendo il tempo medio un valore calcolato con una frazione, possono esserci più decimali di quanti ce ne siano nei dati di partenza.
Oltre al
Sono personalmente d’accordo al cento per cento con Ian, e non solo perché questo blog tratta di Google Analytics. Non difendo nessuno a priori e quando ne ho occasione mostro anche i limiti di GA, ma non mi sembra questo il caso: particolarmente significativa la frase “Quando, come industria, non siamo d’accordo su cosa costituisca esattamente una visita, è facile accusare questo o quel sistema di non essere accurati semplicemente perché non si ha fiducia nell’approccio che essi hanno nei confronti dei dati“. Che non esista un tool perfetto e universale lo sappiamo tutti (e se non lo sapete lo ripeterò ancora una volta), il problema è che bisogna trovare un tool di cui fidarsi. Bisogna studiare, conoscere, chiedere e provare, e poi scegliere di conseguenza. Possibilmente verificando l’aderenza del prodotto con i famosi standard della WAA.


