Nov 09 2009

Google Analytics non ti dice il tempo sull’ultima pagina

autore: categoria: report tag: ,

Quelli tra di voi che mi leggono da più tempo forse si ricorderanno del post “comprendere appieno il tempo sul sito“. Oggi ci ritorniamo per via di un post di metà ottobre di Brian Clifton, che ho avuto modo di leggere solo nel weekend: Brian prende di mira un post del blog ufficiale di Clicktale, che racconta come Clicktale sia più accurato di Google Analytics nel conteggio del tempo sul sito e sulla pagina.

Come ho esplicitato nel mio post passato, il modo per calcolare il tempo sulla pagina è quello di sottrarre il timestamp della pagina successiva da quello della pagina precedente (nel caso del tempo sul sito ovviamente la sottrazione avverrà tra il timestamp dell’ultima pagina della sessione e quello della prima).
Questo porta a tre “problemi”: il primo è che non si può conoscere il tempo sull’ultima pagina, il secondo è che il tempo totale sul sito manca del tempo trascorso sull’ultima pagina, il terzo è che le visite di una sola pagina (i bounce) hanno tempo zero. Cose che ormai conosciamo, ma non solo: questo è esattamente il comportamento tipico dei sistemi di Web Analytics, ed è lo stesso che possiamo trovare nell’ultima versione del documento degli standard della Web Analytics Association (pagina 17).

Come faccia Clicktale a calcolare il tempo sull’ultima pagina non lo so, posso solo azzardarlo da un punto di vista tecnico: deve essere presente un javascript che invia un segnale “hey, sono ancora qui” al server di Clicktale, ogni secondo, per tutte le pagine viste che contengono il suo script. Non può trattarsi di un evento javascript scatenato perché l’uscita dal sito può avvenire in più modi: cambio di URL, tramite digitazione o bookmark, chiusura della scheda, chiusura del browser, spegnimento del PC, e non tutti questi possono generare una chiamata javascript.
E’ conveniente dal punto di vista tecnico? forse se non hai un grosso volume di traffico si, ma se tutte le pagine che contengono il codice di GA facessero una chiamata al secondo come “ping” il sistema collasserebbe all’istante. Ma questo sarebbe eventualmente un problema che dovrebbe risolvere Google; il vero problema è che includere il tempo trascorso sull’ultima pagina porterebbe forse più danni che benefici.

Se guardo tre pagine e sto su ognuna 50 secondi, avere un tempo sul sito di 150 secondi è sicuramente più corretto che averne uno di 100, come invece ci direbbe GA. Ma questo vale solo nel caso in cui i tempi siano all’incirca tutti uguali. Se sto 50 secondi sulle prime due e poi 2000 secondi sulla tre, perché magari mi sono sono andato a bere un caffè e ho chiuso il browser solo al mio ritorno, porta ad avere un tempo totale di 2100 secondi e un tempo medio per pagina di 700 secondi. E vi garantisco che navigare con molte schede aperte (e molte dimenticate aperte) è ormai la norma, specie in ambito lavorativo.
Il sistema che usa Google Analytics e molti altri rinomati sistemi di WA non è il più accurato possibile, ma è il più vicino possibile a quello reale tenuto conto dei vincoli tecnologici odierni.

Come corollario al suo post, Brian dice che il blog di Clicktale usa per monitorare gli accessi anche Google Analytics (il che non è un problema, il detto dice “conosci il tuo nemico” 😉 ), ma che violano i termini del servizio perché includono informazioni personali (nome, cognome ed email) nei loro tracciamenti, informazioni che sono in grado di far risalire puntualmente a chi ha visto cosa e quando. Operazione che è espressamente vietata dalla TOS di Google Analytics.

Condividi l'articolo:

16 Commenti

  1. Marco, lo script di clicktale fa proprio quello che dici.
    Quel dato gli viene gratis dato che deve fare quelle richieste per comunicare la posizione del mouse, i click, i testi digitati, ecc. Per me non è paragonabile a GA, è uno strumento più di usabilità che di statistica.

    Se volesse anche GA potrebbe calcolarlo senza un impiego così eccessivo di risorse e preoccupazioni per la privacy degli utenti.
    Il keepalive non importa eseguirlo ogni secondo, ma magari ogni 30, poi la maggior parte li sovrascrivi con un webbeacon creato onunload o onbeforeunload della pagina, intercettato anche dai click nei bookmark e le chiusure del browser.

    E solo per quei pochi a cui si è crasshato il browser, staccata la corrente, browser incompatibile ti accontenti su una stima basata sui keepalive.
    Non avrai un dato esatto, però abbastanza attendibile come tutti gli altri ricavabili da GA.
    Siamo infatti nell’ambito della statistica e non della matematica.

    Il problema della pausa caffé non lo elimini trascurando l’ultima pagina, se un utente naviga per 7 pagine, può prendersela anche alla 3a pagina la pausa, e più che delle pause io mi preoccuperei del multitasking che hai accennato, che anch’esso non risolvi trascurando l’ultima pagina.

    Per me dovrebbero introdurre il concetto di tempo di attività sulla pagina, calcolato via javascript e comunicato come sopra, in alternativa almeno stimare che l’ultima pagina non valga zero ma quanto il dato medio ricavato da quell’utente o tutti gli utenti del sito.

  2. dici bene, e infatti al momento GA è uno strumento di Web Analytics, non di usabilità 🙂

  3. Marco mi sa che ti sei perso un “non” dove scrivi “Questo porta a tre “problemi”: il primo è che si può conoscere il tempo sull’ultima pagina” 🙂

  4. oh yeah! grazie!

  5. D’altro canto, sempre più dovremmo concentrarci sulla interpretazione dei dati, oltre che sul dato stesso in sé.

    In realtà conoscere il tempo di permanenza di per sé non ha senso, perché nulla può dimostrare che l’umano si muova in modo seriale. In realtà, psicologicamente si muove in modo seriale, ma su micro-task, non su macro-task. A livello di macro-task, tutti noi lavoriamo in parallelo.

    Il tempo di permanenza su un sito è l’arcaico resto della statistica sui siti fatta solo e principalmente per quelli che vendevano pubblicità e sponsorizzazioni, che avevano l’obiettivo di tenere per il maggior tempo possibile i visitatori sul sito, con la speranza di avere prima o poi un click da qualche parte.

    Sono passati anni da quando gli obiettivi di massima sono completamente diversi. Solo che si va ancora con la vecchia scuola americana del tempo di permanenza, che oltre tutto, anche per motivi di carattere sociale, in Italia non ha mai avuto senso, neppure negli ambiti pubblicitari.

    Come consulente direzionale di un cliente che stesse valutando un fornitore, se questo accennasse solo minimamente al tempo di permanenza come parametro di valutazione di qualcosa, consiglierei alla direzione di cassarlo senza neppure offrirgli un caffè. Peccato che i puù parlino proprio di tempo di permanenza e che proprio su questo si misurino molte campagne di keyword advertising.

    …ridiculus…

  6. Ciao Marco,
    a proposito del timestamp…scopro solo oggi come analytics calcola il tempo sulle pagine. Tutto chiaro per quanto riguarda l’ultima pagina ed i bounce (non può essere calcolato. E per la prima? Cioè in assenza di una pagina precedente manca comunque una sponda temporale no??

    Melkio
    Grazie mille in anticipo

  7. no, un attimo. Se si parla di “ultima pagina” significa che ne sono state viste almeno due, quindi di sicuro non è un bounce. Se invece è un bounce, non può avere ovviamente un tempo sulla pagina.

  8. Ciao Marco,
    mi sono spiegato male…per evitare altri equivoci ti faccio al domanda secca.
    Analytics può calcolare il tempo della prima pagina di una visita? Il time viene fissato dall’accesso alla pagina e interrotto con l’accesso alla pagina successiva giusto?

    Grazie
    Melkio

  9. può calcolarlo se e solo se dopo c’è un’altra pagina vista.

  10. Ciao Marco, volevo chiederti un chiarimento sulla questione, probabilmente banale ma è per togliere ogni dubbio…se io sto analizzando i dati di accesso di una singola pagina, e ho un tot n di tempo medio su quella pagina in un giorno qualsiasi, quel dato viene calcolato con una media che prende in considerazione anche il 0.00 degli eventuali bounce?
    Il tempo 0.00 dei bounce insomma, influisce sul calcolo del tempo medio di una pagina? Grazie mille
    Matteo

  11. I bounce sono esclusi, l’avevo spiegato in un altro articolo ( http://www.goanalytics.info/spiegazione-tempo-sul-sito/ )

  12. Ho trovato questo consiglio per gestire al meglio le pagine “bounce”:
    http://analytics.blogspot.it/2012/07/tracking-adjusted-bounce-rate-in-google.html
    Si dedurrebbe che è possibile avere il tempo di permanenza su una pagina “bounce”, in contraddizione con quello che hai detto tu e che anch’io ritengo.
    Come te lo spieghi?
    Ettore

  13. io mi riferivo al comportamento “normale”, senza hack.
    Ho parlato di quella soluzione qui
    http://www.goanalytics.info/dovrei-usare-il-bounce-rate-accomodato/

    e ho spiegato come gli eventi influenzino il tempo di permanenza qui
    http://www.goanalytics.info/calcolo-del-tempo-sulla-pagina/

  14. Grazie Marco,
    sei stato molto chiaro! Complimenti per la tua competenza e per la qualità dei tuoi articoli!
    Ettore

Trackbacks

  1. Tweets that mention Google Analytics non ti dice il tempo sull’ultima pagina • Google Analytics in 30 secondi -- Topsy.com
  2. Notizie dai blog su Il tempo è denaro, anche sui blog. A tempo di pagespeed.

Scrivi un Commento