Sep 21 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

ROI R.I.P. welcome ROAS

autore: Marco Cilia categoria: report tag: , ,

Il titolo un po’ criptico fa seguito ad un post sulla pagina Google+ di GA, in cui si annuncia la sostituzione della metrica del ROI (Ritorno sull’Investimento) con quella del ROAS (Ritorno sulla spesa per annunci) all’interno dei report AdWords. La modifica dovrebbe già essere visibile a tutti.

La formula con la quale è calcolato il ROAS è (entrate ecommerce + valore obiettivo) / spesa. Nei report AdWords il numeratore è segmentato per i valori derivanti da visite con conversioni “ultimo clic non diretto” da AdWords. Questo è il motivo per cui la quasi totalità dei profili che vedo ha un ROAS con una certa percentuale che è comunque inferiore alla media del sito: la media è calcolata come totale entrate ecommerce / spesa AdWords, mentre il ROAS AdWords è entrate ecommerce da ADW / spesa ADW. Sarebbe 100% solo se TUTTE le entrate fossero attribuite ad AdWords.

Mi aspetto che il passo successivo sia introdurre la stessa metrica anche nei report “analisi dei costi”, in modo da poter calcolare il ROAS di qualsiasi attività di spending in advertising.

Altre novità interessanti sul fronte advertising sono elencate in questo post sul blog ufficiale, vediamole una per una:

  1. Eè ora possibile attivare i report demografici anche per le applicazioni mobili, e questo permetterà anche di fare migliori campagne di remarketing in-app, potendo segmentare anche per profili demografici.
  2. La creazione delle liste di remarketing dall’interfaccia di Analytics è ora stata semplificata; inoltre ora si possono importare template già fatti di liste di remarketing con lo stesso meccanismo di custom report, dashboard e segmenti, quindi usando la Solution Gallery
  3. C’è un nuovo report nella sezione AdWords, che misura l’efficacia dei target nella rete Display: a mia memoria è la prima volta che GA mostra un report con TRE dimensioni primarie. Si tratta più precisamente di Parola chiave per la rete display, campagna e gruppo di annunci. In verità la prima posso anche modificarla con Posizionamenti, Argomenti, Interessi e remarleting, età o sesso. L’applicazione di una dimensione secondaria porta a quattro il numero di colonne che elencano dimensioni nel report (e inizia anche a essere stretto da vedere su un monitor da 17 pollici :-/ )

clicca l’immagine per ingrandirla e renderti conto di quanto sia lungo il nuovo report :)

nuovo report target rete display


Sep 12 2014

A volte ritornano: riecco il benchmarking

autore: Marco Cilia categoria: report tag: ,

Non tutte le ciambelle riescono col buco, e alcune volte i report di Analytics vengono ritirati. Se non bastano le lamentele sparse su forum e gruppi di discussione, una rapida occhiata alle statistiche di Google Analytics SU Google Analytics (ebbene sì, è una specie di Matrix :) ) è in grado di dire agli ingegneri “questo report non se lo fila nessuno”.

Questa sorte è probabilmente accaduta al vecchio report del benchmark, che però rivive oggi in una forma tutta nuova e, permettetemi di dire, bella sgargiante! Il blog ufficiale infatti ci informa che nelle prossime settimane tutti avrete accesso alla nuova funzionalità, che sarà attivata se e solo se avete preventivamente deciso di condividere anonimamente i vostri dati con Google (Amministrazione -> impostazioni dell’account -> “anonimamente con Google e altri”).

benchmarking-v2

Quando tutti saranno abilitati nella sezione di report PUBBLICO comparirà una nuova sottocategoria, tradotta in italiano con “Analisi comparativa“. Al suo interno, tre report:

  1. Canali: è il report che vedete nello screenshot sul post ufficiale. La dimensione impostata è Channel, le metriche sono le classiche ABC (Acquistion, Behavior, Conversion) e ogni cella è colorata con tonalità dal verde al rosso, a seconda che il risultato ottenuto dal nostro sito sia migliore o peggiore del campione di paragone. Il colore si può eliminare, così come la numerica di comparazione. In questo senso trovo il report molto bello e agevole da leggere, e spero che questa visualizzazione venga estesa anche in altre parti dello strumento.
  2. Località: qui la dimensione principale è il paese/zona di provenienza degli utenti
  3. Dispositivi: dimensione principale è categoria del dispositivo (desktop, tablet, mobile)

Interessanti le metriche che è possibile posizionare sul grafico: oltre alle metriche secche ci sono anche metriche “dedicate”, tipo “differenza % nuove sessioni rispetto al benchmark”. Infine, la domanda principale: contro chi o che cosa sto confrontando i miei dati? in testa ad ogni report sono presenti 3 grandi selettori, uno dedicato all’industry (o vertical, come amano dire gli inglesi) – e ne potete scegliere una tra circa 1600 – uno dedicato al Paese/Regione (no, in Italia niente province, mentre in Francia ad esempio si) per filtrare i dati e uno dedicato alla dimensione dei siti in base al traffico giornaliero (da siti piccoli 0-100 visite al giorno a siti enormi da oltre centomila visite al giorno). Nessuno mi vieta di confrontare il mio piccolo ecommerce di ferramenta con un colosso giapponese di articoli da giardino, ma avrebbe poco senso. I valori stimati da GA all’inizio dovrebbero essere più che sufficienti…
In ogni caso dopo aver modificato i valori di riferimento, Analytics mostra un avviso che indica quante properties fanno parte del benchmarking per quella particolare selezione. Sempre utile per tenere a mente il contesto.


Sep 03 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Il posizionamento di GA secondo gli utenti

autore: Marco Cilia categoria: generale tag:

Qualche tempo fa abbiamo detto del report Forrester Wave 2014, e delle polemiche che ne sono scaturite (che tra l’altro non si sono sopite, dato che Brian Clifton recentemente ci è tornato sopra).

TrustRadius invece adotta un approccio opposto, e attraverso un panel di utenti ha ricostruito – incrociando diffusione e punteggi – una situazione leggermente diversa: prima di tutto le domande sono poste ad aziende di qualsiasi dimensione, in secondo luogo i tool non sono scremati all’inizio (motivo per cui compare anche Piwik, ad esempio). Ebbene, in questa situazione il leader nel settore small business è Google Analytics free, insieme a StatCounter e Piwik.

Per le medie imprese (“medie” nel metro americano, ovvero fino a 500 dipendenti) invece il leader è Google Analytics free, mentre Adobe si posiziona secondo, esattamente sulla linea mediana dei punteggi (4,3 su 5). Nel segmento enterprise il leader è sempre e comunque Google Analytics Free, Adobe è di nuovo sulla linea mediana (4,1 su 5) e Google Analytics Premium è sulla stessa mediana di punteggio, solo meno diffuso. Gli altri big del settore secondo il report di Forrester? IBM e Webtrends più diffusi di GAP ma con punteggi molto inferiori, AT internet è strong performers per punteggio, ma è comunque inferiore a GA free, mentre SAS non è nemmeno menzionato.

Ovviamente l’ottimo sarebbe un’analisi che prendesse dati da entrambi i report, perché ad ognuno manca un pezzo e quindi arrivano a conclusioni differenti.

Forrester, I’m sure, would beg to differ, identifying “the six most significant software providers in the category” as Adobe, AT Internet, Google, IBM, SAS Institute, and Webtrends.

The TrustRadius report profiles all of those providers, minus SAS Institute, and adds comScore, GoSquared, KISSmetrics, Mixpanel, Piwik, StatCounter, and Woopra.

Però è sempre bene avere altri punti di vista, no? :)


Aug 05 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Ora si possono filtrare i bot. Nel senso, meglio di prima!

autore: Marco Cilia categoria: generale tag: ,

Con un annuncio sul G+ ufficiale, Google Analytics annuncia la nuova possibilità di filtrare bot e spider direttamente con un’opzione nella vista. La cosa ha generato un po’ di confusione, per cui mettetevi comodi e leggete.

Google Analytics, da sempre, è un sistema di web analytics basato su una libreria javascript e sui cookies. Javascript è una tecnologia che funziona sui browser degli utenti, per cui il sistema raccoglie informazioni e poi le invia ai server di Google, che le analizzano. La prima conseguenza di questa affermazione – che resta vera – è che chi non esegue javascript non esegue nemmeno il codice di Google Analytics.
Quindi se io disattivo javascript, GA non mi vede. I bot, da che mondo e mondo, non sono progettati per eseguire javascript e accettare i cookie. Questo però non vieta a nessuno di progettarne uno che invece lo faccia, è già capitato in passato e ancora può capitare. Quindi l’affermazione corretta è “Google Analytics non traccia la maggior parte dei bot”.

Recentemente è stato introdotto anche il Measurement Protocol, ovvero la possibilità di inviare dati ai server Google senza l’uso di javascript. In questo caso ovviamente i bot sono SEMPRE inclusi nel traffico. Ho testato in prima persona una soluzione che addirittura include solo il traffico dei bot in una property Google Analytics. Se invece abbiamo una property “normale” che invia parte o tutti i dati tramite Measurement Protocol, la possibilità di filtrare i bot e gli spider con una spunta è molto comoda.

La cosa era diventata praticamente necessaria anche in virtù delle complessità sempre maggiori in gioco: più i siti diventano interattivi e più gli spider devono diventare “umani” per capire cosa contengono. Questo include anche la possibilità di eseguire javascript per attivare funzioni e contenuti altrimenti inaccessibili. Ultimamente aveva fatto molto scalpore il caso AdRoll, di cui potete leggere in questo post su seroundtable. Un altro caso simile e recente è quello di semalt.

Ovviamente la nuova opzione non è risolutiva nel 100% dei casi: affinché un bot sia escluso deve fare parte della lista ufficiale IAB di bot e spider riconosciuti. La lista non è pubblica perché IAB la fa pagare agli iscritti, quindi presumo non la vedremo mai. La feature non è retroattiva, per cui dovrete tenerne conto in fase di analisi, ma avevo letto un post – che non ritrovo – che diceva che nei primi giorni l’impatto era di circa il 3% di un sito piccolo e ancora meno in un sito grande. Chiaramente dipende dal business, dal settore e da molti altri fattori. Se ritrovo il link aggiornerò il post.


Jul 28 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

4 metriche che si confondono facilmente

autore: Marco Cilia categoria: generale tag: ,

M’è passato sotto agli occhi questo post di edynamic: The Four Most Confusing Metrics in Google Analytics e ho pensato che valesse la pena di riprenderlo, anche se parla di cose che negli anni ho già affrontato su questo blog.

Le prime due metriche interessate sono il bounce rate e l’exit rate (tasso di rimbalzo e tasso di uscita, in italiano): le definizioni per queste due metriche sono:

  • Bounce rate: una visita che non fa registrare una seconda pagina, o un evento (che non sia classificato come “non interattivo” tramite apposito settaggio).
  • Exit rate: l’ultima pagina vista di ogni sessione.

Le differenze principali sono che per esserci un bounce la visita deve iniziare e concludersi nella stessa pagina, quindi è una condizione che può verificarsi oppure no, mentre una sessione deve necessariamente terminare da qualche parte, quindi una exit page c’è sempre.

Vi pregherei di non considerare i calcoli successivi nel post originale, perché sono effettuati su un assunto sbagliato :)
Nel caso descritto nel loro esempio, che riporto qui

Session 1: Page A > Page B > Page C > Exit

Session 2: Page B > Page C > Page A > Exit

Session 3: Page C > Page B> Page A > Exit

Session 4: Page A > Exit

i calcoli corretti sono:
– Il bounce rate della pagina A è 50% (1 bounce – la quarta sessione – su 2 sessioni in cui era landing page)
– Il bounce rate della pagina B è 0% (0 bounce su 1 sessione in cui era landing page)
– Il bounce rate della pagina C è 0% (0 bounce su 1 sessione in cui era landing page)

– L’exit rate della pagina A è 75% (è stata l’ultima pagina in 3 sessioni su 4)
– L’exit rate della pagina B è 0% (non è mai stata l’ultima)
– L’exit rate della pagina C è 33% (è stata l’ultima in una sessione su 3 in cui è stata vista)

In ogni caso ne avevo parlato circa cinque anni fa

Le altre due metriche che generano confusione sono il tempo sulla pagina e il tempo sul sito: il tempo sulla pagina è il tempo trascorso su ogni pagina, calcolato come la differenza tra il momento in cui il sistema sa che stiamo facendo “cose” su una pagina (apertura di pagina, eventi sulla pagina) e il momento in cui è stata aperta la pagina precedente. Inoltre, quando si calcola il tempo sulla pagina, Google Analytics non include le visite che hanno fatto dei rimbalzi, che abbasserebbero drasticamente la media.

Con esempi pratici, sempre presi dal post e corretti per non generare confusione (ipotizziamo non ci siano eventi in questo tracciamento):

Session 1: Page A (30 seconds) > Page B (60 seconds) > Page C > Exit

Session 2: Page A > Exit

Session 3: Page A (20 seconds) > Page B > Exit

– Il tempo medio sulla pagina A è 25 secondi (30+20 diviso 2, perché i bounce non contano).
– Il tempo medio sulla pagina B è 60 secondi (60 diviso 1, perché quando una pagina è l’ultima non si può calcolare il tempo sulla pagina. Diverso sarebbe se ci fossero eventi sulla pagina)
– Il tempo medio sulla pagina C è di 0 secondi.

Il tempo medio sul sito usa lo stesso principio, ma sottrae il momento dell’ultima hit arrivata dal momento della prima hit della sessione. Esso include i bounce, ma tanto quanto prima non può includere il tempo sull’ultima pagina (sempre escludendo gli eventi).
Se prendiamo l’esempio di prima, il tempo medio sul sito è 37 secondi (30+60+20 diviso 3).

Di questo ne abbiamo parlato addirittura nel 2008, accidenti se è anziano questo blog ;)


Jul 17 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo giallo - articolo avanzato

client-ID o CRM-ID?

autore: Marco Cilia categoria: codice di monitoraggio tag: ,

Qualche giorno fa Justin Cutroni ha scritto un bel post sull’integrazione dei dati offline con quelli di traffico online: ve ne consiglio la lettura perché è piuttosto interessante.

Quel che mi ha colpito è stato l’approccio, con cui per una volta non sono d’accordo, e in particolare mi riferisco alla frase “What we need to do is extract the client ID value from the Google Analytics cookies and pass it to your CRM system” (trad: quel che dobbiamo fare è estrarre il client ID da Google Analytics e passarlo al nostro CRM).

Il client ID è l’identificativo univoco che Google Analytics crea di sua spontanea volontà: su GA classico si trova dentro al cookie __utma, su Universal si trova dentro all’unico cookie che viene creato, __ga
Il problema dell’approccio di Justin, è che non risolve affatto il problema del cross-device. Se infatti estraggo il mio clientID da qusto browser, ottengo un valore. Se cambio browser e visito lo stesso sito, ottengo un altro valore. Seguendo il suggerimento del post di Justin, anche se mi identifico (ad esempio loggandomi), il CRM ottiene due valori diversi. Deve salvarli entrambi? deve salvare solo l’ultimo? non si sa.

Se Google Analytics e il CRM si “parlano”, allora ritengo più intelligente fare esattamente l’opposto: usare il CRM-ID per sovrascrivere il clientID di GA. In effetti non lo si sovrascrive, ma ci si “appiccica” sopra. Per farlo si usa una sintassi di questo tipo


ga('create', 'UA-XXXX-Y');
ga('set', '&uid', 'CRM-ID');   
ga('send', 'pageview');

In questo modo il CRM non deve preoccuparsi di registrare un campo nuovo, possiamo usare lo stesso i report cross device, abbiamo direttamente in piattaforma un ID facilmente riconducibile (per il possessore del dato) all’identità dell’utente, che possiamo usare per segmentare, fare remarketing o estrazione di dati.


Jul 03 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo rosso - articolo per esperti

Nuovo debugger interno al TagManager

autore: Marco Cilia categoria: tagmanager tag:

Se usate il Google Tag Manager ad un livello medio/avanzato, immagino che sappiate di cosa parlo quando dico WASP, Observepoint, dataLayer inspector, dataSlayer… sono estensioni di Chrome il cui scopo è (anche) quello di mostrare i valori del dataLayer. questo perché il dataLayer non è statico e immutabile, una volta creato su una pagina, ma può subire modifiche grazie ai push e inoltre contiene anche dei valori che non sono inseriti da noi ma sono propri della sua esistenza, e che a volte tornano utili.

Da ieri gli ingegneri di Google hanno rinnovato – pesantemente rinnovato – la finestra di anteprima delle versioni del contenitore, passando da un anonimo frame con l’elenco dei tag e delle condizioni per cui partivano o meno ad una finestra piena zeppa di informazioni utili a spremere al massimo il dataLayer, sempre con l’intento di lavorare meno far risparmiare tempo e denaro ai clienti ( :P ).
Ecco come si presenta adesso la finestra

GTM-debug-UI

Gli elementi principali del cambiamento sono:

  • nel riquadro verde ci sono i tag che sono partiti. Ogni tag è cliccabile e riporta informazioni sulla sua confogurazione (valori, regole di invio, ecc). Stessa cosa avviene per i tag NON inviati, sotto.
  • nel riquadro blu ci sono gli eventi, in ordine di esecuzione, che vengono sentiti dal TagManager. Oltre che dare un’idea di cosa accade quando, quel riquadro funziona anche da filtro per i tag. Questo significa che se premo “pageview” ottengo la situazione dei tag al momento in cui il TagManager capisce su che pagina si trova, mentre se premo “page load” ottengo la situazione al momento della fine del caricamento della pagina (evento gtm.load), perché potrebbero anche essere cose diverse. Se c’è un push successivo, o un click, il riquadro impila ulteriori “momenti”, anch’essi ispezionabili.
  • il riquadro rosso invece di permette di ispezionare i tag, come abbiamo detto finora, oppure i valori delle macro (molto comodo sapere il valore di ogni macro in qualunque momento, permette di testare velocemente i falsi positivi senza ricorrere ad alert o console.log) oppure il valore complessivo del dataLayer. Il tutto sempre potendo filtrare per momento tramite il riquadro blu. Quindi ad esempio il dataLayer finale al caricamento di una pagina sarà diverso da quello visibile dopo un messaggio conseguente ad un dataLayer push

Trovo che questa visualizzazione sia un balzo gigantesco in avanti nella comprensione, e quindi nel miglior utilizzo, dello strumento da parte degli utenti. Il tipo di controllo che si può attuare è molto accurato e specifico, e in ogni caso si risparmierà tempo durante i setup, con beneficio di tutti. Credo che disinstallerò subito l’estensione dataSlayer :)


Jul 02 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo giallo - articolo avanzato

Data import e query time mode: grosse novità!

autore: Marco Cilia categoria: ga-premium tag: , ,

Durante l’ultimo summit dei partner a San Francisco Google ha annunciato che la funzionalità che prima si chiamava Dimension Widening sarebbe stata rinominata semplicemente Custom Data Import: attraverso di essa si potranno caricare dati di costo o ampliare informazioni presenti in piattaforma. Per i dati di costo è solo un rebranding della funzionalità, mentre per l’ampliamento delle dimensioni c’è una novità importante, ovvero la possibilità di non usare le API e di caricare semplicemente dei file CSV.

Ovviamente le cose non sono così semplici come sembrano a prima vista, come spesso accade per le grosse novità nel prodotto la funzionalità viene prima lanciata e dopo semplificata: se siete interessati vi invito a leggere la documentazione a riguardo, mentre per partecipare alla beta è necessario compilare la domanda usando questo form

Per gli utenti Premium invece c’è un’altra succosissima novità: il cosiddetto Query Time Mode, cioè la possibilità di modificare i dati pregressi. Beh, in verità non è esattamente così, anche se il risultato è praticamente lo stesso: quel che accade è che la funzionalità di data import non modifica perennemente i dati durante il calcolo, ma applica uno “strato” sopra ai dati che vengono visualizzati nel prodotto. Facciamo un esempio pratico, taggo un certo annuncio di campagna usando un solo parametro ?campaignID=12345. Attraverso il Query Time mode carico un file che dice a Google Analytics che campaignID 12345 corrisponde a sorgente A, mezzo B, campagna C e content XYZ. Dentro al sistema vedo questi dati.
A fine campagna mi viene notificato che in realtà la creatività usata era diversa, alla fine l’agenzia ha usato un formato ZZZ. Modifico il file, lo carico nuovamente e voilà: anche i dati pregressi cambiano. Il Query Time mode rappresenta un grosso passo avanti nella “parificazione” dei dati in possesso dell’azienda con i dati di Google Analytics: gli usi sono moltelpici e le possibilità di analisi che apre sono tante.
Purtroppo come detto, per ora la funzionalità è disponibile soltanto agli utenti Premium. chissà che prima o poi non discenda anche sulla free, come già successe per i modelli di attribuzione…


Jun 30 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Ricapitoliamo quel che succede…

autore: Marco Cilia categoria: generale tag: , , , ,

Manco da un po’ di tempo, ma ci tengo lo stesso a darvi un po’ di notizie su cosa è accaduto nel mondo Google Analytics e dintorni nel frattempo :)

Partendo dal blog ufficiale, Premium ottiene le API non campionate; attraverso di esse si possono ottenere informazioni sui report non campionati esistenti, si può creare al volo una richiesta di report non campionato, si può controllare lo stato di avanzamento del calcolo di un report non campionato e infine si può avere il link dal quale scaricare un report non campionato.
La feature è utile perché, come al solito, permette di integrare al di fuori del pannello operazioni che tipicamente possono essere svolte solo da dentro all’interfaccia: nel caso di Premium la cosa è ancora più utile perché non tutte le funzioni aziendali hanno accesso a tutti i report e tutti i dati, e molti si basano sull’uso di API per interrogare solo i KPI di interesse. Se però i KPI di interesse sono fortemente campionati, fino ad ora non c’era altra possibilità che andare sul prodotto e richiedere il report unsampled, mentre adesso anche questa operazione può essere svolta tramite API.

Altra novità recente è la suddivisione semi-automatica tra le keyword di brand e quelle non di brand; il sistema provvede ad estrarre quelle che secondo lui sono le chiavi di brand, ma è ovviamente possibile modificare a piacimento la configurazione. Una volta terminata questa oeprazione Analytics chiederà di poter creare due nuovi canali nel raggruppamento predefinito dei canali: uno per le chiavi di brand e uno per quelle unbranded, che si andranno a sostituire progressivamente al canale di default “Paid Search”. Questa classificazione esiste soltanto per le chiavi a pagamento (non solo per AdWords), mentre per via del fenomeno delle (not provided) non si può applicare (e non avrebbe senso farlo) al traffico organico.

Per quanto riguarda le novità di prodotto vere e proprie, segnalo che per l’ennesima volta è stata rifatta l’interfaccia dei segmenti avanzati, sia nella parte di visualizzazione sia nella parte di creazione.
La nuova visualizzazione dei canali ora si presenta così

Schermata 2014-06-30 alle 23.25.45

se non volete a tutti i costi usare la freccia verso il basso per rimuovere un segmento, vi svelo un trucco: basta trascinarlo ‘via’ :)

L’interfaccia di selezione ora si apre per impostazione predefinita in modalità “verticale”, garantendo finalmente la leggibilità dei segmenti con i nomi più lunghi:

Schermata 2014-06-30 alle 23.28.52

E’ stato introdotto anche un comodo selettore “selezionati”, che provvede a scremare soltanto i segmenti attivi: quante volte volevate togliere un segmento e siete stati costretti a scorrere più volte su e giù il menu perché non li trovavate? :)

Ho notato da qualche giorno che nelle dimensioni secondarie è comparso un raggruppamento “ora”. Sebbene data, ora e ora del giorno siano sempre stati selezionabili, adesso il numero di dimensioni è molto più cospicuo e comprende cose interessanti come ad esempio:

  • giorno del mese
  • giorno della settimana
  • mese dell’anno (03) e mese dell’anno (201403); pessima traduzione di due concetti diversi :-/
  • minuto (001036, inteso come minuto del giorno) e minuto (05, inteso come minuto dell’ora)
  • nome del giorno della settimana
  • settimana ISO dell’anno ISO

e altri ancora. Quando si fanno analisi granulari sono dimensioni che possono tornare MOLTO utili…

infine giovedì e venerdì scorso si è tenuta la prima edizione italiana dell’ Emetrics summit, evento di caratura mondiale dedicato esclusivamente al mondo della misurazione. Oltre ad aver incontrato Jim Sterne, padre fondatore della web analytics e della Digital Analytics Association, e ad aver rivisto molti amici e colleghi, Tommaso Galli ha tenuto uno speech dove tra l’altro ha ribadito con questo video l’importanza di usare un TagManager per la gestione dei tag di marketing. Un po’ quello che cercavo di spiegarvi qualche tempo fa, sotto un’altra ottica… :)


Jun 09 2014

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Credo a quel che mi dice GA? beh, si!

autore: Marco Cilia categoria: generale tag: ,

[Prima di iniziare il post una doverosa premessa: né Google, né nessun altro, mi paga per "difendere" Google Analytics. Questo post è frutto delle opinioni personali di qualcuno che ha un account GA risalente al 14 novembre 2005, e che in quasi nove anni in qualche modo ha testato praticamente tutto il testabile dello strumento, portandolo fin dove ha potuto pur di capirne il funzionamento. Come dice una persona che stimo moltissimo "tu per capire le cose le smonti a pezzettini e le metti in fila, ragionando su come e perché succede una cosa, su quale azione porti quale reazione, poi fai il processo all'inverso e verifichi, ma non per tutti funziona così. Ricordatelo quando le spieghi".
Ecco, in alcuni casi questo tipo di pensiero è utile, e questo credo sia uno di quelli...]

Mi è capitato sotto agli occhi un post di Federico Gasparotto, intitolato “I 10 errori del Digital-Marketing più comuni e come correggerli con i modelli di attribuzione“. E’ un ottimo post, lo dico subito a scanso di equivoci e ve ne consiglio la lettura; tra le altre cose riprende anche un video fatto dall’agenzia dove lavoro, ma questo è incidentale perché mi voglio concentrare sul paragrafo 5:

Errore 5: Credo a quel che mi dice Google Analytics

GA è un buon tool ma molto basico e di sicuro vale molto rispetto a quel che costa…. Va bene per capire se si stanno avendo visite, traffico, picchi, ma non è affidabile sotto a nessun punto di vista, a partire dal campione di rilevazione ( sbagliato concettualmente, non posso rilevare uno ogni tanto li devo rilevare tutti uno per uno), ai criteri di attribuzione della vincita, al metodo di analisi per merceologia praticamente assente e via discorrendo.
Certo è comunque settabile in modo da ovviare a tanti dei limiti endemici, ma nessuno piglia un tool gratuito per poi spenderci un botto su, e a quel punto meglio prendere un analitico come si deve per pochi k l’anno, anche perchè se uno analizza le vendite sulla base di dati imprecisi rischia solo di farsi delle gran pippe mentali.

Smonto e analizzo:

GA è un buon tool ma molto basico”: molto basico rispetto a? se manca il paragone è impossibile determinare la bontà di qualcosa. Rispetto al leader di mercato (secondo Forrester sarebbe Adobe, in un suo recente/a – e stradiscusso – report)? stiamo parlando di un sistema che è installato sul 53% dei siti del campione “The entire internet” di builtwith.com (e su oltre il 20% della top 10k), stiamo parlando di un sistema che ha alcune feature di livello enterprise su una piattaforma gratuita (attribution modeling, tanto per citarne una, cross device report sul vero utente unico, tanto per dirne un’altra recente), stiamo parlando di un sistema scelto da moltissime multinazionali nel mondo.

di sicuro vale molto rispetto a quel che costa“: questo è indubbio, perché è gratis (o quasi), ma l’equazione gratis = scadente su internet non è più vera da un bel pezzo, in alcuni settori. In ogni caso lo strumento mette a disposizione tante di quelle metriche e dimensioni e report, che la maggior parte delle persone nemmeno li conosce tutti. Sebbene io stesso non confonda certo la quantità con la qualità, man mano che passano i mesi mi risulta sempre più difficile trovare un business, un cliente o una situazione in cui Google Analytics abbia difficoltà ad ottenere il risultato sperato

Va bene per capire se si stanno avendo visite, traffico, picchi, ma non è affidabile sotto a nessun punto di vista, a partire dal campione di rilevazione (sbagliato concettualmente, non posso rilevare uno ogni tanto li devo rilevare tutti uno per uno)“: il campione di rilevazione non esiste, nel modo più assoluto. Google Analytics registra TUTTO quello che accade sul tuo sito: registra TUTTE le pagine su cui hai messo il codice (se non l’hai messo su alcune pagine è un problema tuo, non suo: ma ho una buona notizia, la nuova funzionalità di diagnostica automatica in alcuni casi ti avvisa! :) ), registra TUTTI gli eventi che hai impostato di registrare, registra TUTTE le transazioni che vengono fatte, registra TUTTE le pressioni a plugin sociali che hai scelto di registrare. Se visiti 89 pagine, lui registra 89 pagine, pacifico. Esiste un solo caso in cui questo non avviene, ed è se tu scegli volontariamente di non farlo avvenire, cioè se imposti la funzione _setSampleRate

Ipotizzando che invece Federico si riferisca al fenomeno del campionamento, ho spiegato in passato come e perché questo avviene, ma vale la pena di ribadirlo qui: i report standard (e sono oltre 200) non sono MAI campionati. Se il tuo sito in un mese riceve 19.234.599 visite, accadono due cose: la prima è che hai avuto esattamente 19.234.599 visite, la seconda è che stai violando i termini del servizio e in quel caso si che dovresti usare la funzione _setSampleRate per ovviare. Ma i numeri sono giusti, se non applichi segmenti, dimensioni secondarie o custom report. Se invece applichi una delle cose descritte in precedenza, allora il sistema campiona, effettuando i calcoli su un sottoinsieme del traffico e scalando i risultati proporzionalmente. Gli algoritmi per fare questa operazione non sono noti, ma sono prodotti da un’azienda che vive di algoritmi. Ovviamente più il campione diventa basso più – e qui siamo d’accordo – diventa azzardato fare analisi importanti. Ma più il campione diventa basso, più il traffico diventa alto, e in genere più traffico significa più revenue, e quindi la possibilità di acquistare un prodotto di livello superiore è più tangibile. GA free funziona benissimo sui range di traffico per il quale è “licenziato”.

Infine, se proprio vogliamo essere pignoli, esiste un altro limite tecnico di questo tipo: per ogni report di Google Analytics associato a una tabella, vengono visualizzati – per un singolo giorno – i primi 50.000 record (50k url nel report degli url, 50k keyword nel report delle keyword, 50k risoluzioni dello schermo nel report delle risoluzioni dello schermo, e così via…). Questo però è solo un “problema” di storage, a cui nessuno si può sottrarre, nemmeno le piattaforme leader del mercato: taglio corto con due concetti che gli addetti al settore conoscono, sia in generale sia nello specifico: table limits e bucketing.

ai criteri di attribuzione della vincita“: ai criteri di attribuzione della conversione? il modello di attribuzione predefinito su Google Analytics è noto da sempre: si tratta del “last click non direct”. Non vi piace? cliccate su “conversioni – attribuzione – strumento confronto modelli” e ne potete scegliere altri 6: last click puro, last click AdWords, first click, lineare, decadimento temporale, sulla base della posizione. Un click e lo applicate ai dati pregressi. Ve ne serve uno diverso? allora siete tosti e sapete di cosa si parla, ottimo! potete creare un modello personalizzato e applicarlo in real time sui dati già registrati. Non mi sembra male per un sistema “molto basico” no?

al metodo di analisi per merceologia praticamente assente e via discorrendo“: questa non l’ho capita del tutto. Ipotizzando che si riferisca alla scarsità di analisi sui prodotti possibili, convengo con lui che i report E-commerce sono sempre stati limitati nel numero e nelle funzionalità. Le nuove funzioni di segmentazione avanzata e il revamp completo dei report E-commerce però fanno passare il prodotto dalla preistoria al presente (anche leggermente al futuro, unendo le due funzioni e usandole per creare liste di remarketing).

Certo è comunque settabile in modo da ovviare a tanti dei limiti endemici, ma nessuno piglia un tool gratuito per poi spenderci un botto su, e a quel punto meglio prendere un analitico come si deve per pochi k l’anno, anche perchè se uno analizza le vendite sulla base di dati imprecisi rischia solo di farsi delle gran pippe mentali“: TUTTI i sistemi di digital analytics devono essere settati: alcuni perché sennò nemmeno funzionano, altri perché hanno dei limiti, altri ancora per dare il meglio di sé. Addirittura alcune integrazioni che GA ha con pochi click (AdWords, tanto per citarne una, o Dobleclick su Google Analytics Premium) su altri tool richiedono spese ed effort aggiuntive, e non riescono ad arrivare allo stesso livello. L’approccio di Google Analytics è di tipo incrementale: prendi questo codice e mettilo su tutte le pagine, e intanto ti diamo 200 report. Col tempo capirai cosa ti serve, e molte di quelle cose nuove potrai farle anche senza dover averci pensato a priori, prima di mettere il codice, come al contrario avviene in altri casi. La gratuità dello strumento in ogni caso non va confusa con la semplicità nell’uso e manutenzione, per cui un budget in tal senso andrebbe sempre previsto; un budget per un analitico invece andrebbe sempre stanziato a prescindere. Anzi, per rientrare nel caso citato all’inizio del post di Federico, avere una piattaforma gratuita ma potente permette di avere più budget da dedicare all’analisi dei dati e all’estrazione di insight da parte di un analista. E’ anche grazie a questo fatto che il settore è cresciuto, negli ultimi anni.

Sul fatto che nessuno spende un botto guardando i dati di un tool gratuito, dovremmo certamente fasarci sulla definizione di “un botto”, che magari non collima: nel mio piccolo so che sulla base di quei dati si spendono dalle poche decine di migliaia a qualche milione di euro l’anno. Questi investitori evidentemente si fidano dei dati che lo strumento tira fuori, quindi o sono tutti in errore o c’è qualcos’altro che mi sfugge…
Se prendo la Fortune100 di quest’anno, escluso Google al n #1, le compagnie seguenti sono:
#2 SAS: usa Google Analytics, pur producendo un proprio sistema di analytics
#3 BCG: usa GA
#4 Edward Jones: usa GA
#5 Quicken Loans: usa GA, e Adobe mi sembra
#6 Genetech: usa GA
#7 Salesforce: non usa GA
#8 Intuit: usa GA

Prendendo a caso quelli che immagino essere big adv spender internazionali:
Coca Cola: usa GA (sito IT, l’internazionale non riesco a vederlo per il geoip :/ ) e Webtrends
Procter & Gamble: usa GA
General Motors: usa Adobe
Expedia: usa GA
Vodafone: usa GA e Adobe
Ebay: usa GA

In conclusione penso che nessuno di voi dovrebbe fidarsi ciecamente di quel che qualsiasi sistema di digital analytics gli mostra, nessuno! io in nove anni, su questa piattaforma, ho fatto tanti di quegli esperimenti che sono giunto alle mie conclusioni, la maggior parte delle quali potete tranquillamente andare a rileggere su questo blog; voi dovreste fare altrettanto, nei limiti della vostra curiosità e delle vostre capacità, e trarne le opportune conseguenze. Tuttavia dire che GA è un sistema impreciso e inaffidabile, o che rileva solo un dato ogni tanto, rappresenta un’inesattezza. E siccome sono fatto così, mi piace mettere ordine nelle cose, la smonto attraverso quel che ho imparato.