Jul 15 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

L’unico sensato – ma ancora da venire – modo di bloccare i ghost referrals

autore: Marco Cilia categoria: generale tag: , , ,

Questo post è il complementare dello scorso “L’unico vero – ma insensato – modo per bloccare i ghost referrals” e ne riprende naturalmente il titolo :)

Si diceva che se Google dovesse fare un sistema di blocco preventivo dei ghost referrals dovrebbe studiare un sistema simile a quello descritto nel post, almeno a detta del sottoscritto. Si diceva nei commenti che forse un altro modo potrebbe essere un “segnala come spam” simile a quello di Gmail, ma che la cosa potrebbe avere problemi di workflow di approvazione.

Com’è, come non è, oggi thesempost.com ci informa che Adam Singer, Analytics advocate a Google, ha detto chiaramente durante il Mozcon che Google sta lavorando per risolvere il problema alla radice. Non ci sarà quindi da rivolgersi a terze parti ma soprattutto Singer – secondo l’articolo – ha detto che Google sta lavorando al problema in modo che la soluzione sia scalabile, ovvero che possa risolvere il problema adesso e per sempre, anche se gli spammer cambiassero i loro pattern di invio dei dati fasulli. Sembrerebbe quindi un qualcosa più simile ai filtri antispam di Gmail, ma ovviamente senza prima vederlo in azione non possiamo sbilanciarci troppo.

La creazione di un sistema definitivo spiegherebbe anche la relativa latitanza da parte di Google negli ultimi mesi durante i quali il problema è balzato alle cronache. Meglio tardi che mai, no? :)


Jun 30 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo rosso - articolo per esperti

L’unico vero – ma insensato – modo per bloccare i ghost referrals

autore: Marco Cilia categoria: codice di monitoraggio tag: , , ,

Sul fenomeno dei cosiddetti ghost referrals hanno scritto più o meno tutti, ma come direbbe il buon Corrado Guzzanti interpretando uno dei suoi personaggi più riusciti (Quelo) “la risposta che cerchi è dentro di te. Solo che è SBAGLIATA!” :)

I ghost referrals sono delle visite che vengono registrate dai vostri Google Analytics, ma che non sono originate da veri e propri visitatori sul vostro sito. “sono bot?” no, non sono nemmeno bot, o meglio non nel senso classico con cui siamo abituati a pensare a un agente automatico che NAVIGA il sito. La gente ha difficoltà a comprendere ciò che non riesce a visualizzare, e in questo caso ciò che non riesce a visualizzare è che da qualche tempo si possono inviare dati a Google Analytics anche SENZA l’ausilio del tipico codice javascript, attraverso una cosa chiamata Measurement Protocol.

Intendiamoci, è una cosa che si è sempre potuta fare, bastava copiarsi una richiesta HTTP dell’immagine _utm.gif che veniva usata – prima di Universal Analytics – per inviare i dati ai server Google e che conteneva nei parametri tutte le informazioni necessarie al calcolo delle visite. Con il measurement protocol la cosa è stata standardizzata e ufficializzata, dando peraltro l’avvio a tutta una serie di nuove possibilità di tracking veramente incredibili (tracciare la macchinetta del caffé?)
Quello che accade è che un qualche server da qualche parte del mondo viene istruito per comporre ed effettuare centinaia di chiamate fasulle a tutte le property del mondo. Che sia un fenomeno distribuito e completamente automatizzato se ne è accorto il mio amico Enrico Pavan creando una property di un sito inesistente che ha iniziato a tracciare visite da ghost referrer, ed è confermata da alcune opinioni secondo cui le property che terminano con numeri diversi da 1 (tipo UA-XXXXXXXX-2 e oltre) non sono soggette al problema. Ora, perché non potete semplicemente fare un filtro? perché gli spammer vincono sempre, sono troppi e fanno grossi danni con poco sforzo: voi passate 3 ore a configurare 80 filtri? domani qualche spammer cambierà una lettera nel pattern delle informazioni che invia e passerà i filtri. Quindi, tanto per essere chiari:

  • potete usare la “lista esclusione referral” che trovate nella configurazione della property? no, per il motivo sopra ma SOPRATTUTTO perché essa serve a trasformare in dirette (e quindi a non sovrascrivere la sorgente di traffico) le visite da alcuni domini. Quindi peggiorereste il problema
  • potete filtrare uno a uno i domini referrer? se proprio volete farlo, il buon vecchio Simo Ahava ha creato un tool per voi, lo spam insertion tool che vi evita gran parte del lavoro. Ma tanto poi lo dovrete mantenere nel tempo…
  • potete fare un filtro di inclusione che includa solo le visite al vostro dominio/hostname? tra tutte le alternative è forse quella che può mitigare meglio il problema, ma poiché anche l’hostname può essere inviato come parametro del measurement protocol, alcuni spammer particolarmente ostinati potrebbero aggiungere della logica per controllare l’UA su ogni host e bypassare il problema

e quindi? quindi l’unica soluzione secondo me valida dal punto di vista tecnico, ancorché completamente insensata, l’ho letta sul blog di Himanshu Sharma, Optimizesmart e consiste in un complicato metodo di codifica/decodifica di tutte le hit inviate. Per la precisione:

  1. Si decide una stringa di sicurezza, ad esempio “dhffjsrr12353fdf4253kc“, per mantenere il suo esempio
  2. Si antepone la stringa di sicurezza a tutte le chiamate a GA. Per farlo si modifica il codice di GA ad esempio così
    ga('send', 'pageview','dhffjsrr12353fdf4253kc' + location.pathname); o si usa un TagManager. ATTENZIONE che l’esempio riportato tronca tutte le query interne, quindi ad esempio la pagina /ricerca.html?key=asd viene tracciata solo come /ricerca.html. Dovrete ingegnarvi con un po’ di javascript per gestire tutti i casi.
  3. Si crea un filtro di inclusione di tipo custom con “includi – URI della richiesta – corrisponde a espressione regolare – ^/dhffjsrr12353fdf4253kc
  4. Si crea un filtro cerca e sostituisci per evitare di avere nei report degli URL orrendi. quindi filtro custom – cerca e sostituisci – URI della richiesta – cerca ^/dhffjsrr12353fdf4253kc/ – sostituisci con /. Nell’ordine dei filtri questo deve stare sotto al precedente, altrimenti non funziona nulla

Come vedete è una soluzione radicale, che va aggiustata e testata per bene prima di essere portata in produzione, e che a me sinceramente fa anche abbastanza orrore, concettualmente, perché costringe tutti a un lavoro grande e potenzialmente pericoloso per i dati. Ma è anche vero che se dovessi pensare a un metodo radicale per Google di evitare a tutti noi i ghost referrals senza uccidere il measurement protocol non mi viene in mente qualcosa di tanto diverso. Magari la chiave di sicurezza potrebbe essere generata direttamente da GA, e così il filtro di inclusione e replace, e il codice di monitoraggio potrebbe già essere fornito funzionante, ma la sostanza del problema non cambia di molto.


Jun 25 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Lavora sempre al meglio. E possibilmente migliora ancora!

autore: Marco Cilia categoria: generale

bandiera grecaSono appena tornato da dieci giorni di vacanza in Grecia, posti magnifici, cibo ottimo, relax, mare e cultura.
Perché ve ne parlo qui? perché c’entrano Google Analytics e il digital marketing. Seguitemi:

Appena esaurita la prima carica del MacBook Air estraggo l’alimentatore solo per scoprire con orrore che il mio cavo terminale finisce con una spina a tre denti (tipo L italiana, con messa a terra) mentre in Grecia usano prese con Europlug (due fori) o comunque Schucko. Figure su Wikipedia.
Chiedo al ragazzo dell’hotel in cui alloggio se ha un adattatore, e me ne procura uno, ma il Mac non si ricarica. “Che computer hai?” mi dice. “MacBook Air” rispondo. “Gimme five! anche io. Ti presto il mio alimentatore”.
Ovviamente lui aveva il modello vecchio (connettore MagSafe) e io quello nuovo (MagSafe 2 – grazie Apple!) quindi al mattino sono punto e a capo, col computer morto. “Ti presto il mio, che lavoro fai?” “mi occupo di digital marketing” “fantastico! sai che ho appena rifatto il sito? magari puoi darmi qualche consiglio!”. Mi sembra ovviamente il minimo, data la sua estrema gentilezza, e quindi iniziamo a parlare dopo che gli ho precisato che in particolare mi occupo di Digital Analytics.

“ah si! ho Google Analytics, te lo faccio vedere, dimmi se secondo te è a posto, perché io ho dei dubbi”. E inizia a mostrarmi il pannello spiegandomi i problemi: i dati del sito vecchio non ce li ha più, gli hanno fatto aprire un account nuovo “perché era meglio” (in realtà la vecchia agenzia lo ha tagliato fuori dai vecchi dati). Il sito ha un booking engine esterno, niente cross domain tracking. Il profilo non ha nemmeno un goal configurato, gli dico che almeno almeno dovrebbe avere la thankyou post prenotazione e l’invio della form dei contatti.
“ma questa Agenzia è partner certificato?” gli chiedo; non perché questo sia una garanzia assoluta, ma insomma un minimo… “si si” mi assicura, eppure io sull’elenco dei partner non la trovo. “guarda la firma nelle mail”, che ovviamente riporta il logo Google Analytics Qualified Individual.

Insomma, dopo due in ogni caso piacevoli sessioni da mezz’ora (si, perché anche dopo aver switchato i cavi terminali non andava – alla fine era proprio morto l’alimentatore) sono costretto a sentenziare “mi dispiace, cambia agenzia. In questo campo non mi sembrano proprio a loro agio”. La morale che ne ho tratto è questa: lavora sempre al meglio delle tue possibilità, non approfittarti di nessuno, non mentire, ammetti i tuoi limiti, non fare (male) cose che non sai fare bene. Sii onesto e cerca sempre sempre di migliorare, perché anche se lavori per il cliente microscopico nel più remoto angolo del paese, prima o poi alla lunga i nodi vengono sempre al pettine :)


Jun 14 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

TagManager vendor template

autore: Marco Cilia categoria: tagmanager tag: ,

Uno dei due ingegneri a capo del Google Tag Manager – Brian Kuhn – ha da poco annunciato una novità molto importante: il prodotto ora introduce uno standard aperto per la creazione dei template dei tag, e soprattutto demanda ai singoli vendor la loro creazione tramite un processo di iscrizione – submit, testing&verifica e approvazione: il tag template program.

Se avete mai fatto delle installazioni un po’ corpose avrete usato quasi sicuramente tag di Analytics e AdWords: per essi ci sono dei comodissimi template che rendono il lavoro veloce, facile e praticamente a prova di errore. Se avete aggiunto dei tag diversi (Criteo fino a qualche tempo fa, ma anche solo un conversion pixel di Facebook al quale passare la revenue di un acquisto) avrete dovuto giocare con i tag HTML custom, con il rischio di perdere tempo nel capire come mai il tag non funzionava o peggio il contenitore non validava. Una volta ho perso più di mezz’ora su un tag HTML custom perché mancava un apostrofo su migliaia di caratteri.

Questo da ora in poi potrebbe ridursi, perché ogni strumento di marketing che richiede tag ha la possibilità di iscriversi al programma e di creare in autonomia i suoi template, che dopo essere stati validati da Google saranno resi disponibili agli utenti di tutto il mondo. La prima infornata di questi nuovi tag comprende:

  • Affiliate Window
  • Ve Interactive
  • Neustar
  • Eularian
  • Mouseflow
  • Nudge
  • SearchForce
  • TradeDoubler
  • Google Consumer Surveys

Il Tag Manager vuole diventare uno strumento sempre più facile da gestire e alla portata di tutti, e questa mossa sono certo che vada nella direzione giusta


Jun 06 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Perché non parlo della cookielaw?

autore: Marco Cilia categoria: cookie tag:

Vi sarete accorti che non ho scritto nulla sulla cosiddetta cookielaw, e per chi mi segue sui social network, che mi sono tenuto a distanza da quasi tutte le conversazioni. E’ stata una scelta deliberata, quando ho capito mesi fa che le cose non sarebbero andate affatto lisce come qualcuno sperava. Qualcuno si aspettava un post almeno a proposito dei cookie di Analytics, ma nemmeno su quelli ci sono certezze.

Per lavoro, so di questa norma da più di un anno, quando ancora era in discussione. Io e l’azienda dove lavoro abbiamo tentato di fornire materiale e risposte per provare a chiarire i punti critici del provvedimento quando ancora non era una legge. Nonostante tutto, è uscita come tutti la conosciamo. La prima cosa che ho capito quando abbiamo iniziato a lavorarci è stata questa: l’interpretazione legale è imprescindibile, e quindi qualsiasi cosa avessi detto o scritto, sarebbe stata sbagliata, semplicemente perché – ed è assurdo, me ne rendo conto – ognuno in quella norma ci legge cose diverse.

Ho finora lavorato con 4 legali diversi, e non c’è una installazione uguale ad un’altra. Ho letto i post di molte persone sui social e sui blog, e ognuno dice tante cose giuste e tante cose enormemente sbagliate, ma poiché tutto si basa su interpretazione, hanno ragione tutti.

Il più grande demerito di questa legge è quello di aver trasformato per sempre i concetti alla base dei cookie. Una cosa universalmente nota (oserei dire binaria) come “cookie di prima parte e cookie di terza parte” (cookie salvati nello stesso dominio che si visita = prima parte, salvati su altri domini = terza parte), un concetto cristallino e inoppugnabile, è diventato un problema insormontabile una volta trasformato in legalese “cookie DELLA prima parte e cookie DELLA terza parte” (cookie creati dal gestore del sito o creati da “altri”): i casi si moltiplicano e si complicano, perché ad esempio un “pezzo di sito” fatto e hostato da un partner diverso dal gestore è una terza parte? quindi i loro cookie tecnici sono di terza parte? e se quel pezzo di sito c’è un pulsante di Facebook, è una terza parte che crea cookie su una terza parte? se invece vale “chi ha deciso di mettere quel pulsante” e sto usando un template già pronto? insomma le complicazioni di questo modo di chiamare le cose sono infinite.

Fine della digressione e del rant, non credo ci saranno ulteriori update in materia su queste pagine.


May 15 2015

Come NON configurare i goal

autore: Marco Cilia categoria: codice di monitoraggio,report tag: , ,

L’altro giorno mi sono imbattuto per l’ennesima volta in uno dei drammi peggiori del web analyst: un sito con un tasso di conversione del 264%. Ovvio, se fosse un ecommerce e tutto fosse perfetto ci sarebbe da stappare lo champagne, ma ovviamente nel 99,9% dei casi si tratta solo di grossolani errori di concetto. Per cui ho pensato che valesse la pena di fare un elenco più o meno esaustivo di cosa NON ANDREBBE fatto su un Analytics e di come eventualmente rimediare gli stessi dati senza distruggere le coronarie dell’analista :)

– non dovreste usare i tipi di goal pagine/visita e tempo sul sito
O almeno, non dovreste usarli impostando metriche molto basse. Questi tipi di goal sono stati introdotti pensando principalmente a siti di contenuto senza obiettivi precisi di lead generation, vendita, eccetera, per dare modo anche a loro di avere un conversion rate. Se però li impostate su “visite che durano più di 30 secondi” o peggio ancora “visite con più di una pagina vista” capite bene che le numeriche spesso sono altissime.
Cosa usare in alternativa:
Con dei segmenti impostati sulle stesse condizioni. In alcuni casi, a seconda della vostra configurazione, un goal “visite con più di due pagine” equivale esattamente al segmento predefinito “visite senza bounce”.

– non dovreste fare dei goal per chi aggiunge item al carrello
Di norma il goal è che le persone comprino, non che aggiungano cose senza comprarle. Diciamo che su questo potrei soprassedere, ma se avete numeriche importanti in tal senso alzate il conversion rate senza motivo. Un semplice evento è più che sufficiente, non disturba il conversion rate e consente comunque di segmentare, nel caso vogliate fare una lista di remarketing di coloro che hanno aggiunto item
Cosa usare in alternativa:
l’Enhanced Ecommerce ha una funzione pensata apposta per questo: un click, una chiamata a GA e va tutto nel report corretto.

– non dovreste fare goal per passaggi intermedi di navigazione
C’è chi configura come goal la visione di una scheda prodotto, e magari ci aggiunge un funnel per chi parte dalla homepage. Questo secondo me è il male (e infatti su Premium c’è addirittura la canalizzazione personalizzata, per ovviare). Un goal è sempre per un evento conclusivo di conversione.
Cosa usare in alternativa:
Dei semplici segmenti sequenza vanno più che bene

– non dovreste fare goal uguali con funnel diversi
Alcune volte mi capita di guardare degli account con dei goal configurati uguali ma con canalizzazioni diverse. E spesso la domanda conseguente è “perché segnano lo stesso conversion rate?”. Beh, perché i goal sono una cosa, la canalizzazione è un’altra. O per essere più precisi, NIENTE di quel che mettete nei passaggi della canalizzazione influisce sul conteggio dei goal.
Se faccio un goal+funnel così

A -> B -> thankyou

e un altro così

X -> Y -> thankyou

molti si aspettano che quando l’utente arriva sulla thankyou passando per A e poi B solo il primo goal venga valorizzato, ma non è così. Entrambi segnano un goal (conversion rate del 200%), il primo con la canalizzazione corretta, il secondo con ingresso dritto sulla thankyou.
Cosa usare in alternativa:
regular expression per specificare i passaggi del funnel. A|X -> B|Y -> thankyou
oppure anche qui segmenti sequenza.

Vi ci ritrovate?


Apr 26 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Dovrei passare al TagManager V2?

autore: Marco Cilia categoria: tagmanager tag:

Da qualche settimana ormai Google ha reso possibile la migrazione alla nuova interfaccia di gestione del TagManager, raggiungibile dall’indirizzo tagmanager.google.com. In precedenza la creazione di un account su quell’indirizzo permetteva di usare la nuova interfaccia, ma la cosa valeva solo per i nuovi account: cliccando su un container in versione “v1″ si veniva riportati all’interfaccia precedente.
La cosa era aggirabile al prezzo di esportare completamente il contenitore e reimportarlo nella V2, ma questo costringeva a cambiare l’ID del contenitore sul sito, e quindi a ritaggare almeno in parte le pagine.
La procedura di migrazione, attualmente completamente volontaria, invece permette di trasferire un account (e non un singolo contenitore) dalla vecchia alla nuova interfaccia, e la domanda è: “mi conviene farlo, o posso aspettare che Google migri tutto automaticamente per tutti, a inizio Giugno?”

Beh, la risposta è che la nuova interfaccia cambia in po’ di cose, e il passaggio non è del tutto indolore: è necessario un po’ di tempo e ci vuole un po’ di pratica prima di capire bene come funziona il tutto: la differenza più grande è che ad esempio le Regole si chiamano Attivatori, e sono integrati all’interno dei tag: durante la creazione di un tag si devono fornire sia le informazioni su cosa faccia attivare il tag, sia le informazioni su quanto il tag debba essere attivo (per i clic listener, ad esempio).

Insomma il mio consiglio è quello di andare sulla nuova interfaccia e creare un account di test, fare delle prove e procedere alla migrazione prima dello switch forzato: in questo modo si potranno fare dei piccoli miglioramenti che saranno necessari perché la migrazione per mantenere la compatibilità non effettua uno switch “pulito”. Intendo dire che la situazione che si trova dopo la migrazione, soprattutto per i contenitori più complessi, non è esattamente quella che si avrebbe creando la stessa struttura da zero sulla V2; ovviamente il funzionamento sarà lo stesso, ma sicuramente il tutto sarà migliorabile. Sapere per tempo cosa toccare farà sicuramente risparmiare fatica.


Apr 08 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

La malattia per i dati

autore: Marco Cilia categoria: generale tag: ,

Sogno di scrivere questo post da tantissimo tempo. Un post in cui provo a indagare le pieghe più recondite della mente di una persona che vive per i numeri, tipo me. So già che è un po’ mettersi alla berlina, perché effettivamente molte cose se le leggi da fuori sono ridicole, ma so anche che vale sicuramente la pena di spiegare per bene da dove nasca – e magari perché – un amore che si è poi trasformato in un lavoro.

Non mi ricordo esattamente quando la passione per i numeri sia cominciata, ma sicuramente è iniziata prima dell’avvento dei computer; quindi non è legata all’informatica in senso stretto. Ricordo benissimo che a scuola preferivo le materie scientifiche: dentro di me sapevo benissimo che esisteva una e una sola risposta alle domande scientifiche/matematiche, e azzeccarla significava fare bene. Azzeccarle tutte significava massimo dei voti, e io ci tenevo a fare bene. Alle domande di lettere invece dovevi improvvisare un po’, perché la risposta magari era una, ma le sfaccettature erano troppe: magari la prof si era laureata studiando Dante per una vita? allora la tua risposta era probabilmente ok, ma lei avrebbe detto qualcosa in più. Oppure ancora, le materie letterarie erano il terreno perfetto per far soffrire gli studenti invisi ai professori. Ti faccio una domanda cattiva, pretendo una risposta articolata, più articolata, con più sfaccettature, ti metto un brutto voto lo stesso.

Ricordo invece molto chiaramente che una volta un professore di Matematica in prima superiore stava scrivendo una roba piuttosto complicata alla lavagna. Lui era veramente terribile, temuto da tutti e i brutti voti fioccavano ogni giorno. Fatto sta che, non so nemmeno perché, io stavo parlando col mio vicino di banco e ad un tratto lui tuonò “Cilia!, ora vieni e la risolvi tu”.
Non lo so come feci, ma alla fine scrissi un 2 molto grande (lui nemmeno guardava) e timidamente dissi “fatto!” immaginando che quella sera avrei dovuto prodigarmi in innumerevoli spiegazioni con i miei genitori. E invece lui laconico disse “Vedete? l’ho chiamato con il chiaro intento di mettergli un brutto voto, ma è giusta. E’ giusta, maledizione! Vatti a sedere!”
(A proposito, alle superiori ero a ragioneria, anche questo un po’ è sintomatico, no? 😀 )

Dopo il diploma scelsi Ingegneria informatica, ma non ce l’avrei mai fatta e infatti durai solo un anno. Ironia della sorte, mi mancavano completamente le basi di matematica che mi avrebbero permesso di non soffrire (troppo) Analisi I, Fisica I, Matematica I, ecc. Avevo comunque scoperto internet e deciso che volevo lavorare nei computer, e possibilmente con i numeri. Il mio primo lavoro vero, guarda caso, era la gestione del centro di elaborazione dati della ruota di Genova, per conto di Lottomatica. Numeri non ce n’erano tanti, a parte quelli che estraevano, ma computer si. Sintomatico anche quello, direi, tra tutte le possibilità che c’erano.

In ogni caso dopo varie avventure sono finalmente approdato su Google Analytics, su questo blog e sul lavoro che attualmente svolgo, interamente legato ai numeri. Nel frattempo la “malattia” per tutto quello che è dato/numero/statistica non si è affievolita, ma anzi si è rafforzata e contamina praticamente ogni aspetto della mia vita. Di qualsiasi cosa si stia parlando, state certi che una parte del cervello lavora per estrarre numeri, collegamenti, occorrenze, date. Quando non lo faccio inconsciamente, è perché allora lo faccio di proposito, ed ecco un elenco abbastanza esaustivo. Parte dell’elenco non esisterebbe senza un altro fattore tipica dei “malati”: la costanza maniacale nel dedicare tempo a fare data input e controllare la data quality. Ad esempio:

Biglietti del cinema
Colleziono (fisicamente) i biglietti del cinema da quando ci vado con gli amici (Batman, ottobre 1989). Su ognuno c’è scritto il cinema, il film, la data (una volta mica li stampavano dal computer 😉 ) e sul retro i nomi delle persone con cui ero. Una volta avevo provato a trasportarli su Excel, ma non trovavo un modo sensato di rappresentare i dati e lasciai perdere. Oggi ne uscirebbero delle infografiche mica male, ad esempio:
– con quale frequenza vado al cinema, e come essa è cambiata prima e dopo la nascita di mia figlia?
– con quale persona ho visto più film di fantascienza insieme? e film di azione?
– bubble chart combinata delle info sopra, con evoluzione nel tempo
– numero medio di amici per film, diviso per genere o per anno
– rating medio IMDB dei film visti, segmentati per genere, per amico o per sala (per capire se ad esempio un certo cinema è solito proiettare film migliori)

Fitbit
Sono un utente Fitbit da marzo 2014. Prima con un Fitbit Flex, ora con un Charge HR. Attraverso di essi ho il numero di passi al giorno/settimana/mese, la distanza percorsa, le calorie bruciate, i minuti di attività intensa, la durata e la qualità del sonno. Da quando ho il Charge HR anche il battito cardiaco e il numero di piani (equivalenti) saliti.
Avendo anche la bilancia Fitbit Aria, ho anche il peso registrato automaticamente.
Cosa me ne faccio e quali insight mi offre?
Di norma bisognerebbe fare 10.000 passi al giorno, ma poiché alcuni giorni lavoro da casa non ci vado nemmeno lontanamente vicino. Questo mi sprona, per quanto possibile, a recuperare quando posso andando a piedi nei tragitti ove è possibile. Un conto è immaginare che genericamente “mi muovo poco”, un altro è vedere un grafico terribilmente basso o la tua posizione in una classifica di amici che invece escono di casa tutti i giorni. Monitorare il peso, è banale, mi aiuta a regolare l’assunzione di cibo, ma in particolare mi interessa la % di massa grassa e magra. Ok, non è una vera e propria plicometria, ma come dato generico è sufficiente se integrato ad altri dati che ottengo.

FitBit-sonno

Il grafico della qualità del sonno è utile per capire come mai certi giorni finisci il carburante a metà giornata, mentre altri dati sono ovviamente più banali (indovina? in ferie dormo di più! 😀 ).

MyFitnessPal
Su MyFitnessPal inserisco la lista dei cibi che assumo. Sono iscritto da luglio 2013 e attualmente ho uno streak (giorni consecutivi di accesso al servizio) di 358 giorni

MyFitnessPal

Quali insight mi offre?
Sostanzialmente controllo la quantità di calorie assunte ogni giorno, solo ogni tanto anche la percentuale di carboidrati, grassi e proteine settimanali. Essendo sincronizzato a FitBit, più cammino e faccio attività più calorie posso assumere. Ma siccome un giro in bici di due ore è diverso se fatto in piano o in montagna, ecco che il numero esatto aiuta più di un generico “ho fatto attività, mangio di più per recuperare”. Oppure, al contrario, sapere esattamente di quanto hai esagerato un giorno di festa, mi aiuta a riequilibrare nella settimana successiva, con calma.

Runtastic Mountain Bike
Il terzo pilastro dei miei dati relativi al corpo è Runtastic Mountain Bike, una delle app più famose per il monitoraggio delle attività legate alla bici in montagna. Devo solo ricordarmi di indossare la fascia cardio e accendere il pulsante prima di partire :)
Cosa me ne faccio e quali insight mi offre?
Distanza per giro, mese, anno e totale. Frequenza di allenamento. Tempo di percorrenza, tempo medio, min e max per km, dislivello e battito cardiaco (anche su mappa geografica). Percentuale di tempo (o distanza) in salita, piano e discesa.
Se faccio un giro che ho già fatto in passato, allora confronto i dati per vedere se ho migliorato in qualcosa (non sempre è il tempo, magari mi basta avere un battito cardiaco minore nello stesso percorso, o un tempo minore in un particolare punto del giro).
Il tutto è di nuovo collegato a MyFitnessPal, in modo che le calorie bruciate vengano aggiunte a quelle assumibili nel giorno.

Assenze
In uno dei posti dove ho lavorato in vita mia c’era un tizio con la nomea di essere uno “poco presente”. Come al solito un conto è dirlo, un altro è avere un numero in mano e quindi con molta pazienza io e un paio di colleghi abbiamo popolato per un anno solare un Google Drive condiviso, il key learning era abbastanza scontato (andava solo verificato), così come il KPI da usare.

assenze

Purtroppo essendo un dato ad “uso interno” non poteva essere actionable, però concorderete con me che messa così (lavori solo 4 giorni alla settimana) fa un altro effetto, no? 😀

Automedicazione e topini
Sempre correlato a Google Drive, c’è stato un periodo della mia vita in cui ho sofferto di disturbi di stomaco. Mi svegliavo di notte con dolori, soffrivo un po’ e poi passavano. Non trovando conforto nelle spiegazioni mediche, ho pensato che in questo caso forse correlation e causation andassero di pari passo, e quindi presi a compilare un Gsheet con il contenuto delle cene e dei pranzi dei giorni precedenti ogni evento. Non raggiunsi mai una soglia statistica decente, ma siccome il problema rientrò da solo non me ne feci mai un cruccio :)

Allo stesso modo, siccome i miei due gatti (Brin & Page) sono dei trovatelli di campagna, amano portare in casa le loro prede più strane. Avevo iniziato a popolare un Gsheet con data e tipo del “riporto”, per provare ad avere una base statistica di un certo tipo nella stagionalità successiva. “Siccome entriamo in marzo, è più facile che portino orbettini a pezzetti. Ad Aprile topini di campagna o mantidi religiose”. Volevo preparare meglio moglie, figlia ed eventuali ospiti, ma quando sforo troppo nel ridicolo me ne rendo conto da solo, e ho lasciato perdere 😀

NetAtmo
Ho rimpiazzato il mio vecchio termostato con un NetAtmo controllato via WiFi. A parte l’indubbio vantaggio di poterlo controllare anche da fuori casa (tornare a casa e trovare sempre caldo, a prescindere dalla programmazione, è un toccasana credetemi), lui tira fuori delle statistiche niente male.
Cosa me ne faccio e quali insight mi offre?
Temperatura programmata, temperatura effettiva, percentuale di accensione della caldaia. Sembra poco, ma in realtà è molto complesso: il termostato conosce la sua posizione geografica ed elevazione (va puntato su una mappa), quindi è in grado di conoscere le previsioni e le temperature: se io dico che alle 7 del mattino voglio 20 gradi, è diverso se fuori ce ne sono 18 o se ce ne sono 2. Nel secondo caso la caldaia deve accendersi MOLTO prima, e da lì poter controllare il tempo di accensione totale è importante se si vuole controllare la bolletta in modo efficace.

netatmo-station

L’insight in questo caso è utile a risparmiare sulla bolletta del gas. Inoltre NetAtmo ha un sistema di conteggio automatico che il primo del mese manda email come questa

netatmo-mail

In realtà la temperatura esterna non la scarica più da internet (linea azzurra nella figura sopra), perché ho abbinato anche la Stazione Barometrica WiFi: lei comunica al termostato l’esatta temperatura fuori da casa mia, non quella generica di un sito di previsioni qualunque. Ovviamente anche lei produce una quantità di dati niente male: oltre ai dati esterni (temperatura, umidità, temperatura percepita) ha anche un modulo interno che misura temperatura, umidità, pressione in casa, più qualità dell’aria (CO2 in ppm) e rumorosità in decibel: quando c’è una festa di bambini e dico che fanno troppo rumore, ho il dato in mano! 😉

Prima di tutta questa automazione la produzione di dati relativi all’energia era basata su un file Excel con il conteggio dei consumi di Luce e Gas, con Kw/ora e metri cubi al giorno. Veramente arcaico, no?

MoneyTrackin
Un malato di dati e per lo più genovese come me, secondo voi, poteva non avere un repository di flussi monetari? Ho scelto moneytrackin perché è abbastanza flessibile senza essere troppo complesso come un MS Money, e inoltre essendo online puoi aggiornarlo anche mentre sei in giro.
Cosa me ne faccio e quali insight mi offre?
Abbastanza ovvio, tengo d’occhio le finanze di casa, mi assicuro che le spese non superino le entrate, cerco di fare il forecast delle uscite e il planning degli acquisti. In periodi di ristrettezze (tipicamente per spese extra non preventivate) posso ragionevolmente capire dove c’è margine per recuperare e dove invece no.

Google Dashboard, Google location history e search history
Non ho mai fatto opt-out da Google Search History. Mi serve più che altro perché a volte ti ricordi più facilmente la query con cui hai trovato qualcosa piuttosto che il sito che poi hai trovato. Comunque sia, contiene un sacco di informazioni interessanti, ad esempio che il giorno in cui cerco di più è il mercoledì, e il mese è Gennaio.
Location History lo uso molto poco, ma mi piace ogni tanto vedere dove sono stato in tutto un mese. Il migliore dei tre è sicuramente Google Dashboard che ogni tanto guardo per capire quante migliaia di mail ricevo e invio ogni mese

Assunzioni
Da quanto lavoro in InTarget, tengo un grafico dell’organico che compone l’azienda.
Cosa me ne faccio e quali insight mi offre?
Senso di orgoglio, prima di tutto e in massima parte. Più che altro è un draft da completare con altri dati incrociabili che permetterebbe di estrarre informazioni utili che però sono tutte ad uso interno. Vi mostro solo una delle tante visualizzazioni create

Schermata 2015-04-08 alle 21.02.40

OK, io direi che a questo punto mi sono esposto abbastanza: ma siccome se leggi questo blog almeno un po’ malato di dati lo sei anche tu, perché non mi racconti nei commenti che rapporto hai tu con i numeri? :)


Apr 06 2015

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Piccole ovvietà che vi cambiano la vita

autore: Marco Cilia categoria: generale tag:

A volte anche un post di poche righe, scritto sul blog ufficiale, può farci gioire tanto. Ad esempio l’ultimo, di una settimana fa, in cui si annuncia una cosa tanto piccola e banale quanto dirompente: la pagina delle Release Notes ufficiali di Google Analytics!

Le Release Notes sono la lista dei cambiamenti introdotti nello strumento, ordinate per data. Quante volte gli annunci sono stati fatti sul blog ufficiale, o sulla pagina Google+ del team di GA, oppure semplicemente NON sono stati fatti, lasciando che le persone scrivessero le loro impressioni su nuove feature apparse in Google Analytics? troppe, esatto, per questo motivo accolgo con gioia anche io l’arrivo di una pagina nella quale le novità sono elencate ufficialmente.

Mettetela nei bookmark! :)


Mar 18 2015

Caso d’uso reale dei segmenti sequenza

autore: Marco Cilia categoria: generale tag: ,

Un altro brillante caso risolto grazie alla segmentazione avanzata, Watson!

Business Problem:
Dopo la migrazione a Universal Analytics, quasi tutta la revenue viene attribuita al referral sella.it (o in generale al vostro/i gateway di pagamento). Questo è chiaramente impossibile perché:
a) prima della migrazione non era così
b) ha pochissimo senso

Technical explanation:
Qualcuno si è dimenticato di inserire il dominio sella.it nella lista di esclusione dei referral, che su Universal Analytics è requisito necessario al funzionamento. NORMALMENTE essa contiene il dominio stesso del tracking – o i domini in caso di tracciamento multidominio – ma se il funnel di acquisto esce dal sito e ci rientra con un link o un redirect ALLORA dovreste inserire anche il gateway. Questo perché a differenza di Analytics classico, Universal Analytics crea SEMPRE una nuova sessione quando si arriva da un referrer, ANCHE se siamo all’interno dei 30 minuti in cui normalmente questo non avveniva su GA classico

Business Request:
“d’accordo, ma io voglio sapere le reali sorgenti delle transazioni che sono state attribuite male prima della correzione”

L’intuizione:
Tutti coloro che escono dal sito verso il gateway, poi ci rientrano e convertono all’istante (convertono direttamente sulla thankyoupage). In questa esatta sequenza, e senza niente altro nel mezzo.

Svolgimento:
Creiamo tanti diversi segmenti avanzati di tipo SEQUENZA, uno per ogni sorgente o mezzo da analizzare, con queste regole (esempio per riattribuire il cpc):

segmento-sequenza-cpc-sella

Il segmento mostra la revenue delle sessioni in cui l’UTENTE fa una qualsiasi sessione da CPC seguita immediatamente da un’altra sessione da sorgente che contiene “sella” in cui però converte.
Se ne faccio un altro con mezzo organic e poi sorgente “sella” riattribuisco la quota parte del traffico all’organico e così via

Success Story:
C’erano da riattribuire 776 transazioni: ovviamente la somma dei risultati di segmenti sequenza come questi non potrà mai essere precisa al 100% con il segmento “tutto il traffico”, ad esempio perché un utente nel periodo fa due transazioni in due giorni diversi, tuttavia la somma fatta per controllo restituisce 782, con una scarto piccolissimo. Le revenue sono state quindi riattribuite alle corrette fonti di traffico e il caso è chiuso.

Elementare, Watson :)