Oct 29 2012
Universal Analytics, ovvero la Business Platform
[edit: e mi stavo dimenticando del primo annuncio, che da solo sarebbe valso un post ma che evidentemente passa talmente in secondo piano da farmelo tralasciare durante la scrittura: real time avrà presto la visualizzazione dei GOAL 😀 ]
Oramai ci siamo, siamo nella famosa “Business Platform“, possiamo dirlo senza mezzi termini: durante i primissimi minuti del Google Analytics Partner Summit 2012 è stato annunciato l’arrivo di Universal Analytics, ovvero la prossima versione di quel che fino ad oggi abbiamo chiamato Google Analytics. Magari il nome non cambierà, ma il concetto stesso di misurazione cambierà.
Praticamente GA non sarà più uno strumento basato sulle sessioni, come lo abbiamo conosciuto fino ad ora, ma sarà user-centrico, cioè basato sull’utente (sempre senza registrare dati personali): questo significa che potenzialmente sarà in grado di risolvere una volta per tutte il dilemma del cross-device tracking, ovvero lo stesso utente che si collega da più dispositivi diversi: dettagli ancora non ce ne sono, e probabilmente il tutto sarà fattibile per chi in qualche modo si logga al sito, ma il balzo in avanti è che non si dovranno più legare le sessioni, come si potrebbe già fare oggi con le variabili personalizzate, ma si legheranno gli utenti, e le loro sessioni saranno solo una conseguenza.
Il tutto si baserà sulla definizione di “user-ID“, che potranno essere poi passati a GA attraverso una API documentata, e con delle librerie sviluppate da Google o da terzi. Addio alla presenza di cookies multipli, addio al cross domain tracking. Come ci spiega egregiamente il solito Justin Cutroni, l’identificazione delle sessioni avverrà lato server, e nei browser dei visitatori resterà soltanto l’identificativo univoco. Questo vuol dire che l’aggiunta di motori di ricerca, il cambio della durata del cookie o altre operazioni che adesso siamo abituati a fare aggiungendo funzioni al codice di GA, potranno essere fatte dall’interfaccia, lato server.
Poiché si sta parlando a tutti gli effetti di usare una API per tracciare le visite, vorrei per prima cosa soffermarmi su questa vecchissima previsione di Ian Thomas che risale addirittura a Maggio 2008: 2 delle tre si sono già avverate, mancava la terza, e cioè l’esistenza di una “standard API” bidirezionale che permettesse a chiunque di tracciare pressoché tutto dentro a Google Analytics.
Quando dico “tutto”, intendo anche ad esempio le conversioni offline: ad esempio stampando il visitor-ID su un coupon che viene riscosso offline: si può creare una interfaccia che invierà a GA il “segno” che è stata fatta una conversione da un utente che aveva visto il sito 4 volte da desktop, da certe campagne, e poi due volte da cellulare cliccando quali annunci. Non è affatto male, no? oppure, più in generale, un CRM che dialoga con GA e lo aggiorna su quando un prospect diventa customer, anche attraverso altri mezzi (pensiamo al call center…).
Come se non bastasse, hanno annunciato anche le Dimensioni e le Metriche personalizzate, cioè una delle ultime feature che separavano GA dai grandi nomi della web analytics Webtrends e Adobe; sono un’evoluzione delle Variabili personalizzate. Non basta? ok, si potranno anche IMPORTARE dei csv per ampliare le dimensioni, in un processo che in inglese suona “dimension widening” e che voglio vedere come avranno il coraggio di tradurre. L’esempio nel post di Justin è esemplare:
state tracciando la vendita di libri, voi passate a GA il codice ISBN, e poi con comodo attraverso un csv importare nome autore, data pubblicazione e altri dati. Potrete legare le metriche di Analytics a tutti questi dati, senza bisogno di farlo al momento della collezione dei dati, quindi via codice.
Tutto questo nella prima ora e mezza di summit, che dura due giorni. Sopravviveremo? 😀
…e speriamo di sopravvivere! 🙂
Potresti esplicitare la tua definizione di “dato personale” (cosa lo è, e cosa non lo è)? Grazie.
lo è: qualsiasi informazione mi permetta di farmi arrivare al tuo nome e cognome
non lo è: tutto il resto
Queste novità saranno disponibili a tutti o solo agli account Premium?
non hanno specificato niente, questo di solito significa che sono per tutti
@Marco La definizione legale è un po’ diversa (volutamente più generica)… http://www.dataprotection.ie/viewdoc.asp?docid=210
A tuo modo di vedere, un cookie contenente un ID univoco che permetta di mettere in relazione gran parte delle tue attività online (ricerche, acquisti, lettura della posta, ecc.), i dispositivi e i programmi che usi, da dove e quando ti colleghi, ecc. costituisce un “dato personale” (o, come dicono gli americani, “personally identifiable information”)? [Sì/No]
Questo è estremamente interessante:
http://support.google.com/analytics/bin/answer.py?hl=en&answer=2838718&topic=2790009&ctx=topic
È un ammissione implicita del fatto che le visite non vengono aggregate solo in base all’ID “anonimo”[:D] nel cookie, ma anche facendo ricorso al browser fingerprinting (https://panopticlick.eff.org/)?
quel che fanno loro è diverso da quel che possiamo fare noi. Io mi riferisco a quel che possiamo fare noi, con lo strumento. Lo strumento ha GIA’ un identificativo alfanumerico per ogni visitatore (è nel cookie utma); la modifica ti consentirà di usare lo stesso anche su altri dispositivi, leggendolo e riutilizzandolo con una API push invece di crearne due diversi.
Diciamo che lo era una volta; oggi, con la creazione di liste di remarketing integrata in GA, lo è molto meno.
Non hai risposto alla mia semplice domanda. 🙂
cmq no, un id univoco come dici tu non è un dato personale in senso stretto. così come un semplice ID di transazione non mi dice niente, finché non sono in grado di incrociarlo con il CRM dell’ecommerce e farmi dire chi sei, dove abiti e cosa compri.
Eh, la differenza sta tutta lì: ovviamente un numero preso da solo, ossia non collegato o collegabile ad altre informazioni, è solo un numero. 🙂
Ma in un’era in cui gran parte delle informazioni sulle persone sono almeno virtualmente interconnesse, la distinzione fra “PII” e “non-PII” è sempre più difficile da operare (non lo dico io, lo dicono autorevoli giuristi e policy-maker).
La mia non era una domanda retorica: il problema è aperto, ed è un problema assolutamente centrale per il marketing online, il cui futuro si giocherà, anzi si sta già giocando, sulla (nuova) definizione di “dato personale”, di qua e di là dall’Atlantico (vedi http://www.whitehouse.gov/sites/default/files/privacy-final.pdf e http://ec.europa.eu/justice/newsroom/data-protection/news/120125_en.htm).
Ho scritto “marketing online”, ma volevo dire “marketing digitale”.
Finalmente il tracciamento per utente, anche cross platform.
Così potremmo avere finalmente la reale conversione di alcune campagne, come le newsletter/dem, che spesso vengono aperte sul telefono, e poi si finalizza la conversione sul desktop.
Solo per fare un esempio…
Giacomo, ci ho riflettuto un po’ in treno, e quella frase significa una cosa: il sistema è progettato per tracciare gli user e non le session, per cui – nel caso tutto funzioni a dovere, quindi immaginiamo con una login – se ti dà lo stesso cookie tra desktop e mobile può farlo anche tra mobile e desktop. quindi cancellare i cookie da un solo dispositivo non ti rende un NUOVO visitatore, ma un visitatore di ritorno.
Io l’ho interpretata un po’ diversamente, quella frase, perché non fa esplicitamente riferimento a visite da dispositivi diversi, ma solo all’effetto della cancellazione dei cookie dal browser (“clearing or deleting cookies from a browser”); però l’ipotesi implicita che fai tu, ossia che lo stesso si applicherà anche alle visite cross-device, è lecita, visto quanto annunciato ieri. In ogni caso, la domanda rimane: se i cookie non sono più l’unico modo usato per aggregare visite fatte da uno stesso utente, allora come fa GA ad operare questa correlazione? Io ho pensato al browser fingerprinting (magari fatto cross-device?). Cookie o no, Google ci profilerà. E questo io lo trovo abbastanza inquietante. Tu no?
la correlazione non la fa Google, la devi fare tu. Da quanto ho capito io, tu potrai specificare i tuoi ID, ma se non lo fai GA si comporterà come adesso: quindi device diversi, utenti diversi. Se invece lo fai allora è vera anche l’ipotesi monodevice: vieni, ti do un ID. cancelli i cookie, torni, ti do lo stesso ID, sei un visitatore di ritorno.
Secondo, il cookie sarà ancora il metodo per aggregare i dati. tutto parte da un unico cookie che contiene l’id, invece dei 4/5 che ci sono adesso. adesso nuovo/di ritorno è una informazione scritta nel cookie, domani non lo sarà più. E’ lì la differenza, ma il riconoscimento e l’assegnazione dell’id la dovrai fare tu, non Google.
perché poi dici “profilerà” al futuro? se già lo fa, lo potrà fare anche in futuro. A lui non cambia niente. Cambia qualcosa a noi con il nuovo metodo, semmai
Per potermi dare lo stesso ID devi accertare che sono lo stesso visitatore di prima, e non un altro: come fai, se ho cancellato i cookie? Puoi riconoscermi se io (visitatore) mi identifico in qualche modo, ad esempio effettuando un login come utente registrato al tuo sito. È questo che intendi? Se è così, allora credo di aver capito: in pratica, la nuova versione di Analytics permetterà di collegare direttamente i dati sugli utenti presenti nei database dei siti web con quelli presenti lato Google. Già ora si può fare qualcosa di simile con le variabili personalizzate: quando ti autentichi sul mio sito, ti assegno una variabile personalizzata contenente il tuo ID utente, e poi lato Analytics segmento ed aggrego le tue visite in base a quella variabile e a quel valore. Giusto?
Perché leggendo il post sul blog ufficiale ieri sera mi sembrava di aver capito che il tipo di profilazione che Google opererà in futuro sarà non solo cross-device e cross-property, ma anche più sofisticata di quella attuale, tale da rendere praticamente impossibile l’opt-out, ma forse avevo inteso male. Il browser fingerprinting viene utilizzato da anni per la personalizzazione dei risultati di ricerca anche in assenza di cookie (e sicuramente viene utilizzato lato AdWords/AdSense per l’analisi dei click fraudolenti), per questo non ritenevo implausibile l’ipotesi che la stessa tecnica venisse estesa all’analisi delle visite fatta da Analytics: fatta su un grande volume di dati, avrebbe statisticamente senso.
qualche dettaglio in più https://developers.google.com/analytics/devguides/collection/protocol/policy
in quelle pagine cmq ci sono diverse info interessanti.
tieni conto che anche leggendo la documentazione non mi è del tutto chiaro, quindi parlo per ipotesi e per logica. Ma siccome l’ID è un testo e glielo puoi passare, deve per forza conseguire che il “riconoscimento” devi farlo tu, non può essere altrimenti.
Adesso puoi farlo con la customvar, ma leghi le VISITE, domani invece le visite le legherà automaticamente GA, perché legherai gli USER (e tutta l’analisi verterà intorno allo user inteso come ID, segmenti e multichannel compresi).
Quanto alla privacy, stamattina ho letto dei tweet di maggiori possibilità di controllo dell’opt-out. Ero già andato a dormire, spero di recuperare quanto prima le info
Leghi le visite se imposti lo scope della custom variable a Session-level (valore “2” del parametro “opt_scope” della funzione _setCustomVar()); se lo imposti a “Visitor-level” (valore “1” dello stesso parametro), leghi i visitatori (IMHO): https://developers.google.com/analytics/devguides/collection/gajs/gaTrackingCustomVariables#overview
no 🙂 leghi due VISITE dello stesso visitatore, ma non lo deduplichi. due device, due visite di una sola custom var, due nuovi, eccetera (lo scope peraltro setta soltanto la persistenza del cookie/informazione: browser, sessione o pagina) .Legare il VISITATORE (e derivare da esso le visite) è tutta un’altra cosa.
Probabilmente stiamo dicendo la stessa cosa. 🙂 Infatti sopra dicevo che le custom vars permettono di fare una cosa simile, a patto di aggregare le visite in base al valore dell’ipotetica custom var contenente l’ID univoco da te assegnato a ciascun visitatore (cosa che ovviamente va fatta a mano: GA continuerà a conteggiarle come visite distinte). Non so se mi sono spiegato.
Se riescisse a fare questo sbancherebbe, poiché riuscirebbe a fare l’unica cosa che ancora non riesce fa fare: dare un’identità a un cookie. Questo permetterebbe in prospettiva una profilazione utente/cliente e, come hai fatto notare te, dargli un’identità. Praticamente colmerebbe quel gap che lo divide da Facebook, dando in più strumenti che il Social Network non riesce ancora a dare.