Jun 09 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

43 controlli su un nuovo profilo

autore: Marco Cilia categoria: web analytics tag: ,

Spuntata in un tweet di Avinash, ho messo gli occhi su questa ottima lista di controlli da fare su un nuovo profilo di Google Analytics, redatta da Himanshu Sharma

Si tratta di una lista molto esaustiva e per nulla scontata, che un bravo web analytics man dovrebbe sempre tenere a portata di mano. Ad esempio si parte con il punto 1: “fatti un giro sul sito del cliente”, che non è per nulla banale, anzi…
Altri punti interessanti a mio avviso sono il 5 (fai un accordo scritto col cliente sui goal, il loro valore, i funnel e i target), il 16 (accertati che l’autotagging sia abilitato su AdWords), il 29 (crea avvisi personalizzati nell’intelligence) e il 41 (usa un # al posto del ? per taggare la campagne).

Un punto da rivedere è invece l’11: come ormai sappiamo benissimo (vero? :D ) non c’è bisogno di aspettare 24 ore per vedere se Analytics sta ricevendo i dati, e nemmeno per vedere se li riceve corretti. Bastano un analizzatore di header HTTP e un controllo sul giorno odierno dopo 3-4 ore.


May 20 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

La web analytics nella PA

autore: Marco Cilia categoria: web analytics tag: ,

Per lavoro mi occupo di siti per la pubblica amministrazione, e per questo motivo mi sono trovato davanti agli occhi la versione 11 maggio 2011 delle linee guida per i siti web della PA. Mentre mi addentravo nella lettura mi è caduto l’occhio su questa pagina del capitolo 4 e in particolare sulla nota a fondo pagina

[21] Si raccomanda di considerare, per le statistiche web, un visitatore unico ogni 30 minuti per IP.

La cosa ovviamente non ha senso: un visitatore unico prescinde da un intervallo di tempo, e di sicuro se io faccio una visita di un’ora e mezza non sono tre visitatori, ma uno solo. Inoltre sono anni che si dice che basarsi sugli IP è arcaico, perché le visite aziendali fatte da dietro a un proxy (ma anche gli accessi dalla rete geografica di Fastweb) vengono “annegati” dietro a un unico indirizzo. Migliaia di persone che risultano come una sola, che però ogni mezz’ora va conteggiata come fosse un’altra :-/

Perché – mi direte voi – una scelta così palesemente sbagliata? non lo so, ma di sicuro fa il paio con quanto scritto nel paragrafo “Policy” a proposito dei cookies, che sarebbero la soluzione al problema di cui sopra:

…né debbono essere utilizzati cookies persistenti di alcun tipo, ovvero sistemi per il tracciamento degli utenti. [omissis] L’utilizzo di cookies permanenti deve essere strettamente limitato all’acquisizione di dati statistici relativi all’accesso al sito e/o per mantenere le preferenze dell’utente (lingua, layout, etc.)

Due frasi in antitesi tra di loro: da un lato sembrerebbe che non si possano utilizzare cookies per il tracciamento, ma per le statistiche si. Ma allora se posso utilizzare i cookies, perché definire gli unici attraverso gli IP?

Infine, tanto per non farsi mancare nulla, le linee guida impongono che i dati del monitoraggio vengano pubblicati periodicamente. Tralasciamo un attimo il fatto che se ogni PA usa un sistema di web analytics differente, i dati non saranno mai confrontabili, e concentriamoci su un altro aspetto: i tre dati da pubblicare sono (sic!) pagine viste, sessioni utente (visite) e visitatori unici.

Solo che, se non si da un intervallo di tempo, parlare di unici non ha senso, per il noto “problema dell’hotel“. Alla linea guida manca fondamentalmente l’indicazione del periodo di tempo da considerare per l’indicazione degli unici. Ogni mese si deve dare il totale annuale degli unici, oppure ogni mese si deve dare il numero di unici del mese precedente?


Mar 14 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Google Analytics, cioè la web analytics?

autore: Marco Cilia categoria: web analytics tag: ,

Sono di ritorno da San Marino, dove ho partecipato all’evento Be-Wizard. Mentre ero lì ho avuto modo di fare una riflessione che voglio condividere con voi, spero di non venire frainteso.

Avinash Kaushik, nonostante sia Analytics Evangelist in Google (o forse proprio per quel motivo), è sempre molto attento a citare altri possibili sistemi di web analytics e sistemi complementari; ha citato Omniture, Webtrends, ha mostrato screenshot di Yahoo Web Analytics di cui è un grande estimatore. Paolo Zanzottera per ovvi motivi ha parlato del sistema di Video Analytics di Shinystat, ma tutti gli altri relatori, Anna Smith di Distilled, Rand Fishkin di SEOmoz, Marcus Tandler di Mediadonis hanno dato per scontato che tutti in sala usassero Google Analytics, mostrando schermate o come guardare ai dati. Ogni volta cioè si sono riferiti alla “web analytics”, anzi tutte le volte che hanno genericamente parlato di “misurazioni”, parlavano in realtà di Google Analytics. Le due cose stanno perdendo distinzione?

Se ne parlo è perché ho questa sensazione da qualche tempo, ma durante i due giorni al Be-Wizard la cosa è stata molto marcata. La mia sensazione è che il successo di Google Analytics ricalchi un po’ quello di WordPress:

  • è facile da installare
  • la documentazione è (abbastanza) chiara
  • in rete si trovano facilmente migliaia di risorse che spiegano come fare qualsiasi cosa
  • molte soluzioni preconfezionate hanno solo bisogno di un copia-incolla (allo stesso livello di facilità dell’installazione di un template di WordPress, diciamo)

Se da un lato l’essere autore di un blog come questo dovrebbe rendermi felice di questo fatto – ammesso che non sia solo una mia sensazione, ditemi nei commenti voi cosa vedete – dall’altro avverto un certo fastidio perché le situazioni di non chiarezza mi rendono nervoso. E’ vero che l’obiettivo di un relatore è rendere i concetti facili per chi ascolta, e quindi al 50% inserire uno screenshot di Google Analytics centra l’audience, ma è anche vero che le misurazioni si fanno in molti modi diversi, e con strumenti molto diversi tra loro: Google Analytics è solo uno di essi, per me e per voi è chiaro, ma per gli altri, per i clienti, per il “resto del mondo”?


Nov 17 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

La web analytics è intorno a te

autore: Marco Cilia categoria: web analytics tag: , ,

street vendor on flickrEsattamente come nello slogan di un noto operatore telefonico italiano, la web analytics è intorno a voi. Di ritorno dal corso avanzato di Verona, sono stato per tre quarti d’ora buoni in stazione a Milano Centrale, aspettando pazientemente che sul tabellone elettronico venisse indicato il binario al quale avrei trovato la mia coincidenza. Vengo avvicinato subito da un ragazzo, che propone chiavette per collegarsi ad internet a costo zero, pagando poi solo il canone mensile.
Io sono già connesso quanto basta quindi non mi interessa, ma mentre aspetto noto il numero esorbitante di “NO” che lui e le sue tre colleghe ricevono. il 100% in quasi un’ora, e di gente in un’ora a Milano Centrale ne passa parecchia.

Dopo un pochino mi avvicino, e poiché il ragazzo mi sembra un tipo alla mano, gli dico che secondo me sbagliano l’approccio. Tutti iniziano con la medesima domanda “utilizzi internet?” e io gli dico che quella domanda presuppone due risposte e un bivio: se rispondono “no” lui desiste, se rispondono “si” allora deve fare la domanda successiva “ti interessa la chiavetta eccetera?”. Ma intanto si sono persi secondi (e metri, perché tutti camminano in fretta) preziosi.
Gli propongo – gratis :D – quello che ritengo essere un approcio migliore: iniziare con la domanda “ti interessa risparmiare sulla connessione internet?”, che si presta ugualmente a due risposte, ma in modo differente. Se la risposta è “no” lui comunque non vende nulla, tanto quanto prima, ma psicologicamente è più difficile opporre una negazione ad una domanda basata su un fatto positivo (risparmiare soldi).

Dove sta la web analytics in tutto questo? adesso ci arrivo: il ragazzo rifiuta sorridendo la mia versione, dicendo che l’unico trucco è “portare il cliente vicino al bancone” e che poi lì le cose sarebbero state più facili, e che il no iniziale dipende da come è posto. Può darsi, ma io non ho visto risultati nel loro modo di agire “accademico”, passatemi il termine.
Mi sono allontanato pensando: perché invece non fai uno split test, un test A/B? metà del personale insiste con la tua versione, l’altra metà prova per un periodo limitato il mio approccio, e poi vedi chi converte di più in termini di acquisizione nuovi clienti. Per dirla ancora meglio: qualcuno propone una versione modificata (lui pensa “migliorata”) di qualcosa di tuo, non puoi bocciarla solo sulla base delle conoscenze accademiche, fai un test di rendimento delle versioni e poi decidi.

Ovvero “decidi sulla base dei dati”. web analytics, appunto :)

Sull’argomento, all’incirca, segnalo anche un interessante post di Jeff Artwood su codinghorror.com, relativo agli AB test nel film “ricominicio da capo” con Bill Murray (Groundhog day in originale)

[photo credit: Saucy Salad on Flickr]


Oct 25 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

La mia presentazione a SMAU Milano

autore: Marco Cilia categoria: web analytics tag: ,

Ecco le slide che ho usato durante la presentazione allo SMAU Milano.

Queste sono forse ancora più criptiche delle precedenti di roma, ma ormai mi sono convinto, se mai ce ne fosse stato bisogno, che le slide sono un mero promemoria per quel che devo dire, presentation zen o meno.
Cerco lo stesso di riassumere brevemente il contenuto delle slide significative:

ciclone Scimmia: la web analytics non è facile, anche se spesso la presentano così. Il sistema va scelto con cura, avendo già chiaro cosa andrà a fare. Piccole variazioni nei dati sono normali, e vanno accettate, piuttosto che perdere tempo prezioso a capirne le cause. Quel tempo può essere meglio impiegato. Occhio ai trend, non ai dati assoluti.

ciclone Gru: se il capo guarda solo la dashboard, non ha senso riempirla sperando di mostrargli più dati. I vostri report devono essere “actionable”, e comunicare al volo qualcosa, se vengono cestinati senza che venga intrapresa un’azione, qualcosa non va. Se chi vi sta intorno vi parla di “hits” è necessario impiegare parte del tempo ad educarli, con risposte costruttive e che possano far emergere il reale valore del vostro lavoro

-ciclone Tigre: se la web analytics dice che bisogna cambiare qualcosa, bisogna cambiarlo! non c’è “ma a me piace così” che tenga. “bello” è diverso da “funzionale” che è ancora diverso da “che converte”. Parlate con dati a supporto delle vostre tesi, dovete fare in modo che l’azienda si fidi di quel che dite e dimostrate con i numeri. Nonostante questo, non affidatevi mai al 100% ai soli dati, trovate una mediazione. La WA è un – valido – supporto, non l’unico modo per prendere decisioni.

ciclone Serpente: ad una analisi deve sempre seguire una azione, nonostante le procedura aziendali. Datevi un tempo massimo per avere live le modifiche, anche perché i risultati dei test variano in funzione di molti fattori. Il risultato di un test oggi può dare esiti completamente differenti dallo stesso test effettuato tra sei mesi. Usare sempre le campagne, sono una fonte di dati inesaurbile e sono completamente sotto il nostro controllo. Internet ha la grande fortuna di essere un medium misurabile quasi a livello di singolo, sfruttate questa occasione che fino a 15 anni non esisteva.

ciclone Mantide: fare web analytics non è fare traffic reporting. Il dato complessivo non ci interessa, ci interessano i fenomeni che avvengono nelle “micronicchie”, nei segmenti, per l’appunto. Segmentare è l’unica soluzione per avere il polso di quel che accade realmente e per notare trend e fenomeni che altrimenti resterebbero affogati nei totali. Fino a che non vi libererete del traffico in eccesso (quello fuori target), l’unico modo sensato di fare analisi è eliminarlo con dei segmenti.

La via verso il Nirvana parte dall’integrare la web analytics come processo aziendale, oltre che a trattarlo come un processo nelle vostre teste. Raccogliere requisiti sensati, per evitare di farlo successivamente, dopo alcuni “giri” del processo di cui sopra; Definire con cura le metriche, in modo che ognuna di esse possa risolvere un problema reale in azienda, ed essere sicuri che sia poi possibile avere i dati che servono ai calcoli, quando essi non derivano totalmente dai sistemi che gestite (e in particolar modo se essi arrivano da altri reparti/sedi/aziende). Studiare come fare i report, e che essi comunichino qualcosa a prima vista. Teoricamente dovreste poter lasciare un report sulla scrivania di qualcuno senza spiegarglielo, e lui dovrebbe capire cosa fare. Educate chi vi sta intorno a smettere di pensare con canoni vecchi e a fidarsi di quel che dite. Kung Fu Web Analytics per tutti! :)


Oct 10 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Supervisionare, pensare, immaginare

autore: Marco Cilia categoria: web analytics tag:

Guardate un po’ in cosa mi sono imbattuto oggi durante un giretto su profili minori, non importanti:

Il dato è relativo ad un solo giorno, che ho isolato dopo aver visto una grossa anomalia nella curva delle pagine viste. Secondo Google Analytics c’è un utente che ha navigato ininterrottamente il sito per quasi 24 ore e ha visto di fila 449 pagine. Ovviamente non è possibile, tanto meno non è possibile che Analytics si sbagli (non in senso assoluto, ovviamente: intendo su quel profilo).

Quindi, scava scava, isolo prima la città di provenienza della visita, poi il fornitore di connessione e arrivo sin dove avevo immaginato: un agente automatico che esegue javascript. Domani in ufficio controllerò un paio di cose, poi aprirò il logfile del webserver di quel giorno, per sicurezza, e poi farò le opportune modifiche. Quel che volevo dirvi con questo post è che il vostro ruolo di web analyst non è quasi mai limitato all’ambito della web analytics (prodotto, collezione dei dati, report e analisi), ma deve anche fungere da supervisionatore del lavoro altrui. Poiché il vostro compito è impedire che i dati in ingresso al sistema siano “sporchi“, è vostro dovere conoscere tutti i processi aziendali che potrebbero intaccare i dati all’origine. E se pensate di conoscerli tutti, rifletteteci ancora. E se ci avete già riflettuto, pensate a situazioni analoghe che potrebbero esservi sfuggite. Infine immaginatene di completamente nuove, anche impossibili; potrebbe ancora venirvi qualche idea.

Lo dico perché nel mio caso sono stato fortunato. Una sola visita in tutto il giorno, su un profilo assolutamente minore e “sacrificabile”, e comunque facilmente filtrabile. Se la cosa fosse successa in forma meno eclatante, ma su un profilo più importante, avrei potuto perdere alcune notti di sonno a capire cosa fosse successo, o peggio la cosa sarebbe potuta passare inosservata per qualche tempo…

Prevenire è meglio che curare, si sa. Se riuscite anche a immaginare problemi che (ancora) non esistono, è ancora meglio!


Sep 20 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

L’evoluzione dei vendor di web analytics

autore: Marco Cilia categoria: web analytics tag: ,

Quando l’anno scorso Adobe inglobò Omniture, nello stupore dei più, nessuno avrebbe mai potuto immaginare come sarebbe mutato il panorama della web analytics mondiale. Oggi il prodotto si chiama Adobe Online Marketing Suite, anche se è disponibile al vecchio indirizzo www.omniture.com, ma questa paradossalmente è ormai una notizia vecchia.

Il 15 giugno scosrso IBM ha comprato Coremetrics, e intende offrirlo come complemento alla propria suite di publishing Websphere. Non ancora sazia, il mese scorso si è comprata anche Unica, per 480 milioni di dollari.
Il 2 settembre, infine, ComScore si porta a casa l’olandese Nedstat. Tanto per non farsi mancare nulla, proprio oggi IBM ha comprato Netezza, leader dei sistemi di analytics per banche dati.

Se vi ricordate un post dell’anno scorso relativo al report Forrester sulla crescita dei sistemi di web analytics, noterete come degli otto marchi presenti nel 3 quadrimentre 2009 tre fossero nuovi ingressi. Bene, ad oggi altrettanti non esistono più come indipendenti e probabilmente i nomi verranno sostituiti dagli acquisitori. Di quella parte del report restano in gioco soltanto Yahoo Web Analytics, Google Analytics, AT internet (su cui punterei il dito se mi chiedessero “chi è il prossimo?”) e, incredibilmente, Webtrends. Dico incredibilmente perché non più di tre anni fa l’azienda era data per spacciata, i vertici erano quasi azzerati e non passava mese senza che si levasse qualche rumors di acquisizione. Invece oggi è viva e vegeta, e a quel che posso vedere cerca di cavalcare l’innovazione per recuperare il tempo perso negli anni scorsi).

Se però i grandi nomi comprano i “medi”, c’è speranza per i piccoli di entrare in quel report? diciamo nella parte bianca. E soprattutto, che balzo in alto farà Google Analytics sull’ordinata dell’offerta, dato che quando quel report fu creato non esistevano la maggior parte delle grandiose funzionalità di cui godiamo oggi? quanto manca all’uscita del prossimo report? :)


Jul 13 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti

Google TV e la web analytics

autore: Marco Cilia categoria: web analytics tag: ,

Google TV arriverà nelle mani dei consumatori entro fine 2010. Google ha annunciato una partnership con Sony, Intel e Logitech per trasformare ogni schermo HD in un PC dedicato al multimediale. Google ha rilasciato alcune note agli sviluppatori che vogliono disegnare siti TV-friendly. Tutto questo mi ha fatto pensare che Google TV avrà un impatto non trascurabile sulla web analytics ridefinendo il come dobbiamo pensare all’esperienza utente.

Ecco una lista parziale di modi in cui Google TV potrebbe cambiare lo scenario della web analytics

Il traffico dalle TV potrebbe essere difficile da riconoscere
Saremo in grado di capire quali visite avvengono da un TV? forse. Potrebbero essere identificate attraverso una descrizione del Sistema Operativo differente, ma nei casi più comuni potrebbero apparire identiche a quelle effettuate da altri dispositivi. Sebbene le TV siano più grosse, hanno la stessa risoluzione della maggior parte dei monitor dei computer (e ormai anche di alcuni cellulari!). Useranno un browser Chrome completo, capace di eseguire Flash e tutto il resto. Gireranno con Android. Avranno la stessa velocità di connessione del vostro PC di casa.

La metrica “visitatore” perde significato
Al crescere delle visite al vostro sito dalle TV, misurare qualsiasi tipo di metrica “visitatore” si discosta sempre più dalla realtà. Innanzitutto le TV sono solo un altro modo con cui un visitatore accede a internet, e nemmeno il primario. E’ lecito aspettarsi che una visita da una TV sarà accompagnata da un’altra visita della stessa persona da un altro dispositivo. Se la media dei visitatori usa due, o tre o quattro device per accedere regolarmente a Internet, è pressoché impossibile misurare cose come “visitatore unico”, “nuove visite”, “tempo dall’ultima visita”, eccetera. Tutte queste misurazioni dovranno concentrarsi sulle visite anziché sul visitatore. [E' un problema che si perde nella notte dei tempi: prima con la questione PC del lavoro - PC di casa, poi con le visite da più browser, oggi con la moltiplicazione dei dispositivi connessi a internet. ndT].
In secondo luogo, a differenza di computer e telefonini, le TV tendono a essere usate da gruppi composti da più di una persona. Questo significa che una visita da una TV può in effetti rappresentare tante persone, facendo perdere alla metrica “visitatore” ancora più senso.

Attribuzione della conversione
Attribuire una conversione a una specifica fonte di traffico diventerà ancora più complesso. Immaginate questo scenario: una persona viene introdotta al vostro sito mentre usa Google TV da un’altra persona, ma decide di finire di esplorare il sito da solo sul proprio computer o cellulare. Come si attribuisce questa conversione? non ci sarà modo di connettere la conversione alla visita dalla TV. E non sarà nemmeno possibile comparare il numero di conversioni al numero di persona che hanno visto la pubblicità in TV.
E ancora, come misurerete le conversioni quando una visita è stimolata da una persona che ha già visto il vostro sito? è una nuova visita? una visita diretta? un referral? Se vi trovano dopo avervi cercato, a che serve sapere che la visita viene da un motore di ricerca, se la prima è stata “spinta” da un vostro affezionato lettore? Questi non sono certo problemi nuovi, ma verranno ulteriormente accentuati.
Potremmo presto accorgerci che l’intero dibattito dell’industria della web analytics sull’attribuzione multi-sorgente delle conversioni sta puntando al problema sbagliato. Quello che dobbiamo assolutamente capire è come la media dei nostri visitatori usa molti dispositivi e in quale ordine. Ben distanti dalla quadratura del cerchio sulle converisioni, il progresso della tecnologia puà solo far aumentare il gap.

Dinamiche di gruppo
Ancora qualche parola sull’audience della TV. Scopriremo presto che i gruppi hanno percorsi di navigazione molto differenti rispetto ai singoli. Immaginate di navigare un sito in gruppo con altri amici. Non importa chi ha il controllo fisico, il gruppo eserciterà una certa influenza sul modo in cui voi interagite col sito. Potreste avere chi vi urla suggerimenti, o chi vi indica aree di interesse su cui cliccare direttamente sullo schermo. Sarete meno in grado di terminare con calma la lettura della pagina per non annoiare il gruppo. Quello che farete online con una TV in salotto rivelerà molto più sulle dinamiche di gruppo rispetto alle tendenze dell’individuo. Le decisioni probabilmente saranno meno stravaganti e più critiche. Esse favoriranno anche convenzioni morali o culturali.
I gruppi hanno anche obiettivi differenti. Saranno meno propoensi a effettuare un acquisto, ad esempio, a meno che esso non coinvolga l’intero gruppo. Le pagine dovranno essere ottimizzate per i gruppi anziché per gli individui.

Applicazioni spearate per siti e TV
Una cosa che rende unica Google TV è il suo approccio nel tentativo di sposare internet e TV è la disponibilità di applicazioni create dagli utenti. A partire dal 2011 il Market di Android avrà applicazioni progettate appositamente per le TV. Queste plasmeranno il modo in cui le TV saranno usate e come siamo abituati a pensare ad esse. Appurate quali saranno le differenti restrizioni che le TV imporranno nella navigazione, le aziende inizieranno a sviluppare siti specifici per le TV, come adesso fanno per i telefonini. Sia per le applicazioni sia per i siti TV la web analytics avrà bisogno di guardare ai report con una prospettiva differente.

Cosa significa Google TV per la web analytics?
Questa lista potrebbe scoraggiare un web analyst. Google TV – e altre tecnologie emergenti – prenderanno la web analytics per l’orecchio. Stiamo appena iniziando a prendere confidenza col significato di alcuni numeri, e questi diventeranno irrilevanti o cambieranno significato. Ma questo non segna la fine della web analytics, né le rende meno affidabile di per sé. Significa solo che gli analisti e le aziende che stanno online un qualche modo dovranno ingegnarsi a interpretare meglio i report.
La cosa eccitante di questa industria è che nessuno ha mai determinato “il modo migliore” di misurare l’attività online. Il dibattito su cosa e come misurarlo deve ancora raggiungere la maturità. L’emergere di Google TV terrà i buoni web analytics sulle spine e aggiungerà nuova linfa al dibattito.

[questa è la traduzione del post "Google TV and web analytics" di Analytics Market. Voi cosa ne pensate?]


Mar 22 2010

Il terzo modo per raccogliere i dati

autore: Marco Cilia categoria: web analytics tag: ,

Cisco HandoffQuando si parla di web analytics si sente spesso parlare della contrapposizione tra i sistemi che leggono i logfiles e i sistemi che usano un tag javascritpt, come Google Analytics. Entrambi i sistemi hanno punti di forza e punti deboli, anche se negli anni lo standard de facto è diventato il sistema a tag. Ogni tanto qualcuno prova a immaginare altri modi per raccogliere i dati sulle visite, e devo dire che ho sempre ritenuto affascinante l’ipotesi di usare Flash, che comunque è presente sulla quasi totalità dei computer che navigano in rete.

Flash comunque è figlio di due grandi categorie di siti web: i siti fatti interamente in flash e i siti che lo usano per mostrare parte dei contenuti, soprattutto video. Entrambe queste tipologie sono però in declino: da un lato per le cosiddette Rich Internet Application si sta affermando AJAX, dall’altra HTML5 supporterà nativamente la visione dei contenuti multimediali (e infatti Youtube ha un player sperimentale in HTML5 che mostra i video anche senza flash).

In passato ho sentito parlare di un altro metodo, cioè l’ascolto passivo del traffico web che avviene tra il webserver e il browser del visitatore; mi è sempre sembrata una ipotesi piuttosto irrealizzabile, tecnicissima, alla portata di pochi e soprattutto oscura, ma a giudicare da un paio di link che mi sono capitati sotto gli occhi, direi che qualcuno ci sta spendendo ben più di due soldi.

Il primo link è un vecchio post del blog ufficiale di GA, che risale a Dicembre scorso e annuncia una collaborazione tra Coradiant e Google – nelle vesti di Urchin – nella fornitura di un sistema del genere “chiavi in mano”: Analytics in a box è infatti un sistema passivo di raccolta dati sul traffico che integra una versione modificata di Urchin per l’analisi delle statistiche.

Il secondo link è un post più recente che annuncia l’integrazione di Google Analytics all’interno della piattaforma PION Lite di Atomic Box, un prodotto che si può installare sui webserver e che monitora il traffico in uscita integrandolo ai sistemi di web analytics: rispetto al box di Coradiant, la piattaforma PION supporta anche Unica, Webtrends e Omniture. In ogni caso anche Pion è disponibile in versione hardware con un box analogo.

Come vedete non si sta parlando di cose astratte o ipotetiche, i sistemi esistono e ci sono aziende che ci investono soldi e fatica. Questa “terza via” per raccogliere i dati oltre ai log e ai tag potrebbe davvero essere promettente. Certo, non sarebbe alla portata di tutti penso ad esempio agli hosting condivisi), ma potrebbe essere un investimento interessante per le aziende. E tra l’altro dubito che qualcuno potrebbe sottrarsi all’analisi: non si richiamano script esterni, non si possono installare plugin che bloccano i sistemi, non c’è Adblock che tenga: se ricevi una pagina sei già stato sniffato dal box!

[photo credit: techwisetv on Flick]


Jan 15 2010

il futuro della wa è senza javascript?

autore: Marco Cilia categoria: web analytics tag: , ,

Qualche giorno fa mi ero messo a scrivere un post in cui sostanzialmente mi chiedevo quanto potesse essere vera l’affermazione che feci qualche tempo fa in occasione della presentazione del tracciamento dei siti mobile tramite script lato server; mi chiedevo se Google Analytics avrebbe abbandonato del tutto l’uso di javascript. Il post non mi soddisfaceva, e l’ho cestinato, ma oggi mentre riordinavo le bozze ho trovato questo articolo di Paul Legutko, datato settembre 2009: Web analytics without javascript? in cui si dice che la previsione secca “javascript sparirà entro cinque anni” è addirittura di Yahoo.

Ad alcune considerazioni ammetto di non aver pensato, sono interessanti. Vediamole:
– mobile. Ho appena detto che la soluzione di Google per il mobile non usa javascript, ma un pezzo di codice lato server (asp, php, eccetera). E’ vero che il supporto a javascript da parte degli smartphone è in costante ascesa, ma perché un colosso come big G – che pure ha fatto del tracking code javascript di Analytics una colonna portante – non crede in questa tecnologia portata sui cellulari?
– integrazione dei dati. Praticamente tutti i sistemi di tagging “sparano” i dati in un datacenter remoto; che sia Google, Webtrends o Omniture importa poco, perché l’esigenza sempre più sentita oggi è quella di integrare i dati della web analytics con tutti gli altri messi a disposizione dalla Business Intelligence. Allora perché inviare i dati per poi cavarli di nuovo fuori? è un processo poco razionale, se ci pensiamo…
– cookie. L’attenzione sempre maggiore verso la privacy e la sicurezza degli utenti online porta quasi sempre a puntare anche il dito contro i cookie. Secondo l’autore dell’articolo la percentuale di rifiuto dei cookie è tra il 3 e il 7%, a seconda della tipologia di sito preso in considerazione. Addirittura, alcuni software antivirus tracciano come “non pericolosi” i cookie traccianti dei sistemi di web analytics, ma ne consigliano comunque la cancellazione.

In passato si è parlato ogni tanto di Flash come sostituto di javascript, poiché Flash è leggero e presente su quasi tutti i computer che navigano in rete, ma è anche vero che ultimamente si sente dire che Flash morirà a causa di HTML5 (ok, in rete si sente dire di tutto, ma stiamo ragionando abbastanza in astratto…). In uno dei commenti al post viene invece suggerito il packet sniffing lato server, ovvero l’apertura di tutti i pacchetti a livello TCP che vengono inviati dal server ai visitatori del sito, in modo da carpire tutte le informazioni che normalmente vengono affidate allo script di tracciamento. Questa però è una soluzione che non è affatto alla portata di tutti, certamente non semplice quanto copiare e incollare un pezzo di codice in tutte le pagine di un sito.
Sia come sia, ritengo difficile pensare di tornare ai file di log, almeno non nella forma in cui li abbiamo conosciuti (e in qualche caso ancora conosciamo). Cinque anni sono un tempo enorme in informatica, e può darsi che la prossima generazione di sistemi di web analytics utilizzerà una tecnologia che non è stata ancora inventata; il dibattito però è affascinante, ed ancora una volta potenzialmente in grado di ribaltare completamente il settore.