Dec 20 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Come funziona l’ordinamento ponderato?

autore: Marco Cilia categoria: generale

Una delle caratteristiche introdotte ultimamente da Google Analytics e passata più in sordina è l’ordinamento ponderato (weighted sort in inglese), che permette di ordinare alcuni report in forma tabellare secondo un criterio slegato dal mero ordine crescente o decrescente: spesso infatti quando si fa analisi si cercano informazioni che non sono ne nelle prime righe delle tabelle ne nelle ultime, ma sparse lungo tutto “l’arco” dei dati. Un esempio classico è il report sulle percentuali di bounce rate, diciamo per le keyword. Se si stessero guardando le keyword e si mettessero in ordine inverso di bounce rate, ai primi posti della tabella – e per svariate decine di righe – si avrebbero si keyword con 100% di tasso di rimbalzo, ma relativi a keyword che hanno portato una sola visita.
L’informazione di qualità che stiamo cercando è celata nelle pieghe delle righe di mezzo. Ed è qui che ci viene in aiuto l’ordinamento ponderato, che riarrangia l’ordinamento combinando due metriche e provvedendo a evidenziare più facilmente i fenomeni nascosti, permettendo di avere nelle prime righe del report le situazioni che richiedono maggiore attenzione, almeno secondo lo strumento.

Avinash tempo fa ha scritto un post molto interessante, che vorrei riprendere almeno in parte per spiegare il funzionamento dell’algoritmo di weighted sort.
La chiave di tutta la “magia” dell’ordinamento ponderato è quel che in Google chiamano expected true value (forse si potrebbe tradurre con “vero valore atteso”, ma lasciamolo invece così com’è), cioè una variante del concetto matematico di valore atteso.
Facendo seguito all’ipotesi “il vero valore di una metrica per dimensioni con basso impatto sarà impreciso” è piuttosto facile dimostrare che se si sta guardando i referrer e Bing in un mese ha portato 5 visite e convertito all’80%, non è molto indicativo di un vero valore di conversione.
Google Analytics allora calcola l’expected true value (ETV da ora in avanti) per ogni singola riga del report e lo mostra permettendo di riordinare il report secondo un criterio diverso, nuovo.

Avinash usa una scala fatta così per iniziare a spiegare il funzionamento:
scala 0-a lot

Se stessimo guardando il bounce rate diviso per paese di origine della visita e il Sud Africa avesse poche visite, il bounce rate riportato dal sistema non avrebbe molto senso, ok? se invece ci fossero tante visite, allora sarebbe significativo. Oppure la si può vedere così: per i valori che stanno molto vicini alla parte sinistra di quella scala, assumeremo che l’ETV sia uguale alla media del sito. Una scommessa piuttosto difensiva, facile che questo non porti grandi problemi. Per i valori che stanno molto vicini alla parte destra invece, l’ETV sarà uguale al valore registrato. Per tutti i valori intermedi invece l’ETV sarà un mix tra la media del sito e il valore attuale; più il valore è a sinistra e maggiore sarà la componente di “media del sito” rispetto al “valore registrato”, e viceversa per i valori verso il fondo scala

Chiariamo con una immagine (sempre by Avinash)
ETV metric

I numeri che usa ovviamente NON SONO i veri valori che Google Analytics usa (GA usa valori diversi per ognuno di noi, basati sul contesto dei numeri registrati dal tool. In altre parole, non sapremo mai i veri valori 🙂 ), ma mi sembra che chiariscano abbastanza le idee sul funzionamento, e soprattutto sulle possibilità. Vi invito anche a leggere alcuni esempi che fa sul funzionamento e casi pratici in cui potrebbe esservi molto utile il weighted sort.

Già che siamo in tema, vale la pena anche di segnalare questo post di SEOmoz, che va un pochino oltre e fornisce anche un foglio Excel da scaricare con altre versioni dell’ordinamento ponderato, da usare direttamente con i propri dati grezzi o in altri contesti, ma non mi addentrerò nelle spiegazioni, che in quel post tendono a diventare parecchio complesse anche per me 🙂