Feb 05 2010

Come tracciare le ricerche di universal search

autore: Marco Cilia categoria: filtri

Marco, è tutto bellissimo, va bene. Però non ho voglia di fare mille filtri/profili per tracciare tutte le declinazioni di Universal Search. Che si fa?

E’ una richiesta legittima, d’altronde si dà sempre per scontato che quello che interessa ai gestori dei siti sia sempre una sola peculiarità di Universal Search di Google, ma magari invece non è vero. Ecco quindi un paio di filtri che vi permetteranno di avere in un profilo separato – ma unico – tutte le visite che provengono da clic fatti su ricerche “maneggiate” da Universal Search.

Il primo filtro, come sempre, esclude tutto quel che non proviene da ricerche organiche

Filtro 1: Solo google organic
filtro personalizzato – includi
campo filtro: mezzo campagna
pattern filtro: organic
maiuscole/minuscole: no

Filtro 2: traccia universal
filtro personalizzato – avanzato
campo A -> estrai A: Referral (.*)oi=([a-zA-Z_]+)&(.*)
campo B -> estrai B: Referral (\?|&)q=([^&]*)
Output in -> Constructor: Definito dall’utente $B2: $A2
Campo A obbligatorio: si
Campo B obbligatorio: si
Sostituisci campo di output: si
maiuscole/minuscole: no

Nel campo “definito dall’utente” avrete una lista di keyword seguite, dopo i due punti, dal tipo di ricerca universal che vi ha portato la visita. image piuttosto che social_search e tutti gli altri…


Jan 03 2010

Segmenti avanzati vs. filtri sul profilo

autore: Marco Cilia categoria: generale

Il sempre ottimo Brian Clifton mette in piazza la sua personale visione sulle modalità di scelta tra segmenti avanzati e profili-clone con filtri, visto che le due cose sono molto simili e ultimamente tendono a sfumare l’una nell’altra: Brian considera i profili-clone come una segmentazione “di lunga durata”, destinata a durare nel tempo e destinata a una categoria di visitatori piuttosto importanti, dato che quelli esclusi dal filtro sono persi per sempre (nel solo profilo-clone, ovviamente).

Ecco una comparazione puntuale:

Segmenti avanzati

Filtri sui profili

Modificano un report al livello della visita

modificano i dati in ingresso al livello della pagina vista

Applicati ai dati correnti e passati.

Applicati solo ai dati in arrivo dopo la creazione del filtro.

Risultati istantanei – fatto il segmento si vedono già i dati.

Destinati a usi di lungo periodo, il segmento non dovrebbe variare.

Permettono l’uso di valori condizionali, ad esempio più grande di, meno di….

Supportano solo stringhe di testo, niente condizioni basate sui numeri.

Creati dagli stessi utenti del report, nessun dato può andare perso.

Creati dagli utenti con accesso da amministratore, perché potenzialmente distruttivi rispetto ai dati.

Ottimo banco di prova.

Impiegano 3-4 ore per popolare il primo report.

Combinano le istruzioni in un solo passaggio.

Usano filtri a cascata per combinare diverse istruzioni.

Creati in base all’utente. I segmenti possono essere condivisi ma non possono essere usati per nascondere dati.

Creati in base al profilo., quindi l’accesso ai dati segmentati può essere controllato

Le espressioni regolari non sono limitate, anche le istruzioni combinate per creare un segmento non possono superare i 30.000 caratteri

Le espressioni regolari sono limitate a 255 caratteri.

Brian quindi dice di usare i filtri sui profili per filtrare il “rumore” permanente (visite interne), quando il segmento definito è destinato ad essere usato per lungo tempo o quando c’è bisogno di controllare l’accesso ai soli dati segmentati.
Di contro, usate i segmenti avanzati quando state cercando di capire i differenti comportamenti di alcune fasce di utenti, visite da social network, visite da mobile, o se i clienti acquisiti navigano diversamente dai potenziali clienti, oppure quando c’è bisogno di condizioni basate su valori numerici (visite di persone che hanno speso più di 100 dollari per transazione e che restano sul sito almeno 30 secondi).

Direi che mi trovo sostanzialmente d’accordo con Clifton, e che già ora è questo l’uso che faccio dei segmenti avanzati e dei filtri applicati a profili-clone, anche se ultimamente mi è capitato molto meno di creare filtri al profilo. Potrebbe dipendere dalla tipologia di siti che analizzo, indubbiamente, ma non è detto. Capita anche a voi?


Dec 07 2009

Tracciare le ricerche Social Search

autore: Marco Cilia categoria: filtri

Social Search è uno degli esperimenti di Google Search che è possibile sottoscrivere in test (gli altri due al momento sono keyboard shortcut e accessible view). In sostanza è una speciale categoria di ricerche che si preoccupa di cercare contenuti rilevanti per la query da noi inserita nel motore, all’interno della nostra rete di amici e conoscenti online. Il cosiddetto “circolo sociale”.

La settimana scorsa Giorgio Taverniti mi ha chiesto come si potessero tracciare queste ricerche in Analytics, poiché stava preparando il suo intervento al ConvegnoGT 2009. Poiché un giorno Social Search potrebbe essere promosso a funzione ufficiale, eccovi il metodo che ho impiegato, che poi è sostanzialmente una modifica di quello che abbiamo usato per tracciare separatamente i risultati illustrati mantenendo la keyword:

Anche in questo caso servono tre filtri per fare tutta l’operazione. Possiamo pensare a Social Search come a una “branca” di Universal search. Il referrer di una ricerca Social avrà al suo interno il parametro oi=social_search oppure il parametro tbs=frim:1. Poiché ho avuto qualche problema con il filtro in presenza dei due punti, ho inserito soltanto tbs=frim. Ecco i tre filtri:

primo filtro, di tipo personalizzato – avanzato:
nome: SocialSearch – cambia sorgente
Campo A -> Estrai A -> Referral -> (\?|&)q=([^&]*)
Campo B -> Estrai B -> Referral -> (tbs=frim)|(oi=social_search)
Output in -> Constructor -> Sorgente campagna -> Google Social Search
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

secondo filtro, di tipo personalizzato – avanzato
nome: SocialSearch – estrai keyword
Campo A -> Estrai A -> Referral -> (\?|&)q=([^&]*)
Campo B -> Estrai B -> Referral -> (tbs=frim)|(oi=social_search)
Output in -> Constructor -> Termine della campagna -> $A2
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

terzo filtro, di tipo personalizzato – avanzato
nome: SocialSearch – cambia mezzo
Campo A -> Estrai A -> Referral -> (\?|&)q=([^&]*)
Campo B -> Estrai B -> Referral -> (tbs=frim)|(oi=social_search)
Output in -> Constructor -> Mezzo della campagna -> SocialSearch
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

Il risultato dell’operazione sarà poi visibile nel report “tutte le sorgenti di traffico” e sarà segmentabile per parola chiave.
Se vi siete iscritti all’esperimento (che lo ricordo funziona solo su google.com e solo in lingua inglese) avrete notato che Social è solo l’ultima delle scelte nelle opzioni della barra laterale. Ognuna di esse ha un parametro che la distingue, e che potrebbe essere usato modo simile a quanto ho fatto io. Ve li elenco:

Images ha il parametro tbs=isch:1
Videos ha il parametro tbs=vid:1
News ha il parametro tbs=nws:1
Blogs ha il parametro tbs=blg:1
Books ha il parametro tbs=bks:1
Forums ha il parametro tbs=frm:1
Social ha il parametro tbs=frim:1
Edit 9/12: Real-time ha il parametro rltm:1 [Google ha lanciato la ricerca real-time, è anch'essa è disponibile su google.com nella medesima barra delle opzioni]


Oct 05 2009

Novità di Ottobre 2009: aiuto per la creazione di filtri

autore: Marco Cilia categoria: filtri

Aprendo i report di Google Analytics oggi si potrebbe anche concludere che non c’è nessuna novità, invece è stata ridisegnata l’interfaccia di creazione dei filtri, croce e delizia di molti utilizzatori.

La prima cosa che balza all’occhio è che i filtri predefiniti sono stati potenziati: ora ci sono tre menu a tendina, che permettono di includere o escludere il traffico di domini, indirizzi IP e sottodirectory che soddisfano criteri di uguaglianza totale o parziale rispetto a un dato valore. Questo significa, ad esempio, che potete rifare il primo filtro del mio famoso metodo “solo miodominio” senza scrivere niente tranne il vostro nome a dominio. Più in generale i filtri predefiniti acquistano nuovo vigore e aiuteranno molte persone ad avvicinarsi a questa schermata senza timore.

nuovi menu a tendina per i filtri

La seconda cosa che si nota è che selezionando i filtri personalizzati ora in alcuni casi si apre un box giallo con informazioni utili e contestualizzati al tipo di filtro che si presume si stia creando, con esempi e collegamenti a voci dell’help ufficiale che possono tornare utili. Anche in questo caso qualche riga di spiegazione può aiutare molte persone a capire meglio quello che stanno per fare o possono aspettarsi dall’azione che stanno per intraprendere, mi sembra un buon passo nella direzione giusta. Poiché GA sta aumentando le funzioni avanzate, è bene che almeno quelle di base siano chiare ed accessibili a tutti.


Sep 21 2009

GA per SEO: tracciare il posizionamento II

autore: Marco Cilia categoria: filtri

André Scholten ha scritto su yoast.com un aggiornamento del suo metodo per tracciare il posizionamento delle parole chiave nelle SERP (le pagine dei risultati) di Google. E per me è doveroso darvene comunicazione, in modo che anche voi possiate fare le relative modifiche, se avevate letto soltanto il mio post relativo. L’aggiornamento è necessario perché Google sta introducendo un nuovo url delle SERP che veicolano traffico verso i siti, basato su tecnologia AJAX, che riporta come informazione aggiuntiva anche la posizione del link al momento del click.

Nel caso in cui stiate mettendo il piedi il metodo per la prima volta, vi ricordo che è necessario creare un profilo-copia, perché i primi due filtri sono distruttivi nei confronti di tutto il traffico che non proviene da Google organico. Una volta fatto il nuovo profilo-clone, si possono creare e applicare i primi due filtri descritti nel vecchio post (Ranking 1 e Ranking 2), e dopo aggiungere il terzo

Ranking 3:
filtro personalizzato – avanzato
campo A -> estrai A: Termine della campagna (.*)
campo B -> estrai B: Referral (\?|&)cd=([^&]*)
Output in -> Constructor: Definito dall’utente $A1 (posizione: $B2)
Campo A obbligatorio: si
Campo B obbligatorio: si
Sostituisci campo di output: si
maiuscole/minuscole: no

(che in realtà noi conosciamo già, ve l’ho descritto in questo post).
Questi tre filtri insieme mostrano il posizionamento, e la cosa vale per tutti coloro che cliccano un risultato dopo aver fatto una ricerca su un datacenter che è già stato aggiornato. Le SERP che implementano il cosiddetto “universal search” non sono da meno. Nel post su yoast, André fa l’esempio di una ricerca per “pizza Amsterdam”, la cui parte superiore della pagina dei risultati è monopolizzata da una mappa e dai risultati del Local Business Center. Un eventuale click sul primo risultato “classico” porterà come posizione 11, e non 1, perché Google li elenca così (è una cosa che avevamo già trattato parlando del tracciamento delle immagini nelle SERP).

Discorso inverso invece per i sitelink, che inviano un numero compreso tra 1 e 8 a seconda della posizione in cui si trovano all’interno della voce che li contiene. Se siete fortemente interessati ai sitelink, André propone di creare un ulteriore profilo-copia, applicare i tre filtri menzionati sopra, e di aggiungerne uno (che si chiama erronamente Ranking 5 solo perché era presente un quarto filtro eliminato dopo alcuni commenti di attenti lettori):

Ranking 5:
filtro personalizzato – includi
Campo filtro: Referral
Pattern filtro: oi=(oneline_sitelinks|smap)

oneline_sitelinks sono i sitelink su una riga, smap quelli “classici” su due colonne. Includendo questo filtro gli unici risultati che vengono mostrati nel profilo sono quelli relativi ai sitelink, pertanto vi permette di fare accurate analisi su quali e quanto essi vengano cliccati.

Come chicca finale – che non conoscevo – André dice che le ricerche fatte sulle declinazioni nazionali di Google (quindi tutte le versioni tranne google.com) hanno un ulteriore parametro meta= che indica quale tra le tre scelte è stata fatta dal navigatore sulle opzioni “Cerca: nel web, pagine in italiano, pagine provenienti da: Italia”

tre_opzioni

Creando l’ennesimo profilo-clone ed applicando il filtro

Web/Lingua/Paese
filtro personalizzato – avanzato
campo A -> estrai A: Referral (\?|&)meta=([^&]*)
Output in -> Definito dall’utente $A2

avrete anche la possibilità di capire in che percentuale vengono usate quelle tre opzioni per arrivare al vostro sito. Avete visto a quante domande si può dare risposta con Google Analytics? ;-)


Aug 14 2009

-98% di visite ed essere felici

autore: Marco Cilia categoria: generale

drastico-calo

Chi sarebbe contento di avere un grafico come quello sopra? ci tengo a precisare che la linea dopo il calo non è a zero (sito scomparso o codice di monitoraggio assente), ma la curva è talmente schiacciata dai numeri precedenti che anche 500 visite sembrano non esistere.

La persona che mi ha sottoposto il caso però, dopo che gli ho diagnosticato il problema e la cura che ha ridotto del 98% le sue visite, era più contenta di prima; il motivo? quelle visite non erano le sue!
E’ successo infatti che un grosso sito – anzi una serie di grossi siti facenti capo ad uno stesso webmaster – ha copiato il suo codice di monitoraggio nelle proprie trafficatissime pagine, inviando i dati a lui invece di vederli nel proprio account Google Analytics.

Chiaramente questo è un caso esagerato e di facile diagnosi, ma mi serve per farvi comprendere quanto sia importante assicurarsi della qualità dei dati in ingresso. Se invece che un grosso network a copiare il codice di monitoraggio fosse stato un sito di dimensione poco inferiore a quella del mio amico, lui avrebbe notato un incremento non molto marcato e avrebbe potuto scambiarlo per traffico qualificato.

Il modo più veloce per accorgersi di un problema simile è guardare il report visitatori -> proprietà rete -> nomi host, che indica da quale dominio provengono i dati che vedere nei report di GA. Il modo più veloce per risolverlo, a parte contattare il webmaster e far rimuovere il vostro codice, è impostare un filtro che faccia accettare a GA solo i dati provenienti dal vostro host.

Infine questo piccolo case-history ci può far riflettere su due cose:

  1. dare un’occhiata alle statistiche tutte le mattine (o almeno un giorno si e uno no) non costa molto tempo e permette spesso di diagnosticare velocemente eventuali problemi. Tanto più che potete mettere nei preferiti l’indirizzo della dashboard di un profilo ed andarci direttamente, se siete già loggati su un qualsiasi servizio Google (Gmail, ad esempio)
  2. controllare pertinenza dei dati che arrivano a GA è una cosa da fare con regolarità. Uno degli assiomi fondamentali della web analytics è il motto inglese “garbage in, garbage out”. Se i dati in ingresso sono spazzatura, non c’è software di analisi che tenga: i dati in uscita saranno per la maggior parte spazzatura. I software, vale la pena di ricordarlo, sono come scatole più o meno chiuse, che effettuano trasformazioni sui dati. E trattandosi di programmi, che girano su computer, non mentono a patto che non siano stati fatti errori nella scrittura del codice. Ma di sicuro non possono nemmeno accorgersi da soli se i dati che gli fornite da elaborare siano o no i vostri.

Jul 29 2009

Risultati illustrati come sorgente separata e con keyword

autore: Marco Cilia categoria: filtri

Qualche giorno fa mi ha scritto Maurizio Petrone con una domanda insolita, almeno per me: ha modificato un metodo noto per tracciare le ricerche Universal Search di Google per tenere conto solo dei click effettuati sulle immagini, ovvero quelli che Google stessa indica come “risultati illustrati” (vedi immagine sotto)

risultati-illustrati

Dico “domanda insolita” perché io non ho mai avuto un sito di foto come cliente, quindi non mi sono mai posto questo tipo di problema che invece è del tutto lecito. Guardando gli url di destinazione dei click (che sono poi i referrer dei siti monitorati con Google Analytics), per la ricerca “montagna” – sul mio browser e in questo momento, ma la sostanza non cambia – i risultati illustrati per una foto puntano a questo indirizzo

http://www.google.it/imgres?imgurl=http://agenda.filastrocche.it/wp-content/uploads/2008/09/montagna.jpg&imgrefurl=http://agenda.filastrocche.it/%3Fp%3D1849&h=600&w=800&sz=166&tbnid=Gvcrgtm0c9eaFM:&tbnh=107&tbnw=143&prev=/images%3Fq%3Dmontagna&hl=it&usg=__ePp09iMbJpQU99vjyP6TqM79NC4=&ei=2QdwSv6CJaGwnQPn-9G5Bw&sa=X&oi=image_result&resnum=5&ct=image

mentre i risultati di Google Immagini per la stessa keyword, e per la stessa immagine di destinazione, puntano invece a

http://images.google.it/imgres?imgurl=http://agenda.filastrocche.it/wp-content/uploads/2008/09/montagna.jpg&imgrefurl=http://agenda.filastrocche.it/%3Fp%3D1849&usg=__1RZ-MlgZ2o5X1eCCBAZnKb73aLg=&h=600&w=800&sz=166&hl=it&start=5&sig2=wSQ01ux59X1UE3WRa7VRUA&um=1&tbnid=Gvcrgtm0c9eaFM:&tbnh=107&tbnw=143&prev=/images%3Fq%3Dmontagna%26hl%3Dit%26safe%3Dactive%26rlz%3D1B3GGGL_it___IT259%26sa%3DN%26um%3D1&ei=IwpwSvunIcf0_AbX25SjCQ

tralasciando il dominio di provenienza (www.google.it piuttosto che images.google.it) potete vedere che le informazioni passate sono leggermente differenti. L’esigenza di Maurizio e di Globopix quindi è chiara, e lecita.

Quello che ci serve quindi è estrarre la keyword usata per la ricerca, cambiare il mezzo di provenienza e la fonte dell’accesso. Servono tre filtri per fare queste operazioni (hey, Google, a quando i filtri con output su più campi? ;-) ), e precisamente:

Risultati illustrati – cambia sorgente
Filtro personalizzato, avanzato
Campo A -> Estrai A -> Referral -> (.*)oi=image(.*)
Campo B -> Estrai B -> Referral -> prev=/images%3Fq%3D([^&]*)
Output in -> Constructor -> Sorgente campagna -> Google (risultati illustrati)
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

Risultati illustrati – estrai keyword
Filtro personalizzato, avanzato
Campo A -> Estrai A -> Referral -> (.*)oi=image(.*)
Campo B -> Estrai B -> Referral -> prev=/images%3Fq%3D([^&]*)
Output in -> Constructor -> Termine della campagna -> $B1
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

Risultati illustrati – cambia mezzo
Filtro personalizzato, avanzato
Campo A -> Estrai A -> Referral -> (.*)oi=image(.*)
Campo B -> Estrai B -> Referral -> prev=/images%3Fq%3D([^&]*)
Output in -> Constructor -> Mezzo della campagna -> Organic
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

Questi tre filtri applicati a un profilo inseriranno una nuova riga tra le sorgenti di traffico, che potrà poi essere segmentata per parola chiave. Il lato negativo è che le frasi di ricerca composte da due o più termini, ad esempio “mare genova” vengono codificate nel referral tramite il carattere ASCII esadecimale %2B, equivalente al segno più (quindi mare%2Bgenova). Poiché un filtro cerca e sostituisci che tenti di cambiare qualsiasi cosa con uno spazio non si può fare, o lo cambiate esplicitamente con un + o lo tenete così. Non si può avere tutto :) (o meglio, si può a patto di modificare tramite javascript il referrer PRIMA di inviarlo a Google Analytics, ma la cosa esula da questo articolo).

Una cosa interessante che ho notato è che nel referrer è presente anche l’indicazione della posizione dell’immagine cliccata. Nell’immagine qui sopra, cliccando per esempio l’ultima immagine il parametro resnum sarà impostato a 6: modificando il filtro risultati illustrati – estrai keyword in questo modo:

Risultati illustrati – estrai keyword e posizione
Filtro personalizzato, avanzato
Campo A -> Estrai A -> Referral -> (.*)oi=image(.*)
Campo B -> Estrai B -> Referral -> prev=/images%3Fq%3D([^&]*)(.*)resnum=([^&]*)
Output in -> Constructor -> Termine della campagna -> $B1 (pos: $B3)
Campo A: Obbligatorio
Campo B: Obbligatorio
Sostituisci campo output: SI

avremo anche la posizione dell’immagine nella SERP al momento del click :)


Jun 23 2009

Keep it simple

autore: Marco Cilia categoria: filtri

Bruno Munari
Keep it simple, stupid è una locuzione anglosassone che viene spesso indicata tramite il suo acronimo K.I.S.S. e significa “falla semplice, stupido”. Viene spesso associata al mondo dell’informatica, dove il grado di complicazione tende a salire molto velocemente e dove esistono sempre soluzioni e accorgimenti che, con molto lavoro in più, riescono a fare quello che ci prefiggiamo.

Bruno Munari, che di informatica penso ne sapesse ben poco, diceva in un suo celebre scritto:

Complicare è facile, semplificare è difficile. Per complicare basta aggiungere, tutto quello che si vuole: colori, forme, azioni, decorazioni, personaggi, ambienti pieni di cose. Tutti sono capaci di complicare. Pochi sono capaci di semplificare.
Piero Angela ha detto un giorno è difficile essere facili. Per semplificare bisogna togliere, e per togliere bisogna sapere cosa togliere

e questa è la frase che riporto sempre quando parlo con qualcuno delle famigerate regular expression di Google Analytics. Prendiamo questo caso reale dal forum di assistenza inglese:

Filter: Exclude traffic from IP addresses in the range of 1 to 9 and 11 to 255.
Filter design: ^(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[2-9][0-9]|1[1-9]|[0-9])\.
Result in Google: 0 page views.

Che gli IP possibili sono solo 256 (da 0 a 255) spero sia chiaro anche all’autore, altrimenti serve un ripassino di base sulla tecnica di internet, e non ha senso lanciarsi a fare un filtro senza sapere cosa e come si deve filtrare. Ora, assunto che la regola sia chiara, perché mai fare un filtro complicato per escludere tutti gli IP da 1 a 9 e da 11 a 255?

Fai un filtro che include solo 0 o 10! eccolo:
(0|10)
:)


Apr 20 2009

Mostra il ranking del sito nei tuoi rapporti

autore: Marco Cilia categoria: filtri

Non appena si è diffusa la voce che Google sta modificando le informazioni passate nei referrer delle ricerche (si veda anche Alessio Semoli) sono fioccate le supposizioni su cosa significhino i nuovi parametri che vengono inviati. Secondo la versione che va per la maggiore, il parametro cd= conterrebbe la posizione del nostro sito nelle pagine dei risultati del motore, consentendo di conoscere il posizionamento del sito per ogni chiave ricercata (e cliccata) dagli utenti.

Mi sono subito messo a scrivere un filtro per mostrare questa importante informazione nei report, ma mentre ero ancora nella fase di affinamento della regular expression (e bloccato soprattutto dal fatto che non ho ancora trovato un referrer “nuovo”) sul sito websharedesign.com è apparso il filtro fatto e finito. Diamo quindi a Cesare quel che è di Cesare, perché intanto stavo percorrendo la stessa strada ma ero solo leggermente più indietro.

Il filtro è di tipo personalizzato/avanzato, e ha i seguenti parametri:

Campo A -> Estrai A: Termine della campagna – (.*)
Campo B -> Estrai B: Referral – (\?|&)(cd)=([^&]*)
Output in -> Constructor: Termine della campagna – $A1 ($B2)
Campo A obbligatorio: SI
Campo B obbligatorio: SI
Sovrascrivi campo di output: SI
Maiuscole/minuscole: NO

Questo filtro presuppone che non abbiate campagne Adwords, e se le avete dovrete applicare un’altra procedura in due step.

Il mio consiglio è quello di testare il filtro su un profilo-copia per due motivi: il primo è il solito, ovvero evitare di distruggere dati di produzione ed essere sicuri che il filtro funzioni adeguatamente; il secondo è una domanda che ho postato nei commenti e che al momento è in moderazione: secondo me questo filtro porta ad una disaggregazione delle keyword di ingresso; se prima la keyword “hotel roma” era unica, applicando il filtro potremmo trovarci ad avere sia “hotel roma (5)” che “hotel roma (8)”, poiché è variata la posizione in SERP del nostro sito su una determinata parola chiave. In settori molto competitivi, come ad esempio il turismo, questo potrebbe portare ad avere risultati molto frammentati e la necessità di riaggregare in fase di analisi dati che lo erano già in origine prima di applicare il filtro.

Inoltre, come noto, gli utenti che fanno ricerche mentre sono loggati ad un Google Account visualizzano risultati differenti e personalizzati rispetto a chi non lo è (Google infatti mostra più in alto risultati che abbiamo già cliccato in passato): il rischio è che vi siano una moltitudine di parametri cd= differenti per query uguali, a prescindere dalla reale posizione nelle pagine dei risultati.

Concludo dicendo due cose: la prima è che il nuovo referrer è ancora in “fase sperimentale”, cioè ha iniziato ad essere inviato solo da alcuni server, e probabilmente ci vorrà ancora del tempo prima di vederlo all’opera (ovvero il filtro potrebbe non fornire nessun risultato anche se corretto). La seconda è che, naturalmente, siccome stavo lavorando su un mio filtro analogo non ho testato questo. Prendete la segnalazione così com’è :)


Apr 02 2009

Raggruppare i domini delle webmail

autore: Marco Cilia categoria: filtri

Se il vostro sito offre una funzione di invio degli articoli per email, ha una newsletter o semplicemente i vostri lettori usano segnalare pagine ad altre persone utilizzando la mail, è probabile che guardando il report “tutte le sorgenti di traffico” dentro a Google Analytics abbiate molte righe del genere:

wmail-new.libero.it / referral
webmailcommunicator.alice.it / referral
mail.google.com / referral
mail.tiscali.it / referral
it.mg40.mail.yahoo.com / referral
fastmail.fastwebnet.it / referral
it.mg41.mail.yahoo.com / referral
it.mc236.mail.yahoo.com / referral
co109w.col109.mail.live.com / referral
it.mc238.mail.yahoo.com / referral
co115w.col115.mail.live.com / referral
it.mc279.mail.yahoo.com / referral
by110w.bay110.mail.live.com / referral
by111w.bay111.mail.live.com / referral
by104w.bay104.mail.live.com / referral
webmail.interfree.it / referral

questo accade perché le webmail, specialmente quelle dei grandi provider che ne gestiscono decine di migliaia, risiedono su differenti server, e generano di conseguenza referrer differenti. Per ovviare a questo problema il blog francese wagablog.com propone un filtro avanzato di riscrittura, che permette di raggruppare le visite da uno stesso provider di posta elettronica.
Il filtro prende come campo A il “sorgente campagna” con espressione regolare:

mail(.*)\.(.*)\..{2,4}

Il campo B non è necessario.
L’output (il constructor) è lo stesso campo “sorgente campagna” con espressione:

webmail - $A2

In pratica effettua una sovrascrittura del campo eliminando le parti superflue, come il nome esatto del server della webmail. Non ho testato il filtro in sé, ma ho fatto parecchie prove con il mio programma preferito di test delle espressioni regolari, verificando che la regex è buona e funziona per bene anche con i provider italiani. Per i più curiosi, l’espressione regolare guarda dove vi sia scritto “mail” nel dominio, e raggruppa qualsiasi cosa vi sia da lì fino al dominio primario memorizzandolo dentro alla variabile $A1. Il dominio (con esclusione dell’estensione) viene estrapolato e memorizzato nella variabile $A2, che è poi quella che viene mostrata nei report.