Dec 28 2012

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Report che non guarderete nel 2013: keywords

autore: Marco Cilia categoria: report

keywords-not-ptovided

Su questo blog nell’ultimo mese la percentuale di chiavi (not provided) è stata di oltre il 51% del totale delle visite (non il 51% delle keyword, il 51% delle visite): è sicuramente un blog di nicchia, che molto si presta ad essere navigato da utenti che stanno usufruendo di un servizio Google, e perciò magari non fa molto testo, ma il problema sta dilagando pressoché ovunque.

E questo perché praticamente ogni mese qualcuno abbraccia la filosofia del “veicolo le ricerche su Google in https”:
Firefox
Safari su iOS6
Google, per default
Chrome, anche per gli utenti non loggati (non ancora confermato, ma è in testing)

Pensare di passare tutto il sito in https solo per recuperare parte delle keyword (quelle dei non loggati che cercano su https) non porta il risultato sperato, si vedano i commenti a quel post di Giacomo Pelagatti, che aveva già fatto un test a suo tempo. Ha sicuramente degli altri vantaggi, ma non sana la situazione.

Per questo motivo non guardo quasi più quel report, perché le percentuali di visite delle keyword rimanenti sono talmente basse da essere inutili, mentre tutto il “succo” è affogato nel (not provided). Qualcuno ci vede una grande opportunità, anche dal punto di vista SEO, perché questo argomento aiuta a spostare il focus dal tradizionale “posizionamento secco” delle keyword al più giusto “conversion rate da motore di ricerca”, ma ciò non toglie che – ad esempio – per i siti che vivono di contenuti sapere se i propri articoli sono aderenti alle ricerche fatte è piuttosto importante.

Già che ci siamo vi dico anche perché tendo a smentire la possibilità che un domani Google possa far pagare per vedere le keyword:
1) indubbiamente non può sovvertire i protocolli http, quindi non può forzare il referrer quando si passa da https a http: in quel caso il referrer viene tolto sempre
2) AdWords non è la risposta, perché è in grado di “recuperare” solo le chiavi cercate associate ai click sugli annunci: quindi mi dice si la keyword cercata, ma questo ha poca o nessuna attinenza con un possibile click sul risultato organico (ammesso addirittura che il mio sito sia posizionato per la prima pagina organica dove appare il mio sito, beninteso)
3) Poter recuperare la keyword presuppone un meccanismo di collegamento Google Analytics <-> Webmaster Tools più integrato di adesso: ora le keyword ci vengono mostrate aggregate, troncate alle prime 1000, arrotondate. Con un eventuale “abbonamento” dovrebbero ridarcele singole, per visita, e puntuali. E questo vorrebbe dire che ogni visita dovrebbe poi essere in grado di risalire alla situazione presente al momento del click (esattamente come fa AdWords), quindi in poche parole significherebbe identificare ogni click organico con l’equivalente del parametro gclid che usa il sistema cpc. Secondo me è piuttosto infattibile.

[edit: aggiunto il link al blog di Martino Mosna, che peraltro ringrazio per avermi fatto scoprire il post di makeitrank con altre motivazioni a supporto del not provided]


Apr 18 2012

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Un altro modo per distinguere i (not provided)

autore: Marco Cilia categoria: report

Più il fenomeno delle keyword (not provided) aumenta e più le persone si ingegnano per contrastarlo. Non passa giorno senza che si legga qualcosa in merito, a volte sono cose banali, altre volte cose sensate, altre ancora metodi complicatissimi che tirano in ballo funzioni statistiche magari non alla portata di chiunque. Io ve ne parlo quando trovo qualcosa di interessante, e in questo caso il post di Barry Adams su State of Search lo è; è uno di quei post che mette in fila concetti noti, ed è utile perché è semplice.

La premessa è avere un sistema che tracci su Google Analytics la posizione della keyword: in passato ne abbiamo visti alcuni, altri ne potete trovare con delle ricerche su Google. Se avete dei profili-copia in cui avete keyword (posizione), allora avete già risolto la parte “difficile” del lavoro. Darò per scontato che sia così, diversamente rileggetevi il post che ho linkato poco sopra.

A questo punto il report delle keyword mostrerà un record per ogni posizione in cui si trovava la keyword estirpata da Google al momento di passarvi la visita, quindi avremo dei record con (not provided)(1) distinti dai (not provided)(3). Aggiungendo la dimensione secondaria “pagina di destinazione” e ordinando per quest’ultima ci ritroveremo con la situazione che mostra nello screeshot

keyword rank
key rank 2
key rank 3
key rank 4

Se la keyword (not provided) ha lo stesso ranking di una in chiaro, e anche la medesima landing page, ci sono buone probabilità che si tratti della stessa keyword. La cosa funziona meno per le pagine molto popolari, cioè quelle che attraggono visite con keyword molto variegate, come spiega Barry in fondo al suo post.

Qualunque tecnica si scelga, il primo passo da fare per provare e venire a capo dei (not provided) è quello di diluirli: con dimensioni secondarie, filtri o segmenti, analizzare un unico blocco è diverso da avere tanti piccoli record. Ci sono maggiori possibilità di controllarli e confrontarli.


Mar 20 2012

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Recuperare le visite da Google https (ma non la keyword)

autore: Marco Cilia categoria: generale

Come dovreste ormai sapere, da qualche mese Google ci pone due problemi con l’intercettazione delle visite provenienti dalle sue pagine di ricerca: il primo – e il principale – è la questione delle keyword omesse per chi fa ricerche mentre è loggato, keyword che vengono raggruppate nell’unica chiave (not provided) e su cui secondo me c’è poco da fare, per noi comuni mortali.

La seconda, meno pressante, sono le ricerche fatte da https://www.google.com; la versione su protocollo sicuro di Google, per via delle specifiche stesse del protocollo, non solo non passa la keyword, ma non passa nemmeno il referrer: a tutti gli effetti su Google Analytics quelle visite vengono registrate come (direct). Questo potrebbe cambiare da Aprile, quantomeno in un prima fase almeno per chi usa il browser Chrome: con un post sul blog di Webmaster Tools (tnx Riccardo per la segnalazione) Google ha annunciato che aderirà alla proposta d’uso del meta referrer, un elemento della pagina attraverso il quale i webmaster potranno controllare l’invio del referrer dalle loro pagine.

Sostanzialmente i sistemi di web analytics potranno controllare se il referrer sarà https://www.google.com (o .it o qualsiasi TLD) e attribuire quella visita a organic invece di direct. Presumibilmente Google Analytics lo farà automaticamente, ma nel caso in cui non lo facesse, o tardasse a farlo, teniamo gli occhi aperti e semmai imposteremo un filtro avanzato. Per la keyword comunque non c’è niente da fare, è persa anche in quel caso.


Mar 09 2012

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Spalma i (not provided) proporzionalmente

autore: Marco Cilia categoria: generale

Il problema delle keyword (not provided), non fornite da Google per gli utenti che fanno ricerche mentre sono loggati, è destinato ad aggravarsi nei prossimi giorni, con la progressiva adozione della “censura” anche nelle declinazioni nazionali del famoso motore di ricerca.
Per fortuna non ho ancor avuto modo di scontrarmi con profili con alti numeri di keyword nascoste, ma siccome nella vita non si può mai sapere, vi segnalo questo post di Ani Lòpez che descrive un metodo per “spalmarle” proporzionalmente sulle chiavi branded e su quelle non-branded. Rispetto all’approccio “non tocco niente e considero le (not provided) come una terza categoria di chiavi”, il metodo di Ani ha il vantaggio della semplicità – ci sono due formule sempre uguali da applicare – e lo svantaggio che al crescere della percentuale di (not provided) sul totale diminuisce l’affidabilità del sistema.

Se volete cimentarvi, le formule sono quelle illustrate in figura

not provided compensation

mentre in calce al suo post trovate anche un link ad un foglio Excel già pronto dove dovrete soltanto immettere i dati.


Feb 27 2012

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Le dimensioni alternative nei funnel multicanale

autore: Marco Cilia categoria: canalizzazioni-multicanale

Una delle feature più potenti delle canalizzazioni multicanale sono i raggruppamenti di canali, sia automatici sia personalizzati, perché con poche regole ci permettono di raggruppare molte fonti, spesso in modi completamente diversi da come siamo abituati a vedere nei report delle sorgenti di traffico. E’ tuttavia altrettanto utile guardare alle conversioni indirette o ai percorsi di conversione usando alcune delle dimensioni che invece sono proprie di Analytics e che conosciamo e maneggiamo meglio, ad esempio il Mezzo, o la Sorgente; In questo ambito credo che tutti almeno una volta abbiamo selezionato la parola chiave, ad esempio nel report dei percorsi di conversione. Ecco un esempio reale di pattern preso dal mio Google Analytics

Questa conversione ha richiesto 22 sessioni, 9 delle quali da motore di ricerca con le parole chiave illustrate, che si sono concluse tra l’altro con una conversione durante una visita con chiave brand. Quando nel report viene scritto “non disponibile” significa che la sorgente e il mezzo non sono ORGANIC, e che quindi non c’è nessuna keyword. Non sarebbe bello se, dato che una keyword non c’è, Analytics lasciasse la combo sorgente / mezzo? è comunque un’informazione in più, ed è meglio che una in meno…

Ecco, nei funnel multicanale c’è proprio la dimensione “alternativa” Percorso parola chiave (o mezzi/sorgente) che fa esattamente quel che desideriamo; in verità c’è anche Percorso campagna (o mezzi/sorgente), e fa esattamente quel che dice. Le potete trovare entrambe nel classico menu a tendina delle dimensioni:

Attivando quella dimensione il report si modifica così:

Nel mio caso purtroppo ho solo visite direct in mezzo alle keyword, ma siccome i percorsi dei visitatori sono molti è probabile che voi vediate tutt’altro, o che abbiate anche altre combinazioni di sorgenti/mezzi inframezzate alle vostre visite da organico. E’ un modo comodo per avere due informazioni sullo stesso report e farsi un colpo d’occhio sulla situazione.


Oct 19 2011

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Il vostro report delle keyword cambierà. In peggio :(

autore: Marco Cilia categoria: generale

Abituati come siamo ormai da tempo a parlare sempre e solo di buone notizie, una cattiva ogni tanto ci riporta con i piedi per terra. Con una mossa a sorpresa Google ha detto ieri che nelle prossime settimane tutte le ricerche fatte da utenti che sono loggati ai suoi servizi (gmail, google plus, eccetera) saranno reindirizzati alla versione https del motore (si veda anche il post sul blog ufficiale di GA). Inoltre, per questioni di privacy, la keyword verrà omessa dal referrer. E’ un po’ diverso da coloro che usano il sito https://encrypted.google.com, che cripta elimina totalmente il referrer e viene visto da Analytics come traffico diretto (quando la pagina di destinazione è su HTTP. da encrypted a HTTPS il referrer c’è); in questo caso il mezzo sarà riconosciuto correttamente come ORGANIC, ma la parola chiave mancante sarà sostituita con (NOT PROVIDED).

E attenzione, la cosa vale per TUTTI i sistemi di web analytics, non solamente Google Analytics.

Ovviamente questa non è una buona notizia. Nonostante quel che può dire Google, cioè che solo una minima parte del traffico sarà affetta, è evidente che il numero di persone che utilizzano servizi personalizzati di Google è alto, e in in crescita. Paradossalmente se Google+ dovesse avere grande successo, ci ritroveremmo con moltissimi utenti che iniziano a navigare da loggati, e quindi a perdere le informazioni sulle loro keyword. E’ vero che abbiamo ancora i report del Webmaster tool (e la loro integrazione con GA), ma non sono affatto la stessa cosa.

La modifica non avrà impatto invece sui click provenienti da annunci AdWords, e il motivo è semplice: le keyword per il traffico organico sono estratte direttamente dal referrer, e se Google toglie l’informazione nessuno la può trovare, invece i clic sugli annunci a pagamento transitano prima dai server di google, che deve registrare il clic, l’annuncio, la parola chiave e tutto il resto delle informazioni che poi ci rendiconta in AdWords, e poiché il parametro gclid non viene tolto dal referrer poi GA sarà in grado di reimportare quelle informazioni dentro ad Analytics.

Quanto ai facili commenti sul fatto che in Google Analytics Premium sarà invece possibile avere le informazioni sulle keyword organiche, dico che secondo me non è così: se fosse prima o poi si verrebbe a sapere, e sarebbe una enorme figuraccia per Google Analytics. Io stesso sono deluso da questa novità, ma penso che non possano spingersi così tanto oltre…


Dec 01 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Parole chiave più lunghe di TOT parole

autore: Marco Cilia categoria: report

Quando si parla di “coda lunga” si intendono, di solito, quelle parole chiave a medio-basso traffico i cui numeri sommati (accessi, ma anche conversioni) possono dar luogo a fenomeni di rilievo, a volte anche maggiori delle equivalenti keyword mainstream. Per intenderci, e a titolo meramente esemplificativo, potremmo associare il concetto alle parole chiave che trovate nei vostri report dalla riga 25 in giù.

Altre persone tendono a definire il concetto come “le parole chiave che contengono più di X parole”, con il numero X variabile. Io non sono d’accordo con questa definizione, ma la regular expression che vi propongo può essere utile a loro ma anche a voi per altri scopi: la regex serve a isolare le keyword con un numero di parole superiore al numero specificato. E’ questa:

^([^ ]+ ){5,}[^ ]+$

e ovviamente in questo caso prende solo le keyword con 6 o più parole (il numero indicato è infatti il numero di spazi). Potete utilizzarla con un filtro al volo direttamente nel report delle parole chiave, oppure creare un segmento avanzato come questo (clicca per ingrandire)

e verificare le performance del segmento rispetto ai dati di tutto il traffico. O crearne vari e controllare le performance di vari segmenti, tenendo ovviamente presente che il segmento con 6 o più parole contiene anche i dati di un eventuale segmento con 3 o più parole chiave.

Prima che me lo chiediate nei commenti, se volete invece la regex che seleziona SOLO le keyword con l’ESATTO numero di parole, dovete togliere la virgola dopo il numero 🙂


Sep 21 2009

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

GA per SEO: tracciare il posizionamento II

autore: Marco Cilia categoria: filtri

André Scholten ha scritto su yoast.com un aggiornamento del suo metodo per tracciare il posizionamento delle parole chiave nelle SERP (le pagine dei risultati) di Google. E per me è doveroso darvene comunicazione, in modo che anche voi possiate fare le relative modifiche, se avevate letto soltanto il mio post relativo. L’aggiornamento è necessario perché Google sta introducendo un nuovo url delle SERP che veicolano traffico verso i siti, basato su tecnologia AJAX, che riporta come informazione aggiuntiva anche la posizione del link al momento del click.

Nel caso in cui stiate mettendo il piedi il metodo per la prima volta, vi ricordo che è necessario creare un profilo-copia, perché i primi due filtri sono distruttivi nei confronti di tutto il traffico che non proviene da Google organico. Una volta fatto il nuovo profilo-clone, si possono creare e applicare i primi due filtri descritti nel vecchio post (Ranking 1 e Ranking 2), e dopo aggiungere il terzo

Ranking 3:
filtro personalizzato – avanzato
campo A -> estrai A: Termine della campagna (.*)
campo B -> estrai B: Referral (\?|&)cd=([^&]*)
Output in -> Constructor: Definito dall’utente $A1 (posizione: $B2)
Campo A obbligatorio: si
Campo B obbligatorio: si
Sostituisci campo di output: si
maiuscole/minuscole: no

(che in realtà noi conosciamo già, ve l’ho descritto in questo post).
Questi tre filtri insieme mostrano il posizionamento, e la cosa vale per tutti coloro che cliccano un risultato dopo aver fatto una ricerca su un datacenter che è già stato aggiornato. Le SERP che implementano il cosiddetto “universal search” non sono da meno. Nel post su yoast, André fa l’esempio di una ricerca per “pizza Amsterdam”, la cui parte superiore della pagina dei risultati è monopolizzata da una mappa e dai risultati del Local Business Center. Un eventuale click sul primo risultato “classico” porterà come posizione 11, e non 1, perché Google li elenca così (è una cosa che avevamo già trattato parlando del tracciamento delle immagini nelle SERP).

Discorso inverso invece per i sitelink, che inviano un numero compreso tra 1 e 8 a seconda della posizione in cui si trovano all’interno della voce che li contiene. Se siete fortemente interessati ai sitelink, André propone di creare un ulteriore profilo-copia, applicare i tre filtri menzionati sopra, e di aggiungerne uno (che si chiama erronamente Ranking 5 solo perché era presente un quarto filtro eliminato dopo alcuni commenti di attenti lettori):

Ranking 5:
filtro personalizzato – includi
Campo filtro: Referral
Pattern filtro: oi=(oneline_sitelinks|smap)

oneline_sitelinks sono i sitelink su una riga, smap quelli “classici” su due colonne. Includendo questo filtro gli unici risultati che vengono mostrati nel profilo sono quelli relativi ai sitelink, pertanto vi permette di fare accurate analisi su quali e quanto essi vengano cliccati.

Come chicca finale – che non conoscevo – André dice che le ricerche fatte sulle declinazioni nazionali di Google (quindi tutte le versioni tranne google.com) hanno un ulteriore parametro meta= che indica quale tra le tre scelte è stata fatta dal navigatore sulle opzioni “Cerca: nel web, pagine in italiano, pagine provenienti da: Italia”

tre_opzioni

Creando l’ennesimo profilo-clone ed applicando il filtro

Web/Lingua/Paese
filtro personalizzato – avanzato
campo A -> estrai A: Referral (\?|&)meta=([^&]*)
Output in -> Definito dall’utente $A2

avrete anche la possibilità di capire in che percentuale vengono usate quelle tre opzioni per arrivare al vostro sito. Avete visto a quante domande si può dare risposta con Google Analytics? 😉


Apr 20 2009

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Mostra il ranking del sito nei tuoi rapporti

autore: Marco Cilia categoria: filtri

Non appena si è diffusa la voce che Google sta modificando le informazioni passate nei referrer delle ricerche (si veda anche Alessio Semoli) sono fioccate le supposizioni su cosa significhino i nuovi parametri che vengono inviati. Secondo la versione che va per la maggiore, il parametro cd= conterrebbe la posizione del nostro sito nelle pagine dei risultati del motore, consentendo di conoscere il posizionamento del sito per ogni chiave ricercata (e cliccata) dagli utenti.

Mi sono subito messo a scrivere un filtro per mostrare questa importante informazione nei report, ma mentre ero ancora nella fase di affinamento della regular expression (e bloccato soprattutto dal fatto che non ho ancora trovato un referrer “nuovo”) sul sito websharedesign.com è apparso il filtro fatto e finito. Diamo quindi a Cesare quel che è di Cesare, perché intanto stavo percorrendo la stessa strada ma ero solo leggermente più indietro.

Il filtro è di tipo personalizzato/avanzato, e ha i seguenti parametri:

Campo A -> Estrai A: Termine della campagna – (.*)
Campo B -> Estrai B: Referral – (\?|&)(cd)=([^&]*)
Output in -> Constructor: Termine della campagna – $A1 ($B2)
Campo A obbligatorio: SI
Campo B obbligatorio: SI
Sovrascrivi campo di output: SI
Maiuscole/minuscole: NO

Questo filtro presuppone che non abbiate campagne Adwords, e se le avete dovrete applicare un’altra procedura in due step.

Il mio consiglio è quello di testare il filtro su un profilo-copia per due motivi: il primo è il solito, ovvero evitare di distruggere dati di produzione ed essere sicuri che il filtro funzioni adeguatamente; il secondo è una domanda che ho postato nei commenti e che al momento è in moderazione: secondo me questo filtro porta ad una disaggregazione delle keyword di ingresso; se prima la keyword “hotel roma” era unica, applicando il filtro potremmo trovarci ad avere sia “hotel roma (5)” che “hotel roma (8)”, poiché è variata la posizione in SERP del nostro sito su una determinata parola chiave. In settori molto competitivi, come ad esempio il turismo, questo potrebbe portare ad avere risultati molto frammentati e la necessità di riaggregare in fase di analisi dati che lo erano già in origine prima di applicare il filtro.

Inoltre, come noto, gli utenti che fanno ricerche mentre sono loggati ad un Google Account visualizzano risultati differenti e personalizzati rispetto a chi non lo è (Google infatti mostra più in alto risultati che abbiamo già cliccato in passato): il rischio è che vi siano una moltitudine di parametri cd= differenti per query uguali, a prescindere dalla reale posizione nelle pagine dei risultati.

Concludo dicendo due cose: la prima è che il nuovo referrer è ancora in “fase sperimentale”, cioè ha iniziato ad essere inviato solo da alcuni server, e probabilmente ci vorrà ancora del tempo prima di vederlo all’opera (ovvero il filtro potrebbe non fornire nessun risultato anche se corretto). La seconda è che, naturalmente, siccome stavo lavorando su un mio filtro analogo non ho testato questo. Prendete la segnalazione così com’è 🙂


Feb 20 2009

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

Analisi delle keyword di ingresso

autore: Marco Cilia categoria: report

Ciao Marco, ieri cercavo di capire quali sono le keyword grazie alle quali gli utenti arrivano direttamente su alcune pagine indicizzate da Google. Sono andato su “content” – “top landing page”. La pagina che mi interessa ha 275 entrances. e fino a qui tutto ok.

Successivamente ho selezionato la pagina e dopo “entrance keyword”. Quindi ho trovato che la pagina in questione è raggiunta attraverso le keyword x,y,z,ecc.. ma con un totale di visite enormemente superiore a 275 (10 volte tanto). Quel numero (2800 circa) mi sembra il numero di utenti che hanno visto quella pagina (dopo essere arrivati sul sito attraverso le varie kw), piuttosto che gli utenti che sono “landati ” sulla pagina grazie a quelle kw.

E’ un caso arbitrario, purtroppo. Io ho alcuni profili in cui tutto combacia perfettamente e altri che si comportano come il tuo. Parte della spiegazione secondo me è riconducibile al discorso delle dimensioni, parte invece è proprio legata all’architettura del sistema. Una conferma mi viene da questa discussione sul forum:

There is no way in Google Analytics to create a report that shows two dimensions at a time (like keyword and landing page) side by side. You can only drilldown from a top level dimension to a lower level dimension (even in a custom report).

In realtà nei custom report si possono annidare più dimensioni, ma il sistema esclude automaticamente le “combinazioni impossibili”, secondo questa tabella. La combinazione che cerchi tu, keyword per pagina di ingresso, è attualmente una di quelle off limits.