Apr 02 2009

Raggruppare i domini delle webmail

autore: categoria: filtri tag: ,

Se il vostro sito offre una funzione di invio degli articoli per email, ha una newsletter o semplicemente i vostri lettori usano segnalare pagine ad altre persone utilizzando la mail, è probabile che guardando il report “tutte le sorgenti di traffico” dentro a Google Analytics abbiate molte righe del genere:

wmail-new.libero.it / referral
webmailcommunicator.alice.it / referral
mail.google.com / referral
mail.tiscali.it / referral
it.mg40.mail.yahoo.com / referral
fastmail.fastwebnet.it / referral
it.mg41.mail.yahoo.com / referral
it.mc236.mail.yahoo.com / referral
co109w.col109.mail.live.com / referral
it.mc238.mail.yahoo.com / referral
co115w.col115.mail.live.com / referral
it.mc279.mail.yahoo.com / referral
by110w.bay110.mail.live.com / referral
by111w.bay111.mail.live.com / referral
by104w.bay104.mail.live.com / referral
webmail.interfree.it / referral

questo accade perché le webmail, specialmente quelle dei grandi provider che ne gestiscono decine di migliaia, risiedono su differenti server, e generano di conseguenza referrer differenti. Per ovviare a questo problema il blog francese wagablog.com propone un filtro avanzato di riscrittura, che permette di raggruppare le visite da uno stesso provider di posta elettronica.
Il filtro prende come campo A il “sorgente campagna” con espressione regolare:

mail(.*)\.(.*)\..{2,4}

Il campo B non è necessario.
L’output (il constructor) è lo stesso campo “sorgente campagna” con espressione:

webmail - $A2

In pratica effettua una sovrascrittura del campo eliminando le parti superflue, come il nome esatto del server della webmail. Non ho testato il filtro in sé, ma ho fatto parecchie prove con il mio programma preferito di test delle espressioni regolari, verificando che la regex è buona e funziona per bene anche con i provider italiani. Per i più curiosi, l’espressione regolare guarda dove vi sia scritto “mail” nel dominio, e raggruppa qualsiasi cosa vi sia da lì fino al dominio primario memorizzandolo dentro alla variabile $A1. Il dominio (con esclusione dell’estensione) viene estrapolato e memorizzato nella variabile $A2, che è poi quella che viene mostrata nei report.

Condividi l'articolo:

12 Commenti

  1. In questo articolo ho riportato un po’ di URL riferibili alle webmail utilizzate dagli italiani:
    http://www.voxmail.it/blog/2008/11/19/webmail-marketing-le-basi

    Da aggiungere la nuova webmail di virgilio:
    http://webmailvtin.alice.it/cp/ps/

    Ti segnalo poi le seguenti url di un mio db locale che non hanno la sequenza “mail”:
    wpop.libero.it (importante!! webmail classica di libero)
    wpop.blu.libero.it
    wpop.inwind.libero.it
    wm.infinito.it
    posta..it
    fwbox.fastwebnet.it
    pop..

    Non conosco approfonditamente le regexp di google, ma credo
    che machino almeno un paio di backslash nell tua regex: mail(.*)\.(.*)\..{2,4} (senza l’escaping il punto significa qualunque carattere…)

    [spero che wordpress non rovini le barre inverse]

  2. per l’espressione regolare non capisco. nell’editor la vedo corretta, ma poi wordpress si mangia i backslash. Ho risolto togliendo il tag CODE

    per il discorso pop hai ragione, la regex non li cattura, ma non è difficile fare un altro filtro cambiando mail con pop (la variante di inserire un or non è così banale come potrebbe sembrare a prima vista 🙂 )

  3. ciao,come al solito utilissimo post.
    prendo spunto per una veloce riflessione: le visite al sito da mail (newsletter, mail da customer service, ecc.) lette con un client (vedi tutte le mail aziendali) come vengono tracciate? vanno nei referral e vengono identificate con l’IP ? non c’è modo di filtrarle?
    grazie
    a dopo

    marco

  4. vengono tracciate come traffico diretto. i client di posta (i client, in generale) non producono nessun referrer.

  5. ciao, ho messo su il filtrino. per ora sembra funzionare, anche se non sul pregresso (questo credo che sia inevitabile). mi resta fuori solo:
    wm6.email.it
    ora attivo lo stesso codice sui pop…

  6. Ciao ragazzi,
    interessante il post. Ma sapete dirmi se analytics riesce a registrare le visite di chi legge la newsletter tramite i client di posta?

    Oppure non resta che utilizzare solo link di tracking?

    Grazie mille a tutti!

  7. se la newsletter viene letta interamente all’interno del client, direi di no. A meno che tu non la invii in HTML, inserisci il codice di GA, il client lo esegua, non venga visualizzato un errore di sicurezza… insomma praticamente impossibile 🙂

  8. Ho provato a fare un segmento avanzato con l’exp reg mail(.*)\.(.*)\..{2,4} e mi sono accorto che c’è qualcosa che non va. Ovvero i dati non corrispondono con le visite provenienti dalla newsletter che contiene link con utm (sono di meno!), ho provato ad aggiungere al segmento un OR pop(.*)\.(.*)\..{2,4} ma non è cambiato nulla.

    Cosa mi sfugge? UTM e segmento entrano in conflitto?

  9. certo, perché se ha l’utm quelle visite non le troverai nei referrer, ma nelle campagne!

  10. ed è possibile che alcune visite dalla newsletter non vengano segnate tra le campagne? perché altrimenti è strano (nel mio caso) avere anche refer da webmail varie

  11. se hai gli utm no. Ma se ad esempio io prendo un tuo URL e lo mando per email, senza utm ovviamente, perché non dovresti vedere visite da referral webmail?

Trackbacks

  1. Il meglio della settimana [004] | Il Blog di Omar Cafini

Scrivi un Commento