Jul 28 2008

Quanto è affidabile la geolocalizzazione degli IP?

autore: categoria: report tag: ,

Ho sempre detto ai miei clienti di non fare troppo affidamento sul dato “città” del report provenienza geografica di Google Analytics, perché so per esperienza che è una cosa tanto affascinante quanto potenzialmente fonte di grane per il consulente: i clienti sono esterrefatti dalla precisione dei dati e si perdono in quei report, spesso formulando poi strane richieste.
Il mio consiglio quindi era quello di prendere i dati cum grano salis e semmai di soffermarsi su un dato di livello superiore, su un’area geografica maggiore (per l’Italia le regioni, anche se il dato non esiste per GA).

Tecnicamente l’operazione che Google Analytics compie è detta “geolocalizzazione degli IP” (IP location in inglese) e si basa su un grande database che riporta la lista dei possibili IP e la relativa provenienza geografica; più questo database è accurato e più l’informazione è precisa, e poiché gli IP sono di proprietà degli internet providers, i fornitori di connessioni, di norma sono essi che forniscono la maggior parte dei dati. Ad esempio, uno dei database considerati più attendibili è quello fornito da Ip2Location.com, ma ne esistono innumerevoli altri, free o a pagamento.

Google non precisa da nessuna parte se usa un database di terze parti o se ne ha implementato uno proprio (la qual cosa non dovrebbe stupirci, vista la mole di dati che maneggia), ma l’impressione che se ne trae è che in entrambi i casi la precisione dei dati forniti aumenti nel tempo. Non sono l’unico ad essersene accorto, ma per giustificare questa frase ho estratto l’overlay geografico delle visite al mio blog personale nel mese di Luglio con provenienza Norvegia, dove sono stato in viaggio di nozze e da dove mi connettevo per postare un resoconto a puntate e leggere eventuali commenti (e da dove normalmente non ricevo molte visite, ulteriore controprova):

A parte una indicazione (Lesja), i pallini riproducono esattamente le città da cui mi sono connesso: Oslo, Bergen, Trondheim, Tromso, Alesund, Bodo. L’indicazione sbagliata è comunque geograficamente vicina a un posto dove abbiamo dormito, un piccolo paesino che potrebbe “uscire” con quella indicazione, ma anche nel caso in cui fosse errata, cambierebbe di poco la grande precisione del resto dei dati.
In Italia abbiamo un paio di grandi problemi: Fastweb, che per la sua architettura esce da pochi punti collocati in grandi città (in questo momento ip2location mi colloca a Roma, di solito sembro un milanese), e Tele2 che di norma assegna alle ADSL italiane ip geolocalizzati in Svezia. Al primo non si può ovviare, non in tempi brevi, per il secondo ci sono speranze. Di certo da questo momento guarderò con più fiducia all’overlay geografico, anche se la strada da percorrere è ancora lunga e non si arriverà mai ad avere una accuratezza totale…

Condividi l'articolo:

16 Commenti

  1. Non sono per i commenti complimentosi, ma complimenti, gran bel case histroy, molto bella l’autoanalisy sul viaggio di nozze. Anche io dall’Irlanda mi collegai spesso con il mio htc, più che altro per mandare foto ai nonni di Enrico, apensarci prima, mi sarei tracciato. :)

  2. a dire la verità non era una cosa programmata, ma quando me ne sono accorto ho effettivamente realizzato che sarebbe servito come dimostrazione tangibile :)

  3. Enrico Giubertoni

    Ma perchè Roma viene definita da GA come Augusta?

  4. quello credo proprio fosse un errore del database. Infatti non mi risulta esistere nessuna città di nome Augusta nel Lazio o vicino Roma (ce n’è una in Sicilia), e il fatto che le visite si siano azzerate a partire dal 12 Luglio è anch’esso indicativo…

  5. Bell’articolo e problema tutt’altro che irrilevante.

    Io abito in Svizzera e da GA vengo segnalato dove risiede il mio provider, cioè in Svizzera interna, a circa 200km di distanza e con lingua diversa.

    Praticamente tutti i maggiori provider hanno lo stesso problema e lascio immaginare i problemi per avere dati affidabili se cerco di filtrare i dati per utenti provenienti dal solo canton Ticino, che è la zona che mi interessa maggiormente.

  6. Ho una domanda, che forse è un po’ stupida.

    Poniamo che nell’analisi del traffico sul mio blog/sito io voglia incrociare la localizzazione geografica con le fonti di traffico, per comprendere quali fonti di traffico sono le più efficaci rispetto ad una determinata zona. Soprattutto nell’ottica di comprendere se le mie azioni di web marketing funzionano, come ad esmepio nel caso di una campagna Adwords localizzata solo in alcune zone di interesse.

    A quanto affermi nel tuo articolo, quest’analisi non avrebbe alcun senso o quantomeno non è un dato su cui fare grande affidamento. Quindi come trovare la giusta soluzione, sopratttuto se dovessi spiegare i risultati ottenuti ad un cliente? Dovrei sempre specificare che non sono affidabili al cento per cento, ma comunque presentare questi dati?

  7. al contrario: io dico che prima non mi fidavo molto e che ora mi fido un pochino di più :)
    Diciamo che piuttosto che la città singola tenderei a concentrarmi su un suo intorno. Diciamo la provincia, anche se come dicevo non è un dato che esiste in GA e te lo devi ricavare a mano.

  8. A seguito di alcune prove effettuate con indirizzi IP di diversi gestori ho notato che, oltre a quanto riportato sopra, anche la geolocalizzazione di alcuni indirizzi Telecom Italia Business sono errati: talvolta l’errore è di circa 700 km…

Trackbacks

  1. RSS Week #14: articoli interessanti che ho trascurato | Matteo Moro
  2. Rimandato il party facebook a Milano | Milano2015.in
  3. Google Analytics in 30 secondi… da un anno! · Google Analytics in 30 secondi
  4. Ferie, finalmente! · Google Analytics in 30 secondi
  5. Le vostre mappe miglioreranno, probabilmente · Google Analytics in 30 secondi
  6. Ho provato statistiche.it • Google Analytics in 30 secondi
  7. Le statistiche dei blog realizzati con wordpress
  8. L’oceano atlantico nel report real-time • Google Analytics in 30 secondi

Scrivi un Commento