Oct 10 2011
Il Google Analytics “percolato”
Il “senno di poi” è una cosa fantastica, ti fa sembrare tutto così dannatamente facile e chiaro… adesso che qualcuno mi ha mostrato la via, mi batto il palmo in fronte ed esclamo “ma certo! perché non ci ho pensato io?” beh, in primo luogo perché non sono un SEO e non sono così addentro alle loro questioni tecniche, in secondo luogo perché non avevo ben chiara una cosa.
Ricapitoliamo: durante gli ultimi mesi ho detto più volte, nel blog, su twitter, per mail e a voce, che qualcosa era cambiato nell’infrastruttura di Google Analytics, qualcosa che rendeva il prodotto talmente performante da consentire agli ingegneri di rilasciare feature che un paio di anni fa ci saremmo semplicemente sognati. Pensate ai funnel multichannel, o ai report senza campionamento precisi fino alla milionesima riga di Google Analytics Premium, o anche soltanto alla funzione Real Time…
Ebbene mi scrive Francesco Tinti, conosciuto in rete anche come MisterJinx, con una considerazione tanto breve quanto illuminante: “potrebbe essere stato caffeinato”. Per me, che appunto non faccio il SEO di mestiere ma comunque mi tengo informato, Caffeine era niente altro che un cambio di infrastruttura dell’indice delle ricerche che permetteva di avere risultati più “freschi” cioè indicizzati e disponibili in minore tempo rispetto a prima. Francesco però mi punta a questo articolo di The register, dove si parla di Google Percolator, cioè l’infrastruttura che sta sotto a Caffeine. Percolator – si legge nell’articolo – è una piattaforma per il processing incrementale dell’indice delle ricerche che rimpiazza MapReduce, che invece era un sistema da lanciare ciclicamente (in modo batch). In sostanza MapReduce faceva pochi grandi cambiamenti, mentre Percolator ne fa moltissimi piccoli e di continuo, risultando più veloce.
Fino a prima di leggere l’articolo Caffeine per me era relegato nel mondo del search, subito dopo invece mi è parso l’uovo di Colombo! se è vero che tutti i dati di tutti i prodotti Google condividono il database (e si dice sia così da tempo, ormai), si può applicare Caffeine anche ai dati di Analytics, in modo che gli update siano più frequenti. Questo ad esempio permetterebbe di avere più “freschezza” nei dati intraday, ma anche più dati “semilavorati” e pronti per essere estratti con query più veloci richieste dagli utenti (e sto pensando ad esempio ai Funnel Multichannel in presenza di visite a 6 zeri), fino ad arrivare appunto al Real Time.
Se applicano questo paradigma a tutti i prodotti ci sarà da ridere in futuro: più dati, più veloce a fornirli, più integrazione, più possibilità. Non c’è quasi limite alle possibilità offerte! Grazie Francesco per l’ottimo spunto; non so se è la spiegazione ufficiale, ma quadra parecchio 🙂
Metti due teste geniali e preparate insieme, un seo e un “web analyzer”, mescola bene ed ecco una gran bella segnalazione! 😉
Grazie per tutti gli spunti del tuo articolo 😉 seguirti e’ sempre un piacere oltre che utile!
A presto, Nicola
Speculazione interessante… e per quanto riguarda il nome in codice dell’infrastruttura… LOL!!
perché? “percolare” rende bene l’idea di qualcosa di invasivo e continuo, che filtra ovunque… 🙂
Ciao,
in effetti ora i conti tornano anche a me. Con la nuova versione di Google Analytics è molto più facile ed immediato rispetto alla precedente risolvere dubbi Seo. All’inizio credevo si trattasse solo di una differente presentazione degli stessi dati ma ora le cose mi sono molto più chiare.
Ottimo post!