Dec 05 2017
il report dei contenuti a 1M di righe
Qualche settimana fa mi sono imbattuto in un fenomeno curioso, ma prima di scrivere un post aspettavo conferme; qualche giorno fa ho visto fugacemente un post su Google+ per la stessa cosa e m’è tornato in mente di verificare. Ora vi spiego tutto, ma prima un minimo di ripasso delle basi.
quante righe può contenere ogni report?
La domanda sembra banale, specialmente se si ha a che fare con siti di piccole dimensioni, o se il setup è stato fatto cum grano salis, ma non lo è affatto quando si guarda l’Analytics di siti grandi o giganteschi. La risposta infatti non è “infinite” 🙂
Il numero di righe di un report in gergo tecnico viene definita cardinalità, e prima di proseguire la lettura vi consiglio un ripassino di questo post evergreen: la voce (altro) nei report
Detto fatto, più un sito ha un distinto numero di pagine univoche (vere pagine uniche, o anche semplicemente parametri non filtrati nell’URL), più la voce (other) pesa nel report dei contenuti; parliamo di contenuti perché difficilmente si arriva a 50k record al giorno su altre dimensioni, in ogni caso il problema si porrebbe su qualsiasi tabella.
Cosa è cambiato di recente?
Di recente, da qualche settimana, il valore di (other) nel report dei contenuti è sceso moltissimo sugli analytics di siti giganteschi cui ho accesso, ed è praticamente sparito su siti grossi. Possiamo affermare con relativa tranquillità che il nuovo limite massimo giornaliero è passato da 50k a 1 milione, un incremento pazzesco se ci pensate. Oltretutto dai primi riscontri sembrerebbe che la cosa valga anche sugli Analytics standard, non è una prerogativa di Premium/360. Il cruccio delle analisi sui contenuti, tanto care anche ai nostri amici SEO, è adesso minore e non costringe ad artifizi e trucchi vari per venire a capo lo stesso del problema. Ma c’è di più:
Le custom tables (se hai GA360) e il loro ruolo nei report standard
Se hai accesso a un GA360, e hai i privilegi sufficienti, puoi creare le custom tables, o tabelle personalizzate nella UI italiana, che sono praticamente dei custom report che vengono permanentemente salvati ed elaborati preaggregati. Significa cioè che su quelle tabelle i dati sono sempre puntuali e mai campionati, entro 1M di righe e a patto che eventuali dimensioni secondarie o segmenti siano specificati già in fase di creazione della custom table.
Bene, ma questo cosa c’entra col problema iniziale? ecco, ora ti spiego la magia: quando tu fai una qualsiasi richiesta a GA, lui interroga uno schema, ovvero una “mappa” delle combinazioni possibili di dimensioni e metriche. I report preaggregati hanno uno schema predefinito, l’aggiunta di una dimensione secondaria tra quelle previste provoca l’interrogazione di uno schema diverso, ma non predefinito.
Però se tu crei una custom table (che un limite di cardinalità di 1M di righe) che ricalca esattamente lo schema di un report preaggregato (che ha un limite di cardinalità di 50k righe), quando tu chiedi il report standard, lo schema “punterà” alla custom table, regalandoti il report standard con 1M di righe, anche se non è il report dei contenuti che abbiamo visto poco sopra. Fico eh? 🙂
L’unica cosa da tenere presente è che ovviamente le custom tables non sono retroattive, o meglio vengono rimpolpate con i 30gg precedenti alla creazione, non oltre. Meglio di niente, in ogni caso…