Jan 15 2010

HelpSemaforoQuesto semaforo indica il livello difficoltà del post
semaforo verde - articolo per tutti semaforo giallo - articolo avanzato semaforo rosso - articolo per esperti

il futuro della wa è senza javascript?

autore: categoria: web analytics

Qualche giorno fa mi ero messo a scrivere un post in cui sostanzialmente mi chiedevo quanto potesse essere vera l’affermazione che feci qualche tempo fa in occasione della presentazione del tracciamento dei siti mobile tramite script lato server; mi chiedevo se Google Analytics avrebbe abbandonato del tutto l’uso di javascript. Il post non mi soddisfaceva, e l’ho cestinato, ma oggi mentre riordinavo le bozze ho trovato questo articolo di Paul Legutko, datato settembre 2009: Web analytics without javascript? in cui si dice che la previsione secca “javascript sparirà entro cinque anni” è addirittura di Yahoo.

Ad alcune considerazioni ammetto di non aver pensato, sono interessanti. Vediamole:
– mobile. Ho appena detto che la soluzione di Google per il mobile non usa javascript, ma un pezzo di codice lato server (asp, php, eccetera). E’ vero che il supporto a javascript da parte degli smartphone è in costante ascesa, ma perché un colosso come big G – che pure ha fatto del tracking code javascript di Analytics una colonna portante – non crede in questa tecnologia portata sui cellulari?
– integrazione dei dati. Praticamente tutti i sistemi di tagging “sparano” i dati in un datacenter remoto; che sia Google, Webtrends o Omniture importa poco, perché l’esigenza sempre più sentita oggi è quella di integrare i dati della web analytics con tutti gli altri messi a disposizione dalla Business Intelligence. Allora perché inviare i dati per poi cavarli di nuovo fuori? è un processo poco razionale, se ci pensiamo…
– cookie. L’attenzione sempre maggiore verso la privacy e la sicurezza degli utenti online porta quasi sempre a puntare anche il dito contro i cookie. Secondo l’autore dell’articolo la percentuale di rifiuto dei cookie è tra il 3 e il 7%, a seconda della tipologia di sito preso in considerazione. Addirittura, alcuni software antivirus tracciano come “non pericolosi” i cookie traccianti dei sistemi di web analytics, ma ne consigliano comunque la cancellazione.

In passato si è parlato ogni tanto di Flash come sostituto di javascript, poiché Flash è leggero e presente su quasi tutti i computer che navigano in rete, ma è anche vero che ultimamente si sente dire che Flash morirà a causa di HTML5 (ok, in rete si sente dire di tutto, ma stiamo ragionando abbastanza in astratto…). In uno dei commenti al post viene invece suggerito il packet sniffing lato server, ovvero l’apertura di tutti i pacchetti a livello TCP che vengono inviati dal server ai visitatori del sito, in modo da carpire tutte le informazioni che normalmente vengono affidate allo script di tracciamento. Questa però è una soluzione che non è affatto alla portata di tutti, certamente non semplice quanto copiare e incollare un pezzo di codice in tutte le pagine di un sito.
Sia come sia, ritengo difficile pensare di tornare ai file di log, almeno non nella forma in cui li abbiamo conosciuti (e in qualche caso ancora conosciamo). Cinque anni sono un tempo enorme in informatica, e può darsi che la prossima generazione di sistemi di web analytics utilizzerà una tecnologia che non è stata ancora inventata; il dibattito però è affascinante, ed ancora una volta potenzialmente in grado di ribaltare completamente il settore.

Condividi l'articolo:

12 Commenti

  1. Ciao Marco,

    secondo me js ha le spalle ben coperte al momento, soprattutto rispetto all’analisi dei log e anche delle sniffate di pacchetti, perchè dato che si tratta di un’analisi solo server side perdi alcuni interessanti dati, come ad esempio le risoluzioni dei pc che visitano il sito.

    Certo non tutti saranno interessati a questo tipo di date, ma in un ottica di analisi ritengo che avere il maggior numero di dati possibili sia un bene, tanto abbiamo sempre modo di filtarli no? 🙂

    Esiste sempre l’alternativa immagine, non ha bisogno di js, ma anche qui torniamo allo stesso problema dei log: i dati non saranno completi al 100%.

    Flash potrebbe essere un’alternativa, permette di recuperare le informaziono locali del pc che visualizza il sito, ma ha un limite molto importante: flash non è installato su un pc appena acquistato e la sua installazione è a discrezione dell’utente finale.
    Potremmo così rischiare di perdere più dati rispetto a chi non ha js attivo sul suo pc (che secondo w3c si sarebbe dovuto attestare intorno al 5% nel 2008, con un tasso di decrescita annuale medio del 1.6% negli ultimi 8 anni)

    Come dicevi bene tu alla fine c’è solo da aspettare e vedere, magari a breve nascerà una nuova tecnologia, con diffusione del 100% e capace di estrapolare dei dati client side di ogni pc…

    Beh attendiamo fiduciosi!

  2. L’introduzione in vari Paesi di leggi restrittive contro la pirateria, vera o presunta, ha come effetto collaterale quello dello sviluppo e della diffusione esponenziale di sistemi per rendere anonima la navigazione!
    E sono tantissimi i programmi che hanno questa funzione, sia gratuiti sia con pagamenti di qualche euro.

    Inoltre sono molti i problemi di sicurezza che bloccano tutto, anche il tracciamento delle statistiche.
    Per farti un esempio l’estensione di firefox NOSCRIPT che non fa eseguire gli script di una pagina web, dichiara circa 300.000 download settimanali.

    E questo ha effetti negativi sulla WA con tracciamento js.
    Un sistema nuovo e diverso dal JS è necessario.

  3. Effettivamente se i numeri sono quelli, come dici bene Luca forse sarà necessario trovare una soluzione alternativa anche ai js.

    Dopo il tuo post ho provato a cercare un po’, soprattutto sui futuri standard (HTML5 e CSS3), e proprio in quest’ultimo parrebbe esserci uno spiraglio per poter ottenere ancora tutti i dati relativi al client attraverso le media queries.

    Che dite, la web analytics del futuro potrebbe passare da CSS3 e immagini da 1×1 pixel dinamiche?

  4. le media query mi pare risolvano solo la parte di screen e color, comunque è una osservazione interessante; non le conoscevo 🙂

  5. I log file tengono comunque conto di un sacco di finto traffico, come quello generato da spider… Mi riferisco a spider che si mascherano da browser. I dati sarebbero affetti da un errore maggiore rispetto a chi non accetta cookies forse… Confido in JavaScript.

  6. Giusto per continuare la conversazione a supporto di quello che dicevo qualche giorno fa: http://www.corriere.it/scienze_e_tecnologie/10_gennaio_21/ipredator-nuova-sfida-pirate-bay_7d56699e-068d-11df-a8ce-00144f02aabe.shtml

  7. la navigazione anonima è però una cosa diversa dalla non tracciabilità. La prima cerca di nascondere l’IDENTITA’ della persona, che in GA è preservata in vari modi tra cui in ultima battuta i termini del servizio. A me che venga tizio, caio o ??? potrebbe (anche) importare poco, se il resto dei dati (visite, referrer, conversioni) c’è.

  8. Si è vero
    ma rompe sempre le scatole

    otteniamo meno dati su GA (tipo le provenienze geografiche)

    inoltre alcuni risultati nelle SERP sono relativi all’IP di collegamento e sti risultati sono falsati.

  9. la provenienza geo è sempre stato un dato “sacrificabile”, poiché soffre dei noti problemi. Per il secondo magari mi perdo qualcosa, ma mi sembra più un problema di chi si anonimizza che del webmaster del sito…

  10. Il fatto che Flash decadrà a breve è ancora da vedere, ma sostanzialmente lo si potrebbe argomentare con il fatto che è proprietario, e sappiamo come si è evoluto nel tempo il concetto di software proprietario dopo l’avvento di internet.

    JavaScript è l’unico metodo open source attualmente valido (fatte le opportune considerazioni per renderlo crossbrowser) per rendere dinamiche le pagine lato client.
    Vista la rapida crescita di applicazioni 2.0 avanzate e potenti (tanto da competere con diversi software desktop) grazie all’interazione asincrona (AJAX) che Javascript permette, vedo proprio difficile il decadimento di questa tecnologia in così poco tempo. Affinché si arrivasse ai livelli di complessità delle wep apps di oggi ci sono voluti 10 anni. Non ci sono attualmente alternative open source ugualmente valide e seppure uscissero a breve non sarebbe scontata un’ascesa così bruciante.

  11. eppure Google stessa ha parlato sul suo blog di Analytics di un box in grado di sniffare il traffico lato server e produrre analisi statistiche. Giuro che mi piacerebbe vederlo in azione, ma dato che costa dei soldi non credo sia aria fritta 😀

  12. 1. Flash è in costante salita (e siamo nel 2011)
    2. Ajax e Javascript non sono ben visti dai programmatori, le applicazioni web che ne fanno uso sono un vero e proprio macello dal punto di vista del codice.
    3. Molti framework famosi (per esempio per PHP come CodeIgniter) non sono basati su Ajax ma le pagine vengono gestite sul server, altro che RIA! Siamo alla fine del 2011 e questo è ancora lo “standard”.
    4. Ci sono ancora pochi framework decenti per Ajax e le RIA (per esempio YUI) e non mi sembra siano molto diffusi, anzi sono già dei progetti semi-abbandonati.

Scrivi un Commento