Conservazione dei dati: il Nulla che avanza

Cominciano a farsi sentire gli effetti della funzionalità introdotta da Google, che consente a tutti i titolari di account Google Analytics di impostare il periodo di conservazione dei dati. Si tratta di un’opzione a livello di Proprietà per definire il periodo di tempo prima che i dati a livello di utente ed eventi memorizzati da Google Analytics vengano eliminati automaticamente dai server di Analytics.

Il periodo di conservazione riguarda i dati a livello di utente ed evento associati a cookie, identificatori utente (ad esempio User ID) e identificatori pubblicitari (ad esempio cookie DoubleClick, ID pubblicità di Android e Identifier for Advertisers di Apple).

Conservazione dei dati di utenti ed eventi

La buona notizia è che i rapporti aggregati standard di Google Analytics non sono interessati.

La conservazione dei dati nella pratica

La Fig. 1 mostra un report standard di Google Analytics che rappresenta gli utenti in un intervallo di tempo risalente a cavallo di 14 mesi precedenti alla data in cui sto scrivendo questo articolo (settembre 2020):

Fig. 1 – Report standard di Google Analytics

Come si può osservare, al di là di qualche picco e avvallamento indipendente dai sistemi Google, i dati aggregati degli utenti sono mostrati per l’intero intervallo di tempo selezionato.

Facendo invece una richiesta a Google Analytics di un report non standard riguardante i dati a livello di utente, nel caso specifico aggiungendo un segmento per isolare gli utenti provenienti da un determinato terzo livello del sito, lo scenario assume un aspetto alquanto desolante, Fig. 2:

Fig. 2 – Stesso rapporto della Fig. 1 con l’aggiunta di un segmento a livello di utente

Lo scudo in alto a sinistra del report passa da un confortante colore verde ad un interrogativo colore giallo, infatti, nonostante il rapporto si basi su tutte le sezioni, ci avvisa che alcuni dati di questo rapporto non sono disponibili perché hanno una data precedente al periodo di conservazione dei dati, Fig. 3:

Fig. 3 – Notifica del report in Google Analytics

Il periodo di conservazione dei dati impostato a livello di Proprietà, che nel caso specifico è di 14 mesi, Fig. 4, conferma il comportamento osservato:

Fig. 4 – Conservazione dei dati di utenti ed eventi nella Proprietà di Google Analytics

La citazione “il Nulla che avanza“, che ho preso in prestito dal romanzo La storia infinita (1979), è evocativa di cosa succede giorno dopo giorno ai nostri dati in Google Analytics.

Conclusioni

Poiché è possibile scegliere per quanto tempo Analytics deve conservare i dati prima che vengano eliminati automaticamente, sia per il Web (14 mesi, 26, 38, 50 oppure Mai) che per le App (2 o 14 mesi, con restrizione di due mesi applicata sempre ai dati relativi a età, sesso e interessi), il Titolare dei dati dovrebbe selezionare opportunamente il periodo di conservazione a seconda del tipo di utilizzo che dovrà essere fatto con tali informazioni, in base ad un’attenta analisi del business e ad uno studio dei trattamenti.
Ovviamente il tempo di conservazione deve essere giustificato e comunicato adeguatamente al fine di essere conformi alla normativa GDPR.
A tal proposito è bene sapere che, per quanto riguarda le Proprietà Web, l’ampliamento del periodo di conservazione non influisce sui dati già raccolti. In altri termini, i dati raccolti con i 14 mesi ancora in vigore verranno eliminati 14 mesi dopo l’acquisizione, anche se il periodo di conservazione passa in seguito a 26 mesi.

È intuitivo che, minore sarà il periodo in cui i dati sono mantenuti in piattaforma e più limitata potrà essere un’analisi con lo storico. Nel caso dell’esempio visto nell’articolo, i dati in Analytics a livello di utente sono disponibili da fine luglio dello scorso anno in poi. Per questo motivo un confronto sull’andamento del primo quarto dell’anno corrente con quello precedente, con il segmento utilizzato, non sarà in alcun modo possibile.

È bene ricordare che queste restrizioni sono legate ai termini di servizio di Google Analytics. Poiché ci possono essere altre informazioni a livello di utente, come le dimensioni personalizzate, una buona pratica per mantenere consultabili questi dettagli nel tempo (sempre regolata adeguatamente per conformità con la normativa per la protezione dei dati), è quella dell’esportazione in altri supporti non soggetti a queste limitazioni. Probabilmente è proprio questo il motivo per cui BigQuery si sta facendo sempre più spazio all’interno della cassetta degli attrezzi di un digital analyst.