I Report con i Dati Demografici non tornano

Quando si analizzano gli utenti in base a età, sesso e categorie di interessi è opportuno tenere in considerazione che questi dati, in Google Analytics, sono disponibili solo per un sottoinsieme di utenti e potrebbero non rappresentare la composizione completa del traffico, Fig. 1:

Fig. 1 – Dati demografici con evidenziata la percentuale di sessioni sulla quale si basano rispetto al totale di sessioni acquisite nel periodo di tempo selezionato

Le limitazioni sull’interrogazione di questi dati tuttavia, non si fermano qui.

Se proviamo ad interrogare, utilizzando lo strumento Query Explorer, il numero di utenti suddiviso per la loro età (laddove disponibile), otterremo una situazione simile a quella in Fig. 2:

Fig. 2 – Report Utenti suddivisi per la loro età

Supponiamo adesso di voler incrociare un’altra dimensione, scegliamo la data del giorno così da distribuire le informazioni appena viste nell’arco dei giorni dello stesso intervallo di tempo selezionato.
Quello che ci può essere restituito dall’interrogazione dei dati è qualcosa di simile al seguente, Fig. 3:

Fig. 3 – Report Utenti suddivisi per la loro età e per i giorni del periodo di tempo selezionato

Anziché il risultato atteso, ovvero un elenco esploso nel numero di righe sulla base di ciascun range di età e della data, quello che otteniamo è un report incompleto dove non tutte le fasce di età presenti nell’estrazione precedente sono mostrate e dove la somma dei valori (in questo caso il numero di utenti) non è confrontabile.
Da considerare che spesso, sulla base della percentuale del sottoinsieme di utenti per i quali sono disponibili i dati demografici, il report potrebbe restituire anche nessun risultato.

Il motivo

Lo spiega documentazione:

Le soglie vengono applicate per impedire a chiunque visualizzi un report di dedurre i dati demografici o gli interessi dei singoli utenti. 
Quando un report contiene età, genere o categoria di interesse (come dimensione primaria o secondaria o come parte di un segmento applicato), è possibile che venga applicata una soglia e alcuni dati potrebbero essere esclusi dal report. 

Informazioni su dati demografici e interessi

In conclusione, non è sempre possibile ottenere i dati demografici con dettaglio granulare nei report di Google Analytics. Questo sia per questioni di privacy degli utenti sia per il fatto che tali dati, basati su una porzione di utenti totali, si trovano nel database della piattaforma di analisi all’interno di tabelle dedicate e con valori preaggregati.

Mancando quindi il dettaglio riconducibile alle singole sessioni effettive, il risultato fornito può essere non statisticamente significativo.