Emoji nei report di Google Analytics

Il contenuto di questo articolo ha principalmente un aspetto curioso piuttosto che una finalità tecnico/pratica. Ci sono casi in cui possiamo trovare tra i report situazioni bizzarre come quella mostrata nell’immagine in Fig. 1. Mi riferisco a emoji, caratteri speciali e simboli all’interno dei report di Google Analytics.

Fig. 1 – Emoji e caratteri speciali inseriti nel form di ricerca di un sito e raccolti in Google Analytics

Dall’esterno, il principale canale di trasferimento di questi dati alla piattaforma di analisi è il modulo di ricerca interno, ad ogni modo è possibile passare questo tipo di informazione come valore di altre dimensioni, quali ad esempio il titolo della pagina, la categoria, azione ed etichetta dell’evento, ecc…

Non c’è da stupirsi, dopotutto Google Analytics supporta l’UTF-8, una codifica che usa gruppi di byte per rappresentare i caratteri Unicode. Questo è anche il motivo per cui simboli come quelli dell’alfabeto cirillico vengono correttamente acquisiti e visualizzati nei report:

А Б В Г Д Є Ж Ѕ З+И І,+Ї К Л М Н О П Ҁ+Р С Т Ѹ Ф Х Ѡ,+Ѻ Ц Ч+Ш Щ Ъ Ꙑ Ь Ҍ Ю Ꙗ Ѧ+Ѩ Ѫ Ѭ Ѯ Ѱ Ѳ Ѵ Ѥ Ѿ

A ispirare la scrittura di questo articolo è stata una domanda alla quale ho risposto tempo fa su stackoverflow. In quell’occasione l’utente si preoccupava del fatto che alcuni caratteri sul proprio sito, con codifica UTF-8, potessero non essere accettati da Google Analytics.

Il test effettuato

La prova di effettiva acquisizione di questo tipo di caratteri è stata sinceramente semplice. Tramite l’hit builder ho inviato un’hit di tipo evento, ad una mia Proprietà di test, contenente un’emoji e un carattere speciale rispettivamente come valori di azione ed etichetta evento, Fig. 2.

Fig. 2 – Hit builder del ga-dev-tools

Già dal report in tempo reale si poteva constatare che l’acquisizione stava avvenendo correttamente, Fig. 3.

Fig. 3 – Report in Tempo Reale di Google Analytics

La conferma a dato consolidato è stata osservabile nell’effettivo report degli eventi, Fig. 4.

Fig. 4 – Report degli Eventi di Google Analytics

Filtrare le emoji da Google Analytics

La parte ancora più curiosa e interessante è che per filtrare un’emoji è necessario definire nel pattern l’emoji stessa.

La seguente tabella mostra una tra le più popolari emoticon, quella con volto sorridente ed occhi felici, e le relative codifiche Unicode e UTF-8:

EmojiUnicodeUTF-8
😁U+1F601\xF0\x9F\x98\x81

Un filtro personalizzato in Google Analytics, ad esempio, per l’esclusione delle URL che contengono tale emoticon nell’URI della richiesta, non funzionerà se definito nel pattern il valore Unicode o quello UTF-8 bensì, affinché l’hit venga scartata, è necessario specificare l’emoji nella sua rappresentazione visiva, Fig. 5:

Fig. 5 – Filtro personalizzato per l’esclusione delle URL che contengono la specifica emoji

Conclusioni

In definitiva l’emoji, come appunto qualsiasi altro simbolo o carattere speciale, è riconosciuto da Google Analytics come una qualsiasi stringa e come tale richiede di essere gestito all’occorrenza.