
Sentiment Analysis di Francesco Galofaro, Università di Torino
La sentiment analysis della settimana è dedicata alla prima giornata delle olimpiadi di Pechino. Le nostre reti neurali hanno analizzato i 200 tweet più influenti con l’hashtag #Olimpiadi. L’analisi delle emozioni suscitate è incontrovertibile: si tratta di un successo mediatico, con un 75% di tweet che esprimono gioia (figg. 1-2). Si tratta di utenti di ogni tipo, da quelli istituzionali (La Farnesina augura in bocca al lupo agli atleti italiani) alle televisioni (RAI: «È il momento più emozionante delle #Olimpiadi. È il momento che sancisce l’inizio dei giochi») al Papa, che si appella perché durante i giochi cessino le guerre. Prevalgono su tutti i messaggi degli utenti che, nonostante l’ora tarda, seguono in diretta le prestazioni degli azzurri (biathlon, staffetta, pattinaggio di velocità … Vitozzi, Bormolini, Hofer: i nomi dei nostri sportivi si susseguono senza sosta, ritwittati migliaia di volte. Molto ripresi anche i lanci dell’agenzia Xinhua Italia, che racconta i giochi con annotazioni di costume («Uno dei luoghi più gettonati per scattarsi una selfie alle Olimpiadi Invernali di Pechino è in prossimità del ghiaccio bianco e lucido del National Speed Skating Oval»). Molti utenti si profondono in commenti sarcastici sul costume degli azzurri firmato Armani («un poncho realizzato con una tenda della doccia tricolore»).
Anche i messaggi che esprimono tristezza (8,5%, fig. 3) sono prevalentemente dedicati all’andamento delle competizioni. Si conferma l’adorazione degli Italiani verso il Curling; tiene banco lo scontro con la formazione norvegese: «L’Italia rimane l’unica squadra imbattuta del torneo dopo il quarto round. Repubblica Ceca costretta alla resa per manifesta inferiorità»; «peccato per l’errore di Amos alla penultima, che avrebbe forse aperto ancor più la partita. In ogni caso la Norvegia fa solo 2 punti e si porta sotto di 1. 9-8»). Più seri sono i messaggi di tristezza per la pandemia in corso, e per le misura di sicurezza sanitaria cui sono sottoposte le delegazioni sportive e la stampa. Un po’ triste è anche chi deve svegliarsi alle 3 del mattino per seguire il pattinaggio sul ghiaccio. Quanto ai messaggi che esprimono paura (4%, fig. 4) sono prevalentemente incentrati sul cambiamento climatico, che metterebbe a rischio i giochi, e – di nuovo – al Covid.
Venendo ai messaggi che esprimono rabbia (12,5%, fig. 5) si tratta – era scontato – di messaggi politicizzati. Nell’antica Grecia i giochi olimpici erano una cerimonia religiosa e le guerre si fermavano per permettere agli atleti di gareggiare. Non così oggi: si attacca preventivamente Pechino per la strumentalizzazione politica dello sport, come se tale attacco non fosse a propria volta strumentale. Qualcuno arriva ad attaccare la strategia “Covid 0” della Cina nel nome della libertà, concludendo con un «Viva l’Occidente e viva il #Vaccino» come se in Cina i vaccini non ci fossero. Si attacca Xi Jinping per aver stretto un accordo con Putin sulle forniture di gas: chi esecra l’asse Pechino-Mosca, chi accusa la Cina di aver inaugurato un «sistema politico anti Occidente». Fortunatamente, alla cerimonia di apertura era presente anche un commentatore indefesso come il prof. Michele Geraci, ex sottosegretario allo sviluppo economico. Ci associamo al suo augurio: «Godetevi i giochi, non vi fate fregare dalla politica».
Una novità importante: l’analisi dello stile enunciativo
Da oggi la nostra analisi si arricchisce con la valutazione dello stile con cui si esprimono gli utenti. Grazie a una ricerca portata avanti dall’autore presso l’Università di Torino, si è potuto sostituire il grado di “soggettività” dei messaggi (nozione empirica e di sapore psicologistico) con una valutazione dello stile enunciativo (impersonale o personale), impiegando categorie della linguistica e dalla semiotica (fig. 6). L’uso di questo nuovo algoritmo è una esclusiva di Marx21. La maggior parte dei messaggi mostra uno stile impersonale. Dunque, quali messaggi usano lo stile “personale”? Alcuni riprendono semplicemente lo stile degli annunciatori TV: «Ricordo ore 13.00 la #cerimoniadiapertura su #Rai2». Per la maggior parte, tuttavia, si tratta di messaggi che impiegano la prima persona plurale (“noi”) costruendo un soggetto collettivo che include gli sportivi impegnati nella competizione e gli spettatori che la seguono («al momento siamo primi con Lisa Vittozzi che ha fatto 5/5 al 1° poligono»). In questo modo i messaggi costruiscono attraverso il linguaggio l’identità collettiva della nazione impegnata nella grande impresa sportiva di Pechino.
Nota tecnica
Le sentiment analysis di Marx21 sono realizzate scaricando dalla rete i duecento commenti più influenti, perché sono i più rilanciati dagli utenti o i più citati oppure hanno avuto più risposte o “like”. Le nostre analisi delle emozioni sfruttano una libreria open-source del linguaggio di programmazione Python; l’algoritmo di analisi dello stile enunciativo è stato sviluppato da Francesco Galofaro e dai suoi studenti nell’ambito del laboratorio semiotica e big data dell’Università di Torino applicando tecniche semiotiche all’elaborazione del linguaggio naturale, ed è una ricerca di frontiera. In entrambi i casi, le reti neurali che classificano i messaggi sono addestrate direttamente sulla lingua italiana. Il word-cloud è una rappresentazione delle parole più utilizzate nei messaggi e permette un “colpo d’occhio” sul loro contenuto. Nonostante questo, per evitare distorsioni, non manchiamo mai di citare i messaggi degli utenti più significativi per assegnare una interpretazione ai numeri.
Figura 1

Figura 2

Figura 3

Figura 4

Figura 5

Figura 6
