Twitter può prevedere chi svilupperà la depressione postpartum?

Mika Heittola/Shutterstock
Fonte: Mika Heittola / Shutterstock

Il nuovo campo dell'analisi dei dati sociali ci fornisce più risorse che mai per indagare sui fenomeni sociali. Uno dei miei esempi preferiti di come viene applicato il nuovo campo dell'analisi dei dati sociali è uno splendido studio del 2013 condotto da Microsoft Research [1] . Analizzando i feed Twitter delle donne in gravidanza, i ricercatori potrebbero prevedere con una precisione dell'80% se una donna sviluppasse la depressione postpartum.

Hanno iniziato reclutando circa 400 donne per partecipare. Da Twitter, hanno raccolto dati, inclusi i testi dei tweet femminili, i loro preferiti e le risposte. Hanno quindi misurato quattro tipi di comportamento:

  • Fidanzamento. Questo include quanto spesso qualcuno ha twittato, quanti di quei tweet erano risposte ad altre persone, e quanti link, retweet e domande hanno postato.
  • Social networks. Su Twitter, questo è semplicemente il numero di persone seguite e il numero di follower che qualcuno ha.
  • Emozione. Usando strumenti che analizzavano i tipi di parole che le persone usano, hanno misurato post per parole che esprimevano felicità, tristezza, ansia, tristezza, ecc.
  • Stile della lingua. Scendendo nei dettagli linguistici, queste misure hanno esaminato le cose come articoli, verbi d'aiuto, pronomi e preposizioni nei tweet. Queste parole sono interessanti perché non portano il significato centrale di ciò che stiamo dicendo, ma tendono a variare tra le persone in base al loro umore, personalità o altri tratti. Sono anche molto difficili da controllare perché li abbiamo scelti per lo più inconsciamente.

Dopo aver compilato un elenco di attributi, le donne sono state monitorate per segni di depressione postpartum (PPD). Mentre tutto il comportamento delle donne è cambiato nel corso delle loro gravidanze, le donne che hanno cambiato la PPD sono cambiate in modi diversi. I ricercatori hanno costruito modelli di computer utilizzati da queste piccole differenze. Quei modelli di computer potevano quindi guardare il feed di Twitter di una persona e indovinare se avrebbe continuato a sviluppare PPD.

Usando solo i dati di prima che le donne partoriscano, i loro modelli potrebbero classificare con precisione le donne con la probabilità di sviluppare una PPD o meno con un'accuratezza del 70% circa. Tuttavia, la PPD si sviluppa in genere circa un mese dopo il parto. Quando i ricercatori hanno aggiunto nelle prime settimane dopo il parto, prima che i sintomi della PPD iniziassero a svilupparsi , gli algoritmi sono migliorati, raggiungendo l'80% di accuratezza o superiore.

In che modo è cambiato il comportamento Twitter delle donne? Le donne che hanno sviluppato PPD tendevano a diminuire la frequenza dei tweet e il numero di follower, così come il loro uso dei pronomi personali di 2a e 3a persona ("lui", "loro", "tu"), mentre quelli che facevano non sviluppare PPD effettivamente aumentato in tutte le categorie.

D'altra parte, le donne che sviluppano la PPD tendono a fare più domande mentre le donne che non hanno diminuito il numero di domande che hanno chiesto.

L'interessante intuizione scientifica è che questi sono tutti segnali sottili che non sono espressioni dirette della PPD. Significa che anche se le donne hanno cercato di nascondere la loro potenziale condizione, è improbabile che siano in grado di farlo con successo, almeno dall'algoritmo.

Come strumento diagnostico per i medici, questa tecnica è molto promettente. È non invasivo e, con una precisione così elevata, potrebbe essere di grande aiuto nel segnalare a quali nuove madri potrebbero trarre beneficio da un monitoraggio e un'attenzione aggiuntivi.

[1] De Choudhury, Munmun, Scott Counts e Eric Horvitz. "Prevedere i cambiamenti post-partum nelle emozioni e nel comportamento attraverso i social media." Atti della conferenza SIGCHI sui fattori umani nei sistemi informatici. ACM, 2013.