Usare i Big Data per studiare psicologia

Amazon
Fonte: Amazon

C'è molta discussione sul valore dei big data per le aziende. Ad esempio, Amazon abbina i tuoi acquisti e le tue pagine a quelli di altri acquirenti e cerca di trovare persone con interessi simili. Quindi, Amazon suggerisce l'acquisto di prodotti a cui piacciono le persone partendo dal presupposto che piaceranno anche a loro.

I big data possono essere utilizzati per rispondere a domande di interesse per la comunità di ricerca in psicologia? Seth Stephens-Davidowitz ha esplorato questa domanda con dettagli nel suo affascinante libro, Everybody Lies .

Quello che mi piace del libro di Stephens-Davidowitz è quanto è chiaro sia su cosa possiamo imparare dai big data, sia su alcune delle cose difficili da usare con successo.

I big data sono particolarmente efficaci nell'affrontare domande che le persone potrebbero altrimenti essere riluttanti a rispondere nei sondaggi. Spesso, il modo in cui le persone interagiscono con il computer rivela aspetti dei loro interessi che non esprimono in un colloquio o persino in un'indagine anonima.

Ad esempio, Stephens-Davidowitz esplora i dati relativi all'orientamento sessuale. Sottolinea che ci sono grandi differenze regionali in quanti uomini riferiscono di essere gay. Ad esempio, molti più uomini in Rhode Island si identificano come gay nei sondaggi rispetto agli uomini nel Mississippi. Potrebbe essere che gli uomini gay si spostino verso stati che sono più tolleranti, ma potrebbe anche essere che gli omosessuali in stati meno tolleranti hanno meno probabilità di rispondere sinceramente ai sondaggi.

Stephens-Davidowitz ha utilizzato i dati di Facebook su dove sono nati gli uomini che si sono autoidentificati come gay e dove si sono trasferiti. C'era una certa tendenza al movimento da luoghi meno tolleranti a quelli più tolleranti. Ma quel movimento da solo non spiegherebbe le grandi differenze regionali viste nelle indagini.

Ha quindi utilizzato i dati di Google, che traccia i tipi di ricerche effettuate dagli utenti e fornisce informazioni sulle località da cui hanno origine le ricerche. In particolare, ha esaminato la proporzione di ricerche per la pornografia in particolare alla ricerca di pornografia maschile gay. Circa il 5% di tutte le ricerche pornografiche di uomini riguardavano la pornografia maschile gay. Questo era vero praticamente in ogni stato degli Stati Uniti, indipendentemente da quanto tollerante fosse lo stato. Ciò suggerisce che circa il 5% della popolazione maschile è attratta dagli uomini e che questo è vero in ogni stato.

I big data possono anche essere utilizzati per rispondere a domande a cui è difficile o impossibile rispondere in altri modi. Il mio esempio preferito nel libro deriva da un'esplorazione dei sogni. Freud ha suggerito che i sogni possono rivelare desideri sessuali inconsci simbolicamente. Una banana o un cetriolo in un sogno, quindi, potrebbe essere un sostituto per un pene.

È difficile confutare una teoria come questa perché i desideri che Freud aveva discusso dovevano essere inconsci. Ciò significa che anche se le persone parlano dei loro sogni, per definizione non possono sapere cosa significhi il sogno.

Stephens-Davidowitz ha preso i dati da un'app che ha raccolto descrizioni di sogni dagli utenti e ha esaminato le descrizioni dei sogni e ha trovato tutti gli alimenti citati. Ha esaminato i fattori che predicono la frequenza con cui un determinato cibo appare nei sogni e poi ha scoperto che la frequenza con cui questi alimenti sono stati consumati era un grande predittore del loro aspetto nei sogni e della bontà degli alimenti.

Quindi, ci sono cibi a forma di fallo nei cetrioli e nelle banane dei sogni, ma sembrano apparire più con la frequenza con cui vengono mangiati che con qualsiasi altra cosa. Ad esempio, i cetrioli sono il settimo vegetale più popolare nei sogni, e sono anche il settimo vegetale più popolare in assoluto. Questo suggerisce che non c'è motivo di credere che una banana in un sogno sia qualcosa di più di una banana.

Infine, Stephens-Davidowitz fa un buon lavoro nell'esplorare alcuni dei fattori che possono rendere inaffidabile l'analisi dei big data. Supponiamo che tu abbia qualche tratto complesso, come l'intelligenza, e vuoi sapere se ci sono dei predittori genetici dell'intelligenza. Potresti provare a correlare i punteggi sui test di intelligenza con i geni delle persone che prendono quei test. Ora che gli scienziati hanno dati sulle sequenze di geni per così tante persone, questa analisi è stata fatta più volte su diversi set di dati.

Ogni volta che questa analisi è stata eseguita, alcuni geni appaiono come buoni predittori di punteggi QI all'interno di quel set di dati. Il problema è che diversi geni sono emersi in diverse analisi. Succede perché anche quando hai molti dati se hai un gran numero di potenziali predittori (come i geni) e hai molte opportunità di notare una correlazione che è solo il risultato di variazioni casuali in quel set di dati. Di conseguenza, se senti un rapporto che è stato trovato un particolare gene che predice alcuni tratti come l'intelligenza, dovresti trattarlo scetticamente fino a quando non è stato convalidato su diversi set di dati.

I big data non sostituiranno i tradizionali modi in cui facciamo psicologia. In definitiva, i big data ci offrono l'opportunità di vedere in che modo diversi aspetti dell'ambiente sono correlati, ma non possono dirci quali fattori causano comportamenti particolari. Per fare ciò, la psicologia deve continuare a fare il tipo di sperimentazione che è stata fondamentale nel campo per il secolo scorso. Tuttavia, i big data hanno un grande potenziale per essere uno strumento importante per comprendere il comportamento delle persone.

Seguimi su Twitter.

E su Facebook e su Google+.

Ecco le informazioni sul mio ultimo libro Brain Briefs .

Dai un'occhiata ai miei libri Pensiero intelligente e abitudini di leadership e Smart Change .

Ascolta il mio programma radiofonico sulla radio KUT di Austin Two Guys on Your Head e segui 2GoYH su Twitter e su Facebook. Lo spettacolo è disponibile su iTunes e Stitcher.