Correlazioni spurie di Tyler Vigen: una recensione del libro

Il libro di Tyler Vigen, Spurious Correlations , è caldo, divertente e fa molti punti molto importanti. Secondo Vigen, il suo libro è basato su dozzine di correlazioni tra insiemi di dati completamente indipendenti. Ha fatto affidamento su un computer per generare correlazioni casuali tra prodotto e momento di Pearson (r) tra tali variabili prive di significato come l'iscrizione alle scuole pubbliche e il consumo di panna acida. E infatti, la correlazione tra l'iscrizione alle scuole pubbliche e il consumo di panna acida è piuttosto alta, r = 0,95. Non solo questo è casuale e privo di significato, ma il problema più grande è che vediamo ogni assurdità come questa ogni giorno e le persone basano le conclusioni su queste correlazioni. Ad esempio, sono preoccupato per l'iscrizione scolastica. Questa alta correlazione significa che se mangio più panna acida più bambini resteranno a scuola?

Il libro di Vigen è molto divertente perché ha quasi duecento di queste sciocche correlazioni casuali che derivano da basi di dati serie. Ad esempio, quando i dati del Center for Disease Control, CDC, sono correlati con i dati del Database di Internet Movie, ha scoperto che le apparizioni cinematografiche di Ben Affleck hanno una correlazione molto alta con avvelenamenti accidentali da pesticidi, r = .92. Questo significa che i film di Ben Affleck causano avvelenamenti accidentali da pesticidi? Ovviamente no. Come sa bene ogni psicologo universitario, la correlazione non implica nesso di causalità. Una correlazione è semplicemente una relazione matematica tra due serie di dati. Significa che due variabili vanno insieme o covary.

Mentre divertente e sciocco, questo libro dimostra molti principi importanti. Insieme a 1) essere cauti nell'interpretazione dei dati e 2) la correlazione non implica la causalità è il terzo concetto di correlazione spuria. In effetti, il libro di Vigen si intitola Spurious Correlations. A rigor di termini, una correlazione spuria è quando la relazione tra variabili con una forte correlazione è spiegata da una terza variabile. È qui che il libro di Vigen diventa ancora più interessante. Ecco un altro esempio. Le entrate pubblicitarie TV di March Madness e le birrerie negli Stati Uniti sono correlate .94. Così come le entrate pubblicitarie aumentano così fanno i birrifici. Potrebbero entrambi essere spiegati da un'economia in forte espansione? Un'economia migliore porta a più soldi da spendere per tutto, compresi spot televisivi e birrifici. E questo suggerisce un altro principio di scienze sociali, The Law of Parsimony. La legge di Parsimony sostiene che quando le cose sono ambigue, la spiegazione più semplice che spiega la maggior parte delle osservazioni è la migliore.

Hmmm …., Ora le cose stanno diventando complesse. Non è sufficiente osservare una correlazione tra le variabili e saltare a una conclusione. Sfortunatamente, questo accade sempre e questo è il motivo per cui questo libro è un così grande complemento a una classe formale nelle statistiche. Ad ogni modo, comincia a diventare ovvio che la scienza sociale riguarda il ragionamento, la logica e non solo le correlazioni casuali generate dal computer. Usiamo il ragionamento deduttivo per formare ipotesi, ragionamenti induttivi per testare le ipotesi e replicare attentamente le nostre scoperte prima di trarre conclusioni. La ricerca in scienze sociali è fondamentalmente un esercizio di logica. Sfortunatamente, nell'era dei big data questo non sta succedendo abbastanza. Ogni giorno siamo sopraffatti dai dati. Non riesco nemmeno a mangiare una cioccolata da Sees senza sapere quante calorie mi costerà. Gli scienziati corrono per pubblicare risultati e i risultati negativi non vengono neppure pubblicati. Media e insegnanti afferrano la conclusione più rapida e la diffondono come pettegolezzi o bambini che giocano al telefono. Tutto accade molto rapidamente senza molto pensiero critico o esame. E questo è esattamente il motivo per cui il libro di Vigen è così importante. Prendendo in giro le correlazioni insignificanti, richiama l'attenzione sul pensiero sciatto. Leggi questo libro per il gusto di farlo e poi fermati a riflettere sulle implicazioni per tutte le conclusioni insignificanti che formiamo ogni giorno.