Dividere e conquistare

J. Krueger
La sezione aurea
Fonte: J. Krueger

Ho scritto questo saggio con Patrick Heck.

In principio erat ratio . ~ San Giovanni, pseudepigrafico

Questo saggio tratta di un problema matematico apparentemente semplice, che, crediamo, ha implicazioni psicologiche di vasta portata. Prima di entrare nella questione, facciamo un commento su San Giovanni, che apre il suo vangelo equiparando il Logos con dio. Il logos è un concetto greco antico di enorme gravità. Può riferirsi a parole, frasi, significato o comunicazione, ma anche all'ordine divino della natura e della legge naturale. Si potrebbero persino vedere somiglianze tra il Logos della Grecia antica e il Tao dell'Est. Nell'Occidente moderno, Logos è ridotto a The Word, una retrocessione iniziata con il testamento Vulgate (latino), che rende Logos come Verbum. Immagina, dio è un verbo. Al di fuori della Bibbia, i Latini hanno reso Logos come Ratio, e lì entriamo nel vivo delle cose. Dal rapporto otteniamo razionalità e razionalità, il gold standard del pensiero, la più alta portata del funzionamento psicologico.

Un altro significato di rapporto si riferisce al risultato della divisione, ciò che ottieni dal frazionamento. Ma quanto è diverso questo stretto significato matematico da quello psicologico cognitivo? Seguendo Posner (1973), che ha definito il pensiero come l'immaginazione di ciò che non è dato immediatamente (lo stimolo) e considerando le loro relazioni, Dawes (1988) ha diagnosticato il pensiero relativo, comparativo e frazionatore come il cuore della razionalità. Dawes ha quindi incorporato la creazione di rapporti nel raggiungimento della razionalità. Nella psicologia del giudizio e del processo decisionale, i rapporti e la loro presunta razionalità provengono per lo più da una maggiore argomentazione bayesiana. Il Reverendo Bayes ha insegnato come avere una mente ben educata, una mente che non si contraddice.

Ricordo come era l'altro ieri, quando un compagno di classe in una scuola di specializzazione riassumeva un articolo di McCauley e Stitt (1978), che pretendeva di dimostrare che gli stereotipi sociali sono bayesiani, cioè che sono relativi. Considera il giapponese. Hanno – grazie a Dio – un basso tasso di suicidio, ma questo tasso può essere – e può essere percepito come – un po 'più grande che nel resto del mondo, o nel tuo paese, se non è il Giappone. Diciamo che la prevalenza del suicidio in Giappone è del 3%, mentre in Lussemburgo è dell'1%. Secondo McCauley & Stitt, questo differenziale di percezione rende il suicidio stereotipato del giapponese e contro-stereotipato dei lussemburghesi e dovrebbe essere espresso come un rapporto diagnostico ; qui 3/1. McCauley e Stitt hanno sostenuto che il rapporto diagnostico è una misura migliore e più fedele della stereotipizzazione rispetto al buon valore percentuale vecchio stile ottenuto per il giapponese. Hanno scoperto che i rapporti diagnostici sono correlati alle classificazioni di tipicità ("Com'è tipico il suicidio dei giapponesi?"), Ma in una decennale ricerca durata, i miei colleghi e io abbiamo dimostrato che il numeratore (% giapponese) fa tutto il lavoro, mentre il denominatore (% lussemburghesi) degrada la misura invece di affilarla (revisionata in Krueger, 2008). Le stime percentuali semplici per un gruppo sono più altamente correlate con i punteggi di tipicità del tratto rispetto ai rapporti diagnostici. Possiamo vederlo anche nei dati di McCauley e Stitt.

Perché McCauley e Stitt pensano che i rapporti diagnostici siano superiori? Partirono dalla premessa – si potrebbe dire prima – che tutta la cognizione, e quindi la cognizione sociale, è bayesiana. Ciò significa che le convinzioni possono essere espresse probabilisticamente e che un insieme di credenze è – o almeno dovrebbe essere – coerente nel modo di Bayes. Nel teorema di Bayes, il rapporto tra la probabilità che un giapponese muoia per suicidio, p (S | J), diviso per la probabilità che un lussemburghese morirà per suicidio, p (S | L), è uguale al rapporto di classificazione posteriore, cioè la probabilità che un suicidio sia giapponese, p (J | S), oltre la probabilità che un suicidio sia lussemburghese, p (L | S), se moltiplicato per il rapporto tra la probabilità a priori che una persona è Giapponese, p (J), con la probabilità che una persona sia lussemburghese, p (L). In altre parole, il teorema di Bayes richiede il calcolo di un rapporto di probabilità condizionali in modo che una persona possa essere classificata come giapponese o lussemburghese, date le loro diverse probabilità di suicidio. Elegante come il metodo di Bayes, non è una buona descrizione di come le persone percepiscono la tipicità dei vari tratti nei gruppi sociali.

McCauley e altri successivamente si sono spostati dai rapporti ai punteggi delle differenze senza molti commenti. In entrambi i casi, probabilmente hanno pensato che prendere in considerazione il modo in cui viene percepito un gruppo di confronto può solo migliorare la misurazione e la previsione. Tuttavia, i rapporti e i punteggi delle differenze differiscono in modi importanti. Innanzitutto, i rapporti sono delimitati da 0 sul pavimento, ma non hanno il soffitto. Mentre 1.0 è il punto medio, l'abbassamento del numeratore non può rendere il rapporto negativo, mentre l'abbassamento del denominatore può spostare il rapporto verso l'infinito. Questa asimmetria produce distribuzioni altamente distorte. Al contrario, i punteggi delle differenze si basano su una distribuzione modesta e simmetrica intorno a 0, dove il massimo è X max – Y max . Secondo – e in relazione – la dimensione del rapporto ci consente di stimare la dimensione del denominatore. Se il rapporto è molto grande, il denominatore è probabilmente molto piccolo. Un punteggio molto ampio, tuttavia, ci dice che entrambi, il numeratore e il denominatore sono vicini ai punti finali delle loro scale, ma alle estremità opposte. A livello intuitivo-concettuale, i rapporti sembrano "relativizzare" la variabile nel numeratore, mentre i punteggi di differenza sembrano "correggerla".

Il fascino dei punteggi "relativi" o "corretti" è profondo, almeno per due motivi. Una ragione è che il teorema di Bayes fornisce uno standard per il pensiero razionale. Il pensiero razionale è coerente e il teorema di Bayes garantisce che i pezzi combacino. Se una probabilità viene trascurata o ignorata del tutto, l'adattamento coerente non può più essere garantito e tutto l'inferno mentale può scatenarsi (Thomas Bayes era un ecclesiastico). L'altra ragione è l'intuizione quotidiana. Questa intuizione è una cosa divertente. Ad esempio, dice che "più informazioni sono sempre migliori", ma poi tende a ignorare il proprio consiglio quando emette giudizi intuitivi. Bayesiani e altri correttori e relativizzatori attingono all'intuizione più-migliore di quando professano l'orrore al pensiero che semplici indicazioni euristiche possono essere utili come strumenti decisionali. Sulla loro filosofia, il giudizio razionale deve dividere (o sottrarre) perché non farlo lascerebbe le informazioni sul tavolo – e ciò prima o poi causerebbe un caos.

I punteggi relativi come i rapporti o le differenze sono utili se fanno meglio di entrambi i loro componenti semplici nel predire una terza variabile. Una ragione per cui potrebbero non farlo è che sono confusi con i loro componenti. Il punteggio della differenza è più facile da capire rispetto ai rapporti. Quindi iniziamo da lì. I manuali di statistica ci insegnano che le differenze sono positivamente correlate alla variabile da cui sottraggono, e sono correlate negativamente con la variabile sottratta (McNemar, 1969). La correlazione, r , è positiva tra X e X – Y, ed è negativa tra Y e X – Y.

J. Krueger
Fonte: J. Krueger

Mettendo da parte le varianze, o assumendo che siano uguali per X e Y, possiamo vedere che il numeratore è probabile che sia positivo e che sarà più positivo in quanto la correlazione tra X e Y diminuisce o diventa negativa.

P. Heck
Rapporti in base al loro numeratore
Fonte: P. Heck

Che cosa, tuttavia, si può dire dei rapporti? Il rapporto X / Y sarà correlato positivamente con il suo numeratore X? Come può non essere così? Man mano che X aumenta, quindi, ceteris paribus , anche X / Y deve aumentare. Bene, inizialmente non sembra funzionare in questo modo. Abbiamo eseguito simulazioni al computer lasciando che X e Y superassero una distribuzione uniforme da 0 a 1. Abbiamo anche variato la correlazione tra X e Y, ma non importava molto. In ogni simulazione la maggior parte dei valori di X / Y era vicina a 1, mentre alcuni erano molto più grandi e ancora meno erano molto grandi. Questo risultato conferma l'idea che la divisione produca una distribuzione altamente distorta. Inclina in uno

P. Heck
Inclinazione positiva (destra) quando X e Y sono negativamente correlati.
Fonte: P. Heck

variabile deprime le correlazioni con altre variabili. Per i valori positivamente correlati di X e Y ( r = .5) troviamo una correlazione tra X e il rapporto X / Y di -.021, e per una X e Y negativamente correlata troviamo .152. I grafici a sinistra mostrano i due diagrammi di dispersione in cui X / Y è mostrato come una funzione di X. La maggior parte dei rapporti si trova nella sezione più bassa della scala, mentre vi è una spruzzata di valori anomali. Quando X e Y sono correlati positivamente, la distribuzione di X / Y è asimmetrica; quando la correlazione è negativa, è corretta.

Si potrebbe essere tentati di concludere che la mancanza di correlazione fornisce la prova di indipendenza. Una simile conclusione potrebbe essere affrettata perché lo skew può mascherare la vera associazione. Una correzione standard consiste nel registrare una variabile distorta prima di correlarla con altre variabili. Quando noi log-trasformiamo i valori, eliminiamo l'influenza eccessiva di quelli periferici di grandi dimensioni e emerge un'associazione positiva tra il numeratore, X e il rapporto pieno, X / Y. La seconda serie di due figure mostra questo. Per i valori positivamente correlati di X e Y ( r = .5) troviamo una correlazione tra X e il rapporto X / Y di. 514, e per una X e Y negativamente correlata troviamo .831. Queste correlazioni sono abbastanza grandi, dando credito all'opinione che la divisione aggiunge poco a ciò che il numeratore già realizza. La divisione aggiunge di più quando la correlazione tra X e Y diventa sempre più positiva. Ciò è interessante perché significa che "relativizzare" una variabile X dividendolo per la variabile Y è più informativa in quanto le differenze tra di esse (tra un valore campionato di X e un valore campionato di Y) diventano minori.

P. Heck
Relazione lineare che emerge dopo la trasformazione del log
Fonte: P. Heck

L'inclinazione della distribuzione del rapporto ha un'altra conseguenza problematica. Sappiamo che la media aritmetica è probabilmente superiore al punto centrale concettuale di 1.0, che otterremmo quando X = Y. Poiché è possibile ottenere un rapporto di X / Y> 2 ma impossibile ottenere uno <0, la maggior parte dei mezzi di campionamento sarà> 1. In una distribuzione simmetrica, la media è una stima imparziale della media reale (cioè la media di un campione infinitamente grande); non è né sistematicamente troppo piccolo né troppo grande e non varia in modo sistematico in funzione della dimensione del campione. Non è così in una distribuzione distorta. In una distribuzione distorta, la volontà media

P. Heck
Forte associazione lineare tra X e X / Y.
Fonte: P. Heck

aumenta come la dimensione del campione N aumenta perché i campioni più grandi rendono più probabile che vengano catturati valori molto rari ma molto grandi (qui, rapporti). Se vengono catturati, tirano su la media. Poiché sappiamo che un rapporto può andare alla deriva verso l'infinito mentre il denominatore diventa infinitamente piccolo, sappiamo anche che un campione molto grande molto molto probabilmente produrrà un significato virtualmente, praticamente o moralmente infinito. Non vorremmo che ciò accadesse perché il risultato sarebbe ininterpretabile.

Per illustrare l'aumento della media in funzione di N, abbiamo eseguito una serie

P. Heck
L'effetto di polarizzazione della dimensione del campione sul rapporto medio atteso.
Fonte: P. Heck

di simulazioni. La figura finale mostra il mezzo campione di X / Y calcolato su oltre 1.000 simulazioni per ciascuna delle 7 dimensioni dei campioni lungo una scala logaritmica. Si noti che il rapporto medio sale, così come la precisione con cui viene stimato (le barre attorno a ciascuna media esprimono l'errore standard, che è la deviazione standard dei mezzi campionati divisa per la radice quadrata del loro numero).

Non c'è motivo di abbandonare ogni speranza e tutti i rapporti. Ma in molti contesti psicologici è buona norma chiedersi se è stato ottenuto quanto si è sperato. Uno non vorrebbe razionalizzare l'uso dei rapporti dopo il fatto. Raccomandiamo di riportare i rapporti insieme alle loro variabili degli ingredienti in modo tale che si possano apprezzare i livelli assoluti da cui i rapporti sono sorti. E, naturalmente, alcuni rapporti sono belli, come quello d'oro nella foto in alto. Chiudendo il cerchio – se permetti una metafora geometrica – Fra Luca Pacioli, il grande matematico del Rinascimento, osservò che "Come Dio, la Divina Proporzione è sempre simile a se stessa".

Krueger, JI (2008). La robusta bellezza delle semplici associazioni. In JI Krueger (a cura di), Razionalità e responsabilità sociale: saggi in onore di Robyn M. Dawes (pp. 111-140). New York, NY: Psychology Press.

McCauley, C., & Stitt, CL (1978). Una misura individuale e quantitativa di stereotipi. Journal of Personality and Social Psychology, 36 , 929-940.

McNemar, Q. (1969). Statistica psicologica (4a ed.). New York, NY: Wiley.

Posner, M. (1973). Cognizione: un'introduzione . Glenview, Ill: Scott, Foresman.