Le donne nere non sono (meno votate) meno attraenti! La nostra analisi indipendente dell'aggiunta del set di dati sulla salute

[Questo post è stato scritto insieme a Jelte Wicherts]

Nel suo blog ben leggibile, originariamente intitolato "Perché le donne nere sono meno attraenti fisicamente delle altre donne", lo psicologo Satoshi Kanazawa della London School of Economics (LSE) ha concluso che aveva scoperto che le donne afroamericane erano "oggettivamente" meno attraenti di donne europee americane, asiatiche americane e native americane. Le risposte immediate e di vasta portata alle sue controverse conclusioni hanno portato Psychology Today a cambiare prima il titolo del blog e poi a ritrattarlo del tutto.

Nel giro di pochi giorni dopo che il post è apparso sul sito, è seguita una tempesta di fuoco. I blogger di tutto il mondo hanno espresso il loro sdegno al post. Le risposte di molte persone sono state caricate emotivamente, e giustamente. Molte donne afroamericane, che dovevano subire discriminazioni per tutta la vita, erano sconvolte e ferite. Altre critiche tentarono di essere analitiche, ma non affrontarono i problemi chiave, o attaccarono l'intero campo della psicologia evolutiva a causa di un membro della disciplina (vedi i miei pensieri su questo qui). La più grande organizzazione studentesca di Londra (in rappresentanza di 120.000 studenti) ha chiesto la dimissione di Kanazawa dalla LSE. Secondo il suo portavoce, LSE ha avviato un'indagine interna sul blog, anche se il portavoce della LSE ha sottolineato la libertà accademica dei suoi ricercatori.

Siamo d'accordo sul fatto che gli scienziati non dovrebbero essere licenziati per fare dichiarazioni scortese che potrebbero offendere le persone. Tuttavia, la libertà accademica non comporta il diritto (1) di interpretare erroneamente i dati e (2) di ignorare i risultati empirici che vanno contro le affermazioni dichiarate.

Abbiamo recuperato i dati da Add Health su cui Satoshi Kanazawa ha basato le sue conclusioni per vedere se i suoi risultati reggono all'esame. Add Health è uno studio condotto su un campione rappresentativo a livello nazionale di adolescenti di grado 7-12 che sono stati seguiti fino all'età adulta. Lo studio include molte, molte variabili (oltre 8000 nei soli set di dati disponibili pubblicamente), comprese le misure di benessere sociale, economico, psicologico e fisico. Quando abbiamo aperto il set di dati per la prima volta, siamo stati sopraffatti dalle variabili! (Una cosa alla quale possiamo ringraziare Kanazawa è anche sollevare questa domanda in primo luogo, perché probabilmente non avremmo normalmente mai guardato le variabili che ha fatto. Inoltre, si deve notare che con così tante variabili, ci sono sicuramente molti risultati statisticamente significativi nel set di dati semplicemente dovuti al caso [1]).

Una volta individuate le variabili rilevanti, abbiamo condotto le analisi pertinenti ed ecco cosa abbiamo scoperto:

1. Kanazawa menziona più volte che i suoi dati sull'attrattiva sono valutati "oggettivamente". Le valutazioni di attrattiva degli intervistatori mostrano differenze estremamente ampie in termini di attrattiva con cui hanno trovato l'intervistato. Ad esempio, le valutazioni raccolte dalle onde 1 e 2 sono correlate solo a r = .300 (una correlazione varia da -1,0 a +1,00), suggerendo che un magro 9% delle differenze nelle valutazioni della seconda ondata dello stesso individuo può essere previsto sulla base dei rating effettuati un anno prima [2]. Le valutazioni effettuate su Waves 3 e 4 sono risultate in correlazione tra i valutatori ancora più basse, a soli 0,16, anche se gli intervistati avevano raggiunto l'età adulta da allora e quindi non ci si aspetta che cambino nello sviluppo fisico tanto quanto gli adolescenti. Sebbene queste valutazioni non siano state prese allo stesso tempo, se le valutazioni di attrattiva hanno una varianza comune inferiore al 2%, si è costretti a schierarsi dall'affermazione di Kanazawa che l'attrattività può essere valutata obiettivamente.

La bassa convergenza dei risultati delle valutazioni suggerisce che in questo insieme di dati molto ampio e rappresentativo, la bellezza è principalmente negli occhi di chi guarda. Quello che stiamo guardando qui sono semplici valutazioni di attrattiva da parte degli intervistatori i cui gusti differiscono piuttosto fortemente. Ad esempio, un intervistatore (numero 153) ha valutato 32 donne come "media", mentre un altro intervistatore (n ° 237) ha trovato quasi tutte le 18 donne che ha classificato come "poco attraenti". Perché i valutatori differiscono fortemente in termini di come Valutare l'attrattiva dell'intervistato e poiché la maggior parte di esse ha effettuato numerose interviste e valutazioni, questa fonte di variazione deve essere presa in considerazione quando si effettuano test per differenze medie di razza nelle valutazioni di attrattiva. Kanazawa non indica che lo ha fatto.

2. Kanazawa interpreta le sue scoperte in termini di attrattiva per gli adulti, ma la maggior parte dei suoi dati si basava sulle valutazioni di attrattiva dei partecipanti quando erano adolescenti . Se molti di noi (inclusi gli autori di questo post) sono stati giudicati per tutta la vita sulla base della nostra attrattiva fisica da adolescente, molti di noi sarebbero nei guai!

Al momento Health ha quattro "onde" o fasi. Ecco una tabella delle quattro onde e i gruppi di età delle quattro onde:

Si noti che solo Wave IV in realtà consiste in "Adulti". In effetti, la gamma di età per Wave I e Wave II è 12-22, con un'età media di circa 16 per entrambe le onde.

Immagina lo scenario. I ricercatori adulti (purtroppo non siamo riusciti a trovare informazioni sugli stessi intervistatori) sono entrati nelle case di questi partecipanti e hanno valutato la propria visione soggettiva dell'attrattiva fisica dei partecipanti allo studio su una scala da 1 a 5 (da "molto non attraente "a" molto attraente "). Per Waves I e II in particolare, le valutazioni non potrebbero (si spera!) Riferirsi alle valutazioni dell'attrattiva sessuale di questi bambini. Quindi le discussioni su questo argomento utilizzando i dati dal sito di incontri OK Cupid in realtà non sono appropriati qui.

Solo in Waves 3 e 4 i partecipanti erano in media abbastanza anziani (M = 22.2, SD = 1.9 e M = 29.00 SD = 1.8, rispettivamente) per essere effettivamente chiamati "donne" e "uomini" invece di ragazze e ragazzi. Se si guardano i dati dalle onde (3 e 4) in cui tutti gli intervistati hanno raggiunto l'età adulta legale, il modello dei risultati non supporta più la conclusione principale di Kanazawa.

In Wave 3, abbiamo riscontrato una leggera differenza nei rating di attrattiva a favore delle donne europee, ma questo è un effetto non più significativo dopo aver preso in considerazione la variazione casuale dovuta ai valutatori.

Tuttavia, solo i dati di Wave 4 sono rilevanti per il problema che Kanazawa intende affrontare semplicemente perché questa è l'unica onda composta da adulti (sono stati raccolti quando tutti i partecipanti erano adulti di età compresa tra 25 e 34 anni). Sfortunatamente, Kanazawa non include la presentazione di questi risultati di Wave 4, nonostante utilizzi i dati Add Health nella maggior parte dei suoi studi e questi dati sono disponibili da oltre un mese.

Concentrandosi solo su Wave 4, è ovvio che tra le donne nel campione, non vi è alcuna differenza tra le etnie in termini di valutazioni di attrattiva fisica . Le differenze nelle distribuzioni per le femmine quando vengono testate con un test di indipendenza regolare (e leggermente liberale) non sono significative e quindi possono essere attribuite al caso (Pearson's Chi-Square = 15.6, DF = 12, p = .210). Ecco il grafico che mostra la distribuzione delle valutazioni (in percentuale) per 1564 americani europei, 553 afroamericani, 97 nativi americani e 96 femmine americane americane (con mezzi aritmetici sotto ciascun gruppo):

Abbiamo anche analizzato i dati per gli uomini nel campione e la stessa ondata e abbiamo scoperto che le differenze del gruppo di razza per i maschi erano solo significative (Pearson's Chi-Square = 21.2, DF = 12, p = .048), con maschi neri che mostravano un rating di attrattiva generale leggermente più alto rispetto alle altre etnie ( Nota : questo risultato non è statisticamente valido sebbene non tenga conto della dipendenza dei datapoint dall'uso degli stessi valutatori). Ecco il grafico:

Dal momento che questa differenza molto piccola non si è presentata all'onda 3, non ne faremo gran parte.

Kanazawa afferma di essere interessato solo alle "dure" verità sulla natura umana. E la verità è che , da adulti, le donne nere in Nord America non sono valutate meno attraenti dagli intervistatori dello studio Add health, che è uno dei campioni più rappresentativi a livello nazionale mai disponibili per le indagini .

Si noti che i dati potrebbero essere usciti in qualsiasi modo e, indipendentemente da come si è verificato, avremmo riportato ciò che abbiamo trovato. Pensiamo che questo sia un argomento di indagine interessante e importante. Altre rigorose ricerche pubblicate su peer review (che coinvolgono un campione molto meno rappresentativo e più piccolo degli Stati Uniti) hanno mostrato differenze medie statisticamente significative nei rating di attrattiva basati sull'etnia.

Riteniamo tuttavia che tale ricerca debba essere mantenuta ad un livello più elevato rispetto ad altri temi di ricerca sia nel rigore scientifico sia nella presentazione (si veda qui per un argomento simile). Questo dovrebbe essere così specialmente per argomenti che potrebbero potenzialmente causare danni e sofferenza alle persone all'interno di un particolare gruppo. La scienza non funziona nel vuoto. Una raccolta rigorosa delle scienze e una relazione scientifica responsabile sono essenziali non solo per il progresso della scienza ma anche per il miglioramento della società (non è questo il punto della psicologia?).

Anche se una ricerca buona e rigorosa alla fine mostra che le donne di colore hanno un punteggio diverso, in media, in caratteristiche rilevanti (sebbene sia altamente improbabile considerando la rappresentatività di questo set di dati), potrebbero esserci delle implicazioni per il razzismo. Il modo per combattere il razzismo non è ignorarlo (vedi qui per un argomento correlato) ma capire come e perché si sviluppa, intrattenendo l' intera gamma di potenziali spiegazioni causali , dall'apprendimento biologico, all'apprendimento culturale, alla bio-socio-culturale apprendimento.

Earl Hunt e Jerry Carlson offrono 10 principi di progettazione, analisi e reporting che dovrebbero essere considerati attentamente quando si fanno o si valutano le ricerche sulle differenze di gruppo (si concentrano sulle differenze di intelligenza, ma i loro principi si applicano anche all'indagine delle differenze di attrattiva). Il documento completo può essere scaricato qui e speriamo possa offrire una serie di linee guida per ulteriori ricercatori che decidono di condurre ricerche su questo argomento, nonché i blogger che decidono di voler comunicare questi risultati a un pubblico generale.

Come affermano i ricercatori:

"Quando gli scienziati si occupano di indagini che hanno rilevanza per le politiche sociali immediate, poiché gli studi sulle differenze di gruppo possono avere, è dovere degli scienziati esercitare un più alto livello di rigore scientifico nella loro ricerca di quanto sarebbe necessario quando l'obiettivo della ricerca è unicamente per far progredire l'esplorazione all'interno della scienza stessa. In qualsiasi momento, non sosteniamo che certe conoscenze dovrebbero essere proibite sulla base del fatto che potrebbero essere usate impropriamente. Sosteniamo che quando c'è la possibilità che particolari risultati vengano rapidamente tradotti in dibattiti pubblici e decisioni politiche, è dovere dello scienziato assicurarsi che tali risultati siano della massima qualità ".

Kanazawa non segue queste linee guida in tutte le sue pubblicazioni. Ad esempio, in un documento sulle differenze di razza nel QI, egli non solo commette diversi errori teorici, ma ha anche omesso di prendere in considerazione spiegazioni alternative. Per inciso, in quel particolare articolo ha anche supposto che la terra fosse piatta!

La scienza, se fatta correttamente, è autocorrettiva. La cattiva scienza e le interpretazioni sono sostituite da una scienza di migliore qualità e da conclusioni più sensate e accurate. Se si desidera analizzare da soli l'insieme di dati Add Health, è possibile! Puoi richiedere la tua copia del set di dati qui. Attendiamo con impazienza ulteriori discussioni sensate su questi importanti argomenti, che hanno un impatto importante sulla vita di molte persone.

Puoi scaricare qui un riassunto più completo e più tecnico della nostra analisi.

© 2011 di Scott Barry Kaufman e Jelte Wicherts

Segui Scott su Twitter o Facebook . Contattalo qui !

[1] Alcuni possono cavillare con il nostro uso della parola "magro" qui per riferirsi a una correlazione di .30. Dovremmo notare che queste correlazioni non sono le tipiche correlazioni trovate nella psicologia differenziale (ad esempio, il QI con alcune variabili di personalità), ma piuttosto un'analisi di accordo inter-valutatore. Sulla base dei campi incrociati, la Cohen's Kappa di Wave1-Wave2 per le donne è .196. Secondo Landis e Koch questo dovrebbe essere interpretato come "lieve accordo". Kappa per Wave3-Wave4 è .099- anche peggio.

[2] Il nostro ragionamento qui è tratto dalla teoria delle decisioni standard di Pearson-Neyman. Se si assume che l'ipotesi nulla sia vera per, diciamo, 1000 test potenziali, allora si prevede che 50 di questi test siano significativi ad alpha = 05. Se concludiamo sulla base di p <.05 in questi 50 casi che esiste effettivamente un effetto, stiamo commettendo errori di tipo 1. I loro risultati possono essere chiamati risultati "casuali" perché non ci aspettiamo che possano essere replicati semplicemente perché l'ipotesi nulla è vera.