Diversi anni fa ho scritto un post sull'effetto Dunning-Kruger. A quel tempo stavo ancora ottenendo le mie metaforiche gambe marroni per scrivere e, di conseguenza, non penso che il post sia risultato il migliore possibile. Nell'interesse di mantenermi ad uno standard più elevato, oggi ho deciso di rivisitare l'argomento sia nell'interesse di migliorare il post originale e di generare un riferimento futuro per me (e, si spera, tu) quando ne discuti con altri. Questo è un po 'un risparmio di tempo per me perché la gente parla spesso dell'effetto nonostante, ironia della sorte, non lo capisca davvero troppo profondamente.
Per prima cosa, qual è l'effetto Dunning-Kruger? Come si può riepilogare quasi ovunque, si riferisce all'idea che le persone che hanno prestazioni al di sotto della media in alcuni domini – come il ragionamento logico o l'umorismo – tenderanno a giudicare la loro performance come sopra la media. In altre parole, le persone sono inesatte nel giudicare quanto bene le loro capacità si accumulino ai loro pari o, in alcuni casi, a degli standard oggettivi. Inoltre, questo effetto si fa più grande e più non qualificato . Non solo i peggiori sono quelli che peggiorano il compito rispetto agli altri, ma sono anche peggio nel capire che non sono bravi nel compito. Si è detto che questo effetto si ottiene perché le persone hanno bisogno di sapere quali sono le buone prestazioni prima di poterle valutare con precisione. Quindi, poiché gli artisti al di sotto della media non capiscono come eseguire correttamente un compito, mancano anche delle capacità per giudicare le loro prestazioni in modo accurato, rispetto agli altri.
Come menzionato nel mio post iniziale (e da Kruger & Dunning stessi), questo tipo di effetto non dovrebbe estendersi ai domini in cui le abilità di produzione e di valutazione possono essere disgiunte. Solo perché non puoi scrivere una nota per salvarti la vita durante la serata karaoke, questo non significa che non sarai in grado di capire quali altri cantanti sono cattivi. Questo effetto dovrebbe essere principalmente limitato ai domini in cui il feedback che si riceve non è oggettivo o gli standard per le prestazioni sono chiari. Se ti viene chiesto di riassemblare un motore per auto, ad esempio, le persone non qualificate si renderanno subito conto che non possono farlo senza assistenza. Detto questo, per evidenziare il motivo per cui la spiegazione originale di questo risultato non funziona – nemmeno per i domini studiati nel documento originale – Volevo esaminare un grafico piuttosto importante dell'effetto di Kruger & Dunning (1999) ) per quanto riguarda il loro studio umoristico:
Le mie frecce rosse aggiunte rozzamente dimostrano il problema. Sul lato sinistro, vediamo ciò che la gente indica come l'effetto Dunning-Kruger: quelli che erano i peggiori esecutori nel regno dell'umorismo erano anche i più imprecisi nel giudicare la propria esibizione, rispetto ad altri. Erano non specializzati e inconsapevoli di ciò. Tuttavia, il lato destro tradisce il vero problema che ha attirato la mia attenzione: anche i migliori interpreti sono stati imprecisi. Lo schema che dovresti aspettarti, secondo la spiegazione originale, è che quanto più alto è il rendimento, tanto più accuratamente stimano la loro posizione relativa, ma quello che vediamo è che i migliori interpreti non sono così precisi come quelli che sono solo modestamente sopra media. A questo punto, alcuni di voi potrebbero pensare che questo punto che sto sollevando sia fondamentalmente un non-problema perché i migliori esecutori erano ancora più precisi dei peggiori esecutori e l'imprecisione della mano destra che sto evidenziando non è apprezzabile . Lasciami provare a persuaderti altrimenti.
Supponiamo per un momento che le persone stessero solo indovinando come si comportavano, rispetto ad altri. Dato che avere un buon senso dell'umorismo è un'abilità socialmente desiderabile, tutti tendono a classificarsi "modestamente sopra la media" nel dominio per cercare di persuadere gli altri in realtà sono divertenti (e perché, in quel momento, non ci sono conseguenze ad essere sbagliato). Malgrado queste ipotesi, coloro che in realtà sono modestamente sopra la media sembreranno più accurati nella loro autovalutazione rispetto a quelli che si trovano nella metà inferiore della popolazione; quella precisione non ha nulla a che fare con il loro vero livello di intuizione delle loro abilità (indicate come le loro abilità metacognitive). Allo stesso modo, coloro che sono più che modestamente sopra la media (cioè stanno sottovalutando le loro abilità) saranno anche meno precisi; ce ne saranno meno di quelli che hanno sopravvalutato le loro capacità.
Considerando i risultati di Kruger & Dunning (1999) nel suo complesso, lo scenario appena descritto non riflette perfettamente la realtà. C'era una correlazione positiva tra le prestazioni delle persone e la loro valutazione della loro posizione relativa (r = 0,39), ma, per la maggior parte, i giudizi delle persone sulla propria capacità (la linea nera) appaiono relativamente uniformi. Poi di nuovo, se si considerano i loro risultati negli studi due e tre di quella stessa carta (ragionamento logico e grammatica), le correlazioni tra prestazioni e giudizi delle prestazioni rispetto agli altri scendono a un minimo di r = 0,05 fino ad un massimo di r = .19, che era statisticamente significativo. I giudizi delle persone riguardo alla loro performance relativa erano quasi piatti in diversi compiti di questo tipo. Nella misura in cui questi giudizi metacognitivi di rendimento usano le prestazioni effettive come input per determinare le posizioni relative, non è chiaramente il fattore principale per i performer bassi o alti.
In effetti, non ci si dovrebbe aspettare che le prestazioni effettive siano l'input principale per questi sistemi metacognitivi (quelli che generano giudizi relativi di prestazioni) per due ragioni. La prima di queste è la spiegazione della performance originale postata da Kruger & Dunning (1999): se il sistema che genera la performance non ha accesso alla risposta "corretta", sembrerebbe particolarmente strano che un altro sistema – il meta-cognitivo una – avrebbe accesso alla risposta corretta, ma la userebbe solo per giudicare le prestazioni, piuttosto che per aiutarla a generarla.
Per metterlo in un esempio di memoria veloce, dì che stavi sperimentando uno stato di "punta della lingua", in cui sei certo di conoscere la risposta giusta a una domanda, ma non riesci a ricordarla del tutto. In questo caso, abbiamo un sistema di memoria a lungo termine che genera prestazioni (cercando di richiamare una risposta) e un sistema meta-cognitivo che genera giudizi di confidenza (lo stato della punta della lingua). Se il sistema metacognitivo avesse accesso alla risposta corretta, dovrebbe semplicemente condividerlo con il sistema di memoria a lungo termine, piuttosto che usare la risposta corretta per dire all'altro sistema di continuare a cercare la risposta corretta. Quest'ultimo percorso è chiaramente inefficiente e ridondante. Invece, il sistema meta-cognitivo dovrebbe usare alcuni spunti diversi dall'accesso diretto alle informazioni nel generare i suoi giudizi.
La seconda ragione per cui le prestazioni effettive (rispetto ad altre) non sarebbero un input per questi sistemi metacognitivi è che le persone non hanno accesso affidabile e accurato ai dati a livello di popolazione. Se stai chiedendo alle persone quanto siano divertenti rispetto a tutti gli altri , potrebbero avere un senso per questo (quanto sei divertente, rispetto ad alcune persone particolari che conosci), ma certamente non hanno accesso a quanto sono divertenti tutti perché non conoscono tutti; loro non conoscono nemmeno la maggior parte della gente. Se non si dispone delle informazioni pertinenti, dovrebbe essere ovvio che non è possibile utilizzarle per informare le proprie risposte.
Quindi, se questi sistemi metacognitivi utilizzano input diversi da informazioni accurate per generare i loro giudizi su come impilare gli altri, quali sarebbero questi input? Un possibile input potrebbe essere la difficoltà del compito , non nel senso di quanto difficile sia oggettivamente il compito per una persona, ma piuttosto in termini di quanto difficile possa essere il compito. Ciò significa che fattori come la rapidità con cui una risposta può essere richiamata alla mente probabilmente giocano un ruolo in questi giudizi, anche se la risposta stessa è sbagliata. Se giudicare il valore dell'umorismo di uno scherzo è facile, le persone potrebbero essere inclini a dire che sono al di sopra della media in quel dominio, anche se non lo sono.
Ciò fornisce una previsione importante: se fornite alle persone compiti che si sentono difficili , dovreste vederle in gran parte iniziare a indovinare che sono inferiori alla media in quel dominio. Se ognuno sta effettivamente indovinando che sono al di sotto della media (a prescindere dalla loro performance effettiva), ciò significa che coloro che eseguiranno il meglio saranno i più inaccurati nel giudicare le loro abilità relative. In attività che si sentono facili, le persone potrebbero essere inesperte e inconsapevoli; per quelli che si sentono difficili, le persone potrebbero essere abili ma ancora inconsapevoli.
Questo è esattamente ciò che Burson, Larrick e Klayman (2006) hanno testato, attraverso tre studi. Mentre non entrerò nei dettagli sulle specifiche di tutti i loro studi (questo sta già diventando lungo), ricreare un grafico da uno dei loro tre studi che cattura abbastanza bene il loro schema generale di risultati:
Come possiamo vedere, quando i domini sottoposti a test sono diventati più difficili, è stato ora il caso che i peggiori esecutori fossero più precisi nella stima del loro grado percentile rispetto ai migliori. Su compiti di moderata difficoltà, i migliori e peggiori esecutori erano ugualmente calibrati. Tuttavia, non sembra che questa accuratezza sia dovuta principalmente alla loro reale comprensione delle loro prestazioni; è proprio il caso che le loro ipotesi siano arrivate più vicine alla verità. Quando la gente pensa "questo compito è difficile", tutti sembrano stimare la loro performance come modestamente al di sotto della media; quando invece il compito sembra facile, sembrano tutti stimare le loro prestazioni come modeste rispetto alla media. La misura in cui ciò corrisponde alla realtà è in gran parte dovuta al caso, relativo alla vera intuizione.
Vale la pena notare che quando chiedi alle persone di esprimere diversi tipi di giudizi, c'è (o almeno può esserlo) un modesto vantaggio medio per i migliori performer, rispetto a quelli inferiori. Specificamente, quando chiedi alle persone di giudicare la loro performance assoluta (cioè quante di queste domande hai avuto ragione?) E paragona questo alla loro performance effettiva, i migliori interpreti a volte hanno avuto una migliore comprensione di quella stima, ma i peggiori, ma la dimensione di tale vantaggio variava a seconda della natura dell'attività e non era del tutto coerente. Mediata tra gli studi riportati da Burson et al (2006), i soggetti con metà superiore hanno mostrato una migliore correlazione tra la loro performance assoluta percepita e reale (r = .45), relativa ai risultati inferiori (r = 0,05). Le correlazioni corrispondenti per percentili effettivi e relativi erano nella stessa direzione, ma inferiori (rs = .23 e .03, rispettivamente). Mentre potrebbe esserci qualche verità sull'idea che i migliori interpreti siano più sensibili al loro rango relativo, la maggior parte della calibrazione errata sembra essere guidata da altri fattori.
Questi giudizi sulla posizione di un parente rispetto agli altri appaiono piuttosto difficili da ottenere per le persone. Come dovrebbero, davvero; per la maggior parte non abbiamo accesso alle informazioni / feedback rilevanti e ci sono possibili problemi di desiderabilità sociale da affrontare, insieme a una mancanza di conseguenze per essere sbagliati. Questa è fondamentalmente una tempesta perfetta per inesattezza. Forse vale la pena notare che la correlazione tra le prestazioni relative e le prestazioni effettive era piuttosto vicina per un dominio, in particolare in Burson et al. (2006): conoscenza della curiosità della musica pop (il cui grafico può essere visto qui). Poiché la musica pop è il genere di cose che le persone hanno più esperienza nell'apprendimento e nel parlare con gli altri, è un buon candidato per un caso in cui questi giudizi potrebbero essere più accurati perché le persone hanno più accesso alle informazioni rilevanti.
Il punto importante da tenere lontano da questa ricerca è che le persone non sembrano essere particolarmente brave nel giudicare le proprie abilità rispetto ad altre , e ciò si ottiene indipendentemente dal fatto che i giudici siano essi stessi abili o non qualificati. Almeno per la maggior parte dei contesti studiati, comunque; è perfettamente plausibile che le persone – di nuovo, qualificate e non qualificate – saranno maggiormente in grado di giudicare le loro prestazioni relative (e assolute) quando hanno esperienza con un dominio in questione e hanno ricevuto un feedback significativo sulle loro prestazioni. Questo è il motivo per cui le persone a volte abbandonano un lavoro o un posto di lavoro dopo aver ricevuto un feedback negativo consistente, optando per credere di non essere tagliato fuori per questo invece di continuare a credere di essere effettivamente sopra la media in quel contesto. Probabilmente vedrai la minima calibratura errata per i domini in cui i giudizi delle persone sulla loro capacità devono colpire la realtà e ci sono conseguenze per essere sbagliati.
Riferimenti: Burson, K., Larrick, R., & Klayman, J. (2006). Abili o non qualificati, ma ancora inconsapevoli di ciò: in che modo le percezioni di difficoltà portano a una valutazione errata nei confronti relativi. Journal of Personality & Social Psychology, 90 , 60-77.
Kruger, J. & Dunning, D. (1999). Non qualificato e inconsapevole di esso: come le difficoltà nel riconoscere la propria incompetenza portano a auto-valutazioni inflazionate. Journal of Personality & Social Psychology, 77 , 1121-1134.