Le autovalutazioni delle persone sulle proprie capacità, abilità e prestazioni dei test sono ragionevolmente accurate. Zell & Krizan (2014) riportano una correlazione media complessiva di 0,3. Se questo valore merita che l'etichetta "ragionevolmente accurata" dipende da una serie di ipotesi, il contesto di misurazione e la distribuzione campionaria del coefficiente di correlazione (vedere qui per ulteriori informazioni). Il coefficiente di correlazione è un indice statistico che cattura la somiglianza tra due profili di numeri: l'autovalutazione di un campione di individui e il loro punteggio vero corrispondente (o le migliori misure scientifiche dello stesso). Poiché Galton (1886) ha introdotto il coefficiente di correlazione r (che sta per regressione ), è diventato onnipresente. Le meta-analisi, come quelle riassunte da Zell e Krizan, la usano regolarmente per stimare ed esprimere dimensioni di effetto empirico (o usano indici come Cohen's d, che è la differenza tra due medie in unità standard, ed è facilmente traducibile in r ). Nella misurazione, affidabilità e validità sono anche espresse in termini di r .
Come misura della similarità del profilo, r si concentra su un tipo di somiglianza tra due serie di punteggi. Le autovalutazioni possono anche essere più variabili dei veri punteggi, o possono essere complessivamente più alti (inferiori). Questi diversi tipi di (dis) somiglianza possono essere facilmente separati l'uno dall'altro (Cronbach & Gleser, 1953; Krueger, 2009). In un commento su Zell & Krizan, Dunning & Helzer (2014) sostengono che tale separazione dei punteggi dovrebbe essere fatta quando è in gioco l'accuratezza dell'autovalutazione. Sottolineano che l'autovalutazione contiene un pregiudizio costante tale che le stime sono più alte in media rispetto ai punteggi veri. Le altre valutazioni, cioè le previsioni fatte da colleghi o osservatori, sono meno distorte. I coefficienti di correlazione non catturano questa differenza.
Questo è un buon punto, ma Dunning ed Helzer vogliono di più. Ci esortano a "esplorare l'accuratezza e l'errore usando misure completamente nuove [e chiedere] se la previsione soggettiva o le prestazioni oggettive siano più problematiche per l'auto-accuratezza. Gli errori nella conoscenza di sé variano in funzione delle previsioni? Oppure il vero problema dell'auto-accuratezza si trova nelle prestazioni oggettive? "(P.128) Tracciano (se si tratta di dati empirici, non dicono) errori assoluti (| stimato – punteggio effettivo |) rispetto alla prestazione prevista ( che si basa sulla regressione degli effettivi sui punteggi stimati), quindi traccia gli errori assoluti rispetto alle prestazioni effettive. Nel primo caso, trovano una linea orizzontale piatta; in quest'ultimo caso, trovano una funzione a forma di U asimmetrica con un ramo alto a sinistra (bassi punteggi effettivi).
Dunning e Helzer pensano di aver scoperto qualcosa di importante. "Gli errori di auto-previsione potrebbero non essere una funzione della previsione stessa ma piuttosto l'evento sottostante che le persone incontreranno successivamente. Cioè, se una persona sta predicendo il livello più basso non dirà al ricercatore se questa persona sarà più o meno probabile che sia in errore "(128-129). Vediamo prima cosa è probabilmente un errore di stampa. Si può prevedere dalle previsioni della gente se sono in errore. Le previsioni più elevate hanno più probabilità di essere in errore rispetto alle previsioni basse. Il pregiudizio di sovrastima di livello medio, enfatizzato da Dunning & Helzer, lo rende così. Quello che Dunning ed Helzer probabilmente intendevano scrivere è che non si possono predire gli errori di previsione dalle prestazioni previste, poiché è ciò che hanno rappresentato graficamente. Tuttavia, il grafico mostra semplicemente cosa ci si può aspettare dalla logica della regressione, piuttosto che da una scoperta. La linea di regressione più adatta minimizza gli errori di previsione (| punteggio effettivo – punteggio previsto |). È matematicamente possibile che, quando i punteggi previsti sono bassi, i punteggi effettivi siano più variabili di quando i punteggi previsti sono alti. Questo è uno stato di cose improbabile, e anche se fosse osservato, il suo significato psicologico sarebbe opaco.
La seconda affermazione di Dunning & Helzer è che le prestazioni effettive prevedono errori di predizione. Anche questa non è una novità. Sapendo che la correlazione tra i punteggi stimati e quelli effettivi non è perfetta (vedi Zell & Krizan), e sapendo che le stime sono nel complesso troppo alte, sappiamo anche che gli errori di predizione dei punteggi bassi sono maggiori degli errori degli high scorer (Krueger & Mueller, 2002). Sebbene questo schema di risultati possa essere recuperato dalla logica della regressione e dalla tendenza generale all'autostima, ha raggiunto una certa notorietà come un fenomeno presumibilmente unico noto come effetto Dunning-Kruger. Questo trattamento di un modello derivato come un fenomeno sui generis non sarebbe degno di nota, se non fosse per le sue implicazioni. Dunning ed Helzer suggeriscono che l'autodeterminazione non può essere migliorata aiutando le persone a fare previsioni migliori, ma piuttosto aumentando i loro punteggi effettivi. La prima parte di questa affermazione è falsa. Lo stesso Dunning e Helzer sottolineano il pregiudizio generale di sovrastima di gruppo. Ne consegue che se le persone fossero consigliate di abbassare le loro autovalutazioni di una certa costante, i loro errori assoluti diminuirebbero.
Anche la seconda parte della richiesta è problematica. È vero che se le auto-previsioni rimangono costanti mentre i punteggi veri sono aumentati, gli errori assoluti diminuiscono. Questa è, tuttavia, un'istanza dell'errore del cecchino del Texas . Lascia che le previsioni siano quello che sono, portiamo il criterio – quello, che deve essere previsto – in linea con la previsione, dopo il fatto. L'effetto Dunning-Kruger suggerisce che le persone a basso rendimento in particolare dovrebbero essere addestrate a fare meglio. Quando lo fanno, gli errori assoluti diminuiranno, ma lo sarà anche la correlazione di precisione. Man mano che l'intervallo di punteggi veri si accorcia, l'errore casuale rimanente sarà relativamente maggiore della variabilità sistematica nei punteggi veri. Che cosa si ottiene quando un tipo di punteggio di precisione viene migliorato a scapito di un decremento in un altro? Una situazione in cui tutti fanno bene (è ricca, sana e felice), è socialmente desiderabile, ma mina il valore della misurazione. La misurazione (e la scienza) richiede variabilità.
L'idea che l'auto-accuratezza possa essere migliorata rendendo gli esecutori (bassi) più alti, implica un'affermazione causale. Dunning ed Helzer pensano che ci sia qualcosa in merito alle basse prestazioni che impedisce alle persone di vedere la lentezza delle loro esibizioni. "I cattivi interpreti non sono in grado di riconoscere le carenze delle loro prestazioni" (p. 129). Rendendoli migliori "li aiuta ad evitare il tipo di esito che sembrano incapaci di anticipare" (p. 129). Da questo modello causale, sembra che una volta che le persone si comportano meglio, faranno previsioni più accurate. Detto in modo diverso, se le basse prestazioni causano errori di previsione, un passaggio a prestazioni elevate eliminerà gli errori. Questo sarebbe un inferenza di modus tollens logicamente valida se non fosse per il fatto che le basse prestazioni sono anch'esse parte del modo in cui viene definito l'errore (errore = stimato – prestazione effettiva). Gli errori devono diminuire una volta aumentata la performance, anche se non c'è alcun effetto causale.
Errori giudiziari come l'auto-valorizzazione sono spesso trattati come se fossero illusioni cognitive alla pari delle illusioni visive. La maggior parte non lo sono, tuttavia (Krueger & Funder, 2004), e Dunning & Helzer dovrebbero essere d'accordo. Se non fossero d'accordo, avrebbero dovuto voler correggere le illusioni visive cambiando la realtà. Dovrebbero cercare di superare l'illusione di Müller-Lyer, rendendo la linea con le frecce in uscita più lunghe della linea con le frecce in entrata; avrebbero dovuto mettere un nano e un gigante nella stanza di Ames; dovrebbero capovolgere il cubo Necker ogni volta che le percezioni passano a una diversa interpretazione spaziale. Le radici di queste illusioni stanno nel modo in cui il sistema visivo interpreta una realtà ambigua. I ricercatori avrebbero imparato meno sulla percezione se non avessero mai trovato modi intelligenti per ingannarlo.
Cronbach, LJ e Gleser, GC (1953). Valutare la somiglianza tra i profili. Bollettino psicologico, 50 , 456-473.
Dunning, D., & Helzer, EG (2014). Oltre il coefficiente di correlazione negli studi sulla precisione di autovalutazione. Prospettive sulla scienza psicologica, 92 , 126-130.
Galton, F. (1886). Regressione verso la mediocrità nella statura ereditaria. Il Journal of Anthropological Institute di Gran Bretagna e Irlanda, 15 , 246-263.
Krueger, JI (2009). Un modello componenziale di effetti della situazione, effetti personali ed effetti di interazione situazione per persona sul comportamento sociale. Journal of Research in Personality, 43 , 127-136.
Krueger, JI, & Funder, DC (2004). Verso una psicologia sociale equilibrata: cause, conseguenze e cure per l'approccio alla ricerca di problemi del comportamento sociale e della cognizione. Behavioral and Brain Sciences, 27 , 313-327.
Krueger, J., & Mueller, RA (2002). Non qualificato, ignaro o entrambi? Il contributo delle abilità socio-percettive e della regressione statistica ai pregiudizi di auto-miglioramento. Journal of Personality and Social Psychology, 82 , 180-188.
Zell, E., & Krizan, Z. (2014). Le persone hanno un'idea delle loro abilità? Una metasintesi. Prospettive sulla scienza psicologica, 9 , 111-125.