Altre prove per una descrizione correlata al dolore del dACC

[Nota: assicurati di leggere il terzo paragrafo che chiarisce ciò che sembra essere una delle principali fonti di confusione sul nostro articolo]

Dall'ultima risposta del nostro blog a Tal Yarkoni (TY), ci sono state tre nuove risposte da TY, Tor Wager (TW) e Alex Shackman (AS). Queste risposte ci hanno dato molto da pensare e ci hanno portato a eseguire analisi aggiuntive che noi (Lieberman & Eisenberger, in seguito L & E) crediamo di chiarire, estendere e infine rafforzare le nostre affermazioni iniziali. Mentre esaminiamo tutte le analisi nel documento PNAS, vorremmo aver pensato di fare queste analisi in precedenza e includerle nel documento.

C'è molto che non concordiamo con alcuni dei blog più recenti, ma poiché siamo interessati ad andare avanti, vogliamo iniziare, ancora, con aree in cui sembra esserci un accordo, quindi passare alle nostre nuove analisi, e poi su una discussione di quattro questioni: (a) La relazione tra dolore e paura nel database Neurosynth (b) I punteggi z di Neurosynth ci informano sull'inferenza al contrario? (c) Priori empirici e (d) Possiamo mai dire che una regione del cervello ha una funzione? Vogliamo essere chiari sul fatto che questo blog sarà il nostro ultimo commento su tutto questo. Tra il post precedente e questo, riteniamo di aver chiarito tutto ciò di cui abbiamo bisogno per dimostrare che le nostre conclusioni sono solide. Anticipiamo che coloro che hanno già scritto messaggi continueranno a non essere d'accordo con noi, ma speriamo che gli altri trovino ciò utile.

Ma prima di saltare nel testo principale di questo blog, volevamo chiarire un punto importante che verrà trattato più avanti in questo blog. Dalle analisi del nostro documento PNAS, non pensiamo che quando vediamo l'attività del DACC, ciò implichi necessariamente che la persona stia vivendo dolore . Per ottenere tale affermazione, è necessario generare probabilità posteriori basate su priori empirici del mondo reale che non esistono (né il Neurosynth precedente a .50 né la prevalenza del 3,5% del dolore negli estratti di Neurosynth forniscono queste informazioni in quanto quest'ultimo riflette ciò che è studiato frequentemente, non ciò che accade frequentemente in generale). Ma questo non era il tipo di rivendicazione che stavamo facendo. La nostra richiesta era molto più semplice: ci sono prove affidabili basate su punteggi z da mappe di inferenza inversa che il dolore è associato a gran parte del dACC . Al contrario, attraverso la maggior parte del dACC c'è molta meno evidenza, basata sui punteggi z dalle mappe di inferenza inversa, che i processi esecutivi, di conflitto e di salienza sono associati in modo affidabile al dACC . Questi risultati suggeriscono che un resoconto della funzione DACC dovrebbe focalizzarsi maggiormente sui processi del dolore rispetto ai processi cognitivi generalmente focalizzati su. La nostra richiesta è di costruire il miglior resoconto della funzione DACC, non predire il processo presente in un particolare studio o supporre che ogni neurone dACC faccia la stessa cosa. Di seguito consideriamo diversi account aggiuntivi della funzione dACC per rendere questa richiesta più completa.

Aree di accordo

Anche se TY sottolinea di non essere d'accordo con quasi tutto ciò che abbiamo detto nel nostro primo blog, egli scrive anche il suo ultimo post sul blog con citazioni da parte nostra o riproposizioni di reclami da noi con cui accetta esplicitamente (o non ha problemi con). Pensiamo che valga la pena di evidenziarli perché pensiamo che queste siano alcune delle affermazioni più importanti del nostro lavoro.

Abbiamo scritto: "La conclusione delle mappe di inferenza inversa di Neurosynth è inequivocabile: il dACC è coinvolto nell'elaborazione del dolore. Quando erano disponibili solo dati di inferenza avanzata, era ragionevole affermare che forse il DACC non era coinvolto nel dolore in sé, ma che l'elaborazione del dolore poteva essere ridotta alla funzione "reale" del dACC, come i processi esecutivi, il rilevamento di conflitti o risposte di salienza agli stimoli dolorosi. Le mappe di inferenza inversa non supportano nessuno di questi account che tentano di ridurre il dolore a processi cognitivi più generici. "

TY ha scritto in risposta: "Questa affermazione mi sembra in gran parte ineccepibile".

Abbiamo scritto: "Per i termini executive e conflict, la nostra figura 3 nel documento PNAS mostra un piccolo frammento di dACC. Pensiamo che le figure più complete che abbiamo incluso qui continuino a raccontare la stessa storia. Se qualcuno vuole raccontare la storia del conflitto sul motivo per cui il dolore attiva il DACC, pensiamo che ci dovrebbero essere prove di diffuse affidabili mappature di inferenza inversa dal dACC al conflitto. Ma le prove per una simile affermazione non sono qui. Qualunque cosa tu pensi del resto delle nostre statistiche e delle nostre affermazioni, questo dovrebbe far riflettere un sacco di persone, perché questo non è quello che quasi nessuno di noi si sarebbe aspettato di vedere in queste mappe di inferenza inversa (compresi noi). "

TY ha scritto in risposta: "Nessuna obiezione qui"

C'erano anche altri casi di accordo parafrasanti. Ad esempio, TY ha scritto:

E "Se L & E mi avesse chiesto", hey, pensi che Neurosynth supporti dicendo che l'attivazione del DACC è un buon indicatore di "salienza"? ", Avrei detto" no, certo che no ".

E in una sezione separata ha scritto:

"Se ciò che significano è qualcosa del tipo" in media, prendendo la media di tutti i voxel nel dACC, c'è più evidenza di un'associazione statistica tra dolore e DACC che dolore e monitoraggio dei conflitti ", quindi sto bene con quello." [Nota : supponiamo che l'ultima frase sia stata scritta male e che TY significasse "monitoraggio dei conflitti e dACC"]

Dato che tutte queste affermazioni in cui vi sono aree di accordo dipendono dall'interpretazione delle mappe z-score fornite da Neurosynth come prova (o assenza di prove) che un termine è un obiettivo di inferenza inversa ragionevole prendiamo come aree importanti di accordo:

  1. I punteggi z di Neurosynth forniscono prove sull'opportunità di attribuire plausibilmente determinati voxel, tramite l'inferenza inversa, a una particolare funzione. Possono esserci più termini che mostrano z-score significativi per un voxel e tutti questi termini sono funzioni plausibili da attribuire a quel voxel.
  2. Esistono poche prove dai punteggi z dell'inferenza inversa che i processi esecutivi, di conflitto e di salienza sono buoni obiettivi di inferenza inversa per l'attivazione del DACC. Nota che diciamo "piccolo", non "no", come abbiamo fatto nel nostro articolo, perché c'è qualche prova inversa del DACC per il conflitto, ma è modesta.
  3. Ci sono prove del punteggio z che i processi del dolore sono buoni obiettivi di inferenza inversa per una grande porzione di voxel di DACC.

Se siamo in grado di concordare su questi punti, penso che siamo d'accordo sulla maggior parte di ciò che ci interessa nel nostro documento.

Nuove analisi di Neurosynth

L'ultima affermazione di TY sopra ("Se quello che vogliono dire è qualcosa come …") ci ha fatto capire che c'era un modo diverso per affrontare le conclusioni che avevamo raggiunto nel documento PNAS. Come abbiamo detto, parte di ciò che ci ha sorpreso quando abbiamo esaminato le mappe di inferenza inverse per dolore, esecutivo, conflitto e salienza alcuni anni fa era quanto fosse diffusa la copertura del DACC per il dolore rispetto agli altri termini. Abbiamo cercato di catturarlo osservando 8 voxel distribuiti attraverso il dACC. Forse questo non era il modo migliore per quantificare ciò che stavamo vedendo e non era sensibile a due problemi ragionevoli sollevati da TY e AS. Innanzitutto, abbiamo solo esaminato la linea mediana, un problema menzionato da TY. In secondo luogo, abbiamo definito i nostri limiti DACC utilizzando un atlante non probabilistico e quindi non abbiamo potuto indicare la certezza che i voxel presi in considerazione fossero in realtà voxel dACC, un problema sollevato da AS.

Quello che abbiamo fatto nelle nostre nuove analisi è definito una maschera dACC usando l'atlante probabilistico di Harvard-Oxford (qui di seguito HO) e poi esaminato la percentuale di voxel nel dACC per i quali termini diversi sono un bersaglio di inferenza inversa ragionevole basato sull'inferenza retrograda di Neurosynth mappe. Per creare l'atlante HO, hanno preso immagini pesate in T1 da dozzine di cervelli (bit.ly/1RMTAzp). Varie regioni di interesse (ad es. ACC) sono state identificate su singoli cervelli prima di qualsiasi trasformazione. Quindi ogni scansione è stata registrata nello spazio MNI. A questo punto, potevano determinare per ogni voxel nello spazio MNI, quanti cervelli individuali erano stati etichettati con una particolare etichetta nel primo passo. Quindi se il 75% dei cervelli aveva una particolare coordinata etichettata come ACC, allora quel voxel sarebbe valutato come avente una probabilità del 75% di essere ACC in ogni nuova scansione registrata nello spazio MNI.

Matthew Lieberman
Fonte: Matthew Lieberman

Usando questo atlante siamo stati in grado di definire maschere dACC (-8 ≤ x ≤ 8; 0 ≤ y ≤ 30) per le quali i voxel erano del 25%, 35%, 50% o 75% probabilmente nel dACC (vedi figura sopra). Si potrebbe sostenere che solo i voxel che hanno il 50% o il 75% di probabilità di essere effettivamente voxel DACC dovrebbero entrare nelle nostre ROI, ma l'ispezione visiva ha suggerito che queste maschere ROI sembravano molto simili a quelle che avevamo già usato nel documento PNAS che portava al risposta da AS, quindi siamo andati con una maschera più liberale del 35% per le nostre analisi presentate qui.

Si noti che i risultati sono qualitativamente uguali su tutte le diverse maschere. L'unica differenza sostanziale che abbiamo visto è che, passando da maschere con DACC di confidenza più basse (25%) a maschere di DACC di fiducia più elevate (75%), la percentuale di voxel del dACC associata, tramite inferenza inversa, a termini affettivi aumentava (ad esempio dolore +9 %, paura + 12%, affetti negativi + 6%) e la percentuale di voxel del dACC associata a termini cognitivi è diminuita (ad es. conflitto -12%; errore -6%). Quindi, mentre aumentiamo la nostra fiducia nel fatto che un particolare voxel sia effettivamente presente nel dACC, è più probabile che sia associato a un processo affettivo e meno probabile che sia associato a un processo cognitivo. In altre parole, quei voxel che sono associati ai processi cognitivi nel DACC tendono ad essere i voxel che dovremmo avere meno confidenza nel dACC.

Le analisi presentate di seguito utilizzano tutte la maschera del 35%. Inizialmente pensavamo di esaminare le nostre quattro principali categorie di interesse nel documento PNAS (dolore, esecutivo, conflitto, salienza) insieme a quelle sollevate da TY come alternative che dovremmo considerare (paura, autonomia, ricompensa). Alla fine abbiamo deciso di includere più termini nelle nostre analisi in modo da poter soddisfare lo standard di selettività dato da TY nel suo ultimo blog:

"Si può dire che una regione del cervello sia 'selettiva' per una particolare funzione se (i) mostra una solida associazione con quella funzione, (ii) mostra un'associazione trascurabile con tutte le altre alternative facilmente disponibili, e (iii) gli autori hanno fatto la dovuta diligenza nel garantire che le principali funzioni candidate proposte in letteratura siano ben rappresentate nella loro analisi. "

Pensiamo che questa definizione vada al di là del modo in cui molti ricercatori hanno usato questo termine in passato (ad esempio nei documenti MVPA), ma abbiamo pensato che sarebbe valsa la pena vedere cosa succede quando applichiamo questa definizione alle nostre analisi. Dovremmo notare che interpretiamo la parola "associazione" in questa definizione per riferirsi solo alle associazioni identificate nelle mappe di inferenza inversa, non a ciò che è osservato nelle mappe di inferenza diretta. Di conseguenza, abbiamo tentato di fare la nostra 'dovuta diligenza nel garantire che le principali funzioni candidate proposte in letteratura siano ben rappresentate nella loro analisi'. Quindi, ora abbiamo una lista di 14 termini che copre ogni account DACC di cui siamo a conoscenza nel corso degli anni. La nostra lista di termini include:

dolore, attenzione, autonomia, evitamento, conflitto, emozione, errore, esecutivo, paura, influenza negativa, inibizione della risposta, selezione della risposta, ricompensa e salienza.

Riteniamo che questo sia un elenco piuttosto esaustivo di termini e speriamo che se ne abbiamo persi, abbiano un sinonimo ragionevole nell'elenco che potrebbe produrre effetti simili.

Su alle analisi. La prima cosa che abbiamo fatto è stata eseguire un conteggio del numero di voxel nella maschera del 35%. C'erano 1110 voxel che l'atlante HO aveva almeno il 35% di fiducia nei voxel del DACC. Di questi, 947 voxel (o 85,3%) compaiono nella mappa di inferenza inversa per il dolore (usando il livello di significatività standard di Neurosynth di p <.01, FDR corretto). Degli altri 13 termini, nessuno copriva neanche il 20% dei voxel del DACC (vedi figura sotto). Il confronto del quadrante chi del dolore rispetto a qualsiasi altro termine era altamente significativo. Tutti X 2 > 975,278, p <0,0000, d > 5,38. Questi ci dicono che il dolore è molto più onnipresente di una spiegazione dell'inferenza inversa tra i voxel del DACC rispetto a uno qualsiasi degli altri 13 termini.

Matthew Lieberman
Mostra la percentuale di voxel del DACC che appaiono nella mappa dell'inferenza inversa di ciascun termine. Lo stesso voxel può apparire nella mappa per più termini
Fonte: Matthew Lieberman

L'analisi di cui sopra non arriva al cuore del problema di selettività come caratterizzato nella definizione di TY perché lo stesso voxel può mostrare apparire per più termini e quindi non indicare la selettività di un termine rispetto ad altri. Quindi, abbiamo poi valutato quanti voxel nel dACC sembravano selettivi per qualcosa di simile a quello mostrato per la mappa di inferenza inversa di un termine, ma non comparivano in nessuna delle 13 mappe di inferenza inversa dei termini. Si potrebbe immaginare che con 14 termini, quasi nessun voxel nel dACC mostrerebbe selettività con questa definizione – qualsiasi voxel significativo per solo due termini viene eliminato da questa analisi. Nonostante l'alto ostacolo alla selettività, 477 voxel su 1110 (43%) nel dACC sono comparsi in una delle 14 mappe di inferenza inversa. Questi 477 voxel sembrerebbero quindi soddisfare la barra per la selettività impostata dalla definizione di TY. Dei 470 voxel del dACC che sono selettivi per un singolo termine (dei 14 termini considerati), il 91,2% era selettivo per il termine dolore .

Matthew Lieberman
Dei voxel dACC che sono selettivi per 1 di 14 termini, mostra la percentuale per ogni termine.
Fonte: Matthew Lieberman

In tutto, 435 dei 477 voxel selettivi erano presenti solo nella mappa dell'inferenza inversa del dolore e non in nessuna delle mappe di inferenza inversa per gli altri 13 termini. L'unico altro termine che aveva> 10 voxel selettivi associati con esso era la ricompensa, a 30 voxel (abbiamo accennato a questo nel documento originale). La paura è prossima a 8 voxel, con errore a 3 voxel e conflitto a 1 voxel. I voxel del dACC selettivo del dolore sono più di un ordine di grandezza più comune di qualsiasi altro tipo di voxel selettivo del dACC. Il confronto del quadrante chi del dolore rispetto a qualsiasi altro termine per il numero di voxel selettivi nel dACC era altamente significativo. Tutti X 2 > 446.203, p <0,0000, d > 1,64. Questi risultati ci dicono che tra i voxel del DACC che mostrano evidenza di selettività, sono molto più probabilità di essere correlati al dolore rispetto a qualsiasi degli altri 13 termini.

Due caveat molto importanti qui:

1) Poiché 477 voxel erano selettivi per un termine, ciò significa che 633 voxel del DACC non erano selettivi per alcun termine. Anche se pensiamo di utilizzare una barra molto alta per la selettività qui, più alta di qualsiasi altra che abbiamo visto in letteratura, è chiaro che con questa barra alta, meno della metà dei voxel del DACC sta mostrando selettività. Da questo punto di vista è eccessivo affermare che "il dACC" è uniformemente selettivo per il dolore rispetto a tutti gli altri 13 conti della funzione dACC che stiamo considerando attualmente. Due risposte a questo avvertimento. Innanzitutto, usando solo i quattro termini inizialmente considerati (dolore, esecutivo, conflitto e salienza), 823 voxel erano selettivi secondo la definizione corrente (cioè il 74,1% dei voxel del DACC) e di questi 811 erano selettivi per il dolore (che avrebbe stato il 98,5% dei voxel selettivi). Pertanto, nel contesto delle categorie considerate nel nostro documento PNAS, la nostra pretesa di selettività per il dolore rispetto ai processi esecutivi, di conflitto e salienza era ragionevole. In secondo luogo, date tutte le risposte che abbiamo visto sul dACC che è troppo generico o sfaccettato pensiamo che sia piuttosto impressionante che quasi la metà dei voxel del DACC sono selettivi e di questi, quasi tutti sono selettivi per il dolore.

2) Si potrebbe guardare a queste analisi e pensare che non è giusto confrontare ogni termine con gli altri 13 perché alcuni di questi sono in categorie sovrapposte. Ad esempio, abbiamo incluso i conflitti e gli errori, che sono account distinti, ma sovrapposti di DACC. Se fossero comparsi negli stessi voxel l'uno dell'altro, avrebbero eliminato quei voxel dall'analisi di selettività di cui sopra. Per risolvere questo problema, di seguito abbiamo una figura che mostra il confronto delle mappe per il dolore e ogni altro termine – quindi ogni termine può dimostrare quanti voxel si mostrano per la sua mappa di inferenza inversa ma non per il dolore. Le barre arancioni in ciascuna coppia di due barre in basso mostrano la percentuale di voxel del dACC associata a ciascun termine quando vengono rimossi solo i voxel associati al dolore. Quindi termini come errore e conflitto non sono in competizione tra loro qui. (Le barre blu mostrano quanti voxel compaiono nella mappa di inferenza inversa del dolore, ma non per l'altro termine nel confronto)

Matthew Lieberman
Fonte: Matthew Lieberman

Come è evidente, questa analisi non mostra nessun altro termine che si manifesti particolarmente bene quando snocciolato 1 contro 1 contro il dolore. Oltre alla ricompensa, per il quale il 2,7% dei voxel del DACC appare nella sua mappa ma non nella mappa del dolore, nessun altro termine supera l'1,1%. Al contrario, in queste analisi il dolore ottiene costantemente oltre il 65% di tutti i voxel del DACC dopo aver rimosso quelli per qualsiasi altro termine. Mentre abbiamo indicato nel documento PNAS che la ricompensa effettivamente mostra effetti più forti del dolore nella porzione anteroventrale del dACC, abbiamo pensato che sarebbe valsa la pena mostrarlo un po 'più chiaramente. Se avessimo usato un limite angolato (linea verde tratteggiata), come alcuni altri, per distinguere il dACC dal rACC, la mappa dell'inferenza inversa della ricompensa potrebbe essere in gran parte assente dal dACC. In questa figura è abbastanza chiaro che l'effetto dell'inferenza inversa per la ricompensa è in gran parte parte di un cluster ACC più razionale.

Matthew Lieberman
Fonte: Matthew Lieberman

Le conclusioni delle nostre attuali analisi riaffermano il punto generale espresso nel documento PNAS. Se parleremo della funzione del dACC come hanno fatto innumerevoli documenti negli ultimi 20 anni, il dolore è l'unica funzione che il dACC sembra selettivo per più di una manciata di voxel. Abbiamo usato la definizione di selettività di TY (con l'assunto che l'associazione si riferisca all'associazione dell'inferenza inversa). Pertanto, abbiamo cercato di creare un elenco più esauriente di termini che siano ragionevoli conti del dACC. Abbiamo determinato quale percentuale di voxel dACC ha mostrato un'associazione inversa inversa con ciascuno dei 14 termini. Abbiamo quindi determinato, di questi voxel, quanti hanno mostrato solo un'associazione inversa inversa con 1 termine e nessuno degli altri 13 termini. Per riassumere i nostri risultati:

  1. Dei voxel dACC 1110, il 43% (cioè 477 voxel) ha soddisfatto i criteri sopra indicati per la selettività (che compare solo in 1 delle 14 mappe di inferenza inversa).
  2. Dei 477 voxel che erano selettivi, il 91,2% (cioè 435 voxel) erano selettivi per il dolore.
  3. Pertanto, una parte considerevole del dACC può essere descritta da un singolo termine tra questa ampia lista di termini storicamente plausibili.
  4. Della considerevole porzione di voxel del DACC che può essere descritta con un singolo termine da questa lunga lista di conti ragionevoli, quasi tutti questi appaiono nella mappa dell'inferenza inversa per il dolore e per nessuno degli altri 13 termini.

Dolore e paura

Abbiamo argomentato che l'affetto correlato all'afflizione potrebbe essere il conto ombrello per i processi di DACC, con il DACC che gestisce gli aspetti del dolore correlati al disagio (Rainville et al., 1997). Decenni di vecchio lavoro sulle lesioni suggerisce che il dACC gioca un ruolo chiave nell'angoscia del dolore fisico e nell'ansia (Foltz & White, 1962; Tow & Whitty, 1953). Come è stato sottolineato, esiste un numero non banale di voxel del dACC che appaiono nella mappa dell'inferenza inversa per paura (12,2% nella nostra maschera dACC). Crediamo che il dolore e la paura siano concettualmente correlati perché la maggior parte di ciò che temiamo sono cose che potrebbero causarci dolore (fisicamente, socialmente o emotivamente). Ma nel contesto di Neurosynth, la relazione è molto più diretta. Molti studi di neuroimaging sulla paura sono studi di condizionamento della paura che usano il dolore (per esempio lo shock) come stimolo incondizionato. Questi studi quasi mai usano la parola "dolore" da nessuna parte e quindi non sono etichettati per il dolore in Neurosynth, ma potrebbero introdurre effetti specifici del dolore nelle mappe di inferenza inversa per paura.

Per esaminare questa possibilità, abbiamo ispezionato manualmente i primi 50 studi fMRI che compaiono in Neurosynth per il termine paura. Abbiamo scoperto che il 50% di questi studi utilizzava manipolazioni del dolore. Per vedere se queste manipolazioni del dolore possano guidare il segnale DACC nella mappa dell'inferenza inversa per paura, abbiamo contato quanti studi con attivazioni di DACC hanno avuto manipolazioni del dolore e quanti studi senza attivazioni di DACC hanno avuto manipolazioni del dolore. Come si può vedere nella figura sottostante, una considerevole maggioranza degli studi sulla paura (71%) che producono una risposta al DACC usano manipolazioni del dolore, mentre una considerevole maggioranza di studi sulla paura (69%) che non producono una risposta al DACC non usano dolore manipolazioni. Il confronto del quadrato chi di questo 2 × 2 è stato molto significativo; X 2 > 8,013, p <0,006, d = 0,87. Questo risultato suggerisce che studi sulla paura che includono una manipolazione del dolore sono più propensi a produrre una risposta al DACC.

Matthew Lieberman
Fonte: Matthew Lieberman

Se si considera la possibilità che la risposta del DACC alla paura nella mappa dell'inferenza inversa di Neurosynth sia (a) concettualmente collegata alle risposte del DACC al dolore o sia (b) letteralmente dovuta alle manipolazioni del dolore che attivano il DACC negli studi sulla paura, allora è ragionevole combinare le risposte del DACC al dolore e alla paura. Sebbene non vogliamo troppe analisi, quando il dolore e la paura sono combinati in un unico ROI combinato (di seguito, dolore + paura), troviamo che 566 dei voxel del DACC 1110 mostrano selettività per uno dei 13 termini . Pertanto, il 51% dei voxel del DACC è selettivo in queste condizioni. Inoltre, 532 dei 566 voxel selettivi sono selettivi per il dolore + la paura. In altre parole, il 94% dei voxel del dACC selettivo in questa analisi è selettivo per il dolore + la paura. Inoltre, il 48% di tutti i voxel del DACC sono selettivi per il dolore + la paura.

In sintesi, se trattiamo il dolore e la paura come parte di un singolo costrutto per quanto riguarda il dACC, vediamo che quasi la metà di tutti i voxel del dACC sono selettivi per questo costrutto e quasi tutti i voxel del dACC che sono selettivi per qualsiasi cosa sono selettivi per questo costrutto. Come nelle nostre analisi principali nella sezione precedente, nessun altro termine oltre al premio (il 5% dei voxel selettivi qui) guadagna anche l'1% dei voxel selettivi nel dACC.

I punteggi z di Neurosynth ci informano sull'inferenza al contrario?

Pensiamo che sia inequivocabile il caso in cui i punteggi z di Neurosynth dicono qualcosa di importante sull'inferenza al contrario. Quindi, uno degli aspetti più inaspettati dello scambio sul nostro documento PNAS è che TY e TW, i creatori di Neurosynth, sembrano suggerire che quasi nulla può essere imparato sull'inferenza al contrario dai punteggi z e che dovremmo concentrarci principalmente su le probabilità posteriori. Ad esempio, TY ha scritto:

"Ho spiegato perché non si può ottenere supporto per un'inferenza inversa usando z-score o p-values. L'inferenza inversa è intrinsecamente una nozione bayesiana e ha senso solo se si è disposti a parlare di probabilità precedenti e posteriori. "

Troviamo questo strano perché quando si utilizza l'interfaccia web Neurosynth e si guarda a qualsiasi termine, c'è un singolo pulsante sullo schermo con l'etichetta "inferenza inversa". Quando fai clic su questo pulsante, viene visualizzata una mappa di calore che, dato il loro schema di etichettatura, possiamo solo supporre che abbia lo scopo di dirci qualcosa sull'inferenza al contrario. Questa mappa di calore è una mappa di calore di z-score di inferenza inversa, non probabilità posteriori. Allo stesso modo, se si scarica la mappa di inferenza inversa per qualsiasi termine, si tratta di una mappa di z-score, non di probabilità posteriori. Nonostante siano non bayesiani, questi z-score sono quelli che TY e TW usavano per popolare le loro mappe di "reverse inferenza". Se questi non ci dicono sull'inferenza al contrario, allora è molto strano che l'unico pulsante di inferenza inversa nell'interfaccia porti a questi z-score.

TY ha anche scritto sul valore dei punteggi z di Neurosynth in più posti che sembrano contraddire la rivendicazione precedente ("non si può ottenere il supporto …"). Per prima cosa abbiamo il testo delle FAQ di Neurosynth:

"Mappa dell'inferenza inversa: i punteggi z corrispondenti alla probabilità che un termine venga utilizzato in uno studio data la presenza di attivazione segnalata (ad es. P (Termine | Attivazione))"

A noi sembra che lo z-score ci stia dicendo qualcosa sull'inferenza al contrario. Ecco alcuni estratti di ciò che TY ha scritto su Google+, dove ha gentilmente risposto a molte domande degli utenti su Neurosynth:

"Il punteggio z è una misura di fiducia nell'associazione statistica; la probabilità posteriore è una misura della dimensione dell'effetto. In generale, raccomando di prestare maggiore attenzione al primo , perché quest'ultimo è soggetto a rumore relativo alla dimensione del campione. Un termine con meno studi inclusi nella meta-analisi avrà una maggiore variabilità, che si tradurrà in probabilità posteriori più estreme. Tuttavia, un termine con meno studi produrrà anche * meno * valori estremi di p / z, a parità di altre condizioni. Quindi, se stai cercando di fare un reclamo del modulo "è probabile che la funzione F sia associata all'attività nella regione R", probabilmente stai meglio basandoti sul punteggio z . [enfasi aggiunta]"

Questa affermazione è in netto contrasto con la sua affermazione precedente che "un cannone ottiene il supporto per un'inferenza inversa usando z-score". Nel suo blog scrisse anche questo di z-score:

"Tutto ciò che ci dice è che, dati tutti i dati che abbiamo, è molto improbabile che ci sia esattamente zero associazione tra un termine e una regione".

Nonostante il fraseggio peggiorativo, pensiamo che "tutto questo ci dice" è piuttosto sorprendente dato che non avevamo modo di farlo prima di database come Neurosynth. Questa è una cosa molto importante da sapere, specialmente quando è combinata con altre analisi che suggeriscono che per altri termini non c'è evidenza di associazione tra il termine e la regione. Alla fine, TY scrive:

"Se il nostro obiettivo è semplicemente quello di dire qualcosa come" pensiamo che la giunzione temporoparietale sia associata al movimento biologico e alla teoria della mente ", o" l'evidenza suggerisce che la corteccia parahippocampale è associata alla navigazione spaziale ", non vedo nulla di sbagliato basando questa affermazione sulle mappe di z-score di Neurosynth. "

Riteniamo che questa sia esattamente l'affermazione che stiamo facendo e che ci mostra che siamo più giustificati nel fare affermazioni relative al dolore sulla funzione DACC rispetto alle richieste di altri termini. Nel documento PNAS abbiamo fatto questo confrontando termini che avevano z-score non significativi (esecutivo, conflitto, salienza) a un termine che ha fatto (dolore). Mentre questi non mostrano che le dimensioni degli effetti sono maggiori per il dolore rispetto agli altri termini (che non è mai stato il nostro obiettivo), mostrano che possiamo essere più sicuri che ci sia una reale associazione tra dolore e DACC che tra gli altri tre termini e dACC. Pensiamo che questo sia un contributo prezioso. Nelle analisi attuali, abbiamo adottato un approccio diverso, contando il numero di voxel che mostrano alcune associazioni di inferenza inversa per uno e solo uno dei 14 termini. Ancora una volta, la maggior parte dei voxel nel dACC che soddisfano questi criteri erano selettivi per il dolore.

TW fornisce alcuni dettagli nella sua risposta al blog su come viene calcolato lo z-score, iniziando in realtà come un chi-quadrato:

"Confronta la frequenza di attivazione per un termine obiettivo (" dolore ") rispetto al tasso base di attivazione per gli altri studi (" non dolore "). Formalmente, confronta P (A | dolore) a P (A | non dolore) usando un test del chi quadrato. Quindi, ci parla di preferenza, ma non di specificità rispetto ad altri stati potenziali. "

Siamo d'accordo che il punteggio z per il dolore non fa il lavoro da solo. Ma se conosciamo anche P (A | motore) e P (A | non motore) per le stesse coordinate, questo ci permette di valutare se questa attivazione è più selettiva per il dolore che per il motore. Più grande è il punteggio z, maggiore è la fiducia che P (A | termine) è maggiore di P (A | non termine). Il confronto di questi z-score in termini (z pain vs. z motor ) ci dice se dovremmo avere maggiore fiducia che uno di questi termini sia associato all'attività nella regione di interesse rispetto all'altra.

Infine, abbiamo confrontato le probabilità posteriori per i termini dolore, esecutivo, conflitto e salienza usando gli 8 voxel su cui ci siamo concentrati nel nostro documento PNAS. Per esempio, abbiamo confrontato le probabilità posteriori per il dolore (usando le 8 probabilità posteriori per il dolore che proveniva da 8 diversi punti di attivazione) con le probabilità posteriori per esecutivo (usando le 8 probabilità posteriori per il dirigente) usando un t-test con misure ripetute. Per il dolore rispetto a ciascuno degli altri tre termini, le probabilità del dolore posteriore erano significativamente più elevate, t è> 5,92, p <0,003, d 's> 4,47. Inoltre, anche confrontando il dolore con la paura e con l'autonomia, le probabilità posteriori per il dolore sono significativamente più alte, t è> 2,92, p = 0,03, d > 2,21. Non abbiamo mai pensato che confrontare le probabilità poste- riori fosse essenziale per chiarire il nostro punto, ma questo è almeno una prova del fatto che l'effetto è lì.

Forse non dovrebbe sorprendere il fatto che vediamo la stessa cosa con probabilità posteriori che abbiamo visto con z-score dato che, almeno con i dati che stavamo osservando, le due serie di statistiche erano altamente correlate. Nello specifico, la correlazione di tutte le probabilità posteriori e dei punteggi z per i termini di interesse nelle 8 posizioni esaminate nel nostro documento PNAS era r = .86 . Pertanto, sebbene tra queste misure potesse esserci qualche luce diurna concettuale, funzionalmente fornivano approssimativamente le stesse informazioni nelle nostre analisi. Questa somiglianza può essere vista nella figura sotto che traccia i punteggi z rispetto alle probabilità posteriori per dolore, esecutivo, conflitto e salienza dalle 8 posizioni nel nostro documento PNAS. Si può anche vedere che le 7 più alte probabilità posteriori ei 7 più alti punteggi z provengono tutti dal dolore. Si noti che la relazione curvilinea è probabilmente dovuta a probabilità posteriori vincolate ad un limite superiore di 1.0.

Matthew Lieberman
Fonte: Matthew Lieberman

selettività

Abbiamo già detto abbastanza sulla selettività nel nostro precedente blog. Vogliamo solo dire alcune altre cose. Uno è che non esiste una definizione di selettività universalmente condivisa (TW lo descrive come "vagamente definito"). Le persone hanno definizioni, ma non tutti hanno lo stesso. L'implicazione è che ognuno di noi ha bisogno di dire cosa intendiamo per selettività quando usiamo il termine (qualcosa che quasi nessun documento che usa questo termine fa, incluso il nostro documento PNAS). Sicuramente faremo più attenzione a questo in futuro, ma dovremmo rispettare le diverse definizioni dei ricercatori quando le danno e non trattarle come se avessero una definizione cattiva o incoerente solo perché è diversa dalla nostra. Ora abbiamo visto almeno tre definizioni di selettività nei voxel del DACC, che sono tutti ragionevoli:

Selettività L & E : i voxel del dACC sono selettivi per il dolore, se il dolore è una fonte più affidabile di attivazione del DACC rispetto agli altri termini di interesse (esecutivo, conflitto, salienza).

Selettività TY : i voxel dACC si possono dire "selettivi" per una particolare funzione se (i) mostra una solida associazione con quella funzione, (ii) mostra un'associazione trascurabile con tutte le altre alternative facilmente disponibili e (iii) gli autori hanno fatto la dovuta diligenza nel garantire che le principali funzioni candidate proposte nella letteratura siano ben rappresentate nella loro analisi.

Selettività TW : i voxel del dACC sono selettivi per una funzione particolare se il voxel viene attivato da quella funzione e "non attivato da altre cose"

Riteniamo che la definizione di TW sia difendibile, ma probabilmente esclude di chiamare qualcosa di selettivo dalle analisi fMRI poiché ci sono probabilmente pochi o nessun voxel nel cervello che mostrano l'attivazione a un solo processo (cioè, solo apparendo in una singola mappa di inferenza diretta ). Pensiamo che la nostra definizione e la definizione di TY siano entrambi più pratici. Riteniamo che la nostra sia implicita nella maggior parte degli studi MVPA che parlano della selettività fino ad oggi e pensiamo che TY rappresenti una barra più alta, ma una barra interessante, e che richiede davvero strumenti come Neurosynth, piuttosto che MVPA, da considerare.

Priori empirici

Nell'ultimo blog di TY, suggerisce che uno dei problemi con le nostre conclusioni è che il nostro uso delle probabilità posteriori è fuorviante. Le probabilità posteriori per il dolore sono intorno a 0,80 mentre le probabilità posteriori per gli altri termini esaminati nella carta tendono ad essere tra 0,50 e 0,60 (dove 0,5 è essenzialmente un effetto nullo). Pensiamo che queste differenze (e in particolare le differenze associate al punteggio z) ci dicono qualcosa sulle probabili funzioni del DACC. Tuttavia, TY implica che pensiamo che sulla base di questi effetti, se un nuovo studio di Neurosynth con attività del dACC fosse selezionato casualmente, potremmo prevedere che sarebbe uno studio del dolore. Mentre possiamo capire perché TY potrebbe pensare che ci crederemmo, non abbiamo mai fatto questa affermazione e in realtà non ci crediamo.

TY sottolinea che la probabilità di dolore a 0,8 per il dolore dipende dall'inizio del .50 prima che Neurosynth assuma per ogni termine. In nessun caso una probabilità posteriore di 80 in Neurosynth implica che l'80% degli studi con attivazioni di DACC fossero studi sul dolore. In realtà, lo abbiamo già sottolineato nel nostro documento PNAS:

"Una probabilità posteriore è simile a una dimensione dell'effetto, sebbene non direttamente interpretabile, perché il priore bayesiano per ogni termine era normato a 0,50. Pertanto, una probabilità posteriore di 0,82 è probabilmente una dimensione dell'effetto significativamente maggiore di un'altra di 0,56; tuttavia, a causa della normazione, non si può dire che lo 0,82 implichi che esiste un'82% di possibilità che un'attivazione provenga da uno studio con un particolare termine psicologico. "

TY continua quindi a discutere i priori empirici per il dolore e altri termini. Perché il dolore appare in astratto del 3,5% di tutti gli studi nel database Neurosynth e il motore appare in astratto del 18% di tutti gli studi nel database Neurosynth, se questi (.03 e .18) sono usati come priori empirici per ogni termine (invece di .50), il motore finisce con probabilità posteriori più elevate del dolore.

Siamo completamente d'accordo sul fatto che se si vede uno studio nel database Neurosynth con un'attivazione DACC, è più probabile che provenga da uno studio motorio piuttosto che da uno studio del dolore. Tuttavia, pensiamo che questo sia quasi del tutto ininfluente. Non siamo interessati alla distribuzione di studi nel database Neurosynth di per sé. Siamo interessati a cercare di trarre conclusioni sulle probabili funzioni del dACC nel mondo reale. Che ci siano più studi motoristici che studi sul dolore nel database Neurosynth si parla solo delle priorità di ricerca passate degli scienziati e forse della maggiore facilità con cui è possibile eseguire uno studio motorio rispetto alla difficoltà di eseguire uno studio del dolore.

Per chiarire quanto sia irrilevante questa differenza nel precedente basato su Neurosynth, si consideri il seguente esempio. Immagina un database con solo studi sul dolore e motori. Supponiamo che ci siano 100 studi sul dolore e 1.000.000 di studi sul motore nel database. Inoltre, immagina che il 100% degli studi sul dolore produca attività di DACC in un particolare voxel e che solo l'1% degli studi motori produca attività DACC nello stesso voxel. Se dovessimo disegnare casualmente uno studio da questo database che mostrava attività in questo voxel del dACC, sarebbe 100 volte più probabile che fosse uno studio motorio rispetto a uno studio sul dolore. Ciononostante, qualsiasi persona ragionevole guarderebbe questi risultati e concluderà che questo punto nel DACC è probabilmente coinvolto nel dolore, ma non coinvolto nei processi motori. Il chi-quadro avrebbe sostenuto questa conclusione.

Comprendiamo che il 3,5% e il 18% sono in qualche modo prioritari empirici per il dolore e il motore, rispettivamente, nel contesto di Neurosynth, ma non sono veri e propri priori empirici (e TY lo mette in evidenza più avanti nel suo blog). Pensiamo che la decisione di TY di impostare tutti i priori a 0,5 quando ha creato Neurosynth è stata una buona idea perché evita che gli effetti siano guidati dai tipi di studi che sono meglio rappresentati nel database.

Nel primo blog di TY ha dato una grande spiegazione su come effettivamente pensare alle probabilità posteriori. Ha scritto:

"L'interpretazione restrittiva di una probabilità posteriore dell'80% per il dolore in un voxel dACC è che, se dovessimo prendere 11.000 studi fMRI pubblicati e far finta che esattamente il 50% di essi includesse il termine" dolore "nei loro abstract, la presenza di l'attivazione nel voxel in questione dovrebbe aumentare la nostra stima della probabilità che il termine "dolore" si verifichi dal 50% all'80%. "

Quindi lascia suonare questo esempio un po '. Supponiamo di avere 2000 studi in un ipotetico database Neurosynth, invece di 11.000. Impostando il priore per il dolore a 0,50, stiamo dicendo "immagina che 1.000 dei 2.000 studi abbiano il termine dolore in astratto e gli altri 1.000 no". Inoltre immagina che attraverso questi 2.000 studi, 1.000 di loro abbiano attività di dACC in un voxel di interesse (ad es. Coordinate 0, 18, 30). Una probabilità posteriore per il dolore di .81 a questo voxel implicherebbe che dovremmo aspettarci circa 810 dei 1000 studi con dACC in questo campione (o una nuova serie di studi con la stessa distribuzione dolore / assenza dolore) per avere dolore come un termine e circa 190 dei 1000 studi con dACC in questo campione non hanno dolore come termine. Al contrario, se il motore ha una probabilità posteriore di 0,51 per questo voxel, allora dovremmo aspettarci circa 510 dei 1000 studi con dACC in questo campione per avere un motore come termine e circa 490 dei 1000 studi con dACC in questo campione per non avere motore come termine. Sebbene il dolore e il motore non siano stati confrontati direttamente in queste analisi, pensiamo che queste due analisi suggeriscano che il dolore è un resoconto migliore dell'attività in questo voxel rispetto ai processi motori. Ciò si riflette anche nei punteggi z a 0, 18, 30 per il dolore (Z = 9,90) e il motore (Z = 0,21).

TY scrive anche quanto segue:

"La cosa interessante di tutto questo è che, non importa quale priorità hai scelto per ogni termine, il punteggio z di Neurosynth non cambierà mai. Questo perché il punteggio z è una misura frequentista di associazione statistica tra insorgenza del termine e attivazione del voxel. Tutto ciò che ci dice è che, dati tutti i dati che abbiamo, è molto improbabile che esista un'associazione zero tra un termine e una regione. Questo può essere o non essere interessante (direi che non lo è, ma è per un post diverso), ma certamente non autorizza un'inferenza inversa come "l'attivazione del DACC suggerisce che il dolore è presente". Per disegnare quest'ultima affermazione, devi usare un quadro bayesiano e scegliere alcuni priori sensibili. No priori, nessuna inferenza inversa. "

Questo ha ancora poco senso per noi. Innanzitutto, per quanto possiamo dire, non abbiamo mai scritto le parole che TY sembra attribuirci qui ("l'attivazione del dACC suggerisce che il dolore è presente") e questo perché non abbiamo approvato e non appoggiamo questa visione. Inoltre, comprendiamo che senza un quadro bayesiano non si ottengono probabilità posteriori, che fornisce una stima della forza dell'effetto dell'inferenza inversa. Tuttavia, lo z-score sembra certamente dirci se esiste un effetto di inferenza inversa diverso da zero. Pertanto, lo z-score ci sta effettivamente dicendo qualcosa di interessante sull'inferenza al contrario. Se ci sono 14 account del dACC e solo 1 dei 14 account ha un punteggio z significativo nelle loro mappe di inferenza inversa per un particolare voxel, allora abbiamo sicuramente imparato qualcosa sulla funzione di quel voxel senza riferirsi affatto alle probabilità posteriori.

Possiamo mai dire che una regione del cervello ha una funzione?

TW ha messo in discussione la premessa del nostro lavoro, suggerendo:

"Non dovremmo cercare una spiegazione unificata per l'attività del DACC, a meno che non si tratti di descrivere una raccolta di diversi processi. Cercare di trovare la "migliore interpretazione" per una raccolta di 550 milioni di neuroni è fuorviante, perché ci invita a fare inferenze psicologiche basate sull'attività cerebrale che non sono giustificate. Per analogia, è come cercare di indovinare se una persona è un repubblicano o un democratico in base al suo stato di origine. La "migliore interpretazione" degli elettori che vivono in Texas è che sono repubblicani. Avresti ragione a indovinare repubblicano, ma avresti ragione solo il 57% delle volte. "

Questa è davvero una questione filosofica riguardante unità / livelli di analisi. Lo stesso problema si presenta nella psicologia sociale quando diciamo "in condizioni particolari, le persone tenderanno a mostrare effetti di conformità". Questo non implica che ogni persona messa in quella situazione mostrerà quegli effetti, ma piuttosto che c'è una tendenza centrale che può essere statisticamente distinto dal rumore. Solo perché ci sono alcune persone che non si conformano, ciò non significa che non possiamo parlare di ciò che le persone in generale fanno, in un modo utile.

La posizione di TW è filosoficamente difendibile, tuttavia, porta in gran parte alla conclusione che la risonanza magnetica funzionale non può quasi mai identificare alcuna funzione psicologica all'interno di qualsiasi regione del cervello, perché ogni singolo voxel contiene circa 5,5 milioni di neuroni (Logothetis, 2008) e probabilmente non esiste una regione in cui Il 100% di questi neuroni è invocato da una singola funzione / processo e da nessun'altra funzione / processo. Ma gli scienziati hanno chiaramente trovato l'utilità nel cercare di descrivere, per esempio, l'ippocampo in termini di una funzione particolare, nonostante abbia milioni di neuroni che non fanno tutti la stessa cosa. Non stiamo suggerendo che una particolare funzione sia la descrizione finale della funzione dell'ippocampo, ma stiamo suggerendo che non è un inutile tentativo di porre una funzione generale per l'ippocampo che sarà discussa, perfezionata e aggiornata nel tempo.

Passiamo all'esempio di TW di indovinare se un texano scelto casualmente è un repubblicano basato sul fatto che il 57% dei texani ha votato per Romney nel 2012 (contro il 41% di Obama). Pensiamo che questo sia un ottimo esempio, ma non cattura la domanda a cui siamo realmente interessati. Se stiamo equipaggiando i singoli Texani con i neuroni DACC e lo stato del Texas con il DACC nel suo insieme, allora la nostra vera domanda non è se possiamo indovinare se una persona in particolare è repubblicana (anche se saresti pazzo a non indovinare repubblicano se fossi costretto a scommettere). Invece, la nostra domanda è più simile a "Il Texas funziona come uno stato repubblicano, nonostante il fatto che molte persone in questo stato non siano repubblicani?" La risposta a questa domanda è un sì enfatico. Quel 57% che vota repubblicano ha assicurato il dominio dei repubblicani in ogni ramo del governo: nel Senato degli Stati Uniti (100%); Camera dei rappresentanti degli Stati Uniti (69%); Texas State Senators (68%); Rappresentanti del Texas (65%); e Texas Supreme Court Justice (100%). Questi numeri sono facilmente abbastanza alti da assicurare che il Texas funzioni come uno stato repubblicano. Con il 65% o più in entrambe le case della legislatura statale, i repubblicani possono votare attraverso una legislazione amichevole al 100% repubblicana e la Corte Suprema dello Stato può rendere le decisioni amichevoli repubblicane, di volta in volta. Forse il più grande significato è che il 57% dei texani che votano repubblicano hanno inviato il 100% dei 38 voti elettorali del Texas al candidato repubblicano alla presidenza delle ultime 9 elezioni di fila. Quindi, per il momento, pensiamo che sia solo sensato descrivere il Texas come uno stato repubblicano in quanto ha un grande valore pratico. Ogni cittadino non ha bisogno di essere un repubblicano perché questo sia il caso, né il fatto che ci siano enclave urbane che magra democratiche minano questa descrizione dello stato. (Per coloro che sono più esperti in termini computazionali, considera semplicemente una rete connessionista.Se una rappresentazione ha un piccolo vantaggio nei pesi che connettono alcuni nodi, i processi di soddisfazione dei vincoli iterativi trasformeranno quel piccolo vantaggio in un grande vantaggio funzionale nei risultati.)

Conclusione

I punteggi z delle mappe di inferenza inversa ci dicono la forza degli effetti dell'inferenza inversa? No, ma sono correlati .86 nelle nostre analisi con le probabilità posteriori che lo fanno. I punteggi z delle mappe di inferenza inversa ci dicono dove nel cervello ci sono prove affidabili di un'associazione inversa inversa diversa da zero? Assolutamente. Gli z-score possono quindi essere usati come strumento per l'inferenza inversa se identifichiamo voxel che mostrano z-score significativi per un termine ma non per altri di interesse? Assolutamente.

Pensiamo che ogni neurone o voxel nel dACC sia selettivo o addirittura attivato dal dolore? No. Pensiamo che questo significhi che non ci può essere discussione sulla funzione del dACC? No. La maggior parte dei voxel nel dACC selettivo usa la definizione di TY? No, ma circa il 43% dei voxel del DACC mostra selettività usando i 14 termini che abbiamo considerato (il che significa che i voxel sono comparsi in una e solo una delle 14 mappe di inferenza inversa prese in considerazione).

Di quei voxel DACC che sono selettivi, il 91% è selettivo per il dolore . Il dACC è selettivo per il dolore rispetto ai processi esecutivi, di conflitto e di salienza come abbiamo sostenuto nel documento PNAS? Assolutamente – solo 1 voxel dei 477 voxel che mostrano selettività è selettivo per uno di questi tre processi. Sulla base delle prove di Neurosynth, è più del DACC selettivo per il dolore che per attenzione, autonomia, evitamento, conflitto, emozione, errore, esecutivo, paura, affetto negativo, inibizione della risposta, selezione della risposta, ricompensa e salienza? Assolutamente. Dato che pochi, compresi noi, avrebbero indovinato molto di più del DACC è selettivo per il dolore rispetto a tutti questi altri account, riteniamo che i nostri risultati siano un contributo significativo alle neuroscienze affettive e cognitive.