Perché le statistiche inferenziali?

Immagina di avere una domanda: "Gli uomini e le donne si differenziano su X?"

Non importa quale "X" sia – altezza, empatia, conoscenza della storia spagnola del 13 ° secolo, o qualsiasi altra cosa – sappiamo che ogni dato uomo sarà diverso da ogni donna data, ma quello che non sappiamo è come gli uomini "in la media "differisce dalle donne" in media. "Cioè, quando abbiamo posto la nostra domanda iniziale, probabilmente volevamo sapere come la media per gli uomini rispetto alla media per le donne. Ma non sapremo mai il vero significato per gli uomini o il vero significato per le donne, perché ciò implicherebbe la misurazione di oltre 7 miliardi di persone! Quindi, dobbiamo, in qualche modo, avere un campione di uomini e un campione di donne, confrontarli e trarre una conclusione da ciò.

Diciamo che abbiamo un campione di 100 uomini e 100 donne e chiediamo loro della storia spagnola. Nel nostro campione, le donne hanno una media del 68% e gli uomini una media del 63%. Questo è il risultato per il nostro campione ed è un risultato solido come la roccia. Ma, ricordate, non siamo particolarmente interessati al nostro campione – siamo interessati a "uomini contro donne", non "uomini a cui siamo capitati di guardare" contro "donne che abbiamo visto". Vogliamo usare il nostro campionare per dedurre qualcosa sulla popolazione più grande (e questo è ciò che mette l'inferenza nelle statistiche inferenziali ).

Fare queste inferenze ha una seria sfida: qualsiasi differenza che vediamo nei nostri campioni potrebbe essere dovuta al caso! Certo, il nostro gruppo di uomini differisce dal nostro gruppo di donne, ma questo non ci dice molto di per sé, perché se prendessimo due gruppi di uomini a caso, sarebbero anche diversi. Questo è un problema serio: dato che ogni due campioni ovviamente differiscono l'uno dall'altro praticamente su tutto ciò che proviamo a misurare (se possiamo misurare in modo sufficientemente dettagliato), come possiamo utilizzare i campioni per trarre conclusioni?

Ma non tutto è perduto, come ci dirà una piccola intuizione. Le differenze riscontrate a causa di casualità sono probabilmente ridotte, e sono probabilmente di dimensioni molto diverse se facciamo di nuovo lo stesso test. Se potessimo ripetere il nostro test più e più volte (con nuovi campioni), ci aiuterebbe a fare inferenze migliori: se avessimo campioni di 100 uomini e 100 donne 20 volte, e ogni volta che abbiamo trovato donne che guadagnavano 5 punti in più degli uomini, abbiamo sarebbe molto più fiducioso nella nostra scoperta. Sebbene la replica non sia di solito pratica, possiamo usare un campione per indovinare cosa succederebbe se venissero replicati. E la nostra intuizione può aiutarci anche qui: se troviamo una piccola differenza tra i gruppi dopo aver misurato solo un piccolo numero di persone, è più probabile che sia dovuta a un caso casuale che se troviamo una grande differenza tra i gruppi dopo aver misurato un molta gente. Distruggere ciò: 1) Le grandi differenze sono meno probabili a causa del caso di piccole differenze, e 2) maggiore è la dimensione del campione, più il punto 1 è vero.

Se potessimo avere una buona padronanza matematica sulla parte "meno probabile" rispetto a "più probabile" di quelle affermazioni, potremmo iniziare a usare i nostri campioni per fare davvero buone ipotesi su quanto siano replicabili i nostri risultati. Cioè, potremmo usare il nostro singolo campione per prevedere in modo affidabile cosa succederebbe se ripetessimo il nostro studio un paio di volte. Abbiamo già concordato in precedenza che se il risultato fosse ripetuto più e più volte, allora saremmo sicuri di trarre conclusioni sulla popolazione più ampia. E ora sappiamo che possiamo usare un singolo campione per trarre conclusioni su cosa succederebbe se avessimo molti campioni. Mettere insieme le ultime due frasi: Se potessimo avere qualche matematica dietro di noi, possiamo usare il nostro singolo campione per fare inferenze affidabili sulla popolazione più grande.

Quindi, non importa quale statistica inferenziale usiamo, la domanda è sempre qualcosa del tipo: "Questa differenza abbiamo trovato nel nostro campione, qual è la probabilità che abbiamo trovato una differenza così grande, solo per caso?" Quando è improbabile che la nostra differenza osservata è dovuto al caso, ci sentiamo sicuri che sia reale.