Il test del chi quadro come altri test di significatività statistica può risultare inaccurato quando si ha a che fare con frequenze attese molto basse o con campioni di dimensione molto piccola.

Nel primo caso, una regola universalmente accettata definisce un evento con frequenza attesa bassa un evento che teoricamente potrebbe verificarsi in meno di 5 occasioni. Per superare questo scoglio si può ricorrere ad un test esatto (es. Fisher per tabelle di contingenza 2×2) oppure accorpare in un’unica classe la lista di eventi con bassa frequenza attesa. Per comprendere meglio quest’ultima opzione si suggerisce di leggere l’esempio del test GOF per variabili continue. In generale si accetta il test del chi quadro per la goodness of fit se meno del 20% delle classi ha una frequenza attesa minore di 5.

Quando si ha a che fare con campioni molto piccoli invece, si ritiene che il test del chi quadro sia poco conservativo. Questa considerazione nasce dal fatto che in generale il p value ottenuto con il test del chi quadro è generalmente minore del p-value ottenuto eseguendo un test esatto. Ciò comporta che è più facile rigettare un’ipotesi H0 aumentando il rischio di commettere un errore di tipo 1 (rifiutare l’ipotesi H0 pur essendo H0 vera). In generale si suggerisce di utilizzare il test del chi quadro quando la dimensione del campione è oltre le 200 unità.

Quando si ha a che fare con test che prevedono l’utilizzo di tabelle di contingenza 2×2, in caso di un campionamento ridotto, si raccomanda l’utilizzo della correzione di Yates per la continuità o il test esatto di Fisher.

Correzione di Yates

Quando si ha a che fare con situazioni con due variabili nominali dicotomiche e con un campione ridotto si possono adottare due soluzioni: il test esatto di Fisher o la correzione di Yates per la continuità. Tale correzione consiste nel sostituire la normale formula del test del chi quadro con la seguente:

dove ogni scarto quadratico tra le frequenze osservate e le frequenze teoriche vengono ridotte di un fattore pari a 0,5. Se la frequenza osservata e la frequenza teorica sono molto vicine tra loro (differenza minore di 0,25), la correzione di Yates ha un effetto contrario in quanto aumenta lo scarto quadratico sottostimando il valore del p-value. Si tratta però di un evento molto raro. Infatti in generale, la correzione di Yates per la continuità è molto conservativa in quanto restituisce dei valori di p-value sovrastimati rendendo più difficile rigettare l’ipotesi H0. Solitamente il test esatto di Fisher è più indicato della correzione di Yates ma come vedremo risulta essere più complesso da applicare.

Test esatto di Fisher

La seconda opzione per le tabelle di contingenza 2×2 è il test esatto di Fisher. Si considera la seguente tabella:

A differenza degli altri test (chi quadro e correzione di Yates), il test di Fisher non stima il p-value, ma ne calcola il valore esatto. Questo è possibile in quanto il test consiste nel calcolare la probabilità di ottenere tabelle statisticamente più estreme di quella ottenuta dall’esperimento. Si tratta chiaramente di un calcolo più difficile. Se i dati sono molto grandi o le tabelle sono più ampie di una 2×2 occorre affidarsi ad un calcolatore potente e a software dedicati. Fisher calcola il p-value esatto considerando la somma delle probabilità delle tabelle per le quali la statistica risulta più estrema della tabella in oggetto. Il test è stato calcolato da Fisher per il caso specifico in cui i valori A,B,C,D siano fissi (indipendence trials).

Considerando la tabella mostrata sopra, considerando il caso di indipendence trials (ovvero A,B,C,D fissi), la probabilità di ottenere tale set di dati è dato da:

 

Una volta calcolato tale valore per la tabella stessa e per tutte le tabelle più estreme, si esegue la somma per ottenere il p-value esatto.

Il test esatto di Fisher può essere utilizzato anche quando A,B,C,D non sono fissi (double dichotomy trials).  In questo caso però il test fornisce una stima del p-value in genere è troppo conservativa. Il test del chi quadro potrebbe allora rivelarsi comunque la scelta più opportuna.

Approfondimenti

Per approfondire ulteriormente il concetto, si suggerisce di leggere l’articolo di John Ludbrook “Analysis of 2 3 2 tables of frequencies: matching test to experimental design”.

Se hai trovato questo articolo interessante, condividilo sui social per farci conoscere.

 

Test esatto di Fisher e correzione di Yates
Tag:                                     
%d blogger hanno fatto clic su Mi Piace per questo: