Il two sample t test è un test statistico utilizzato per verificare se tra le medie di due gruppi di dati ci siano o no differenze statistiche significative. Tale test fa uso della distribuzione t di Student per determinare se la differenza tra le due medie, in termini di variabile t, superi o no un certo valore limite considerato discriminante per la valutazione statistica del test. Capiremo meglio questo concetto nel seguito. In questo appunto vedremo quando è possibile utilizzare il two sample t test e la derivazione matematica dello stesso. In particolare l’appunto è così organizzato:

Quando utilizzare il two sample t test

Per chi si avvicina all’argomento per la prima volta, è necessario comprendere sin da subito in quali situazioni pratiche può essere utilizzato il two sample t test rispetto ad altri test statistici. In generale il two sample t test è utilizzato come strumento statistico per verificare un test di ipotesi nel quale l’ipotesi nulla è l’uguaglianza delle medie di due popolazioni. In realtà è possibile testare anche qualsiasi differenza k ipotizzata tra due medie. Si tratta di un test statistico parametrico utilizzato con variabili continue quali intervalli e rapporti. Esso è un test parametrico in quanto consente di confrontare due distribuzioni con due parametri di queste (le medie).

Il two sample t test fa parte di una categoria più ampia di test statistici detti “two sample test“. Esso può essere utilizzato solo quando si verificano determinate condizioni. La prima condizione è che i due set di dati a disposizione siano distribuiti normalmente. Deviazioni importanti dalla normalità rendono il two sample t test inadeguato al confronto delle due medie. L’ipotesi di normalità si può fondare o su una conoscenza pregressa del dato o della misura in questione oppure su un normality test. Un’altra importante condizione è che i dati siano randomici. Se ad esempio voglio confrontare una caratteristica di due varianti di uno stesso prodotto da una linea di assemblaggio occorre prelevare campioni delle due varianti in maniera totalmente causale dalla linea. Durante questo campionamento è necessario evitare ad esempio di prelevare oggetti prodotti tutti dallo stesso turno o tutti dallo stesso operatore.

In generale il two sample t test è fortemente utilizzato quando si ha a che fare con campioni molto piccoli (<30) e per i casi in cui le deviazioni standard delle due popolazioni da confrontare non siano conosciute. In generale esso sarebbe il test esatto da applicare anche in situazioni di campioni più ampi. Tuttavia, al crescere dei gradi di libertà, e quindi del campione, la distribuzione t di studente converge ad una distribuzione normale standardizzata. Per cui, in caso di campioni di grandi dimensioni si preferisce utilizzare un two sample Z test (più facile da applicare).

Per riassumere, nell’ipotesi che i due gruppi di dati abbiano distribuzione normale, possiamo avere i seguenti casi:

  • Caso 1 varianze popolazioni simili e conosciute: si utilizza un two sample z test
  • Caso 2: varianza popolazioni stimate simili e non conosciute: si utilizzano le varianze dei 2 campioni per stimare le varianze delle popolazioni. Se i due gruppi hanno varianze molto simili allora è possibile utilizzare un 2 sample t test. Quando i campioni a disposizione sono molto numerosi, allora si può utilizzare un two sample z test
  • Caso 3: varianza popolazioni stimate molto diverse, il 2 sample t test prende il nome di Welch test.

Affronteremo in questo appunto la derivazione del caso due con le sue varianti specifiche. Il two sample z test e il Welch test saranno trattati in un altro appunto.

Derivazione matematica

Vediamo in questo paragrafo la giustificazione matematica del two sample t test nel caso in cui le varianze delle due popolazioni possono essere considerate simili. Immaginiamo di avere due popolazioni distribuite normalmente caratterizzate dalla stessa varianza e da una propria media:

2 campioni con distribuzione normale

Sappiamo dal teorema del limite centrale che le distribuzioni delle medie campionarie di Xi e Yi eseguite con campionamento rispettivo n ed m sono:

distribuzioni campionarie

con la varianza della media campionarie che si riduce per ciascuna distribuzione rispettivamente della dimensione del campione (n o m). Ma perché introduciamo le medie campionarie? Lo facciamo perché la distribuzione della media campionaria ci dice in che modo la media di un campione si può posizionare rispetto alla media della popolazione. Un campione con un valore della media molto distante (poco probabile) dalla media della popolazione potrebbe essere considerato una deviazione rispetto alla popolazione con la quale lo stiamo confrontando.

media campionaria
La conseguenza del teorema del limite centrale è che la distribuzione della media campionaria è sempre più stretta della distribuzione della popolazione. Nell’immagine vediamo come si distribuiscono le medie di campioni di 25 dati. Se la media di un campione è alle code della distribuzione della media campionaria allora potrebbe provenire da una differente popolazione


Allora anche la differenza:

differenza medie campionarie

è una distribuzione normale avente come media la differenza delle medie delle due distribuzioni e come deviazione standard il valore

varianza differenza medie campionarie

E’ possibile allora ricavare la distribuzione normale standardizzata (media 0 e varianza 1) eseguendo la trasformazione:

two sample z test

Quest’ultima altro non è che la variabile z utilizzata per il 2 sample z test nel caso in cui le due popolazioni abbiano la stessa varianza σ quadro. Soffermiamoci un attimo su questa trasformazione. Questa nuova distribuzione ci dice che considerando le distribuzioni delle medie campionarie, la differenza tra le medie rilevate e le medie reali delle popolazioni deve agire in un intorno di 0 secondo una distribuzione normale standard. Possono chiaramente esserci delle differenze dovute a variazioni casuali per i quali le due differenze siano diverse. 

Sappiamo però che variazioni casuali danno una bassa probabilità che le due differenze siano molto diverse. Infatti, se supponiamo variazioni solo di natura causale, esiste una probabilità del solo 5% che le due differenze siano maggiori di un valore pari a 1,96 (figura sotto). Quando si effettua un two sample test, si verifica proprio in che modo la differenza delle medie dei campioni si posiziona rispetto alla differenza attesa (in questo caso secondo una distribuzinoe normale). Se tale differenza supera un valore limite (ad esempio 1,96 per la variabile z) allora si deve considerare che la differenza tra le due medie campionarie ha una bassa probabilità (5%) di esser dovuta a variazioni casuali concludendo quindi che l’ipotesi di due medie differenti è statisticamente più significativa. 

distribuzione normale standard. z test

 

Tuttavia nelle applicazioni pratiche capita spesso di non conoscere la varianza delle popolazioni iniziali. Può infatti accadere di avere due gruppi di dati di dimensione n e m e rispettivamente distribuiti normalmente con varianze S2x e S2y. Se le due varianze sono simili è possibile calcolare una deviazione standard combinata Sp e definire una variabile T:

deviazione standard combinata
two sample t test: variabile t di Student

essendo S2x

Tale variabile t segue una distribuzione tipo t di student con n+m-2 gradi di libertà. Infatti esplicitando Sp in T e moltiplicando e dividendo per sigma:

two sample t test: dimostrazione

Chiamiamo la quantità U:

two sample t test

U è una distribuzione chi quadro con n+m+2 gradi di libertà in quanto si può dire che ciascuno degli addendi segue una distribuzione chi quadro con rispettivamente n-1 e m-1 gradi di libertà (per la prova matematica vedere teorema 19 del riferimento  in fondo all’appunto[1]:

two sample t test

ne consegue che la variabile T:

two sample t test: variabile t

segue una distribuzione t di Student con n+m-2 gradi di libertà essendo il rapporto di una normale standard con una distribuzione chi quadro.

Ecco spiegata la derivazione matematica per la quale è possibile utilizzare la variabile T per il 2 sample t test quando si ha a che fare con varianza molto simili. La variabile T introdotta può essere utile per testare qualsiasi situazione in cui si ipotizza che la differenza fra due medie sia uguale ad un valore k:

nella realtà, l’applicazione più comune è quella con k=0 ovvero:

allora la variabile T assume la forma:

Casi particolari

Vediamo adesso due casi particolari del 2 sample t test in cui la formula della variabile t si semplifica notevolmente:

  • Sx = Sy =S. Le varianza dei due campioni possono essere considerate identiche. In questo caso, la variabile t assume la forma:
two sample t test: varianze uguali

essendo Sp = S (lasciamo a voi la dimostrazione)

  • Sx = Sy =S e n = m. Se i due campioni hanno medesima dimensione, allora la variaile t assume la forma:
two sample t test: campioni con dimensione e varianze uguali
Paired 2 sample t test

Consideriamo adesso di avere a che fare con 2 campioni accoppiati tra loro X e Y. Questo vuol dire che ad ogni elemento di X corrisponde un elemento di Y. I due campioni avranno quindi la stessa dimensione n=m. E’ il caso ad esempio in uci si vuole verificare l’efficacia di un trattamento andando a monitorare una caratteristica prima e dopo il trattamento.

Immaginiamo i due campioni normalmente distribuiti. All’interno di ogni campione, i dati sono indipendenti tra loro. Allora per ogni coppia xi e yi possiamo calcolare la differenza:

e di tali differenze ne possiamo calcolare la media:

Immaginiamo per tale media un valore teorico δ con il quale vogliamo confrontare la nostra media. Allora, la forma:

two sample t test: Paired t test

altro non è che una distribuzione normale standardizzata dove σD rappresenta la deviazione standard della popolazione delle coppie. Poiché σD non è conosciuto nella maggior parte delle applicazioni, lo si approssima con la deviazione standard del campione. Allora abbiamo la variabile t così definita:


tale variabile t segue una distribuzione t di Student con n-1 gradi di libertà. Spesso nelle applicazioni pratiche δ=0. Nel caso di campioni accoppiati quindi, potendo confluire in un’unica distribuzione delle differenze D, il t test per confrontare i due gruppi è un one sample t test. Ricordiamo che, quando si ha a che fare con campioni molto grandi, anche il paired two sample t test può essere sostituito da un paired two sample z test.

Test di ipotesi

Abbiamo detto che il two sample di test consente di confrontale le medie di due campioni. Come si traduce questo confronto in termini di testi di ipotesi?

Scelto il livello di significatività α del test, si pone come ipotesi nulla H0 l’uguaglianza ad esempio delle medie dei due campioni (ricorda, il two sample t test consente di testare anche qualsiasi differenza tra le due medie):

H0: μx = μy oppure μx – μy = 0

L’obiettivo del test è verificare se è possibile confutare questa ipotesi con un certo livello di confidenza a favore di una ipotesi alternativa Ha. In un test di questo tipo possono esserci tre tipi di ipotesi alternative:

  • μx ≠ μy : Si utilizza questa ipotesi alternativa quando si pensa che la due medie possano essere differenti. Quando il test presenta tale ipotesi alternativa, allora è definito two tailed
  •  μx > μy o μx < μy sono le altre due ipotesi possibili. In questo caso il test viene definito one tailed in quanto si considera che la media di un campione possa deviare significativamente diversa dalla media del secondo campion in una particolare direzione. In questo caso, a pari livello di significatività alfa, un one tail t test è molto più efficace nel determinare differenze tra le medie dei due campioni e a favorire l’ipotesi alternativa.
    two sample t test: one and two tailed test

Procedura per eseguire un two sample t test

Vediamo in questo paragrafo quali sono i passaggi chiave per l’esecuzione di un one sample t test:

  • Verificare innanzitutto il tipo di t test al quale fare riferimento. Se i campioni sono accoppiati utilizzerai un paired t test. Se invece i campioni sono indipendenti tra loro allora bisognerà valutare le deviazioni standard dei campioni. In caso queste siano simili allora si applica un two sample t test classico, se queste sono diverse bisognerà applicare un Welch test.

  • Definire l’ipotesi e scegliere il livello di significatività α:  Il primo step consiste nel definire il tipo di test di ipotesi (two tailed or one tailed) che si vuole utilizzare, le ipotesi (nulla H0 ed alternativa Ha) ed il livello di significatività. In un normale test di ipotesi bisognerebbe definire insieme al livello di significatività anche la potenza del test beta. Questi due parametri infatti, determinano la capacità del test di ipotesi di rifiutare un’ipotesi nulla e di individuare l’ipotesi alternativa. Ricordiamo però che beta dipende dalla numerosità del campione. In genere, si utilizza il one sample t test quando non è possibile aumentare la dimensione del campione a piacimento (n<30). Per maggiori informazioni su alfa e beta ti rimandiamo a questo appunto.
  • Definire le medie e la deviazione standard dei campioni. Da quest’ultima si dovrà ricavare la deviazione standard combinata
  • Calcolare il numero di gradi di libertà del test. Ricordiamo che i gradi di libertà sono pari al numero di dati indipendenti conosciuti. Poiché conosciamo la media dei due campioni, il numero di dati indipendenti per ciascun campione è data dal numero dei dati meno uno.
  • Calcolare il valore t limite. Ricordiamo che la distribuzione t di studente è una distribuzione che dipende dal numero di gradi di libertà. Quindi il valore del t limite, ovvero il valore oltre il quale, con il livello di significatività scelto, può essere rigettata l’ipotesi H0, dipende dal numero di gradi di libertà. Il calcolo della variabile t limite viene fatto mediante l’utilizzo delle tavole t (si trovano facilmente in rete). Vediamo un esempio calcolando il valore t limite per un test di ipotesi con 15 gradi di libertà e con un livello di significatività dello 0,05 per un one tailed t test:

     

    one sample t test: tavole t
    fonte: https://www.webtutordimatematica.it/images/pdf_vari/tavola-t-student-completa.pdf

    il t limite risulta essere 1,753. Se la variabile t di Student calcolata dal nostro set di dati, dovesse risultare maggiore di tale limite, allora si potrà rigettare l’ipotesi H0.

  • Calcolare la variabile t di student utilizzando una delle formule sopra riportate. Nel caso si stia testando l’uguaglianza tra le medie:

  • Rigettare o no l’ipotesi nulla H0: la variabile t di student, assume un valore oltre il t limite? Allora l’ipotesi H0 può essere rigettata. In caso contrario, non è possibile rigettare l’ipotesi H0

 

Reference:

[1] Loveland, Jennifer L., “Mathematical Justifcation of Introductory Hypothesis Tests and Development of Reference Materials” (2011). All Graduate Plan B and other Reports. 14.
https://digitalcommons.usu.edu/gradreports/14

Two sample t test: confrontare due gruppi di dati
Tag: