Il test di ipotesi o anche detto “test di verifica di ipotesi” è un test statistico utilizzato per determinare la bontà di una ipotesi.

Non si tratta di un test specifico. Per test di ipotesi si intende, infatti, qualsiasi test capace di verificare o confutare una ipotesi. Un’ipotesi può essere interrogata in due modi: per via sperimentale o per via statistica.

Un test sperimentale consiste in un esperimento fisico costruito ad hoc per verificare un’ipotesi. Se le condizioni al contorno scelte per l’esperimento sono giuste, l’ipotesi è confermata o rifiutata durante l’esperimento. In particolare, nel campo dei fenomeni fisici classici, l’ipotesi può essere confermata o confutata senza dubbio. In alcuni casi, per poter eseguire l’esperimento nelle condizioni formulate dall’ipotesi possono passare anni o secoli. Immaginiamo l’ipotesi di Galileo secondo la quale in condizioni di vuoto i gravi cadono tutti con la stessa accelerazione indipendentemente dalla loro massa. Galileo non ha mai potuto testare in prima persona la sua ipotesi in condizioni di vuoto assoluto. Si è dovuto aspettare di poter riuscire a generare condizioni di vuoto per poter verificare sperimentalmente l’ipotesi di Galileo. 

Nel caso statistico, invece, l’ipotesi viene interrogata mediante l’utilizzo di test statistici ed accettata o confutata in base ad un livello di confidenza scelto a priori da chi esegue il test (vedi p-value).

Il livello di confidenza, a causa di variazioni casuali (caso) non può mai essere del 100%. Ovvero l’ipotesi non potrà mai essere accettata o rifiutata con sicurezza assoluta. Mostreremo infatti in seguito quali errori può portare un test statistico. Vediamo però prima alcuni concetti base del test di ipotesi.

Test di ipotesi: concetti chiave

Il test di ipotesi parte con la descrizione dell’ipotesi. Anzi delle ipotesi: l’ipotesi iniziale detta ipotesi nulla H0 e l’ipotesi alternativa H1 o Ha. 

Nell’esecuzione di un test di ipotesi è molto importante saper definire l’ipotesi da testare e quali parametri testare. Si consideri ad esempio di avere due campioni di dati e di chiedersi se le distribuzioni associate appartengano alla stessa popolazione oppure no. In caso affermativo le due distribuzioni avranno media e deviazione standard comparabili. L’ipotesi da testare sarà quindi relativa ad uno di questi due parametri statistici ponendo, ad esempio, come ipotesi nulla che la media del primo campione sia uguale alla media del secondo campione. L’ipotesi alternativa sarà la disuguaglianza delle due medie.

Attenzione! Ipotizzare che le due medie  siano uguali non significa calcolarle e confrontarle. Infatti è molto probabile che le due medie siano diverse in valore. Ciò che ci stiamo chiedendo è: l’eventuale differenza del valore delle due medie è dovuta a variazioni casuali o è dovuta al fatto che i due campioni appartengono a popolazioni differenti? Se la differenza è dovuta a variazioni casuali allora è molto probabile che i due campioni appartengano alla stessa popolazione.

Passi per eseguire un test di ipotesi

Vediamo in breve quali sono i passi per eseguire un test di ipotesi:

  • Definire l’ipotesi principale H0. Questa normalmente è Il confronto tra due parametri statistici(es. medie o dev. standard). Tale confronto può essere espresso sia in termini di uguaglianza che di disuguaglianza:

Test di ipotesi esempio H0

oppure

Test di ipotesi altraH0

 

  • Definire una o più ipotesi alternative H1, H2 … Nel caso in cui H0 sia µ1 = µ2,le ipotesi alternative (oltre all’ipotesi comune µ1 diverso da µ2) potrebbero essere:Test di ipotesi: ipotesi alternative
  • Stabilire il livello di confidenza con il quale si vuole condurre l’analisi. Quanto più è alto il livello di confidenza, tanto più è bassa la probabilità di commettere un errore di primo tipo (rifiutare l’ipotesi H0 che in realtà è vera). Solitamente il livello di confidenza scelto è del 95% o 99% . Si potrebbe pensare che avere un livello di confidenza alto possa essere un’idea ragionevole. In realtà aumentare il livello di confidenza aumenta il rischio di commettere un errore del secondo tipo, ovvero l’errore di accettare l’ipotesi H0 quando questa in realtà è falsa. Identificato il livello di confidenza spesso questo è indicato come CL. 1-CL è detta α  (livello di significatività del test). Vedremo meglio questi concetti nel paragrafo successivo.
  • Stabilire la potenza del test nell’identificare la validità di un’ipotesi alternativa. La potenza del test è definita come 1-β dove β è la probabilità di commettere un errore di seconda specie. Minore è la probabilità di rifiutare una ipotesi alternativa valida e maggiore sarà la potenza del test nell’identificarla.
  • Una volta scelto livello di significatività e la potenza voluta per il test si determinare la numerosità del campione. Un campione più elevato ha effetti sulla potenza del test e diminuisce la probabilità di commettere errori nell’esecuzione del test di ipotesi. Spesso però accade che non è possibile cambiare la numerosità del campione. In questi casi si può ragionare in modo opposto. Ovvero si determina la potenza del test dal numero di dati a disposizione.
  • Determinare il tipo di test da eseguire. Il tipo di test da eseguire dipende da numerosi fattori. Ad esempio dalla numerosità del campione come visto nel precedente punto di questa lista oppure dal tipo di distribuzione che caratterizza i campioni di dati a nostra disposizione. Per la scelta del test di rimandiamo ai seguenti due appunti:
    •  One sample test:  test statistici utili per confrontare un parametro statistico di un gruppo di dati continui con quelli di una popolazione
    • 2 sample test: test statistici utili per confrontare due gruppi di dati continui
  • Eseguire il test. Ovvero calcolare il valore della variabile del test scelto nel punto precedente (Z se Z test, F se F test) e calcolarne il p-value. Il p-value è la probabilità di ottenere dei valori della variabile del test più estremi di quella calcolata. Se tale probabilità è maggiore del livello di significatività alfa scelto, allora l’ipotesi H0 è accettata. Se il p-value è minore del livello di significatività scelto allora H0 è rigettata.
Errori di tipo 1 e 2 e potenza del test

Quando si esegue un test di ipotesi di tipo statistico bisogna sempre ricordare che il test può fornire un risultato errato dovuto ad esempio a poco probabili variazioni casuali. Per capire che tipo di errori possono essere eseguiti con un test di ipotesi, consideriamo il seguente test:

esempio test di ipotesi

Dove µ1 è la media associata ad una distribuzione e µ2 è la media associata ad una seconda distribuzione. Con il test di ipotesi sopra riportato stiamo chiedendo se la differenza osservabile tra le due medie sia dovuta a variazioni casuali (stessa popolazione) o se sono dovute ad una reale differenza tra i due campioni.

test ipotesi due campioni

Abbiamo visto nel paragrafo precedente che il passo successivo alla definizione delle ipotesi è la scelta del livello di confidenza. Normalmente si scelgono livelli di confidenza del 95% o 99% (a cui corrispondono valori del livello di significatività α pari a 5% e 1% rispettivamente). Un livello di confidenza del 95% significa che la probabilità di commettere un errore è pari a un caso su 20. La scelta del livello di confidenza può dipendere da diversi fattori quali la tipologia di test o la dimensione del campione a disposizione. Vediamo da un punto di vista grafico cosa vuol dire aumentare il livello di confidenza di un test di ipotesi. Consideriamo ancora il caso del confronto tra due medie di due campioni:

test di ipotesi livello di significatività

Aumentare il livello di confidenza ( e quindi diminuire il livello di significatività α) ha un effetto molto importante sul test di ipotesi: aumenta la possibilità di accettare H0 (aumentando l’area della gaussiana sottesa trai due limiti di α/2 nella distribuzione del primo campione, è più facile che il secondo campione caschi dentro tale area) in sfavore di H1.

Il parametro α rappresenta la probabilità di scartare H0 pur essendo questa vera (α è rappresentata dall’area colorata):

test di ipotesi alfa

Nel gergo del test di ipotesi l’errore di scartare l’ipotesi H0 pur essendo questa vera viene detto errore di tipo 1. La probabilità di commettere un errore di tipo 1 aumenta al diminuire del livello di confidenza del test. In realtà la scelta di α ha effetti anche sulla seconda distribuzione:

test di ipotesi beta

Aumentare il livello di confidenza (1-α) aumenta anche il valore di β ovvero l’area sottesa dalla curva della seconda distribuzione dalla sua coda al punto corrispondente a quello in cui la prima distribuzione sottende un’area pari ad α/2. Ricordiamo che  1-β è definito potenza del test. Per potenza del test si intende la capacità di individuare l’ipotesi alternativa 1. Se β aumenta all’aumentare del livello di confidenza, 1-β diminuisce. Ciò significa che aumentare il livello di confidenza diminuisce la potenza del test aumentando la probabilità di commettere un errore di tipo 2. Un errore di tipo 2 è un errore che si commette quando si accetta l’ipotesi 0 pur essendo questa falsa in sfavore dell’ipotesi alternativa.

A questo punto ci si può chiedere: ma se α determina β come è possibile scegliere il livello di significatività e la potenza del test? In realtà, se si esegue un test di ipotesi tra due distribuzioni in cui non è possibile cambiare la dimensione del campione, nulla si può fare. Se invece è possibile variare la dimensione del campione, si ricorda che all’aumentare della dimensione del campione, diminuisce la deviazione standard delle singole distribuzioni:

Una volta scelto il livello di significatività α, una deviazione standard minore ha un effetto importante sul fattore β:

test di ipotesi effetto dimensione del campione su deviazione standard e potenza del test

E’ possibile quindi aumentare la potenza del test aumentando la dimensione del campione. Non esiste un’unica formula per il calcolo della dimensione del campione minima richiesta avendo determinato α e β. La formula infatti dipende dal tipo di esperimento che si conduce. Per concludere riassumiamo quanto detto sui due tipi di errori che si possono commettere con un test di ipotesi con la seguente tabella:

 

Test di ipotesi: definizioni e concetti chiave
Tag:                                                     
%d blogger hanno fatto clic su Mi Piace per questo: