Quando si ha l’esigenza di confrontare statisticamente due gruppi di dati continui si utilizzano i “2 sample test”. Confrontare statisticamente due gruppi di dati significa confrontare una caratteristica statistica degli stessi come la media o la varianza. Questi test consentono di determinare se due gruppi di dati appartengono alla stessa popolazione oppure no. Se questo articolo non è quello che cerchi ti invitiamo a seguire il nostro percorso statistico cliccando al seguente link.

Vediamo ad esempio le due distribuzioni di dati riportate in figura:

2 sample test

I due campioni appaiono distribuiti con medie diverse e deviazioni standard molto simili.I due campioni appartengono a popolazioni diverse? Oppure la differenza che osserviamo può essere dovuta al caso? I “2 sample test” consentono di rispondere a queste domande e di associare alla risposta un livello di confidenza. Basandosi tali metodi sul test dell’ipotesi esiste sempre la possibilità che il test conduca ad un risultato errato.

Come già fatto per il one sample test per dati numerici continui, vediamo quali sono i “2 sample test” più utilizzati e quali di questi dovrebbero essere usati in base al contesto che si trova ad affrontare.

Tipologie di 2 sample test

Ci sono diverse tipologie di 2 sample test. Vediamo di seguito una lista di test che possono essere utilizzati

Test per l’uguaglianza di due medie: campioni dipendenti

Nel caso di campioni dipendenti (o anche detti paired sample o accoppiati) i test più usati per verificare l’uguaglianza tra due medie sono due. Uno è utilizzato nel caso di distribuzioni normali mentre l’altro con qualsiasi tipo di distribuzione.

  • Con distribuzione normale:
    • Paired t test: Si tratta di un test che può essere eseguito quando si ha a che fare con due campioni appartenenti a due popolazioni dipendenti tra di loro. Questo è il caso tipico di un un gruppo di oggetti di cui si vuole confrontare una caratteristica prima e dopo un trattamento. É chiaro che in queste situazioni ad ogni oggetto dopo il trattamento corrisponde la sua misura a prima del trattamento. In realtà nel paired t test si cerca di eliminare la dipendenza tra le due popolazioni riconducendo il test ad un normale one sample t test.
  • Con distribuzione non normale:
    • Wilcoxon test o anche detto test dei rangi.
Test per l’uguaglianza di due medie: incampioni dipendenti
  • Con distribuzione normale:
    • Pooled 2 sample t test: utilizzato quando le due varianze delle due popolazioni sono sconosciute e si suppone che siano uguali. Poiché le due varianze delle popolazioni sono sconosciute, si useranno le varianze dei campioni . Si utilizza questo test quando i campioni sono piccoli (tra 5 e 30).
    • Z test: Rispetto al 2 sample t test, questo test è utilizzato quando si ha a che fare con due campioni molto grandi e di cui sono conosciute le varianze delle due popolazioni.
    • Test di Welch: quando si suppone che le due varianze delle due popolazioni siano diverse.
  • Con distribuzione non normale:
    • Mann Whitney test: tipologia di test che richiama molto il test dei ranghi di Welch
Test per l’uguaglianza di due varianze
  • Campioni indipendenti normalmente distribuiti
    • F test: è un test molto sensibile a situazioni di non normalità, specialmente quando il test dell’ipotesi richiede un livello di confidenza molto alto (>95%).Per cui, quando si ha a che fare con campioni che non hanno una distribuzione non normale devonno essere utilizzati altri test.
  • Campioni indipendenti con distribuzioni non normali
    • Metodo di Bonnet: si tratta di una delle soluzioni più robuste quando si ha a che fare con distribuzioni non normali. Tuttavia per campionoi molto bassi e per distribuzioni con code molto pronunciate si preferisce utilizzate il test di Levene. Il Metodo di Bonnet può portare ad errori di tipo 1 nel test di ipotesi.
    • Levene test: Test più adatto quando si ha a che fare con situazioni più critiche (campioni ridotti o distribuzioni con code molto lunghe). Si tratta di un test ANOVA eseguito sulle deviazioni dei dati dei gruppi dalle medie dei gruppi stessi. Come il metodo di Bonnett, anche il Levene test può portare ad errori di tipo 1.
    • Brown – Forsythe test: è un test molto simile al Levene test ma a differenza del secondo ha una rate di eseguire un errore di tipo 1 rigettando erroneamente l’uguaglianza di due varianze. La maggior robustezza è spiegata dal fatto che l’ANOVA test è eseguito considerando le deviazioni dalle mediane e non dalle medie.
Altri appunti utili

Ecco qui un elenco di appunti correlati a questo argomento che possono esserti utili:

 

Step 3: 2 sample test, confrontare due gruppi di dati continui
Tag:                     
%d blogger hanno fatto clic su Mi Piace per questo: