Il teorema del limite centrale è uno dei teoremi statistici con maggiori implicazioni pratiche. In questo appunto non mostreremo la dimostrazione matematica del teorema del limite centrale, ma ne descriveremo le caratteristiche con alcuni esempi pratici.

Il teorema del limite centrale afferma che la somma n di variabili indipendenti aventi identica distribuzione è una variabile che si distribuisce normalmente qualsiasi sia la tipologia di distribuzione di partenza. Indicati con μx e σx sigma x la media e la deviazione standard della distribuzione di partenza, la distribuzione normale ottenuta dal teorema sarà caratterizzata dai seguenti valori di media e deviazione standard:

Teorema del limite centrale: media
Teorema del limite centrale: dev standard

Teorema del limite centrale e media campionaria

L’applicazione più semplice da comprendere e più utilizzata del teorema del limite centrale è quella che riguarda la media campionaria. Si consideri di avere dei dati con una distribuzione di partenza qualsiasi e di campionare da questo set casualmente n valori. Si calcoli la media di tali valori e la si indichi con xj(barrato).

La media altro non è che la somma di n variabili identicamente distribuite (come richiesto dal teorema sopra riportato) divisa per il valore n. Ripetendo questo campionamento altre volte, si ottengono altrettante medie. Secondo il teorema del limite centrale tali medie si distribuiscono normalmente.

La distribuzione della media campionaria sarà una normale con una media ed una deviazione standard come sopra riportate. Il fatto di poter trasformare qualsiasi distribuzione in una gaussiana con una deviazione standard ridotta rispetto alla distribuzione originale è un’arma molto potente in fase di analisi statistiche. Tale distribuzione può essere facilmente trasformata in una distribuzione normale standardizzata secondo la trasformazione

Teorema del limite centrale: normale standard

Attenzione: il teorema del limite centrale è un teorema limite. Questo vuole dire che l’approssimazione ad una gaussiana migliora all’aumentare del valore n. A bassi valori di n, infatti, l’approssimazione si verifica se la distribuzione di partenza è una distribuzione normale. Per distribuzioni di partenza molto asimmetriche, l’approssimazione non vale ed è richiesto solitamente un valore di n maggiore di 30.

Dimostrazione grafica del teorema del limite centrale per la media campionaria

In questo paragrafo dimostriamo graficamente il teorema del limite centrale. Partiamo da una qualsiasi distribuzione di dati. Nella figura sotto ne vediamo 3 molto diverse:

Teorema del limite centrale: distribuzioni di partenza

Da ognuna di queste 3 distribuzioni eseguiamo 100 campionamenti. Ogni campionamento consta di un solo valore (n=1). Essi si distribuiscono nel seguente modo:

Teorema del limite centrale: n=1

Le distribuzioni sopra ottenute riflettono esattamente quelle iniziali di partenza. Aumentiamo il numero di valori per ciascun campionamento passando da n=1 a n=5. Di ogni campionamento di 5 valori viene calcolata la media e delle 100 medie ottenute se ne ricava la distribuzione (media campionaria):

Teorema del limite centrale: n=5

Nelle 3 distribuzioni ottenute si fa già sentire l’effetto pesato della media della campionatura. L’impatto maggiore è sulla prima distribuzione. Questo era un risultato aspettato in quanto delle 3 distribuzioni, la distribuzione triangolo è quella che più si avvicina ad un andamento gaussiano. La seconda distribuzione è invece ancora molto lontana da una gaussiana. Aumentiamo il numero di valori per singolo campionamento passando da n=5 a n=10:

Teorema del limite centrale: n=10

Adesso anche la seconda distribuzione incomincia ad assumere un andamento gaussiano. Si può notare come all’aumentare di n la deviazione standard diminuisca. Si tratta di un risultato aspettato per quanto mostrato nelle formule precedente. Vediamo cosa succede aumentando n da 10 a 30:

Teorema del limite centrale: n=30

Tutte e 3 le distribuzioni hanno un andamento tendente ad una gaussiana. Attenzione, l’aver scelto 100 campionamenti limita la possibilità di mostrare graficamente l’approssimazione gaussiana. Mantenendo n =30 ed aumentando i campionamenti a 300, si ottiene per la seconda distribuzione il seguente andamento:

Teorema del limite centrale

La possibilità di allocare più numeri consente di mostrare un carattere più continuo della distribuzione e quindi sempre più simile ad una gaussiana. Aumentando ulteriormente il numero di campionamenti (qui non fatto per esigenze di calcolo), l’approssimazione diventa sempre più evidente.

Teorema del limite centrale e distribuzioni asimmetriche

Nel paragrafo precedente abbiamo visto come il teorema del limite centrale sia applicabile con qualsiasi tipo di distribuzione. Le distribuzioni mostrate però hanno tutte la caratteristica di essere distribuzioni simmetriche.

La distribuzione delle medie campionarie tende ad una gaussiana anche con distribuzioni fortemente asimmetriche (come la distribuzione esponenziale). Quanto più è asimmetrica la distribuzione però, tanto più è necessario aumentare n. Per n molto grandi, non importa il tipo di andamento mostrato dalla distribuzione originaria, la media campionaria avrà sempre una distribuzione gaussiana.

Vediamo un esempio con una distribuzione esponenziale del tipo:

Teorema del limite centrale: distribuzione asimmetrica

Ed eseguiamo come fatto nel paragrafo precedente diversi livelli di campionamento:

Teorema del limite centrale: media campionaria distribuzioni asimmetriche

Come si evince dalla figura all’aumentare di n diminuisce l’effetto dell’asimmetria sul teorema del limite centrale. Per n=50 si ottiene una perfetta gaussiana (già apprezzabile per n=30).

Teorema del limite centrale e distribuzioni dicotome

L’applicazione del teorema del limite centrale nell’applicazione della media campionaria è valida anche per variabili dicotome, ovvero variabili che consentono di avere solo due tipi di output:si, no; go, no go; 0,1.

Ricordiamo che nel caso di variabili dicotome, le probabilità associata ai due possibili risultati sono rispettivamente p e 1-p e la distribuzione associata all’evento con probabilità p avrà media p e varianza p(1-p). In caso di N eventi, la distribuzione degli outcome è descritta da una binomiale con media e deviazione standard dati da:

media binomiale
dev. standard binomiale

Eseguendo campionamenti di dimensione n, la distribuzione della media campionaria per la distribuzione binaria avrà le seguenti caratteristiche:

Teorema del limite centrale. media binaria
Teorema del limite centrale: deviazione standard binaria

mentre la per la distribuzione binomiale, la distribuzione della media campionaria avrà le seguenti caratteristiche:

Teorema del limite centrale: media binomiale
Teorema del limite centrale: deviazione standard binomiale

dove N è il numero di eventi ed n è il campionament

Teorema del limite centrale
Tag:                                     

Un pensiero su “Teorema del limite centrale

I commenti sono chiusi.