Spesso la distribuzione di Poisson viene introdotta come approssimazione della distribuzione binomiale con N tendente a infinito e p a 0. Si tratta di un approccio che a nostro avviso può essere fuorviante dal punto di vista concettuale. Infatti in questo modo è facile pensare che la distribuzione di Poisson sia solo un’approssimazione della distribuzione di Bernoulli. In realtà è fondamentale sottolineare che essa descrive in primis eventi di tipo Poisson che sono differenti da quelli di tipo Bernoulli.

Per questo motivo preferiamo innanzitutto mettere in risalto le differenze tra le due distribuzioni prima di derivare la distribuzione di Poisson dalla binomiale.

Nel seguente articolo invece, sono state descritte le proprietà statistiche della distribuzione di Poisson. Essa è stata derivata partendo dalle condizioni degli eventi che essa descrive e applicando un approccio infinitesimale.

Poisson e binomiale: distribuzioni a confronto

Obiettivo di questo paragrafo è descrivere le principali differenze tra le due distribuzioni prima di descrivere l’approssimazione della distribuzione binomiale con la distribuzione di Poisson.

Le differenze che qui mostreremo riguarderanno:

  • tipo di eventi descritti
  • tipi di risultati ammessi
  • dipendenza parametrica
  • numero di trials
  • proprietà statistiche
Binomiale

La distribuzione binomiale fornisce la probabilità che un certo numero di successi si verifichino su N eventi. Si tratta di una funzione biparametrica in quanto dipende da N numero di eventi e da p probabilità che un evento abbia successo. Tale probabilità deve essere costante per tutti gli N eventi o trials della prova in studio che devono quindi essere fissati prima della prova. Questo perché gli eventi che tale distribuzione descrive sono eventi indipendenti caratterizzati dal fatto che il risultato di un evento non influisce il risultato dell’evento successivo. Ogni evento inoltre può avere solo 2 tipi di risultati del tipo: successo/insuccesso; si/no; bianco/nero. Per capirci meglio, la distribuzione binomiale risponde a domande del tipo: qual è la probabilità che eseguendo N=12 lanci il numero 6 esca 5 volte?

Esaminando tale evento si può infatti verificare che la probabilità che il numero 6 esca in un lancio (p=1/6) è costante in tutti gli N=12 lanci. E’ importante sottolineare che in questo caso ogni evento “lancio di un dado” può avere ben 6 risultati diversi che però nella nostra domanda sono stati ridotti a 2: “esce 6” “ non esce 6”.

Al contrario, la distribuzione non risponde a domande del tipo: qual è la probabilità di estrarre 6 numeri pari in 15 estrazioni consecutive di un numero della tombola. Qui infatti p non è costante in quanto dopo ogni estrazione la probabilità cambia. Infine la distribuzione binomiale ha un valore atteso sempre maggiore della radice della varianza.

Poisson

La distribuzione di Poisson fornisce la probabilità che possano accadere n eventi in un intervallo di tempo (o di area o di lunghezza) sapendo che essi si verificano con una rate pari a r. Gli eventi che essa descrive, non necessariamente devono prevedere 2 possibili risultati (come per la binomiale). La rate di accadimento r deve invece essere costante nell’intervallo di tempo (area, lunghezza etc..) preso in considerazione e deve essere tale che due eventi non possono accadere allo stesso istante (o punto nello spazio). La distribuzione di Poisson dipende dunque dal solo parametro r motivo per il quale è monoparametrica. Infine la distribuzione di Poisson ha un valore medio pari alla radice quadrata della varianza.

Approssimazione della distribuzione binomiale in Poisson.

Per N molto elevati, l’utilizzo della distribuzione binomiale richiede uno sforzo matematico molto grande a causa del calcolo fattoriale e non sempre risulta conveniente. Quando si ha a che fare con eventi in cui p → 0 è possibile approssimare la distribuzione binomiale per n molto elevati ad una distribuzione di Poisson. La condizione di p → 0 per la quale si realizza la convergenza, definisce la distribuzione di Poisson come la distribuzione degli eventi rari. Ultima condizione per eseguire l’approssimazione della distribuzione binomiale è che il prodotto np sia una costante.

Ricordiamo che la distribuzione binomiale ha la seguente forma:

Definiamo la costante λ= np e la introduciamo nella formula binomiale:

calcoliamo a questo punto il limite per n che tende ad infinito:

esplicitando il temine n fattoriale:

A questo punto è possibile semplificare i termini (n-k)! al numeratore e denominatore della prima frazione:

 

Per n tendente a infinito il numeratore è prossimo ad 1 in quanto anche il numeratore presenterà un termine n elevato a k. L’equazione allora diventa:

L’ultima parentesi è invece prossima ad uno in quanto λ/n tende a 0. Non si può fare lo stesso discorso per la prima parentesi in quanto questa è elevata ad n. L’equazione diventa:

L’ultimo limite è un limite notevole in quanto ricorda lo sviluppo in serie di Taylor della funzione esponenziale:

Si è quindi dimostrata l’approssimazione della distribuzione binomiale alla funzione:

che è la funzione della distribuzione di Poisson! (c.v.d.)

Uso della approssimazione della distribuzione binomiale in applicazioni pratiche

Nella pratica, si preferisce utilizzare la distribuzione di Poisson quando il numero n supera il valore 100 e la probabilità p è inferiore al valore 0,02.

Verifichiamo quanto detto riportando in grafico le due distribuzioni al variare prima di p e poi di n.

n=130 e p variabile

Si sceglie un valore di n molto alto (130) e si vede cosa accade al variare di p che in questo caso assumerà valori da 0,1 in giù:

approssimazione al variare di p

come si evince dalla figura le due distribuzioni si discostano molto in prossimità del massimo (4%) per p=0,1. Aumentando il dettaglio per p=0,05:

dettaglio per p=0,05

la differenza in prossimità del massimo (2,5%) diminuisce ma è ancora significativa. Per p=0,02 la differenza in prossimità del massimo si abbassa notevolmente (0,5%). E’ possibile visionare in maniera più intuitiva quanto detto mediante un grafico 3D della funzione differenza delle due distribuzioni (binomiale – poisson):

rappresentazione 3D al variare di p

L’immagine ci mostra che anche alle code le distribuzioni differiscono tra loro. In particolare la binomiale è una distribuzione sempre più stretta della Poisson e con picchi tendenzialmente più alti. Alle code la funzione differenza risulta negativa perché la funzione di Poisson assume valori maggiori. Come si evince seguendo la freccia gialla, sia la differenza del massimo che quella alle code si riducono notevolmente al diminuire di p. Importante: il grafico riporta la differenza e non la sua percentuale.

p=0,01 ed n variabile

Riportiamo quanto fatto nel paragrafo precedente mantenendo però fisso p ad un valore molto basso ed facendo variare n. In questo caso riportiamo direttamente il grafico 3D per evitare considerazioni ridondanti:

Approssimazione della distribuzione binomiale al variare di n

In questo caso è evidente che le differenze diminuiscono all’aumentare di n.

 

Approssimazione della distribuzione binomiale in Poisson
Tag: