La distribuzione normale o di Gauss è la più comune tra le distribuzioni di densità di probabilità per variabili continue. La sua popolarità è dovuta all’enorme quantità di fenomeni fisici e non, descritti mediante l’utilizzo di tale distribuzione (es. variazione casuale in SPC o Control chart). Inoltre, secondo il teorema del limite centrale, la distribuzione di alcuni valori statistici come la media o la somma di campioni di valori non distribuiti normalmente è normale se il numero di campioni è molto grande.

La distribuzione normale è descritta dalla seguente funzione:

dove σ è  la deviazione standard e µ è contemporaneamente moda, mediana e media della distribuzione. Il fattore che precede l’esponenziale è stato aggiunto per normalizzare l’area a 1. Il grafico di tale distribuzione, detto a campana, è il seguente (caso di µ=1  e σ=0,3):

distribuzione normale

La distribuzione normale ha le seguenti proprietà:

  • Simmetrica rispetto a µ
  • Non tocca mai lo zero
  • Il valore µ risulta contemporaneamente media, mediana e moda
  • Si tratta di una distribuzione unimodale in quanto la sua derivata prima è 0 solo in corrispondenza di µ.
  • L’area della curva è pari a 1.
  • Presenta due punti di flessione in corrispondenza di µ +σ e µ – σ.
  • L’area della curva compresa tra determinati valori di sigma è:
    • 0,683 tra µ – σ e µ + σ. In termini di probabilità 68,3%
    • 0,955 tra µ – 2σ e µ + 2σ. In termini di probabilità 95,5%
    • 0,997 tra µ – 3σ e µ + 3σ. In termini di probabilità 99,7%

 Distribuzione normale standardizzata

Si tratta di una particolare distribuzione normale caratterizzata da µ=0  e σ=1. Essa è definita dalla funzione:

Poiché la media risulta pari a zero, la risultante curva risulta centrata sull’asse delle ordinate:

Distribuzione normale standardizzata

 

La distribuzione normale standardizzata risulta importante in quanto qualsiasi distribuzione Gaussiana può essere trasformata in essa attraverso l’equazione:

Dove X, µ e σ sono i valori della distribuzione di partenza.

Infine, riprendendo il discorso delle aree comprese tra valori di sigma, per la distribuzione normale standardizzata  graficamente si ha:

68,3% tra µ – σ e µ + σ

Area tra µ - σ e µ + σ

95,5% tra µ – 2σ e µ + 2σ

Area tra µ - 2σ e µ + 2σ

99,7% tra µ – 3σ e µ + 3σ

Area tra µ - 3σ e µ + 3σ

 

Normality test

Per verificare se un set di dati di una variabile aleatoria continua segua una distribuzione di densità di probabilità di tipo normale, occorre eseguire dei test di normality. Ne esistono di diversi tipi:

  • Q-Q plot
  • P-P plot
  • Normal probability plot
  • Shapiro-Wilk
  • Anderson-Darling
  • Kolmogorov-Smirnov
  • Jarque Bera
  • D’agostino

In seguito si vedrà come applicare tali metodi utilizzando Excel.

Distribuzione normale o Gaussiana
%d blogger hanno fatto clic su Mi Piace per questo: