In questo articolo vedremo in che modo è possibile lavorare con la distribuzione gaussiana in excel. In particolare descriveremo velocemente le funzioni previste dal software utilizzandole con esempi concreti.

Nei seguenti paragrafi vedremo quindi:

  • Distribuzione normale con la funzione distrib.norm.n e normale standardizzata con distrib.norm.st
  • Calcolo della probabilità cumulata con la funzione distrib.norm.n e distrib.norm.st 
  • Funzione inversa della probabilità cumulata  mediante le funzione norm.inv.n e norm.inv.st

Si noti che il seguente articolo potrebbe subire delle variazioni del tempo per aggiornare la sintassi delle ultime versioni del software o per mostrare ulteriori applicazioni delle funzioni qui mostrate. 

Funzione DISTRIB.NORM.N per la distribuzione normale

La funzione distrib.norm.n fornisce il valore di una distribuzione normale di cui sono note media e deviazione standard per un determinato valore x. Per poter operare la funzione ha bisogno dei seguenti argomenti:

  • x: punto dell’ascissa per il quale si vuole conoscere il valore della funzione normale
  • media: media della distribuzione normale
  • st.dev: deviazione standard della nostra distribuzione
  • cumulativo: impostato al valore falso.

Come esempio, vediamo qual è il valore di una distribuzione normale avente media 3 e deviazione standard 1 al punto x=4. La sintassi corretta è distrib.norm.n(4;3;1;falso). Il risultato è 0,242:

guassiana

tale funzione è estremamente utile per rappresentare una funzione normale nota come nella figura sopra riportata. Farlo è semplicissimo. Occorre riportare in una colonna i valori delle x e calcolare in una seconda colonna i valori della distribuzione normale. Il tutto dovrà essere riportato graficamente con un grafico come scatterplot a linea continua:

sintassi funzione gaussiana

come ottenere grafico distribuzione gaussiana

Spesso accade di lavorare con una distribuzione normale standardizzata (media 0 e deviazione standard 1). Per questo tipo di distribuzione, esiste una funzione particolare DISTRIB.NORM.ST che richiede in ingresso due soli argomenti: la x e il cumulativo impostato su falso. Tale funzione restituisce valori identici alla funzione distrin.norm.n con media 0 e deviazione standard pari 1.

Uso della funzione DISTRIB.NORM.N per la probabilità cumulativa

La stessa funzione descritta nel paragrafo precedente restituisci il valore della probabilità cumulata ad x se il cumulativo è impostato su vero. In cosa consiste la probabilità cumulata? Essa è l’area, e quindi l’integrale della funzione normale, da meno infinito ad x. Ricordiamo che la funzione normale è una funzione a campana normalizzata in modo tale che la sua area sia 1 (integrale da meno infinito a più infinito).

Consideriamo ad esempio la distribuzione normale con media 5 e deviazione standard 2 e visualizziamo la probabilità cumulata al valore 4:

probabilità cumulata

Essa non è altro che l’area evidenziata in giallo. Interrogando excel con Distrib.norm.n(4;5;2;vero) si ottiene un valore per tale area di 0,309. Cosa succede se al posto di 4 inserisco 5? Ricordiamo che la funzione normale è simmetrica rispetto alla media motivo per il quale ci aspettiamo un valore pari a metà dell’area totale e quindi 0,5.

Riportando in grafico la probabilità cumulata della normale con media 5 e deviazione standard 2 (o funzione di ripartizione) in funzione di x otteniamo la seguente curva:

distribuzione gaussiana in excel: funzione ripartizione

Essa è una funzione crescente che raggiunge il plateau 1. Dai valori dell’area possiamo riconoscere alcuni valori particolari della normale.

Al valore 0,5 corrisponderà sempre la media μ; intorno ai valori 0,159 e 0,841 ci sono rispettivamente μ – σ e μ + σ. Ricordiamo infatti che il 68,3% dell’area di una normale è compresa proprio tra tali valori (0,841-0,159 =0,682).

distribuzione gaussiana in excel: valori importanti da funzione ripartizione

Funzione inversa NORM.INV.N

Excel fornisce anche la funzione NORM.INV,N che restituisce l’inverso della funzione cumulativa. La funzione norm.inv.N richiede i seguenti argomenti:

  • probabilità
  • media della distribuzione normale
  • standard deviation

Il suo utilizzo è molto utile nei casi in cui si è interessati a sapere per quali valori di x si ottengono determinati valori di probabilità. Ad esempio è usata quando ci si pone un quesito del tipo: per quali valori simmetrici alla media ho un’area pari al 72% (per percentuali più alte può essere un problema tipico degli intervalli di confidenza).

La risoluzione è molto semplice. Se l’area di interesse è 0,72, quella di non interesse (alle code) sarà ripartita tra destro e sinistro.in (1-0,72)/2 = 0,14 per ogni coda.

Per conoscere quindi l’intervallo intorno la media nel quale giace una probabilità pari al 72% sarà necessario tramite la funzione inversa sapere i valori delle x per le quali la probabilità cumulata è del 14% (coda sx) e del 86% (coda sx + area di interesse).

Nel primo caso (14%), per una distribuzione avente media 4 e sta dev 3 la sintassi della funzione inversa è norm.inv(14;4;3).

Un caso particolare della funzione inversa è la norm.inv.st che restituisce le stesse informazioni per una funzione normale standardizzata. In questo caso richiede un solo argomento (probabilità) perché gli altri due sono noti (media 0 e sta deviation 1).

distribuzione gaussiana in excel: funzioni chiave