Realizzare un boxplot in excel (o grafico “scatola e baffi”) non è un’operazione immediata. Infatti, poiché questo tipo di grafico non è presente nei pre-set messi a disposizione dal programma., la sua realizzazione richiede di eseguire diverse operazioni. Tuttavia è possibile creare un proprio template in un foglio di lavoro può aiuta ad utilizzare  basterà sostituire i dati di volta in volta per ottenere il proprio boxplot.

Abbiamo già visto nel seguente link l’importanza di un tale grafico per consentire un impatto visuale sulle caratteristiche di una distribuzione. Ricordiamo che poiché un boxplot si basa sui quartili di una distribuzione è necessario capire bene cosa i quartili rappresentano in una distribuzione.

Ecco qui un breve elenco di casi in cui è utile utilizzare un boxplot:

  • Confrontare due o più distribuzioni
  • Analizzare una distribuzione mediante la dimensione dei suoi quartili (es, boxplot simmetrico rispetto alla mediana con il secondo ed il terzo quartile 3 volte più stretti del primo e del quarto quartile può indicare una distribuzione gaussiana)
  • Analisi di benchmark
  • Verificare come una distribuzione di un campione si evolve nel tempo

Nei prossimi paragrafi vedremo quali sono gli step necessari per realizzare un boxplot in excel.

Step 1 calcolo dei parametri chiave di una distribuzione

Dopo aver riportato i dati delle distribuzioni in un foglio di lavoro in excel, il passo successivo consiste nel calcolo di alcuni parametri chiave per ciascuna distribuzione. Tale calcolo dovrà essere eseguito per ogni distribuzione che si vuole rappresentare con un boxplot.

Tali parametri consentiranno la realizzazione del boxplot in excel. Essi sono:

  • Minimo della distribuzione. In excel si calcola con la formula =Min(“intervallo dati”). Per dati si intende la colonna contenente la nostra distribuzione
  • Quartile1. Si tratta del valore al di sotto del quale è compreso il 25% dei dati della distribuzione. Utilizzare la formula =Quartile( “intervallo dati” ;1)
  • Mediana. Valore centrale della distribuzione. Al di sotto di essa è contenuto il 50% dei dati. Utilizzare la formula =mediana( “intervallo dati” ) oppure =quartile( “intervallo dati” ;2).
  • Quartile3. Valore al di sotto del quale è compreso il 75% dei dati. Usare la formula =Quartile( “intervallo dati” ;3)
  • Quartile 4. Coincide con il massimo della distribuzione. Usare la formula =Quartile( “intervallo dati” ;4) oppure =max( “intervallo dati” ).

Attenzione: Excel esegue spesso il calcolo dei quartili per interpolazione. Per questo motivo spesso i valori dei quartili sono valori non compresi nella nostra distribuzione dei dati.

Si otterrà a questo punto una tabella del tipo:

tabella valori
Step 2: Calcolo dei parametri chiave per la realizzazione del boxplot.

Dai valori ottenuti nel paragrafo precedente si dovranno ricavare i parametri necessari a realizzare un boxplot in excel. Per capire la necessità di questo ulteriore calcolo bisogna avere chiaro in testa cosa costituisce un boxplot. Guardando la seguente figura notiamo che:

  • Il VAI (valore adiacente inferiore) è l’estremità del baffo inferiore. Si tratta di un parametro dato dalla formula:
                                          VAI = max{min(distribuzione); Q1 – 1,5IQR}
    Si sceglie di utilizzare il valore minimo se questo è superiore al valore Q1 – 1,5 IQR. In caso contrario il limite del baffo è proprio dato da Q1  – 1,5 IQR. In quest’ultimo caso tutti i valori della distribuzione che cadono al di sotto di tale valore sono detti anomali.
  • Allo stesso modo il VAS (valore adiacente superiore) è l’estremità del baffo superiore. Esso è dato da:
                                                 VAS = min {max(distribuzione); Q3 + 1,5 IQR}

    valgono considerazioni analoghe a quelle fatte per il VAI.
  •  La mediana o secondo quartile va da 0 al confine tra rettangolo rosso e giallo. Ne conviene che il rettangolo rosso è dato dalla differenza tra secondo e primo quartile.
  • Con considerazioni analoghe il rettangolo giallo è dato dalla differenza tra terzo e secondo quartile. 
lista dei parametri da calcolare

I parametri quindi necessari per la realizzazione dei rettangoli del boxplot sono:

  • primo quartile = par 1.
  • differenza tra secondo e primo quartile = par 2
  • differenza tra terzo e secondo quartile = par 3

I parametri necessari per la realizzazione delle stanghette sono:

  • Q1 – VAI = par 4. 
  • VAS – Q3 = par 5

In conclusione, al termine dei calcoli otterremo la seguente tabella fondamentale per realizzare un boxplot in excel

tabella parametri per realizzare boxplot in excel
Step 3 inserire un grafico a barre sovrapposte

Il terzo step consiste nell’inserire un grafico a barre sovrapposte presente in tutte le versioni di excel:

scelta grafico a colonne

Tale grafico avrà come seri i valori di par 1 par 2 e par 3 calcolati nel paragrafo precedente. Si ottiene allora un grafico del tipo:

come realizzare un boxplot in excel

Una volta eseguita questa operazione per realizzare un boxplot in excel è necessario non rendere visibile la barra del par 1. Per farlo occorre semplicemente selezionare le barre relative alla serie par 1 e scegliere l’opzione nessun riempimento.

Step 4 aggiungere le stanghette

Le stanghette del boxplot in excel sono costruite mediante l’utilizzo della funzione barra di errore. Attenzione: questo non significa che la stanghetta rappresenti l’errore associato al bloxplot!! si tratta solo di un artificio grafico!!

Ecco come realizzare le stanghette:

  • Selezionare i rettangoli trasparenti (serie par.1) e cercare la funzione “barre di errore” nella propria versione di Microsoft Excel
barra errore per boxplot
  • Scegliere la voce “barra di errore” e successivamente “altre opzioni” e selezionare la voce relativa ad errore negativo (in inglese minus) e terminale con cappello (in inglese cap).
stanghette boxplot in excel
  • Selezionare l’ammontare dell’errore selezionando valori personalizzati (in inglese custom) e poi scegliere l’intervallo dei valori (nell’immagine sopra mediante il tasto specify value). Associare alla barra di errore i valori di par 4.
  • Per la stanghetta superiore utilizzate lo stesso procedimento ma selezionando i rettangoli verdi. Per le barre di errore selezionare barre di errore positive e come parametri personalizzati quelli del par.5.

Avete così ottenuto il vostro boxplot:

boxplot in excel

Se non avete voglia di costruirvi il file ecco il formato da cui partire con il quale abbiamo costruito il nostro boxplot Boxplots.

 

 

Boxplot in excel: come realizzarlo in 4 semplici step
Tag: