Spesso nei report statistici si utilizzano parole come “percentile” o “quartile”. Tuttavia, pur essendo due concetti estremamente semplici non sempre sono noti. In questo breve articolo spiegheremo cosa si intende esattamente con queste due parole. Non ci soffermeremo sulle procedure di calcolo dei percentili e dei quartili che tratterremo in un altro articolo. Esse infatti richiedono spesso operazioni di interpolazione che renderebbero inutilmente più complesse le definizioni che qui vogliamo dare.

Percentile

Immaginiamo di voler confrontare una caratteristica di un prodotto rispetto ad altri presenti sul mercato. Il metodo più intuitivo potrebbe essere quello di ricavare la distribuzione delle frequenze ed identificare il posizionamento del prodotto rispetto ad essa.

In alternativa è possibile utilizzare i percentili. La parola percentile fa pensare ad un collegamento con le percentuali. Ed in effetti è così. L’idea è quella di ordinare tutti i valori esistenti ed associare ad essi una scala da 0% a 100%. Identificare il percentile corrispondente al prodotto di interesse consente di definire la percentuale di prodotti in circolazione che ha un valore per quella caratteristica migliore o peggiore del nostro prodotto. Ci spieghiamo meglio con un esempio.

Immaginiamo di voler eseguire un’analisi di benchmark della durata della batteria di un modello di smartphone in determinate condizioni rispetto a quella di altri modelli dello stesso tipo. Si decide di associare il percentile 0 al peggior smartphone ed il percentile 100 al miglior smartphone. Dai dati risulta che il nostro smartphone si posiziona al 60simo percentile. Ciò significa che il nostro smartphone ha una batteria con una durata maggiore del 60% degli smartphone analizzati.

Il percentile da solo non basta

Siamo del parere che dire “il prodotto si posiziona al 60simo percentile” non fornisce un’informazione completa su come esso si collochi realmente. Spesso perciò è utile accompagnare l’informazione con un grafico tipo boxplot in cui sono riportate le posizioni dei quartili della distribuzione.

Consideriamo ancora il caso delle batterie degli smartphone. Affermare che uno specifico smartphone è al 60simo percentile non da alcuna idea su come sia la distribuzione dei prodotti nel mercato. Riportiamo qui due esempi (i valori sono inventati) in cui il nostro prodotto è per l’appunto nel 60simo percentile.

Caso 1 densità frequenze e percentili
Caso 2 densità di frequenze e percentili

In entrambi i casi il nostro smartphone è migliore del 60% dei modelli. Tuttavia nel primo caso si osserva una distribuzione bimodale degli stessi. Il nostro smartphone è il migliore dei peggiori o il peggiore dei migliori. Un passaggio al 70simo percentile richiederebbe di aumentare la durata della batteria di 800 (minuti). Quasi il doppio! Un peggioramento di soli 45 minuti risulterebbe in uno spostamento al 50simo. Nel secondo caso invece un miglioramento di 90 minuti ed un peggioramento di 60 comporterebbero uno spostamento al 70simo e al 50simo percentile.

E’ chiaro che i dati proposti sono una esasperazione di cosa potrebbe accadere nella realtà ma fa ben capire perché sapere in quale rango percentile si posiziona un prodotto non è sufficiente. Spesso tale informazione è accompagnata per completezza da quella dei quartili e da un grafico tipo boxplot

Quartile

La definizione di quartile è piuttosto semplice. Si tratta di 4 valori corrispondenti al 25simo, 50simo, 75simo e 100simo percentile.

Conoscere i quartili consente di avere un’idea migliore della distribuzione dei valori di interesse. Ad esempio il 50simo percentile coincide con la mediana di una distribuzione. Inoltre essi consentono di ricavare facilmente un boxplot della nostra distribuzione.

Riprendiamo le due distribuzioni precedenti e oltre al rango percentile riportiamo anche i quartili in tabella:

tabella quartili

Il 60simo percentile è tra il secondo ed il terzo quartile. L’aver riportato i valori dei quartili in tabella consente di fare considerazioni simili a quelle fatte nel paragrafo precedente dove è stato necessario costruire un grafico di densità delle frequenze.

Altri strumenti grafici: boxplot

In alternativa è possibile accompagnare l’informazione del percentile con un boxplot (per imparare al leggere un boxplot ti rimandiamo a questo link):

Boxplot

Anche qui è possibile fare le medesime considerazioni di prima. Le due distribuzioni sono estremamente diverse e lo si nota dall’estensione dei blocchi rossi (delimitati da primo e secondo quartile) e gialli (delimitati da secondo e terzo quartile).

 

Percentile e quartile
Tag:                     
%d blogger hanno fatto clic su Mi Piace per questo: