In questo appunto vediamo in cosa consiste la distribuzione multinomiale ed in quale tipo di situazioni questa può essere utilizzata. I paragrafi che seguiranno sono:

Definizione di distribuzione multinomiale e di esperimento multinomiale

La distribuzione multinomiale è una distribuzione di probabilità discreta che descrive eventi caratterizzati da più di due possibili esiti. Essa è considerata la forma generalizzata della distribuzione binomiale che invece descrive la probabilità di ottenere k successi in un processo di Bernoulli. Un evento di tipo Bernoulli si possono avere solo due possibili esiti ( dicotomia): successo/insuccesso; testa/croce; GO/NOGO. Ricordiamo che la funzione di probabilità della distribuzione binomiale è:

distribuzione multinomiale: formula binomiale

La distribuzione multinomiale consente di allargare questa prospettiva descrivendo eventi più complessi che sono caratterizzati da più di due possibili esiti. Immaginiamo, ad esempio, il caso di un dado a sei facce e di lanciarlo 10 volte. Ci chiediamo quale sia la probabilità che dai 10 lanci corrisponda 5 volte il risultato 1, 2 volte il risultato 2 e 3 volte il risultato 3.

Caratteristiche di un esperimento multinomiale

Esperimenti di questo tipo sono detti esperimenti multinomiali. A tali eventi corrispondono le seguenti caratteristiche:

  • Gli eventi sono caratterizzati da più di 2 possibili risultati (6 facce)
  • Gli eventi sono indipendenti tra di loro (l’esito del lancio di un dado non dipende dall’esito precedente)
  • La probabilità associata a ciascun risultato è sempre costante per la durata di tutto l’esperimento (ogni faccia del dado ha sempre una probabilità pari ad un sesto di verificarsi)
Funzione di probabilità della distribuzione multinomiale

La funzione di probabilità della distribuzione multinomiale ha la seguente forma:

distribuzione multinomiale

dove ciascun elemento xi rappresenta il numero di eventi in cui si verifica uno specifico esito (Ei). Ciascun esito Ei ha una probabilità di verificarsi in un singolo trial pari a pi. Di conseguenza, pi^(xi) rappresenta la probabilità che si verifichino xi eventi con l’esito Ei. Allora si dice che il vettore  X = (x1, x2, . . ., xk) ha una distribuzione multinomiale con indice n e probabilità p = (p1^(x1), p2^(x2), . . ., pk^(xk)) e ciascun elemento del vettore X segue invece una distribuzione binomiale.

La speranza matematica (che indicheremo con E) della distribuzione multinomiale è rappresentata da un vettore X di k elementi e che rappresentano il valore atteso delle singole componenti. In particolare, per ogni j vale:

E[xj] = npj (valore atteso di una componente)

da cui:

E[X]= [np1, np2,…npk]

La varianza di una singola componente sarà invece data da npj(1-pj)

Coefficiente multinomiale

La prima porzione della funzione della probabilità della distribuzione multinomiale è detta coefficiente multinomiale. Dati k+1 numeri naturali indicati rispettivamente come x1, x2, …xk, n e tali che x1 + x2 + … + xk = n, si definisce coefficiente multinomiale il valore:

distribuzione multinomiale: coefficiente multinomiale

Immaginiamo adesso di avere n=5 oggetti e di indicarli con le lettere A, B, C , D , E e ci chiediamo quante sono le permutazioni con le quali è possibile disporre tali oggetti in 3 gruppi in modo tale che il primo gruppo abbia 3 elementi, il secondo 0 ed il terzo 2. Sappiamo dal calcolo combinatorio che è possibile posizionare 5 oggetti in 120 modi diversi. Quando però questi oggetti vengono posizionati all’interno di gruppi e tali oggetti sono indistinguibili, occorre eliminare le permutazioni equivalenti. Ad esempio, poiché gli oggetti all’interno dei gruppi sono indistinguibili, la permutazione (ABC) () (DE) è equivalente a (CBA)()(ED). Queste equivalenze riducono pertanto il numero di possibili combinazioni. Abbiamo infatti che vale la relazione:

numero combinazioni

Questa riduzione è eseguita dal denominatore del coefficiente multinomiale che di fatto esprime le permutazioni possibili all’interno dei gruppi stessi.

Esempio di permutazioni equivalente

Ad esempio, le seguenti sono tutte combinazioni equivalenti e devono essere considerate un’unica combinazione:

  1. (A,B,C); (0); (D,E)
  2. (A,B,C); (0); (E,D)
  3. (A,C,B); (0); (E,D)
  4. (A,C,B); (0); (D,E)
  5. (B,C,A); (0); (E,D)
  6. (B,C,A); (0); (D,E)
  7. (B,A,C); (0); (E,D)
  8. (B,A,C); (0); (D,E)
  9. (C,A,B); (0); (E,D)
  10. (C,A,B); (0); (D,E)
  11. (C,B,A); (0); (E,D)
  12. (C,B,A); (0); (D,E)

Nel caso specifico dei 5 oggetti che si dispongono in 3 gruppi, il calcolo delle permutazioni equivalenti è effettuato moltiplicando il numero di permutazioni equivalenti all’interno dei singoli gruppi. In un gruppo di 3 elementi, si avranno 3! possibili modi equivalenti di posizionare i 3 elementi. In un gruppo di 2 elementi saranno 2!, mentre in un gruppo di 0 elementi sarà 0!. Il numero di combinazioni equivalenti con cui disporre i 5 elementi nei 3 gruppi definiti sopra è dato dal prodotto dei singoli fattoriali: 3!*2!*0! = 6*2 = 12. Detto questo, il numero totale di combinazioni per l’esempio scelto sarà 5!/(3!*0!*2!) = 120/12 = 10 possibili combinazioni:

  1. (ABC)()(DE) e tutte le altre permutazioni equivalenti
  2. (ABD)()(CE) e tutte le altre permutazioni equivalenti
  3. (ABE)()(CD) e tutte le altre permutazioni equivalenti
  4. (ACD)()(BE) e tutte le altre permutazioni equivalenti
  5. (ACE)()(BD) e tutte le altre permutazioni equivalenti
  6. (ADE)()(BC) e tutte le altre permutazioni equivalenti
  7. (BCD)()(AE) e tutte le altre permutazioni equivalenti
  8. (BCE)()(AD) e tutte le altre permutazioni equivalenti
  9. (CED)()(AB) e tutte le altre permutazioni equivalenti
  10. (BED)()(AC) e tutte le altre permutazioni equivalenti

Il numero delle 10 permutazioni non equivalenti comparirebbe come coefficiente multinomiale di una funzione di probabilità multinomiale.

Concludiamo il paragrafo sul coefficiente multinomiale con una curiosità. Tale coefficiente è utilizzato per lo sviluppo della potenza di un polinomio:

distribuzione multinomiale: coefficiente polinomiale

nel caso di un binomio (k=2), ciascuno dei termini fattoriali esprime un elemento del triangolo di Tartaglia per la specifica riga n del triangolo!

Distribuzione binomiale come caso specifico della distribuzione multinomiale

Per specifici valori di k ed n, la distribuzione binomiale può ridursi a delle distribuzioni più semplici:

  • k=2 e n=1 la distribuzione multinomiale coincide con la distribuzione di Bernoulli.
  • k=2 e n>1 la distribuzione multinomiale coincide con la distribuzione binomiale.
  • k>2 e n=1 la distribuzione multinomiale con la distribuzione categorica.

In questo paragrafo ci soffermiamo sul legame tra la distribuzione binomiale e quella multinomiale per uno stesso esperimento. Abbiamo detto infatti che ciascun elemento del vettore multinomiale ha una distribuzione binomiale. Pensiamo ad esempio al caso di un dado a 6 facce. Sappiamo che la distribuzione multinomiale ci consente di calcolare la probabilità di un vettore specifico in cui per ogni faccia è associato un numero di eventi K positivi su n eventi totali. Per ogni faccia però è possibile anche associare una distribuzione binomiale in cui si calcola la probabilità che possa uscire quella faccia k volte su n trials e una faccia diversa n-k volte.

Ad esempio vediamo il valore della distribuzione multinomiale nel caso del vettore [2,1,1,2,0,0] che esprime la seguenti lista di esiti in ordine causale:

  • 2 venti per la faccia 1
  • 1 evento per la faccia 2
  • 1 evento per la faccia 3
  • 2 eventi per la faccia 4
  • 0 eventi per le facce 5 e 6

Applicando la formula di probabilità della distribuzione binomiale otteniamo:

distribuzione multinomiale:

mentre il valore della probabilità binomiale per il vettore [2,4] per la faccia 1:

  • 2 eventi per la faccia 1
  • 4 eventi per le altre facce

è pari a:

distribuzione multinomiale: esempio

Questa probabilità è esattamente uguale alla somma delle probabilità multinomiali di tutti i possibili vettori di dimensione 6, aventi come primo elemento 2 e come altri elementi dei numeri la cui somma è pari a 4:

[2,4,0,0,0,0], [2,3,1,0,0,0], [2,3,0,1,0,0], [2,3,0,0,1,0], [2,3,0,0,0,1], [2,2,1,1,0,0], [2,2,1,0,1,0], [2,2,1,0,0,1], [2,2,0,1,1,0], [2,2,0,1,0,1], [2,2,0,0,1,1], [2,2,2,0,0,0], [2,2,0,2,0,0], [2,2,0,0,2,0], [2,2,0,0,0,2], [2,1,1,1,1,0], [2,1,0,1,1,1], [2,1,1,0,1,1], [2,1,1,1,0,1], [2,1,2,1,0,0], [2,1,2,0,1,0], [2,1,2,0,0,1], [2,1,1,2,0,0], [2,1,0,2,1,0], [2,1,0,2,0,1], [2,1,1,0,2,0], [2,1,0,1,2,0], [2,1,0,0,2,1], [2,1,1,0,0,2], [2,1,0,1,0,2], [2,1,0,0,1,2], [2,1,3,0,0,0], [2,1,0,3,0,0], [2,1,0,0,3,0], [2,1,0,0,0,3], [2,0,1,1,1,1], [2,0,2,1,1,0], [2,0,2,1,0,1], [2,0,2,0,1,1], [2,0,1,2,1,0], [2,0,0,2,1,1], [2,0,1,2,0,1], [2,0,1,1,2,0], [2,0,0,1,2,1], [2,0,1,0,2,1], [2,0,1,1,0,2], [2,0,0,1,1,2], [2,0,1,0,1,2], [2,0,3,1,0,0], [2,0,3,0,1,0], [2,0,3,0,0,1], [2,0,1,3,0,0], [2,0,0,3,1,0], [2,0,0,3,0,1], [2,0,1,0,3,0], [2,0,0,1,3,0], [2,0,0,0,3,1], [2,0,1,0,0,3], [2,0,0,1,0,3], [2,0,0,0,1,3], [2,0,4,0,0,0], [2,0,0,4,0,0], [2,0,0,0,4,0], [2,0,0,0,0,4], [2,0,2,2,0,0], [2,0,2,0,2,0], [2,0,2,0,0,2], [2,0,0,2,2,0], [2,0,0,2,0,2], [2,0,0,0,2,2]

Relazione tra la distribuzione di Poisson la distribuzione multinomiale

Abbiamo introdotto la distribuzione di Poisson nel seguente appunto e la considereremo quindi nel seguito di questo paragrafo come una conoscenza consolidata. Ricordiamo solo che tale distribuzione, anche detta distribuzione degli eventi rari, è descritta dalla funzione di probabilità:

distribuzione multinomiale: Poisson

tale funzione descrive fenomeni molto rari per i quali non è definito un numero di trials n come per la distribuzione binomiale e multinomiale. L’unico parametro dal quale la distribuzione dipende è media mu con il quale l’evento accade. Ma in che modo allora la distribuzione di Poisson può rapportarsi con la distribuzione multinomiale? Immaginiamo di avere una serie di eventi (x1, x2 .. xk) descritti da una distribuzione di Poisson e indipendenti tra di loro. Ognuno di questi eventi è descritto da una media (μ1,μ2, …μk).

Immaginiamo ad esempio di lavorare presso un customer center e di ricevere delle telefonate dai clienti per le seguenti ragioni:

  • richiesta di intervento di riparazione (E1)
  • prolungamento garanzia (E2)
  • richiesta di assistenza all’utilizzo del prodotto (E3)
  • altro (E4)

Ciascuna probabilità di ricevere un certo numero di telefonate in un’ora appartenenti a una di queste categorie è descritta da una distribuzione di Poisson. Se volessimo calcolare la probabilità di ricevere un certo numero n totali di telefonate in un’ora indipendentemente dal tipo di categoria allora, si ha a che fare ancora con un evento di tipo Poisson la cui media μ è data dalla somma delle medie dei singoli eventi:

distribuzione multinomiale: Poisson congiunta

Non importa il numero di casi per ogni evento (qui non ci interessiamo di x1,x2…), importa solo calcolare la probabilità che il numero di eventi totali sia n. Se invece si è interessati a calcolare la probabilità che si verifichino x1 casi per l’evento E1, x2 casi per l’evento E2, x3 casi per l’evento E3 ed x4 casi per l’evento E4 con x1+x2+x3+x4=n allora non è più possibile utilizzare una distribuzione di Poisson.

Effetto del limite n sulla distribuzione

In questo caso, gli eventi non possono essere considerati indipendenti in quanto è stato posto un limite massimo ad ogni evento di potersi verificare (n) ed il valore di casi per un evento influenza il valore dei casi per gli altri eventi. Ricordiamo che n è un numero totalmente randomico e può assumere valore 100, 300 o 3000. Calcolare la probabilità di avere 15 telefonate per E1, 20 per E2, 30 per E3, e 30 per E4 significa che stiamo dando per scontato che il numero totale delle telefonate ricevute sia 95.

La probabilità è condizionata al fatto di avere n eventi in totale ed è pari a:

distribuzione multinomiale: relazione con Poisson
distribuzione multinomiale: relazione con Poisson

che null’altro è che una distribuzione multinomiale per il vettore X=(x1,x2,x3,…xk).

Distribuzione multinomiale
%d blogger hanno fatto clic su Mi Piace per questo: