In questo appunto approfondiremo due importanti concetti in teoria della probabilità: la probabilità condizionata e la probabilità composta. Immaginiamo di avere due eventi A e B ognuno caratterizzato da una sua probabilità di potersi verificare. La probabilità condizionata dell’evento A rispetto all’evento B consente di calcolare la probabilità che si verifichi l’evento A una volta saputo che l’evento B si è verificato. Se esiste una dipendenza tra i due eventi, la probabilità condizionata consente di correggere la probabilità associata all’evento A grazie all’informazione aggiuntiva relativa al verificarsi dell’evento B.

Prima di entrare nel merito delle formule, facciamo un esempio concreto di situazione in cui è necessario utilizzare la probabilità condizionata. Immaginiamo d avere un sacco con 10 palle rosse, 5 cubi blu, 6 cubi rossi e 10 piramidi verdi. Consideriamo come evento A la probabilità di estrarre dal sacco una pallina rossa (con probabilità 10/31) e come evento B l’estrazione di un oggetto rosso (con probabilità 16/31). a questo punto ci si chiede quale sia la probabilità che si verifichi l’evento A una volta saputo che l’evento B si è verificato. La risposta di questo semplice esempio è 10/16 ma vedremo nei prossimi paragrafi in che modo è possibile esprimere matematicamente tale probabilità condizionata. Vedremo anche in che modo è possibile esprimere la probabilità composta dei due eventi A e B, ovvero la probabilità che questi eventi si manifestino contemporaneamente. In particolare vedremo
- Esperimento caratterizzato da due eventi simultanei A e B. In questo paragrafo prenderemo familiarità con i concetti probabilistici relativi ad un esperimento in cui avvengono simultaneamente 2 eventi.
- Probabilità condizionata dell’evento A rispetto all’evento B e probabilità composta AB. Dai concetti ricavati nel paragrafo precedente ricaveremo la formula della probabilità condizionata
- Esempi
Esperimento caratterizzato da due eventi simultanei A e B
Immaginiamo di condurre un esperimento in cui osserviamo simultaneamente due eventi A e B, di eseguire N prove e di riportare in una tabella i numeri di casi in cui questi eventi si sono verificati oppure no. Riportiamo i risultati ottenuti in una tabella 2×2 dove per nAB si intende il numero di casi in cui si sono verificati entrambi gli eventi A e B. La notazione A barrato sta ad identificare l’evento “non A” quindi l’evento contrario all’evento A o evento A non verificato:

possiamo sostituire il numero dei casi con le frequenze, dividendo ciascun elemento della tabella per il numero totale di prove eseguite N:

dove f(AB) è la frequenza con la quale si verificano contemporaneamente i due eventi A e B ed è data da:

per N → infinito, le frequenze osservate tenderanno alle rispettive probabilità, la tabella diventa quindi, in termini di probabilità:

Ritornando alla tabella delle frequenze precedentemente ottenuta, è possibile ricavare anche le frequenze dei singoli eventi A e B. Ad esempio, la frequenza f(A) relativa alla manifestazione dell’evento A è data dalla somma delle frequenze osservate f(AB) e f(ABbarrato). Questo è equivalente a dire di sommare le frequenze del caso in cui si manifestano A e B con la frequenza del caso in cui A si manifesta e B non si manifesta.


la stessa cosa si può dire per f(B):


è possibile ricavare anche la frequenza che si verifichi l’evento A o l’evento B f(A+B). Tale frequenza è data dalla somma di f(AB), f(ABbarr) ed f(abarrB):


se i due eventi sono tra loro esclusivi, ovvero il manifestarsi dell’uno esclude il manifestarsi dell’altro, allora f(AB) = 0 e f(A+B) = f(A) + f(B). Tutte queste relazioni ottenute possono essere anche espresse in termini di probabilità:



essendo:

Nel paragrafo successivo vedremo come queste relazioni ci consentiranno di ricavare le formule della probabilità condizionata e della probabilità composta.
Probabilità condizionata e probabilità composta
Adesso ci chiediamo quale sia la probabilità che si manifesti A una volta saputo B essersi manifestato. In termini di frequenze, facendo riferimento alla tabella 2×2 del paragrafo precedente, ci stiamo chiedendo di verificare la frequenza in cui si è manifestato l’evento A tra tutte le volte in cui si è manifestato B e indicheremo tale frequenza con f(A|B). Questa è data dal numero di volte in cui si manifesta A con B manifestato nAB diviso il numero di volte totali in cui B si è manifestato nAB+nAbarrB:

poiché:

e

se ne deduce che avere l’informazione che B si è verificato aumenta la probabilità che si manifesti contemporaneamente AB. f(A|B) è sempre maggiore di f(AB). In altri termini, si può dire che l’aggiunta di una informazione certa sul verificarsi di un evento, riduce l’incertezza del verificarsi di eventi che con questo sono relazionati. In termini di probabilità:

da cui:

Ma cosa succede se i due eventi sono statisticamente indipendenti? Ovvero se il verificarsi dell’ evento B non condiziona il verificarsi dell’evento A? In questo caso p(A|B) = p(A) ottenendo dunque:

Le ultime due formule esprimono il teorema della probabilità composta, ovvero la probabilità che si verifichino contemporaneamente (operatore logico “e”) i due eventi A e B. Nel primo caso si considera l’eventualità che A sia condizionato da B e quindi di due eventi statisticamente dipendenti, nel secondo caso invece i due eventi sono statisticamente indipendenti.
Esempio 1 probabilità condizionata
Riconsideriamo l’esempio mostrato nell’introduzione di questo appunto e cambiamo i due eventi A e B per renderlo un po’ meno intuitivo. Sia l’evento A l’estrazione di un cubo e l’evento B l’estrazione di un oggetto di colore rosso. Quale sarà la probabilità condizionata p(A|B)?

Sapendo che l’oggetto estratto è di colore rosso, la probabilità dell’evento A cambia. Infatti, i cubi blu non sono più estraibili e il numero totale di possibilità è di 6 cubi rossi su 16 oggetti rossi. Per cui p(A|B) = 6/16. I 6 cubi rossi nell’immagine sopra sono situati nell’intersezione di p(A) e p(B):

Esempio 2 probabilità condizionata
Consideriamo come secondo esempio il lancio di un dato al quale associamo due eventi. L’evento A consiste nell’estrazione del numero “2” mentre l’evento B consiste nell’estrazione di un numero pari.

Applicando la formula precedente:

Esempio 3 probabilità composta per eventi indipendenti
Consideriamo il lancio di due dadi. Ci chiediamo quale sia la probabilità che lanciando i due dadi si ottenga due volte il numero 3. I due eventi A: risultato 3 dal lancio del primo dado e B:”risultato 3 dal lancio del secondo dado” sono indipendenti tra di loro. Il lancio del primo dado non influenza il risultato del secondo. Sappiamo dalla formula generale della probabilità condizionata:

dove p(A|B) = p(A) in quanto i due eventi sono tra di loro indipendenti.
Stesso tipo di ragionamento può essere fatto nel caso di estrazione di due numeri con reinserimento. Parliamo quindi del caso in cui, dopo aver estratto il primo numero, questo viene reinserito nuovamente con gli altri per la seconda estrazione. Così facendo, la primo estrazione non ha influenza con quella successiva.
Esempio 4: probabilità composta per eventi dipendenti
Quando abbiamo a che fare con due eventi dipendenti tra di loro, la probabilità composta che questi eventi si manifestino contemporaneamente deve tenere in considerazione del fatto che la manifestazione del primo evento ha un impatto sul secondo evento. Consideriamo infatti di voler calcolare la probabilità che da un’estrazione su 90 numeri venga estratto prima il numero 1 e poi il numero 2. Trattiamo il caso di estrazione senza reinserimento
Evento (B): il primo numero estratto è il numero 1
Evento (A): il secondo numero estratto è il numero 2
Se consideriamo l’insieme di tutte le possibili combinazioni di coppie di numeri che possono essere estratti uno di seguito all’altro, avremo 89*90=8010 possibilità. Ma qual è la probabilità che si verifichi l’evento B? Essa dovrà considerare tutte le possibili coppie (1,y) dove y rappresenta tutti i possibili numeri da 2 a 90. Tali coppie sono in tutto 89, per cui:

lo stesso vale per p(A), dovendo considerare tutte le coppie (y,2) dove y rappresenta tutti i numeri da 3 a 90 più il numero 1. In totale y rappresenta 89 numeri, per cui:

Quale sarà allora la probabilità composta che avvengano entrambi gli eventi? Essa non può essere calcolata come nell’evento precedente moltiplicando p(A) e p(B) in quanto si otterrebbe 1 caso favorevole su 8100 possibilità. Ma da quanto detto prima il numero di possibilità sono 8010 e non 8100. Questa discordanza deriva dal fatto di non aver considerato che i due eventi sono dipendenti tra di loro e che il verificarsi del primo aggiunge una informazione sul secondo:

La probabilità composta per due eventi dipendenti è infatti data dalla probabilità che si verifichi il primo evento (p(B) per la probabilità che si verifichi il secondo dopo che si sia verificato il primo p(A|B):

dove p(A|B) è dato da:

Per cui, la probabilità p(AB) che possano verificarsi i due eventi contemporaneamente è data da:

E’ chiaro che alla stessa conclusione saremmo potuti arrivare affermando che su 8010 possibilità solo 1 soddisfa il contemporaneo manifestarsi dei due eventi A e B. L’esempio è stato però propedeutico a dimostrare che tipo di errore si può applicare applicando la formula della probabilità composta di due eventi indipendenti al caso di due eventi dipendenti.
Avvertenze:
prima di utilizzare le formule della probabilità composta e della probabilità condizionata, è necessario avere bene in mente quali siano gli eventi A, B e le loro probabilità. Ad esempio nell’ultimo esempio proposto si sarebbe potuto attribuire erroneamente a p(A) il valore 1/89 e non 1/90. Un altro errore che può essere commesso sta nel confondere p(A|B) con p(AB). Ricorda, il primo indica la probabilità che si verifichi A dopo aver saputo che B si sia verificato. Il secondo ci dice la probabilità che si verifichino entrambi senza avere nessuna informazione addizionale.