Curs 09 - Probabilitati Conditionate

20

Click here to load reader

description

probabilitati

Transcript of Curs 09 - Probabilitati Conditionate

Page 1: Curs 09 - Probabilitati Conditionate

PROBABILITĂŢI CONDIŢIONATE

Page 2: Curs 09 - Probabilitati Conditionate

Obiectivele cursului

Experiment aleator

Definiţia clasică a probabilităţii

Spaţiul fundamental de evenimente

Definiţia axiomatică a probabilităţii

Independenţa a două evenimente

Probabilităţi condiţionate

Prevalenta

Sensibilitate, specificitate

VPP, VPN

Curba ROC

Teorema lui Bayes

Page 3: Curs 09 - Probabilitati Conditionate

Independenţa a două evenimente

Două evenimente A şi B se numesc independente dacă şi numai dacă

Pr(AB) Pr(A) x Pr(B).

Această proprietate se mai numeşte şi legea de înmulţire a probabilităţilor.

Două evenimente A şi B sunt dependente dacă

Pr(AB) Pr(A) x Pr(B).

Au loc următoarele proprietăţi privind probabilităţile condiţionate:

Dacă A şi B sunt evenimente independente, atunci Pr(B|A) =Pr(B)

Dacă A şi B sunt evenimente dependente, atunci Pr(B|A) Pr(B) şi Pr(AB)Pr(A) x Pr(B).

Page 4: Curs 09 - Probabilitati Conditionate

Probabilitate condiţionată

Dacă A şi B sunt două evenimente arbitrare, prin probabilitatea condiţionată a lui A de către B, notată prin Pr(AB), se înţelege probabilitatea de a se realiza evenimentul A dacă în prealabil s-a realizat evenimentul B.

Prin definiţie:

sau raportul dintre numărul elementelor din B care sunt şi în A la numărul elementelor lui B.

Pr(B)

B)Pr(APr(A/B)

Page 5: Curs 09 - Probabilitati Conditionate

Probabilitate condiţionată

Are loc următoarea regulă de calcul a probabilităţii intersecţiei a două evenimente:

sau

)/Pr()Pr()Pr( ABABA

)/Pr()Pr()Pr( BABBA

Page 6: Curs 09 - Probabilitati Conditionate

EXEMPLU Se ştie că 60% din populaţia dintr-o ţară

trăieşte în mediul urban, 20% din populaţie este alergică şi 55% dintre alergici trăiesc în mediul urban. Care este probabilitatea ca alegând la întâmplare un locuitor din mediul urban el să fie alergic?

Fie A evenimentul ca o persoană să fie alergică, iar U evenimentul ca o persoană să locuiască în mediul urban. Atunci probabilitatea căutată este:

18,060

11

6,0

2,055,0

)Pr(

)Pr()/Pr()/Pr(

U

AAUUA

Page 7: Curs 09 - Probabilitati Conditionate

Riscul relativ

)A Pr(B

A) Pr(B RR

= raportul dintre probabilitatea conditionata de B a avea evenimentul A

si probabilitatea conditionata de B a nu avea evenimentul A

Page 8: Curs 09 - Probabilitati Conditionate

Probabilitate condiţionată – aplicaţii

Să considerăm următoarele evenimente în legătură cu aplicarea unui test diagnostic:

B - evenimentul ca o persoană luată la întâmplare dintr-o

populaţie să aibă o anumită afecţiune B (de exemplu,

TBC , HIV etc.),

T - evenimentul de obţinere a unui test pozitiv în cazul

aplicării unui test diagnostic T pentru detectarea afecţiunii

B la o persoană.

Prin non(B) (persoană fără afecţiunea B) şi non(T) (test

negativ) notăm evenimentele complementare

evenimentelor B şi respectiv T.

Page 9: Curs 09 - Probabilitati Conditionate

Să presupunem că populaţia căreia i s-a aplicat testul are n persoane şi s-au obţinut următoarele rezultate:

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test

negativ

c (FN) d (AN) c+d

Total a+c b+d n

Probabilitatea condiţionată – aplicaţii

Page 10: Curs 09 - Probabilitati Conditionate

Probabilitatea condiţionată – aplicaţii

In general, din cauza imperfecţiunii testului, nu orice persoană având afecţiunea B este detectată la aplicarea testului T ca pozitivă (fals negativ) şi nu toate persoanele cu răspuns pozitiv la testul T au neapărat afecţiunea (fals pozitiv).

Astfel, de regulă, prin aplicarea unui test diagnostic rezultă falşi pozitivi şi falşi negativi.

Ambele rezultate eronate ce rezultă prin aplicarea testului sunt periculoase şi de nedorit.

Page 11: Curs 09 - Probabilitati Conditionate

Prevalenta afectiunii

Extrăgând la întâmplare o persoană din populaţie, cu ajutorul rezultatelor prezentate în tabelul precedent se pot determina probabilităţile diverselor evenimente ce pot avea loc.

Pr(B) se numeşte prevalenţa afecţiunii A.

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 12: Curs 09 - Probabilitati Conditionate

Sensibilitatea testului

Probabilitatea, notată cu Se, de a obţine un test pozitiv, ştiind că testul este aplicat unei persoane care posedă afecţiunea, se numeşte sensibilitatea testului se exprimă cu ajutorul unei probabilităţi condiţionate:

)Pr(

)Pr()/Pr(

B

BT

n

can

a

ca

a

FNAP

APBTSe

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 13: Curs 09 - Probabilitati Conditionate

Specificitatea testului

Pentru caracterizarea unui test diagnostic se utilizează şi specificitatea testului care se defineşte prin probabilitatea de a obţine un test negativ pentru o persoană care nu posedă afecţiunea (probabilitate condiţionată):

)Pr(

)Pr())(/)(Pr(

nonB

nonBnonT

n

dbn

d

db

d

ANFP

ANBnonTnonSp

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 14: Curs 09 - Probabilitati Conditionate

Valoarea pozitivă predictivă VPP

este probabilitatea ca un test pozitiv să indice o persoană cu afecţiunea B:

ba

a

FPAP

AP

B

BTTBVPP

)Pr(

)Pr()/Pr(

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 15: Curs 09 - Probabilitati Conditionate

Valoarea predictivă negativă VPN

este probabilitatea ca un test negativ să indice o persoană fără afecţiune:

dc

d

ANFN

AN

nonT

nonTnonBnonTnonBVPN

)Pr(

)Pr()/Pr(

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 16: Curs 09 - Probabilitati Conditionate

Rata falsilor negativi

APFN

FNRFN

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 17: Curs 09 - Probabilitati Conditionate

Rata falsilor pozitivi

ANFP

FPRFP

Afecţiunea

/ Testul

B

bolnavi

non(B)

sanatosi

Total

T

Test pozitiv

a (AP) b (FP) a+b

non (T)

Test negativ

c (FN) d (AN) c+d

Total a+c b+d n

Page 18: Curs 09 - Probabilitati Conditionate

Formula lui BAYES

Să considerăm două evenimente A şi B care nu sunt independente (A = afectiunea, B = semnul). Atunci din formulele:

şi se deduce formula lui BAYES:

Dar fiindcă Pr(B) = Pr((BnonA) (BA)) =Pr(BnonA) + Pr(BA),

aplicând formula probabilităţilor condiţionate se obţine: Pr(B)=Pr(B|A) Pr(A) + Pr(B|nonA) Pr(nonA).

De aici rezultă următoarea formă a formulei lui Bayes:

Pr(B)

B)Pr(APr(A/B)

Pr(A)

B)Pr(APr(B/A)

Pr(B)

Pr(A)Pr(B/A)Pr(A/B)

Pr(nonA)nonA)|Pr(BPr(A)A)|Pr(B

Pr(A)A)|Pr(BB)|Pr(A

Page 19: Curs 09 - Probabilitati Conditionate

Formula lui BAYES

Formula lui Bayes poate fi utilă în stabilirea unui diagnostic medical.

Fie A o maladie şi B un semn. In acest caz, se pot considera următoarele probabilităţi:

Pr(A/B) - probabilitatea ca maladia A să fie prezentă atunci când

la un bolnav s-a constatat semnul B. Această probabilitate se

numeşte probabilitate a posteriori a lui A.

Pr(A) - probabilitatea lui A dacă nu există nici o informaţie. Este

de fapt frecvenţa maladiei A în ansamblul populaţiei (prevalenţa

lui A). Această probabilitate se numeşte probabilitate a priori.

Pr(B/A)/Pr(B) este frecvenţa semnului B în cazul maladiei A

raportată la frecvenţa sa în ansamblul populaţiei (care are sau

nu maladia A). Această probabilitate se numeşte valoarea

diagnostica a lui B pentru A (care va fi cu atât mai bună cu cât

B va fi mai frecvent în cazul maladiei A în raport cu prezenţa sa

la alte maladii).

Page 20: Curs 09 - Probabilitati Conditionate

Formula lui BAYES

prevalentaatesensibilitprevalentaatespecificit

prevalentaatespecificitVPN

prevalentaatespecificitprevalentaatesensibilit

prevalentaatesensibilitVPP

)1()1(

)1(

)1()1(

)Pr(

)Pr(

)Pr(

)Pr(

ABateSpecificit

ABateSensibilit

BAVPN

BAVPP

Fie A o maladie şi B un semn:

Pr(nonA)nonA)|Pr(BPr(A)A)|Pr(B

Pr(A)A)|Pr(BB)|Pr(A