Curs 09 - Probabilitati Conditionate
Click here to load reader
-
Upload
mihai-vidrean -
Category
Documents
-
view
204 -
download
14
description
Transcript of Curs 09 - Probabilitati Conditionate
PROBABILITĂŢI CONDIŢIONATE
Obiectivele cursului
Experiment aleator
Definiţia clasică a probabilităţii
Spaţiul fundamental de evenimente
Definiţia axiomatică a probabilităţii
Independenţa a două evenimente
Probabilităţi condiţionate
Prevalenta
Sensibilitate, specificitate
VPP, VPN
Curba ROC
Teorema lui Bayes
Independenţa a două evenimente
Două evenimente A şi B se numesc independente dacă şi numai dacă
Pr(AB) Pr(A) x Pr(B).
Această proprietate se mai numeşte şi legea de înmulţire a probabilităţilor.
Două evenimente A şi B sunt dependente dacă
Pr(AB) Pr(A) x Pr(B).
Au loc următoarele proprietăţi privind probabilităţile condiţionate:
Dacă A şi B sunt evenimente independente, atunci Pr(B|A) =Pr(B)
Dacă A şi B sunt evenimente dependente, atunci Pr(B|A) Pr(B) şi Pr(AB)Pr(A) x Pr(B).
Probabilitate condiţionată
Dacă A şi B sunt două evenimente arbitrare, prin probabilitatea condiţionată a lui A de către B, notată prin Pr(AB), se înţelege probabilitatea de a se realiza evenimentul A dacă în prealabil s-a realizat evenimentul B.
Prin definiţie:
sau raportul dintre numărul elementelor din B care sunt şi în A la numărul elementelor lui B.
Pr(B)
B)Pr(APr(A/B)
Probabilitate condiţionată
Are loc următoarea regulă de calcul a probabilităţii intersecţiei a două evenimente:
sau
)/Pr()Pr()Pr( ABABA
)/Pr()Pr()Pr( BABBA
EXEMPLU Se ştie că 60% din populaţia dintr-o ţară
trăieşte în mediul urban, 20% din populaţie este alergică şi 55% dintre alergici trăiesc în mediul urban. Care este probabilitatea ca alegând la întâmplare un locuitor din mediul urban el să fie alergic?
Fie A evenimentul ca o persoană să fie alergică, iar U evenimentul ca o persoană să locuiască în mediul urban. Atunci probabilitatea căutată este:
18,060
11
6,0
2,055,0
)Pr(
)Pr()/Pr()/Pr(
U
AAUUA
Riscul relativ
)A Pr(B
A) Pr(B RR
= raportul dintre probabilitatea conditionata de B a avea evenimentul A
si probabilitatea conditionata de B a nu avea evenimentul A
Probabilitate condiţionată – aplicaţii
Să considerăm următoarele evenimente în legătură cu aplicarea unui test diagnostic:
B - evenimentul ca o persoană luată la întâmplare dintr-o
populaţie să aibă o anumită afecţiune B (de exemplu,
TBC , HIV etc.),
T - evenimentul de obţinere a unui test pozitiv în cazul
aplicării unui test diagnostic T pentru detectarea afecţiunii
B la o persoană.
Prin non(B) (persoană fără afecţiunea B) şi non(T) (test
negativ) notăm evenimentele complementare
evenimentelor B şi respectiv T.
Să presupunem că populaţia căreia i s-a aplicat testul are n persoane şi s-au obţinut următoarele rezultate:
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test
negativ
c (FN) d (AN) c+d
Total a+c b+d n
Probabilitatea condiţionată – aplicaţii
Probabilitatea condiţionată – aplicaţii
In general, din cauza imperfecţiunii testului, nu orice persoană având afecţiunea B este detectată la aplicarea testului T ca pozitivă (fals negativ) şi nu toate persoanele cu răspuns pozitiv la testul T au neapărat afecţiunea (fals pozitiv).
Astfel, de regulă, prin aplicarea unui test diagnostic rezultă falşi pozitivi şi falşi negativi.
Ambele rezultate eronate ce rezultă prin aplicarea testului sunt periculoase şi de nedorit.
Prevalenta afectiunii
Extrăgând la întâmplare o persoană din populaţie, cu ajutorul rezultatelor prezentate în tabelul precedent se pot determina probabilităţile diverselor evenimente ce pot avea loc.
Pr(B) se numeşte prevalenţa afecţiunii A.
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Sensibilitatea testului
Probabilitatea, notată cu Se, de a obţine un test pozitiv, ştiind că testul este aplicat unei persoane care posedă afecţiunea, se numeşte sensibilitatea testului se exprimă cu ajutorul unei probabilităţi condiţionate:
)Pr(
)Pr()/Pr(
B
BT
n
can
a
ca
a
FNAP
APBTSe
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Specificitatea testului
Pentru caracterizarea unui test diagnostic se utilizează şi specificitatea testului care se defineşte prin probabilitatea de a obţine un test negativ pentru o persoană care nu posedă afecţiunea (probabilitate condiţionată):
)Pr(
)Pr())(/)(Pr(
nonB
nonBnonT
n
dbn
d
db
d
ANFP
ANBnonTnonSp
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Valoarea pozitivă predictivă VPP
este probabilitatea ca un test pozitiv să indice o persoană cu afecţiunea B:
ba
a
FPAP
AP
B
BTTBVPP
)Pr(
)Pr()/Pr(
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Valoarea predictivă negativă VPN
este probabilitatea ca un test negativ să indice o persoană fără afecţiune:
dc
d
ANFN
AN
nonT
nonTnonBnonTnonBVPN
)Pr(
)Pr()/Pr(
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Rata falsilor negativi
APFN
FNRFN
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Rata falsilor pozitivi
ANFP
FPRFP
Afecţiunea
/ Testul
B
bolnavi
non(B)
sanatosi
Total
T
Test pozitiv
a (AP) b (FP) a+b
non (T)
Test negativ
c (FN) d (AN) c+d
Total a+c b+d n
Formula lui BAYES
Să considerăm două evenimente A şi B care nu sunt independente (A = afectiunea, B = semnul). Atunci din formulele:
şi se deduce formula lui BAYES:
Dar fiindcă Pr(B) = Pr((BnonA) (BA)) =Pr(BnonA) + Pr(BA),
aplicând formula probabilităţilor condiţionate se obţine: Pr(B)=Pr(B|A) Pr(A) + Pr(B|nonA) Pr(nonA).
De aici rezultă următoarea formă a formulei lui Bayes:
Pr(B)
B)Pr(APr(A/B)
Pr(A)
B)Pr(APr(B/A)
Pr(B)
Pr(A)Pr(B/A)Pr(A/B)
Pr(nonA)nonA)|Pr(BPr(A)A)|Pr(B
Pr(A)A)|Pr(BB)|Pr(A
Formula lui BAYES
Formula lui Bayes poate fi utilă în stabilirea unui diagnostic medical.
Fie A o maladie şi B un semn. In acest caz, se pot considera următoarele probabilităţi:
Pr(A/B) - probabilitatea ca maladia A să fie prezentă atunci când
la un bolnav s-a constatat semnul B. Această probabilitate se
numeşte probabilitate a posteriori a lui A.
Pr(A) - probabilitatea lui A dacă nu există nici o informaţie. Este
de fapt frecvenţa maladiei A în ansamblul populaţiei (prevalenţa
lui A). Această probabilitate se numeşte probabilitate a priori.
Pr(B/A)/Pr(B) este frecvenţa semnului B în cazul maladiei A
raportată la frecvenţa sa în ansamblul populaţiei (care are sau
nu maladia A). Această probabilitate se numeşte valoarea
diagnostica a lui B pentru A (care va fi cu atât mai bună cu cât
B va fi mai frecvent în cazul maladiei A în raport cu prezenţa sa
la alte maladii).
Formula lui BAYES
prevalentaatesensibilitprevalentaatespecificit
prevalentaatespecificitVPN
prevalentaatespecificitprevalentaatesensibilit
prevalentaatesensibilitVPP
)1()1(
)1(
)1()1(
)Pr(
)Pr(
)Pr(
)Pr(
ABateSpecificit
ABateSensibilit
BAVPN
BAVPP
Fie A o maladie şi B un semn:
Pr(nonA)nonA)|Pr(BPr(A)A)|Pr(B
Pr(A)A)|Pr(BB)|Pr(A