Biostatistica medicala-probabilitati

8

Click here to load reader

description

probabilitati

Transcript of Biostatistica medicala-probabilitati

Page 1: Biostatistica medicala-probabilitati

Elemente de teoria probabilitatilor

1 Introducere

Bazele teoriei probabilitatilor au fost puse ın secolul XVII de Pascal si Fermat.

Aparut ca o modelare matematica a sansei la jocurile de noroc, calculul proba-

bilitatilor s-a transformat ıntr-o teorie matematica riguroasa, ın stransa legatura cu

analiza matematica dar si cu alte ramuri ale matematicii. Teoria probabilitatilor are

astazi importante aplicatii ın fizica, chimie, biologie, medicina, economie, sociologie

si multe alte discipline.

Din punct de vedere intuitiv, probabilitatea este un numar (cuprins ıntre zero

si unu) asociat unui eveniment. Chiar si aceasta descriere imprecisa ne conduce la

ideea definirii probabilitatii ca o functie definita pe o multime de evenimente.

Prin experienta sau experiment vom ıntelege realizarea unui complex de conditii

ce conduc la obtinerea unui rezultat. Ne intereseaza numai acele experiente al caror

rezultat nu poate fi prevazut cu exactitate, asa–numitele experiente aleatoare.

O experienta se poate repeta de mai multe ori fara ca rezultatul sa fie neaparat

acelasi; fiecare repetare a unei experiente se numeste proba. Orice situatie ce se

poate realiza prin una sau mai multe probe se numeste eveniment.

Exemplu. Experienta aruncarii unui zar. In raport cu aceasta experienta se pot

considera urmatoarele evenimente:

A: aparitia fetei cu 4 puncte,

B: aparitia unei fete cu numar par de puncte,

C: aparitia unei fete cu cel mult 3 puncte.

Fie Ω = 1, 2, 3, 4, 5, 6 multimea punctelor de pe fetele zarului. Se observa ca Ω

este multimea rezultatelor posibile ıntr–o proba a experientei si ca fiecarui eveniment

ıi corespunde o submultime a lui Ω, numita multimea cazurilor favorabile evenimen-

tului respectiv. Vom identifica evenimentele cu submultimile cazurilor favorabile

lor. Se poate constata o analogie ıntre evenimente si multimi.

Relativ la o experienta, distingem doua evenimente remarcabile:

• evenimentul sigur, notat Ω: se realizeaza la orice efectuare a experientei; ıi

corespunde multimea tuturor cazurilor posibile

• evenimentul imposibil, notat ∅: nu se produce la nici o efectuare a experientei;

corespunzator multimii vide

Numim sistem de evenimente asociat unei experiente aleatoare: multimea eveni-

mentelor ce pot aparea ın acea experienta. Evenimentele elementare sunt ace-

lea corespunzatoare submultimilor formate dintr-un singur element ale lui Ω. In

1

Page 2: Biostatistica medicala-probabilitati

cazul experientei aruncarii zarului, sistemul de evenimente este multimea P(Ω) a

submultimilor lui Ω.

Operatii cu evenimente

Fie A si B doua evenimente asociate unei experiente.

• Evenimentul A implica evenimentul B daca realizarea lui A atrage dupa sine re-

alizarea lui B; multimea cazurilor favorabile lui A este inclusa ın multimea cazurilor

favorabile lui B. A ⊂ B

• Reuniunea evenimentelor A si B este evenimentul care se realizeaza daca cel

putin unul dintre evenimentele A sau B se realizeaza. A ∪B

• Intersectia evenimentelor A si B este evenimentul care se realizeaza daca eveni-

mentele A si B se realizeaza simultan. A ∩B

• Diferenta evenimentelor A si B este evenimentul care se realizeaza cand se

realizeaza A si nu se realizeaza B. A \B

• Evenimentul contrar lui A este evenimentul care se realizeaza daca nu se real-

izeaza A, deci cazurile favorabile lui A corespund complementarei multimii cazurilor

favorabile lui A. A

Au loc relatiile:

A = Ω \ A; A ∪ A = Ω; A ∩ A = ∅.Evenimentele A si B se numesc compatibile daca se pot realiza simultan (A∩B 6=

∅) si incompatibile ın caz contrar (A ∩B = ∅).

Fie Ω 6= ∅ si ∅ 6= K ⊂ P(Ω). Atunci perechea (Ω,K) se numeste camp de

evenimente daca:

(i) A ∈ K ⇒ A ∈ K.

(ii) (∀n ∈ N An ∈ K) ⇒⋃n∈N

An ∈ K.

Fie (Ω,K) un camp de evenimente. Atunci au loc urmatoarele proprietati:

(i) Ω ∈ K.

(ii) ∅ ∈ K.

(iii) (∀n ∈ N An ∈ K) ⇒⋂n∈N

An ∈ K.

(iv) A,B ∈ K ⇒ A ∪B ∈ K.

2

Page 3: Biostatistica medicala-probabilitati

(v) A,B ∈ K ⇒ A ∩B ∈ K.

(vi) A,B ∈ K ⇒ A \B ∈ K.

Ca o consecinta imediata, reuniunea si intersectia unui numar finit de evenimente

din K apartin de asemenea lui K.

2 Camp de probabilitate

Fie (Ω,K) un camp de evenimente. Numim probabilitate pe K o functie P : K → R,

care satisface proprietatile:

(1) Pentru orice A ∈ K P (A) ≥ 0,

(2) Evenimentul sigur are probabilitatea P (Ω) = 1.

(3) Pentru orice sir An de evenimente din K, incompatibile doua cate doua

P (⋃n∈N

An) =∑n∈N

P (An).

Tripletul (Ω,K, P ) se numeste camp de probabilitate.

Fie (Ω,K, P ) un camp de probabilitate. Atunci au loc urmatoarele proprietati:

(i)P (∅) = 0.

(ii) A, B ∈ K, A ∩B = ∅ ⇒ P (A ∪B) = P (A) + P (B).

(iii)A, B ∈ K, A ⊂ B ⇒ P (B \ A) = P (B)− P (A).

(iv) A,B ∈ K, A ⊂ B ⇒ P (A) ≤ P (B).

(v) A ∈ K ⇒ P (A) = 1− P (A).

(vi) A ∈ K ⇒ 0 ≤ P (A) ≤ 1.

(vii) A,B ∈ K ⇒ P (A \B) = P (A)− P (A ∩B).

(viii) A,B ∈ K ⇒ P (A ∪B) = P (A) + P (B)− P (A ∩B).

(ix) Formula lui Poincare. Daca A1, A2, . . . An ∈ K atunci

P (n⋃

i=1

Ai) =n∑

i=1

P (Ai)−∑i<j

P (Ai ∩ Aj) +

+∑

i<j<k

P (Ai ∩ Aj ∩ Ak)− · · ·+

+ (−1)n+1P (A1 ∩ A2 ∩ · · · ∩ An).

3

Page 4: Biostatistica medicala-probabilitati

Demonstratie.

(i) Alegem A0 = Ω si An = ∅ pentru n ≥ 1, dupa care aplicam proprietatea (3)

din definitia probabilitatii.

(ii) Alegem A0 = A, A1 = B si An = ∅ pentru n ≥ 2. Este suficient acum sa

aplicam (3) si sa tinem cont de (i).

(iii) Fie A si B doua evenimente din K cu A ⊂ B. Atunci B = A ∪ (B \ A) iar

evenimentele A si B \ A sunt incompatibile. Aplicand (ii) obtinem

P (B) = P (A) + P (B \ A).

(iv) Din axioma (1) si proprietatea (iii) obtinem

P (B)− P (A) = P (B \ A) ≥ 0,

adica P (A) ≤ P (B).

(v) Luam B = Ω ın (iii).

(vi) Rezulta din (iv).

(vii)Sa observam ca A = (A \ B) ∪ (A ∩ B). Putem acum sa aplicam (ii)

evenimentelor incompatibile A \B si A ∩B.

(viii) Este suficient sa observam ca

A ∪B = (A \B) ∪ (A ∩B) ∪ (B \ A)

si ca cele trei evenimente care compun A ∪ B sunt incompatibile doua cate doua.

Se aplica apoi (ii) si (vii).

(ix) Formula este o generalizare a proprietatii (viii) care poate fi demonstrata

prin inductie. 2

3 Probabilitate conditionata

Sa consideram urmatoarele experiente.

E1. Dintr-o urna cu 10 bile, 3 albe si 7 negre, se extrag succesiv 2 bile fara a pune

bila extrasa ınapoi ın urna. Care este probabilitatea ca cea de-a doua bila extrasa sa

fie alba?

4

Page 5: Biostatistica medicala-probabilitati

Legat de aceasta experienta, consideram evenimentele:

A: prima bila extrasa este alba

A: prima bila extrasa este neagra

B: a doua bila extrasa este alba

B: a doua bila extrasa este neagra

P (A) =3

10Daca ınaintea evenimentului B s-a realizat A, atunci

P (B) =2

9.

Daca ınaintea lui B s-a realizat evenimentul A, atunci

P (B) =3

9.

Deci realizarea evenimentului B depinde de realizarea evenimentului A.

P (A ∩ B) =C2

3

C210

=1

15. Daca notam cu PA(B) probabilitatea de sa se realizeze

B stiind ca s-a realizat A, observam ca PA(B) =P (A ∩B)

P (A).

E2. Se arunca o pereche de zaruri ideale si se urmareste aparitia sumei 6.

Care este probabilitatea ca la cel putin unul din zaruri sa apara fata 2?

In legatura cu aceasta experienta consideram evenimentele:

A: suma punctelor egala cu 6

B: cel putin unul din zaruri afiseaza fata 2

Cazuri favorabile lui A: (1, 5), (5, 1), (2, 4), (4, 2), (3, 3)A ∩B: (2, 4), (4, 2).

Probabilitatea ca unul din zaruri sa afiseze fata 2 stiind ca suma punctelor este

egala cu 6, este 2/5. Sa mai observam ca P (A) = 5/36, P (B) = 11/36, iar

P (A ∩B) = 2/36.

Fie (Ω,K, P ) un camp de probabilitate, A ∈ K, cu P (A) > 0. Atunci functia

PA : K → R definita prin

PA(B) =P (A ∩B)

P (A),

se numeste probabilitate conditionata de evenimentul A.

Se poate arata ca functia PA este o probabilitate pe K.

Evenimente independente

Daca realizarea evenimentului B nu depinde de realizarea sau nerealizarea eveni-

mentului A, ne asteptam ca probabilitatea lui B sa fie egala cu probabilitatea lui B

5

Page 6: Biostatistica medicala-probabilitati

conditionata de A. Aceasta observatie ne conduce la urmatoarea definitie formala

pentru independenta.

Doua evenimente A,B ∈ K se numesc independente daca

P (A ∩B) = P (A) · P (B).

A1, A2, . . . , An dinK se numesc evenimente independente daca pentru orice submultime

de indici I ⊆ 1, 2, . . . , n avem:

P (⋂i∈I

Ai) =∏i∈I

P (Ai).

Din definitia probabilitatii conditionate, rezulta ca daca A este un eveniment cu

P (A) > 0 atunci pentru orice eveniment B are loc:

P (A ∩B) = P (A)PA(B).

Aceasta formula poate fi generalizata pentru o multime finita de evenimente.

Probabilitatea intersectiei de evenimente

Daca A1, . . . , An ∈ K si P (n−1⋂i=1

Ai) > 0 atunci:

P (n⋂

i=1

Ai) = P (A1) · PA1(A2) · PA1∩A2(A3) . . . PA1∩A2∩···∩An−1(An).

4 Formula probabilitatii totale. Formula lui Bayes

Fie (Ω,K, P ) un camp de probabilitate si (Ai)i∈I o familie de evenimente din K.

Atunci (Ai)i∈I se numeste partitie sau sistem complet de evenimente daca:

(1)∀i ∈ I Ai 6= ∅;(2) i 6= j ⇒ Ai ∩ Aj = ∅;(3)

⋃i∈I

Ai = Ω.

Formula probabilitatii totale

Fie A1, . . . , An un sistem complet de evenimente. Atunci pentru orice eveniment A

din K, are loc formula:

P (A) =n∑

i=1

P (Ai)PAi(A).

6

Page 7: Biostatistica medicala-probabilitati

Formula lui Bayes

Fie A1, . . . , An un sistem complet de evenimente si A ∈ K cu P (A) > 0. Atunci:

PA(Ai) =P (Ai)PAi

(A)n∑

i=1

P (Ai)PAi(A)

.

Exemple. 1) Se considera trei urne identice continand:

U1 : o bila alba si una neagra;

U2 : 5 bile albe si 3 bile negre;

U3 : o bila alba si 3 bile negre.

Se alege o urna la ıntamplare si se extrage din ea, la ıntamplare, o bila.

a) Sa se afle probabilitatea ca bila aleasa sa fie alba.

b) Daca bila aleasa este alba care este probabilitatea ca bila sa fi fost aleasa din

urna U2?

Rezolvare. a) Fie evenimentele

Ai: extragerea se face din urna i

B: bila extrasa este alba

Atunci: P (A1) = P (A2) = P (A3) = 1/3.

Pe de alta parte, A1, A2, A3 formeaza un sistem complet de evenimente si folosind

formula probabilitatii totale, obtinem

P (B) = P (A1)PA1(B) + P (A2)PA2(B) + P (A3)PA3(B) =

=1

3· 1

2+

1

3· 5

8+

1

3· 1

4=

11

24.

Pentru b) folosim formula lui Bayes:

PB(A2) =P (A2)PA2(B)

3∑i=1

P (Ai)P (B/Ai)

=1

3· 5

8· 24

11=

5

11.

2) A fost elaborat un nou test pentru a determina riscul ca o anumita persoana

sa se ımbolnaveasca de o anumita boala genetica. Nici un test nu e perfect: vor

exista purtatori ai genei respective care vor fi testati negativ si non–purtatori care

sa fie testati pozitiv.

Consideram evenimentele:

7

Page 8: Biostatistica medicala-probabilitati

A: pacientul are gena respectiva

B: pacientul este testat pozitiv

a) Ce semnificatie au probabilitatile: PA(B), PB(A), PB(A) PB(A)?

b) Sa presupunem ca 1 la 1000 de persoane este purtatoare a bolii. De asemenea

sa presupunem ca probabilitatea ca un purtator al genei sa fie testat negativ este

1%, iar probabilitatea ca un non–purtator sa fie testat pozitiv este 5%. Daca un

pacient a fost testat pozitiv, care este probabilitatea ca pacientul sa fie purtator al

genei respective? Dar daca a fost testat negativ?

8