Carte SPD

365
Ariadna Lucia Pletea Mircea Lupan SATISTICĂ PRIN ... MATLAB ŞI MATHEMATICA IAŞI, 2009

Transcript of Carte SPD

Page 1: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 1/364

Ariadna Lucia Pletea Mircea Lupan

SATISTICĂ PRIN ... MATLAB ŞI

MATHEMATICA

IAŞI, 2009

Page 2: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 2/364

Page 3: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 3/364

Cuprins

1 Câmp de probabilitate 51.1 Câmp de evenimente . . . . . . . . . . . . . . . . . . . 51.2 Definitia probabilitatii . . . . . . . . . . . . . . . . . . 101.3 Formule probabilistice . . . . . . . . . . . . . . . . . . 151.4 Metode de numarare . . . . . . . . . . . . . . . . . . . 201.5 Moduri de selectare a elementelor . . . . . . . . . . . . 221.6 Scheme clasice de probabilitate . . . . . . . . . . . . . 231.7 Probleme rezolvate . . . . . . . . . . . . . . . . . . . . 28

2 Variabile aleatoare discrete 43

2.1 Definitia variabilei aleatoare . . . . . . . . . . . . . . . 432.2 Variabile aleatoare discrete . . . . . . . . . . . . . . . . 442.3 Functia de repartitie a v. a. discrete . . . . . . . . . . . 452.4 Operatii cu v. a. discrete . . . . . . . . . . . . . . . . . 472.5 Caracteristici numerice ale v. a. discrete . . . . . . . . 49

2.5.1 Proprietati ale mediei . . . . . . . . . . . . . . . 522.5.2 Proprietati ale dispersiei . . . . . . . . . . . . . 54

2.6 Functia generatoare . . . . . . . . . . . . . . . . . . . . 612.7 Legi discrete de repartitie . . . . . . . . . . . . . . . . 61

2.7.1 V. a. repartizat˘

a uniform . . . . . . . . . . . . . 612.7.2 V. a. repartizata binomial . . . . . . . . . . . . 642.7.3 V. a. multinomiala . . . . . . . . . . . . . . . . 672.7.4 V. a. repartizata binomial cu exponent

negativ . . . . . . . . . . . . . . . . . . . . . . . 682.7.5 V. a. repartizata geometric . . . . . . . . . . . . 712.7.6 V. a. repartizata hipergeometric . . . . . . . . . 732.7.7 V. a. repartizata Poisson . . . . . . . . . . . . . 75

2.8 Probleme rezolvate . . . . . . . . . . . . . . . . . . . . 78

1

Page 4: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 4/364

2 CUPRINS

3 Variabile aleatoare continue 953.1 Functia de repartitie . . . . . . . . . . . . . . . . . . . 953.2 Densitatea de probabilitate . . . . . . . . . . . . . . . . 983.3 Caracteristici numerice ale v. a. continue . . . . . . . . 993.4 Legi clasice de repartitie . . . . . . . . . . . . . . . . . 105

3.4.1 V. a. distribuita uniform . . . . . . . . . . . . . 1053.4.2 V. a. distribuita exponential . . . . . . . . . . . 1073.4.3 V. a. distribuita Weibull . . . . . . . . . . . . . 1103.4.4 V. a. distribuita gama . . . . . . . . . . . . . . 1123.4.5 V. a. distribuita normal . . . . . . . . . . . . . 1133.4.6 Functia caracteristica . . . . . . . . . . . . . . . 1193.4.7 V. a. distribuita hi-patrat χ2(n) . . . . . . . . . 1233.4.8 V. a. distribuita Student . . . . . . . . . . . . . 1253.4.9 Functii de v. a. . . . . . . . . . . . . . . . . . . 1263.4.10 Repartitia lognormala . . . . . . . . . . . . . . 128

3.5 Fiabilitate . . . . . . . . . . . . . . . . . . . . . . . . . 1303.6 Probleme rezolvate . . . . . . . . . . . . . . . . . . . . 132

4 Teorema limita centrala 1554.1 Aplicatii ale teoremei limita centrale . . . . . . . . . . 162

4.1.1 Aproximarea v. a. binomiale printr-ov. a. normala . . . . . . . . . . . . . . . . . . . 170

4.1.2 Aproximarea v. a. Poisson printr-ov. a. normala . . . . . . . . . . . . . . . . . . . 173

5 Vectori aleatori 1755.1 Variabile aleatoare bidimensionale . . . . . . . . . . . . 1755.2 Functia de repartitie a unui vec. a. bidimensional . . . 1805.3 Caracteristici numerice . . . . . . . . . . . . . . . . . . 1825.4 Operatii cu v. a. continue . . . . . . . . . . . . . . . . 184

5.5 Repartitia normala bidimensionala . . . . . . . . . . . 194

6 Elemente de statistica 1996.1 Populatii statistice . . . . . . . . . . . . . . . . . . . . 1996.2 Reprezentarea grafica a datelor statistice . . . . . . . . 201

6.2.1 Gruparea pe clase . . . . . . . . . . . . . . . . . 2036.2.2 Algoritmul pentru constructia histogramelor . . 204

6.3 Caracteristici statistice ale datelor experimentale . . . 2106.4 Statistica a doua variabile . . . . . . . . . . . . . . . . 214

Page 5: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 5/364

CUPRINS 3

7 Statistica inferentiala 2217.1 Modele statistice . . . . . . . . . . . . . . . . . . . . . 2247.2 Estimatori punctuali . . . . . . . . . . . . . . . . . . . 2277.3 Metoda momentelor . . . . . . . . . . . . . . . . . . . . 2327.4 Metoda verosimilitatii maxime . . . . . . . . . . . . . . 233

7.4.1 Probleme rezolvate . . . . . . . . . . . . . . . . 248

8 Intervale de încredere 2538.1 Intervale de încredere pentru medie în cazul σ

cunoscut . . . . . . . . . . . . . . . . . . . . . . . . . . 254

8.1.1 Constructia intervalului de încredere . . . . . . 2548.1.2 Alegerea dimensiunii esantionului . . . . . . . . 260

8.2 Intervale de încredere pentru medie în cazul σnecunoscut . . . . . . . . . . . . . . . . . . . . . . . . . 262

8.3 Intervale de încredere pentru dispersie . . . . . . . . . 2688.4 Intervale de încredere pentru proportii . . . . . . . . . 273

8.4.1 Alegerea dimensiunii esantionului . . . . . . . . 2768.5 Predictia . . . . . . . . . . . . . . . . . . . . . . . . . . 2778.6 Intervale de toleranta pentru caracteristici ce urmeaza

o distributie normala . . . . . . . . . . . . . . . . . . . 279

8.7 Intervale de încredere pentru caracteristicile a doua po-pulatii care urmeaza o distributie normala . . . . . . . 2818.7.1 Intervale de încredere pentru diferenta mediilor

a doua populatii ale caror dispersii sunt cunos-cute . . . . . . . . . . . . . . . . . . . . . . . . 282

8.7.2 Intervale de încredere pentru diferenta mediilora doua populatii ale caror dispersii sunt necu-noscute . . . . . . . . . . . . . . . . . . . . . . 285

8.7.3 Intervale de încredere pentru raportul dispersi-ilor a doua populatii . . . . . . . . . . . . . . . 289

8.7.4 Intervale de încredere pentru diferenta proporti-ilor a doua populatii . . . . . . . . . . . . . . . 292

9 Testarea ipotezelor statistice 2959.1 Teste parametrice . . . . . . . . . . . . . . . . . . . . . 295

9.1.1 Legatura dintre testarea ipotezei statistice rela-tiv la un parametru si intervalul de încredere alparametrului . . . . . . . . . . . . . . . . . . . 297

9.1.2 Testarea mediei unei distributii normale . . . . 301

Page 6: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 6/364

4 CUPRINS

9.1.3 P -valoarea în teste statistice . . . . . . . . . . . 3039.1.4 Test asupra dispersiei unei populatii distribuite

normal . . . . . . . . . . . . . . . . . . . . . . . 3139.1.5 Test asupra proportiei unei populatii . . . . . . 3179.1.6 Test asupra diferentei mediilor a doua caracte-

ristici distribuite normal . . . . . . . . . . . . . 3209.1.7 Test asupra raportului dispersiilor a doua popu-

latii . . . . . . . . . . . . . . . . . . . . . . . . 3239.1.8 Test asupra diferentei proportiilor a doua pop-

ulatii . . . . . . . . . . . . . . . . . . . . . . . . 324

9.2 Testul lui Pearson (χ2) . . . . . . . . . . . . . . . . . . 3269.2.1 Algoritmul testului lui Pearson . . . . . . . . . 327

9.3 Teste de independenta în tabele de contingenta . . . . 3409.3.1 Testul de independenta . . . . . . . . . . . . . . 3429.3.2 Testarea omogeneitatii populatiilor . . . . . . . 344

Bibliografie 347

Anexe 349

Index de notiuni 361

Page 7: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 7/364

Capitolul 1

Câmp de probabilitate

Teoria probabilitatii este stiinta incertitudinii. Ea dezvolta regulimatematice exacte pentru a întelege si a analiza propria noastra igno-ranta. Întelegerea ne face sa fim mai exacti, sa luam decizii mai bune,sa evitam riscul.

1.1 Câmp de evenimente

Teoria probabilitatilor studiaza experientele aleatoare, experientecare, reproduse de mai multe ori, se desf asoara de fiecare data în moddiferit, rezultatul fiind imprevizibil. Exemple: aruncarea unui zar,tragerile la tinta, durata de functionare a unei masini etc.

Pentru a modela si analiza un experiment aleator trebuie sa intro-ducem multimea rezultatelor posibile ale experimentului.

Definitia 1.1. Multimea rezultatelor posibile ale unei experiente senumeste spa tiu de selec tie . O submultime a spatiului de selectie se

numeste eveniment . Un rezultat posibil al experientei se numesteprob˘ a .

Din definitie rezulta ca evenimentul este format din una sau maimulte probe.

Definitia 1.2. Un spatiu de selectie este numit discret daca el esteo multime finita sau numarabila. Un spatiu de selectie este numitcontinuu daca contine un interval de numere reale.

5

Page 8: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 8/364

6 CAPITOLUL 1. CÂMP DE PROBABILITATE

Notiunile de spatiu de selectie si de eveniment astfel introdusene permit ca teoria multimilor sa poata fi folosita în studiul eveni-mentelor. Traducem în limbaj de evenimente notiuni si simboluricaracteristice teoriei multimilor. Vom nota în continuare spatiul deselectie cu Ω.

1. Drept submultime a lui Ω se poate considera Ω. Cum indiferentde rezultatul ω al experientei, ω ∈ Ω, rezulta ca odata cu ω serealizeaza Ω. Evenimentul Ω se numeste eveniment cert (saueveniment sigur ).

2. Drept submultime a lui Ω putem considera multimea vida ∅ carenu se realizeaza la nici o efectuare a experientei, motiv pentrucare se numeste eveniment imposibil .

3. Fie evenimentul A ⊂ Ω. Evenimentul complementar lui A înraport cu Ω, notat A, se numeste eveniment contrar evenimen-tului A. Acesta se realizeaza daca si numai daca nu se realizeazaevenimentul A, adica

¡ω ∈ A

¢⇔ (ω /∈ A).

4. Fie evenimentele A, B ⊂ Ω. Evenimentul A implica evenimentulB (scris A ⊂ B) daca B se realizeaza prin toate probele lui A(si prin alte probe), adica (ω ∈ A) ⇒ (ω ∈ B).

5. Fie A, B ⊂ Ω doua evenimente. Evenimentul A ∪ B este eveni-mentul care se realizeaza prin probe ale evenimentelor A sau B,adica (ω ∈ A ∪ B) ⇔ ((ω ∈ A) ∪ (ω ∈ B)).

6. Fie A, B ⊂ Ω. Prin evenimentul A ∩ B întelegem evenimentulcare se realizeza prin probe ale evenimentulor A si B, adica

(ω ∈ A ∩ B) ⇔ ((ω ∈ A) ∩ (ω ∈ B)).7. Fie A, B ⊂ Ω. Prin A \ B întelegem evenimentul care se reali-

zeaza prin probe ale evenimentelor A si B, adica (ω ∈ A \ B) ⇔((ω ∈ A) ∩ (ω /∈ B)).

Definitia 1.3. Fie A ⊂ Ω, A 6= ∅. Evenimentul A se numeste eveni-ment elementar daca este implicat numai de el însusi si de evenimentulimposibil. Celelalte evenimente se numesc evenimente compuse .

Page 9: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 9/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 7

Definitia 1.4. Fie A, B ⊂ Ω. Evenimentele A, B se numesc compa-tibile daca se pot realiza simultan, adica exista probe care realizeazaatât pe A cât si pe B (i.e. A ∩ B 6= ∅). În caz contrar evenimentele senumesc incompatibile (i.e. A ∩ B = ∅).

Problema 1.1. O urn a con tine 5 bile albe, 3 bile rosii si 2 bile al-bastre. Bilele sunt numerotate cu 1, 2, 3, . . . , 10, astfel: bilele nu-merotate de la 1, 2, 3, 4, 5 sunt albe, bilele numerotate 6, 7, 8 sunt rosii, iar bilele numerotate 9, 10 sunt albastre. Din urn a se extrage la întâmplare o bil a. Se consider a urm atoarele evenimente:

A = bila extras a are înscris un num ar par,B = bila extras a are înscris un num ar multiplu de 3,C = bila extras a are culoarea alb˘ a,D = bila extras a are culoarea rosie,E = bila extras a are culoarea albastr a,F = bila extras a are înscris un num ar multiplu de 10.S a se defineasc a evenimentele: A∪B, C ∪E , A∩D, B ∩E , A \ B.

S a se precizeze care sunt evenimente elementare si care sunt compuse.Preciza ti dou a evenimente incompatibile.

Rezolvare. Un rezultat posibil al experientei definite este obtinerea

în urma extragerii a unei bile. Spatiul de selectie esteΩ = 1, 2, 3, . . . , 10.Experienta defineste evenimentele A = 2, 4, 6, 8, 10, B = 3, 6, 9,

C = 1, 2, 3, 4, 5, D = 6, 7, 8, E = 9, 10 , F = 10. Se observaimediat ca:

A ∪ B = 2, 3, 4, 6, 8, 9, 10 reprezinta evenimentul: a fost extrasao bila cu numar multiplu de 2 sau 3;

C ∪ E = 1, 2, 3, 4, 5, 9, 10 reprezinta evenimentul: a fost extrasao bila alba sau albastra;

A

∩D = 6, 8 reprezinta evenimentul: a fost extrasa o bila rosie

având înscris un numar par;B ∩ E = 3, 6, 8 ∩ 1, 2, 3, 4, 5, 6, 7, 8 = 3, 6 reprezinta eveni-

mentul: a fost extrasa o bila având înscris un numar multiplu de 3 sibila nu este albastra.

A \ B = 2, 4, 6, 8, 10 \ 3, 6, 9 = 2, 4, 8, 10 reprezinta eveni-mentul: a fost extrasa o bila, care are înscris un numar par si care nueste multiplu de 3.

A \ B = 1, 2, 3, . . . , 10 \ 2, 4, 8, 10 = 1, 3, 5, 6, 7, 9 reprezintaevenimentul: a fost extrasa o bila, care are înscris un numar impar

Page 10: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 10/364

8 CAPITOLUL 1. CÂMP DE PROBABILITATE

sau un numar par multiplu de 3.Singurul eveniment elementar este F . Celelalte evenimente sunt

compuse. Evenimente incompatibile: C si D, C si E , D si E , C si F etc. ♦

Definitia 1.5. Perechea F,Ω, F 6= ∅, F ⊂ P (Ω), se numeste câmpde evenimente daca:

a) ∀A ∈ F⇒ A ∈ F;

b)∀

A, B∈F

⇒A

∪B

∈F.

Observatia 1.1. Daca Ω este o multime finita sau cel mult numara-bila de evenimente, atunci câmpul de evenimente se mai numeste câmp

finit de evenimente .

Consecinte ale definitiei:

1. Ω ∈ F deoarece (∀A ∈ F a)⇒ A ∈ F)b)⇒ A ∪ A ∈ F⇒ (Ω ∈ F).

2. ∅ ∈ F deoarece (Ω ∈ F a)⇒ Ω ∈ F) dar ∅ = Ω⇒ ∅ ∈ F.

3. Daca A, B ∈ F atunci A \ B ∈ F deoarece A \ B = A ∩ B =A ∪ B ∈ F.

4. Urmatoarele proprietati sunt echivalente:

(∀A, B ∈ F⇒ A ∪ B ∈ F) si (∀A, B ∈ F⇒ A ∩ B ∈ F),

deoarece A ∩ B = A ∪ B.

5. Din Definitia 1.5 rezulta, folosind inductia matematica,

∀n ≥ 2, A j ∈ F si pentru 1 ≤ j ≤ n ⇒nS

j=1A j ∈ F.

6. Din Consecinta 4 rezulta:

∀n ≥ 2, A j ∈ F, 1 ≤ j ≤ n ⇒nT

j=1

A j ∈ F.

Într-un câmp de evenimente au loc urmatoarele proprietati:

P1 Dou a evenimente elementare distincte sunt incompatibile.

Page 11: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 11/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 9

Fie A1 si A2 doua evenimente elementare. Presupunem ca nu ar fiincompatibile, adica A1 ∩ A2 = B 6= ∅. Atunci B ⊂ A1, B 6= ∅ deciA1 nu este eveniment elementar, ceea ce este fals.

P2 Într-un câmp finit de evenimente exist a evenimente elementare.

Fie A1 un eveniment. Daca A1 este elementar, afirmatia estedemonstrata. Daca A1 este eveniment compus, exista A2 6= ∅, A2 6= A1

astfel încât A2 ⊂ A1. Daca A2 este eveniment elementar, afirmatiaeste demonstrata. Daca A2 este eveniment compus se continua ratio-namentul anterior. Rationamentul se opreste peste un numar finit de

pasi, deoarece câmpul este un câmp finit de evenimente.

P3 Într-un câmp finit de evenimente orice eveniment se poate scrie ca reuniune finit a de evenimente elementare.

Fie B un eveniment compus (daca B este eveniment elementaratunci afirmatia este demonstrata). Conform proprietatii P2, existaun eveniment elementar A1 ∈ F si un eveniment B1 ∈ F astfel încâB = A1 ∪ B1, B1 = B \ A1 cu A1 ∩ B1 = ∅. Daca B1 este evenimentelementar, afirmatia este demonstrata. Daca B1 nu este evenimentelementar, exista evenimentul elementar A2 si un eveniment B2

∈F

astfel încât B1 = A2 ∪ B2 si deci B = A1 ∪ A2 ∪ B2 si rationamentul secontinua. Numarul pasilor va fi finit deoarece cîmpul de evenimenteeste finit. Deci B = A1 ∪ A2 ∪ · · · ∪ Ak, unde Ai, i = 1, k suntevenimente elementare.

P4 Într-un câmp finit de evenimente reuniunea tuturor evenimentelor elementare ale lui F este Ω.

Într-adevar, fie Ω = A1 ∪ A2 ∪ · · · ∪ As. Presupunem ca în câm-pul finit de evenimente mai exista un eveniment elementar An 6= A j , j = 1, s. Atunci

An ∩Ω = An = An ∩ (A1 ∪ · · · ∪ As) = (An ∩ A1) ∪ · · · ∪ (An ∩ As) = ∅conform P1.

Nu de putine ori de un real folos ne va fi descompunerea unui eveni-ment într-o reuniune de evenimente incompatibile doua câte doua.

Definitia 1.6. Fie F,Ω un câmp de evenimente si A1, A2, . . . , An∈F.Spunem ca familia de evenimente A1, A2, . . . , An formeaza un sistem complet de evenimente daca:

Page 12: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 12/364

10 CAPITOLUL 1. CÂMP DE PROBABILITATE

a) ∀Ai 6= ∅, i = 1, n;

b) Ai ∩ A j = ∅, ∀i 6= j, i, j = 1, n;

c)nSi=1

Ai = Ω.

Observatia 1.2. Multimea tuturor evenimentelor elementare atasateunei experiente formeaza un sistem complet de evenimente.

1.2 Definitia probabilitatii

Introducem notiunea de probabilitate atasata unui eveniment apar-tinând unui câmp finit de evenimente. Probabilitatea este folosita pen-tru a cuantifica sansa de a se produce un eveniment. Probabilitateaca sa fie intr-o anumita zi soare este de 30%. Aceasta este o afirmatiecare cuantifica posibilitatea de a fi soare în ziua respectiva.

Definitia 1.7. Se numeste probabilitate (m asur a de probabilitate ) ofunctie definita pe un câmp de evenimente F,Ω cu valori reale,

P : F→ [0, 1], care satisface urmatoarele axiome:a) P (Ω) = 1;b)∀A, B ∈ F, A ∩ B = ∅ : P (A ∪ B) = P (A) + P (B).

Observatia 1.3. Axioma c) din definitie se generalizeaza, prin in-ductie, la orice numar finit de evenimente incompatibile doua câtedoua, Ai ∩ A j = ∅, i, j = 1, n, i 6= j:

P ³ n[

i=1

Ai

´=

nXi=1

P (Ai) .

Proprietati:

P1. P (∅) = 0. Într-adevar (Ω ∪ ∅ = Ω si Ω ∩ ∅ = ∅) ⇒P (Ω) = P (Ω ∪ ∅) = P (Ω) + P (∅) ⇒ P (∅) = 0.

P2. ∀A ∈ F ⇒ P (A) = 1 − P (A). Relatia rezulta din Ω = A ∪ A,

A ∩ A = ∅ c)⇒ P (Ω) = P (A) + P (A)b)⇒ 1 = P (A) + P (A) ⇒

P (A) = 1 − P (A).

Page 13: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 13/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 11

P3. ∀A, B ∈ F :P (A\B) = P (A)−P (A∩B). Din (A\B)∪(A∩B) =

A si (A \ B) ∩ (A ∩ B) = ∅ c)⇒ P (A \ B) + P (A ∩ B) = P (A).

P4. ∀A, B ∈ F, A ⊂ B ⇒ P (A) ≤ P (B). Într-adevar, tinândseama de P2 si de faptul ca A ⊂ B avem 0 ≤ P (B \ A) =P (B) − P (B ∩ A) = P (B) − P (A). Deci P (B) − P (A) ≥ 0 sauP (B) ≥ P (A).

P5. ∀A ∈ F ⇒ 0 ≤ P (A) ≤ 1. Într-adevar, ∅ ⊂ A ⊂ Ω si, conformP4, avem P (∅) ≤ P (A) ≤ P (Ω), adica 0 ≤ P (A) ≤ 1.

Definitia 1.8. Se numeste câmp de probabilitate un câmp de eve-nimente F,Ω pe care am definit o probabilitate P . Se noteazaF,Ω, P .

Observatia 1.4. DacaΩ este multime finita, fieΩ = A1, A2, . . . , An,atunci orice eveniment A ∈ F , A 6= ∅ poate fi scris ca o reuniune finitade evenimente elementare, A = Ai1 ∪ Ai2 ∪ · · · ∪ Aik . Conform Obser-vatiei 1.3 obtinem

P (A) = P (Ai1) + · · · + P (Aik).

Deci pentru a cunoaste probabilitatea unui eveniment oarecare dinF este suficient sa cunoastem probabilitatile tuturor evenimentelorelementare care-l compun. Probabilitatea unui eveniment A este sumaprobabilitatilor evenimentelor elementare ce-l compun. Evident, pro-babilitatile evenimentelor elementare satisfac conditiile

P (Ai) ≥ 0, i = 1, n, (1.1)

P (A1) + P (A2) + · · · + P (An) = P (Ω) = 1. (1.2)

Deci, fiind date toate evenimentele elementare care compun Ω, familia

F este perfect determinat˘

a si deci câmpul de probabilitate mai depindede alegerea a n numere, probabilitatile evenimentelor elementare, caresatisfac conditiile (1.1) si (1.2). În cazul particular când evenimentele

elementare sunt echiprobabile P (A1) = P (A2) = · · · = P (An) =1

n,

si daca A = Ai1 ∪ Ai2 ∪ · · · ∪ Aik, obtinem P (A) =k

n, deci ajungem

astfel la definitia probabilitatii dintr-un câmp de probabilitate în carespatiul de selectie este o multime finita sau cel mult numarabila: proba-bilitatea unui eveniment este raportul dintre num arul evenimentelor

Page 14: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 14/364

12 CAPITOLUL 1. CÂMP DE PROBABILITATE

elementare favorabile producerii evenimentului dat si num arul total de evenimente elementare ale câmpului . De aici rezulta necesitateade a studia metodele de numarare si modurile de selectare ale eveni-mentelor.

Problema 1.2. Un num ar de telefon luat la întâmplare este format din 6 cifre. Care este probabilitatea ca: 1) toate cifrele s a fie diferite;2) toate cifrele s a fie pare?

Rezolvare. 1) Un rezultat al experientei este o grupare de sase cifreformate cu cifrele 0, 1, 2,. . . , 9. Prima cifra poate fi aleasa în 10 mo-duri, a doua în 10 moduri,. . . , a sasea cifra poate fi aleasa în 10 moduri.Conform principiului multiplicarii exista 106 moduri de alegere a celor6 cifre. Numarul de numere de sase cifre formate cu cifre diferite esteA6

10 = 10 · 9 · 8 · 7 · 6 · 5 = 151 200. Deci probabilitatea este

p =151200

106= 0.1512.

2) Cu 5 cifre pare (0, 2, 4, 6, 8) se pot forma 56 numere diferite.Cum numarul total de numere este 106, rezulta ca probabilitatea eveni-mentului este

p = 56

106=µ1

2

¶6= 0.015625.

Definitia 1.9. Numim probabilitatea evenimentului A condi tionat de evenimentul B, P (B) 6= 0, (notata P B(A) sau P (A|B)) probabilitateade realizare a evenimentului A în ipoteza ca evenimentul B s-a realizat,probabilitate definita prin formula

P (A|B) =P (A ∩ B)

P (B). (1.3)

Observatia 1.5. Daca presupunem ca P (A) 6= 0, atunci

P (B|A) =P (A ∩ B)

P (A). (1.4)

Observatia 1.6. Din relatiile (1.3) si (1.4) retinem

P (A ∩ B) = P (B)P (A|B) = P (A)P (B|A).

Fie F,Ω, P un câmp de probabilitate si A, B ∈ F.

Page 15: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 15/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 13

Definitia 1.10. Evenimentele A si B sunt independente (în probabili-tate ) daca probabilitatea ca unul sa se realizeze nu depinde de faptulca celalalt s-a realizat sau nu, altfel spus

P (A ∩ B) = P (A)P (B). (1.5)

Figura 1.1.

Teorema 1.1. a) Evenimentele A si B cu P (A)P (B) 6= 0 sunt inde-pendente dac a si numai dac a P (B|A) = P (B).

b) Dac a evenimentele A si B sunt independente atunci si evenimentele A si B, A si B, A si B sunt independente.

Demonstratie. a) Deoarece evenimentele A si B sunt independente,rezulta P (A ∩ B) = P (A)P (B). Dar P (A ∩ B) = P (A)P (B|A) ⇒P (B|A) = P (B).

Reciproc, deoarece P (B) = P (B|A) =P (A ∩ B)

P (A), rezulta

P (A ∩ B) = P (A)P (B), adica (1.5).b) Sa demonstram ca (1.5) implica A, B independente:

P (A ∩ B) = P (A)P (B) (1.6)

Într-adevar, daca evenimentele A si B sunt independente, atunciP (A ∩ B) = P (A)P (B) si, deoarece A ∩ B = B \ A, avem

P ¡

A ∩ B¢

= P (B \ A)

Page 16: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 16/364

14 CAPITOLUL 1. CÂMP DE PROBABILITATE

si

P (B \ A) = P (B) − P (A ∩ B) = (1 − P (A))P (B) = P (A)P (B).

Analog se demonstreaza ca A si B sau A si B sunt independente. ¤

Definitia 1.11. Date evenimentele A1, A2, . . . , An, vom spune ca suntindependente daca probabilitatea oricarei intersectii finite de eveni-mente este egala cu produsul probabilitatilor evenimentelor intersec-tate, adica daca

P (Ai1 ∩ Ai2 ∩ · · · ∩ Aik) = P (Ai1)P (Ai2) · · · P (Aik)

oricare ar fi 1 ≤ i1 ≤ i2 ≤ · · · ≤ ik ≤ n.

Observatia 1.7. Daca evenimentele A1, A2, . . . , An sunt independetedoua câte doua, nu rezulta ca sunt independente în totalitatea lor.Urmatorul exemplu ilustreaza acest lucru.

Exemplul lui S. N. Bernstein. Consideram un tetraedru regulat,

cu fetele colorate astfel: una în alb, una în negru, una în rosu si apatra în toate cele trei culori.Aruncând tetraedrul pe o suprafata, acesta se aseaza pe una din

fete; ne intereseaza probabilitatea aparitei fiecarei culori pe fata pecare se aseaza tetraedrul si independenta evenimentelor corespunza-toare. Fie

— A1 evenimentul care consta în aparitia culorii albe,— A2 evenimentul care consta în aparitia culorii negre si— A3 evenimentul care consta în aparitia culorii rosii.

Avem P (A1) = P (A2) = P (A3) =1

2

deoarece pentru fiecare cu-

loare sunt patru cazuri posibile si doua favorabile (fata cu culorearespectiva si fata cu cele trei culori). Se constata ca

P (A1 ∩ A2) = P (A1 ∩ A3) = P (A2 ∩ A3) =1

4,

dar

P (A1 ∩ A2 ∩ A3) =1

46= P (A1)P (A2)P (A3) =

1

8.

Page 17: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 17/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 15

1.3 Formule probabilistice

I. Probabilitatea unei reuniuni de evenimente.Daca F,Ω, P un câmp de probabilitate, atunci oricare ar fi

A, B ∈ F are loc relatia

P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (1.7)

Deoarece A ∪ B = A ∪ (B \ A) si A ∩ (B \ A) = ∅, rezulta

P (A ∪ B) = P (A ∪ (B \ A)) = P (A) + P (B \ A),

dar, conform proprietatii P2, P (B \ A) = P (B) − P (B ∩ A) si decirezulta (1.7).

Utilizând relatia (1.7), putem deduce o formula similara în cazul atrei evenimente:

P (A ∪ B ∪ C ) = P ((A ∪ B) ∪ C ) =

= P (A ∪ B) + P (C ) − P ((A ∪ B) ∩ C ) =

= P (A) + P (B) − P (A ∩ B) + P (C ) − P ((A ∩ C ) ∪ (B ∩ C )) =

= P (A) + P (B) + P (C ) − P (A ∩ B) − P (A ∩ C ) −

−P (B ∩ C ) + P (A ∩ B ∩ C ) .Relatia se poate extinde si în cazul a n evenimente

P ³ nS

i=1

Ai

´=

nPi=1

P (Ai) −nP

i,j=1,i<j

P (Ai ∩ A j) + · · · + (−1)n−1P ³ nT

i=1

Ai

´.

Demonstratia se face prin inductie matematica dupa n.

Figura 1.2.

Page 18: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 18/364

16 CAPITOLUL 1. CÂMP DE PROBABILITATE

II. Probabilitatea unei intersectii de evenimente.Fie F,Ω, P un câmp de probabilitate. Oricare ar fi A, B ∈ F are

loc relatia (1.3). Ea poate fi folosita pentru a calcula probabilitateaunei intersectii: P (A ∩ B) = P (B)P (A|B). Când folosim aceasta for-mula la rezolvarea unei probleme trebuie sa consideram evenimenteleA si B într-o ordine convenabil aleasa, dat fiind ca se poate utiliza,datorita echivalentei demonstrate, relatia P (A ∩ B) = P (A)P (B|A).

Formula se poate extinde si în cazul a n evenimente A1, A2, . . . ,

An, cu P

³k

Ti=1

Ai´6= 0, k = 1, n − 1, sub forma

P ³ nT

i=1

Ai

´= P (A1)P (A2|A1) . . . P (An|(A1 ∩ A2 ∩ · · · ∩ An−1)). (1.8)

Într-adevar, folosind definitia probabilitatii conditionate, obtinem

P (A1) = P (A1),

P (A2|A1) =P (A1 ∩ A2)

P (A1),

...

P (An|(A1 ∩ A2 ∩ · · · ∩ An−1)) = P (A1 ∩ A2 ∩ · · · ∩ An)P (A1 ∩ A2 ∩ · · · ∩ An−1)

.

Înmultind relatiile membru cu membru si f acând simplificarile cores-punzatoare, obtinem (1.8).

Problema 1.3. Un calculator utilizeaz a parole formate din sase ca-ractere, nu neap˘ arat distincte, si fiecare caracter este una din cele 26 de litere (a,b,c,...,z) sau o cifr a (0,1,2,. . . ,9). Literele mari nu sunt admise. Fie A evenimentul c a parola începe cu o vocal a (a, e, i,o, u) si B evenimentul c a parola are al saselea caracter o cifr a par a

(0, 2, 4, 6, 8). Se selecteaz a o parol a la întâmplare. S a se calculeze probabilit a tile: P (A), P (B), P (A ∩ B), P (A ∪ B).

Rezolvare. Numaram câte parole se pot forma: toate sa continanumai litere, deci 266, sau sa contina 5 litere si o cifra, deci 265 · 10etc. Situatiile sunt incompatibile (nu putem avea parole formate, deexemplu, numai din litere si în acelasi timp cu un caracter cifra). Întotal vor fi

266+265 ·10+264 ·102+263 ·103+262 ·104+26·105+106 = 501363136.

Page 19: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 19/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 17

Numarul cazurilor favorabile evenimentului A este

5·265+5·264·10+5·263·102+5·262·103+5·26·104+5·105 = 96 223 680.

DeciP (A) =

96223680

501 363 136=

1503 495

7833 799= 0.19192.

Numarul cazurilor favorabile evenimentului B este

265·5+264·10·5+263·102·5+262·103·5+26·104·5+105·5 = 96 223 680.

Deci

P (B) = P (A) = 0.19192.Evenimentul A ∩B consta în faptul ca parola începe cu o vocala si

se termina cu o cifra para. Numarul cazurilor favorabile evenimentuluiA ∩ B este

5·264 ·5+5·263 ·10·5+5·262 ·102 ·5+5·26·103 ·5+5·104 ·5 = 18 408 400.

Avem acum

P (A ∩ B) =18408400

501 363 136=

1150 525

31335196= 0.036717.

Evenimentele A si B nu sunt incompatibile, deoarece exista parole

care sa înceapa cu o vocala si sa se termine cu o cifra para. AvemP (A ∪ B) = P (A) + P (B) − P (A ∩ B) =

= 0.19192 + 0.19192 − 0.036717 = 0.34712. ♦

III. Formula probabilitatii totale.Fie F,Ω, P un câmp de probabilitate, A1, A2, . . . , An, Ai ∈ F,

i = 1, n, un sistem complet de evenimente si B un eveniment oarecare,B ∈ F. Atunci

P (B) =nPi=1

P (Ai)P (B|Ai). (1.9)

Într-adevar, deoarece Ω=

nSi=1

Ai putem scrie

B = B ∩Ω = B ∩³ n[

i=1

Ai

´=

n[i=1

(B ∩ Ai).

Deoarece pentru i 6= j, Ai ∩ A j = ∅, rezulta ca

P (B) =nXi=1

P (B ∩ Ai) =nXi=1

P (Ai)P (B|Ai).

Page 20: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 20/364

18 CAPITOLUL 1. CÂMP DE PROBABILITATE

Problema 1.4. Un student cunoa ste bine 10 bilete din cele 25 de bilete propuse la examen. Când studentul va avea mai multe sanse s a ia examenul, dac a va fi primul sau dac a va fi al doilea la extragerea biletului?

Rezolvare. Daca studentul va fi primul la extragerea biletului, atunci

probabilitatea ca sa extraga un bilet "norocos" este p1 =10

25= 0.4.

Presupunem ca studentul va fi al doilea la extragerea biletului. Bile-tul extras de prima persoana poate fi "norocos" sau nu. Notam aceste

evenimente cu A1, respectiv A2. Fie B evenimentul c˘

a studentul ex-trage un bilet "norocos". Cum B = (A1 ∩ B) ∪ (A2 ∩ B), rezulta ca

p2 = P (B) = P (A1) P (B | A1) + P (A2) P (B | A2) =

=10

25·

9

24+

15

25·

10

24=

10 · 24

25 · 24=

10

25= 0.4.

Deci sansele sunt egale.

IV. Formula lui Bayes.

Fie F,Ω, P un câmp de evenimente si A1, A2, . . . , An, Ai ∈ F,

i = 1, n un sistem complet de evenimente si B un eveniment oarecare.Atunci

P (Ai|B) =P (B|Ai)P (Ai)nPi=1

P (A j)P (B|A j). (1.10)

În conditiile date prin ipoteza are loc formula probabilitatii totalesi, tinând seama de (1.3), obtinem

P (Ai|B) =P (B ∩ Ai)

P (B)=

P (B|Ai)P (Ai)nPi=1 P (A j)P (B|A j)

.

Problema 1.5. S a presupunem c a sistemul de detec tie a unei ba-terii poate sesiza gre sit prezen ta unei tinte (de ex. un avion inamic)cu probabilitatea de 0.05, iar prezen ta real a a tintei este detectat a de sistem cu probabilitatea 0.9. Presupunând c a probabilitatea apari tiei unei tinte în zona sistemului este 0.25, s a se determine probabilitatea unei alarme false la primirea de c atre sistem a unui semnal relativ la prezen ta unei tinte.

Page 21: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 21/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 19

Rezolvare. Notam cu A1 evenimentul care consta în prezenta realaa tintei, cu A2 evenimentul care consta în absenta tintei iar cu Bevenimentul care consta în detectarea unui semnal.

Atunci P (A1) = 0.25, P (A2) = P (A1) = 0.75, P (B|A1) = 0.9,P (B|A2) = 0.05. Probabilitatea ceruta, conform formulei lui Bayes,este

P (A2|B) =P (B|A2)P (A2)

P (B|A1)P (A1) + P (B|A2)P (A2)=

=0.05 · 0.75

0.25 · 0.9 + 0.75 · 0.05= 0.14286. ♦

Dam în continuare câteva exemple în care Ω nu este o multimefinita si exemplificam modul în care definim functia de probabilitate.

Fie Ω = [0, 1]. Putem considera F ca fiind format din ∅, Ω, toatesubmultimile finite de puncte din Ω, subintervale, reunuini finite saunumarabile de intervale, complementarele lor etc. Pentru orice punctω ∈ Ω definim P (ω) = 0 si pentru orice subinterval [a, b] ⊂ Ω, punemP ([a, b]) = b − a, lungimea intervalului.

Fie Ω ⊂ R2 o multime fixata având arie nenula notata cu µ(Ω).

Notam cu F multimea partilor lui Ω care au arie finita si definim

P (A) = µ(A)µ(Ω)

. Tripletul F,Ω, P este un câmp de probabilitate si se

numeste câmp de probabilit a ti geometrice pe Ω.Dam un exemplu care sa justifice studiul unor astfel de câmpuri

de probabilitate.

Exemplul 1.1. Doua persoane A si B au decis sa se întâlneasca întreorele 12 si 13 într-un anumit loc, venind independent. În plus ele auf acut conventia ca primul venit sa-l astepte pe celalalt 15 minute (sfer-tul academic) si daca acesta nu vine, sa plece. Care este probabilitateaca persoanele respective sa se întâlneasca?

Figura 1.3.

Rezolvare. Notând cu x (respectiv y)momentul sosirii lui A (respectiv B) lalocul de întâlnire, considerând ora 12 ca fi-ind 0 si ora 13 ca fiind 1, avem 0 ≤ x ≤ 1,0 ≤ y ≤ 1. Luam Ω = [0, 1] × [0, 1]si F multimea submultimilor având arie.Atunci evenimentul care consta în întâl-nirea celor doua persoane, pe care îl notam

Page 22: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 22/364

20 CAPITOLUL 1. CÂMP DE PROBABILITATE

cu I , va fi I = ©(x, y) | |x − y| ≤ 14ª. Multimea I este notata în figura

alaturata.Probabilitatea de realizare a întâlnirii va fi

P (I ) =µ(I )

µ(Ω)=

1 − 2 ·34

· 34

21

=7

16= 0.4375. ♦

1.4 Metode de numarare

Calculul probabilitatilor conduce adesea la numararea diferitelorcazuri posibile. Capitolul din algebra referitor la permutari, aranja-mente si combinari este foarte util în aceasta situatie.

Principiul multiplicarii. Presupunem ca avem doua situatiiA si B, situatia A se poate realiza în m moduri, iar situatia B în kmoduri. Numarul de moduri în are se poate realiza A si B este m × k.

Mai general, presupunem ca avem r ≥ 2 situatii. În prima situatieputem face m1 alegeri, în a doua m2,. . . , în a r-a situatie mr alegeri,deci în total m1 × m2 × · · · × mr.

Exemplul 1.2. Care este numarul situatiilor care apar aruncând douazaruri? Pentru primul zar sunt 6 situatii, pentru al doilea 6 situatii,în total 6 × 6 = 36 situatii.

În continuare vom face distinctie între o multime cu o ordine de-terminata de dispunere a elementelor sale, numita multime ordonatasi o multime în care nu ne intereseaza ordinea elementelor.

Permutari. Fie o multime A cu n elemente. Elementele acesteimultimi se pot ordona în mai multe moduri. Fiecare multime ordo-nata care se formeaza cu cele n elemente ale multimii A se numeste

permutare a elementelor acelei multimi. Numarul permutarilor cu nelemente este n! = 1 × 2 × · · · × n. Acest rezultat se obtine din prin-cipiul multiplicarii. O permutare poate fi construita prin selectareaelementului plasat pe prima pozitie, selectare care se face dintre celen elemente, apoi selectarea elementului plasat pe a doua pozitie din-tre cele n − 1 elemente ramase, apoi selectarea elementului plasat pea treia pozitie dintre cele n − 2 elemente ramase, etc.

Daca din aceste n elemente n1 sunt identice de un anumit tip, n2

sunt identice de alt tip,..., nk sunt identice de alt tip atunci se pot

Page 23: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 23/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 21

forman!

n1!n2! · · · nk!(1.11)

n-uple distincte.

Aranjamente. Fie o multime A cu n elemente. Submultimileordonate ale lui A, având fiecare câte k elemente, 0 ≤ k ≤ n, senumesc aranjamente de n luate câte k. Numarul aranjamentelor de nluate câte k se noteaza

Ak

n

= n (n−

1) · · · (n−

k + 1) .

Si acest rezultat se obtine din principiul multiplicarii. O sub-multime poate fi construita prin selectarea elementului plasat pe primapozitie, selectare care se face dintre cele n elemente, apoi selectareaelementului plasat pe a doua pozitie dintre cele n−1 elemente ramase,apoi selectarea elementului plasat pe a treia pozitie dintre cele n − 2elemente ramase etc, elementul de pe pozitia k va fi selectat din celen − k + 1 elemente ramase.

Exemplul 1.3. O companie foloseste parole pentru a deschide usile

unor birouri, cabinete etc. Câte parole diferite sunt posibile daca:Problema 1.6. a) parola este format a din patru caractere selectate din literele E, X, A, M.

b) parola este format a din patru caractere selectate din literele M,A, X, A.

c) parola este format a din patru caractere selectate din cifrele 0, 1,2,. . . , 9.

Rezolvare. a) Numarul parolelor formate din patru caractere selec-tate din literele E, X, A, M este 4! = 24 deoarece sunt patru moduri de

a alege prima litera, trei moduri de a alege a doua litera, doua moduride a alege a treia litera si numai un mod de a alege ultima litera.b) Numarul parolelor distincte se calculeaza folosind formula (1.11),

4!

2!= 12.

c) Numarul parolelor formate din cifrele 0, 1, 2,. . . , 9 este numarulde aranjamente de 10 luate cate 4, adica A4

10 = 10 · 9 · 8 · 7 = 5040. ♦

Combinari. Fie o multime A cu n elemente. Submultimile lui Aavând fiecare câte k elemente, 0 ≤ k ≤ n, în care nu ne intereseaza

Page 24: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 24/364

22 CAPITOLUL 1. CÂMP DE PROBABILITATE

ordinea elementelor, se numesc combin ari de n luate câte k. Numarulcombinarilor de n luate câte k se noteaza

C kn =Akn

k!.

Exemplul 1.4. Pentru un joc, cinci fete si trei baieti trebuie saformeze doua echipe de câte patru persoane. În câte moduri se potforma echipele?

Rezolvare. Studiem în câte moduri se poate forma o echipa de 4

persoane, cealalta formându-se din copiii ramasi. Nu ne intereseazanumarul de fete sau de baieti din grupa si nici ordinea lor, ci numainumarul de grupe care se pot forma. Acest numar este

C 45 + C 35 × C 13 + C 25 × C 23 + C 15 × C 33 = C 48 = 70. ♦

1.5 Moduri de selectare a elementelor

Presupunem ca o urna contine m bile, numerotate de la 1 la m,din care se extrag n bile în anumite conditii. Vom numara, în fiecare

situatie, numarul cazurilor posibile. Evident n ≤ m.

1. Selectare cu întoarcerea bilei extrase în urna si ordonare.

Extragem n bile pe rând, fiecare bila fiind pusa înapoi în urnaînainte de urmatorea extragere, însemnând numarul bilelor în or-dinea în care apar (intereseaza ordinea bilelor în n-uplul extras).Evident ca pot exista si repetitii. Conform principiului multi-plicarii, în care m1 = m2 = · · · = mn = m, numarul n-upluriloreste mn.

2. Selectare f ˘

ar˘

a întoarcerea bilei în urn˘

a si cu ordonare.Procedam ca si în cazul întâi, dar dupa fiecare extragere bilaobtinuta este pusa la o parte, aceasta operatie fiind echivalentacu extragerea simultana din urna a n bile. Obtinem n-upluri(a1, a2, . . . , an). Nu pot exista repetitii. Regula de multiplicarese aplica astfel: pentru a1 avem m posibilitati, pentru a2 avemm − 1 posibilitati,. . . ,pentru an avem m − n + 1 posibilitati, întotal

m × (m − 1) × · · · × (m − n + 1) = Anm.

Page 25: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 25/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 23

Caz particular: daca m = n, atunci numarul cazurilor posibileeste n!.

3. Selectare cu întoarcerea bilei în urna si f ara ordonare.

Extragem n bile, una dupa alta, fiecare fiind repusa în urnaînainte de a realiza urmatoarea extragere. Nu tinem seamade ordinea bilelor în multimea formata. Pot exista si repetitii.Numarul cazurilor posibile este C nn+m−1, deoarece ar fi ca si cumam extrage simultan dintr-o urna care contine n+m−1 bile (nu-merotate de la 1 la m, unele din ele putându-se repeta) n bile,

f ara sa ne intereseze ordinea. Dupa ultima extragere secventialaîn urna vor ramâne m − 1 bile.

4. Selectare f ara întorcerea bilei si f ara ordonare.

Bilele sunt extrase una dupa alta, f ara a pune bila extrasa înapoi;este acelasi lucru cu a spune ca extragem n bile dintr-o data siformam submultimi de n elemente, în total C nm.

Caz particular. Determinarea numarului de permutari a m == m1 + m2 + · · · + mr elemente care se disting prin grupuride culori, adica avem m1 elemente de culoarea c1, m2 elemente

de culoarea c2, . . . , mr elemente de culoarea cr. Culorile suntdistincte, dar bilele de aceeasi culoare nu se disting între ele.

Numarul cazurilor posibile este: C m1m moduri de alegere a poz-

itiilor bilelor de culoare c1, C m2m−m1

moduri de alegere a pozitiilorbilelor de culoare c2, . . . , C mr

m−m1−···−mr−1moduri de alegere a poz-

itiilor bilelor de culoarea cm (de fapt m−m1−m2−· · ·−mr−1 == mr si avem, de fapt, o singura posibilitate); în total, tinândseama de regula multiplicarii,

C m1m C m2

m−m1· · · C mr

m−m1−···−mr−1=

= m!m1!(m−m1)!

(m − m1)!m2!(m−m1−m2)!

· · · (m−m1− · · · −mr−1)mr!

=

=m!

m1!m2! · · · mr!.

1.6 Scheme clasice de probabilitate

Schema lui Poisson. Se dau n urne U 1, U 2, . . . , U n care continbile albe si bile negre în proportii date, deci cunoastem probabilitatile

Page 26: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 26/364

24 CAPITOLUL 1. CÂMP DE PROBABILITATE

pi, i = 1, n, cu care este extrasa o bila alba din urna U i. Se cereprobabilitatea de a extrage k bile albe si n − k bile negre, atunci cânddin fiecare urna se extrage câte o bila.

Notam cu Ai evenimentul extragerii unei bile albe din urna U i.Notam si Bk evenimentul care consta în extragerea a k bile albe sin − k bile negre, adica

Bk = (A1∩· · ·∩Ak∩Ak+1∩An)∪(A1∩· · ·∩Ak∩Ak+1∩Ak+2∩· · ·∩An)∪

∪(A1

∩· · ·

∩An−k

∩An−k+1

∩· · ·

∩An),

numarul parantezelor fiind C kn. Un eveniment

Ai1 ∩ · · · ∩ Aik ∩ Aik+1∩ · · · ∩ Ain

se realizeaza, tinând seama ca evenimentele sunt independente, cuprobabilitatea

pi1 · · · pikq ik+1 · · · q in

indicii i1, i2, . . . , in reprezentând o permutare a indicilor 1, 2, . . . , n, iarlitera p apare de k ori cu indici diferiti, iar q de n − k ori cu indici

care nu apar în p. Se observ˘

a c˘

a dup˘

a aceiasi regul˘

a se calculeaz˘

acoeficientul lui xk din polinomul

P (x) = ( p1x + q 1)( p2x + q 2) · · · ( pnx + q n).

Schema lui Poisson permite rezolvarea problemelor în care se cere pro-babilitatea realizarii de k ori a unor evenimente A1, A2, . . . , An atuncicând se repeta de n ori aceste experiente, presupuse independente,când cunoastem P (Ai) = pi, i = 1, n.

Conditii ale unui experiment Poisson:1. Exista n efectuari în conditii diferite ale unui experiment.

2. Fiecare experiment are exact doua rezultate posibile.3. Probabilitatile celor doua rezultate sunt diferite pe parcursul

repetarilor.4. Repetarile sunt independente una de cealalta.

Problema 1.7. Într-un atelier sunt trei ma sini. Prima d a 0.9% rebut,a doua 1% si a treia 1.3%. Se ia la întâmplare câte o pies a de la

fiecare ma sin a. Se cere probabilitatea ca dou a din piese s a fie bune si una rebut.

Page 27: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 27/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 25

Rezolvare. Avem

p1 = 0.991, q 1 = 0.009, p2 = 0.99,

q 2 = 0.01, p3 = 0.987, q 3 = 0.013,.

P (x) = (0.991x + 0.009)(0.99x + 0.01)(0.987x + 0.013).

Coeficientul lui x2 este

0.991·0.99·0.013+0.99·0.987·0.987·0.009+0.991·0.987·0.01 = 0.0313. ♦

Schema lui Bernoulli. Presupunem ca în schema lui Poissonurnele U 1, U 2, . . . , U n sunt identice. Atunci putem lua

p1 = p2 = · · · = pn = p, q 1 = q 2 = · · · = q n = q

Probabilitatea extragerii a k bile albe se va obtine calculând coeficien-tul lui xk din polinomul

P (x) = ( px + q )n,

adica va fi C kn pkq n−k. Recunoastem în aceasta expresie termenul gene-

ral al ridicarii la puterea n a binomului px + q . Pentru acest mo-tiv schema se mai numeste binomial a . Deoarece urnele sunt identice,putem considera ca toate extragerile se fac dintr-o singura urna, bilaextrasa punându-se în urna dupa fiecare extragere. Obtinem astfelschema lui Bernoulli. Probabilitatea de a extrage k bile albe din nextrageri dintr-o urna, punându-se de fiecare data bila înapoi, este

P n,k = C kn pkq n−k,

unde p este probabilitatea obtinerii unei bile albe dintr-o singura ex-tragere si q = 1− p. Schema lui Bernoulli se mai numeste schema bilei revenite (întoarse ).

Conditii ale unui experiment binomial:1. Exista n repetari identice ale unui experiment.2. Fiecare repetare are exact doua rezultate posibile.3. Probabilitatile celor doua rezultate ramân constante pe parcur-

sul repetarilor.4. Repetarile sunt independente una de cealalta.

Page 28: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 28/364

26 CAPITOLUL 1. CÂMP DE PROBABILITATE

Problema 1.8. Se arunc a un zar de 5 ori. Se cere probabilitatea ca fa ta cu un punct s a apar a exact de dou a ori.

Rezolvare. Avem p =1

6, q =

5

6, n = 5, k = 2 si apoi

P 5,2 = C 25

µ1

6

¶2µ5

6

¶3

= 0.16. ♦

Schema lui Bernoulli cu mai multe stari. Fie o urna care

contine bile de m culori c1, c2, . . . , cm iar pi probabilitatea ca la oextragere sa obtinem o bila de culoarea ci. Probabilitatea ca în nextrageri sa obtinem n1 bile de culoarea c1, n2 bile de culoarea c2, . . . ,nm bile de culoarea cm (n1 + n2 + · · · + nm = n) este

n!

n1! n2! · · · nm!pn11 pn22 · · · pnmm .

Aceasta schema rezolva problemele în care se cere probabilitatea caîn n efectuari ale experientei evenimentul Ai sa se realizeze de ni ori,A1, A2, . . . , Am fiind un sistem complet de evenimente si P (Ai) = pi,i = 1, m. Presupunem ca în cele n efectuari ale experientei s-auobtinut succesiv

A1 . . . A1 | z n1

A2 . . . A2 | z n2

. . . Am . . . Am | z nm

.

Acest eveniment se produce cu probabilitatea

p1 · · · p1 | z n1

p2 · · · p2 | z n2

· · · pm · · · pm | z nm

.

Acelasi rezultat îl obtinem pentru orice alta ordine stabilita dinainte

în care Ai apare de ni ori. Ramane sa vedem în câte moduri putemscrie cele n simboluri, dintre care n1 egale cu A1, n2 cu A2, . . . , nm cuAm:

C n1n C n2n−n1C n3n−n1−n2 · · · C nmn−n1−n2−···−nm−1 =

=n!

n1! (n − n1)!

(n − n1)!

n2! (n − n1 − n2)!· · ·

(n − n1 − · · · − nm−1)!

nm! (n − n1 − · · · − nm)!=

=n!

n1! · · · nm!.

Page 29: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 29/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 27

Problema 1.9. Se arunc a un zar de 5 ori. Care este probabilitatea ca exact de dou a ori s a apar a fa ta cu un punct si exact de 2 ori s a apar a fa ta cu dou a puncte?

Rezolvare. Avem:

n = 5, n1 = 2, n2 = 2, n3 = 1,

p1 =1

6, p2 =

1

6, p3 =

2

3,

P 4,2,2,1 = 5!2! · 2! · 1!

µ16¶2µ1

6¶2µ2

3¶ = 5

324. ♦

Schema hipergeometrica. O urna contine a bile albe si b bilenegre. Din aceasta urna se extrag n bile (n ≤ a + b) pe rând, f ara apune bila extrasa înapoi în urna (ceea ce este echivalent cu a extragen bile deodata). Se cere probabilitatea ca din cele n bile extrase, ksa fie albe (k ≤ a) si n − k negre (n − k ≤ b). Pentru a calculaacesta probabilitate vom stabili numarul cazurilor posibile si numarulcazurlor favorabile.

Numarul cazurilor posibile este C na+b.Numarul cazurilor favorabile: un grup de k bile albe dintr-un total

de a bile albe poate fi luat în C ka moduri; un grup de n − k bile negredin totalul de b bile negre poate fi obtinut în C n−kb moduri. Un grupde k bile albe si n− k bile negre poate fi obtinut, conform principiuluimultiplicarii, în C kaC n−kb moduri. Probabilitatea cautata este

C kaC n−kb

C na+b.

Exemplul 1.5. Controlul de calitate. Presupunem ca într-o cutie sunt550 de piese, din care 2% sunt defecte. Care este probabilitatea caalegând 25 de piese, acestea sa contina doua piese defecte. Acestaeste principiul test arii produselor prin selec tii aleatoare .

Rezolvare. Spatiul de selectie este format din multimea grupelor decâte 25 de piese care se pot forma cu cele 550 piese (un rezultat posibilal experientei este o grupare de 25 de piese, iar un rezultat favorabileste o grupare de 25 de piese dintre care 2 piese sa fie defecte). Putemalege cele 25 piese dintre cele 550, f ara sa ne intereseze ordinea pieselor,

Page 30: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 30/364

28 CAPITOLUL 1. CÂMP DE PROBABILITATE

în C 25550 moduri. Câte din acestea vor contine 2 piese defecte? Putemalege cele 2 piese defecte, din cele 550 × 0.02 = 11, în C 211 moduri,iar celelalte 25 − 2 = 23 piese, care nu sunt defecte, în C 23439 moduri.Probabilitatea cautata va fi

C 211C 23439C 25550

= 0.00059. ♦

Problema 1.10. La o tombol a sunt 400 bilete dintre care 4 câ stig a-toare. O persoan a cump˘ ar a 10 bilete. Care este probabilitatea s a nu

se g aseasc a nici un bilet câ stig ator? Rezolvare. Avem a = 4, b = 396, k = 0, n − k = 10, n = 10,

p =C 04C 10396

C 10400= 0.903. ♦

În general, daca urna contine ai bile de culoarea ci, i = 1, m, proba-bilitatea de a obtine n1 bile de culoarea c1, n2 bile de culoarea c2, . . . ,nm bile de culoarea cm când facem n = n1 + n2 + · · · + nm extractii,este egala cu

C n1a1 C n2a2 . . . C nmamC na1+a2+···+am

.

Problema 1.11. O urn a con tine 7 bile albe, 7 bile negre si 6 verzi.Se extrag 9 bile. Care este probabilitatea s a obtinem câte 3 de fiecare culoare?

Rezolvare. Avem a1 = 7, a2 = 7, a3 = 6, n1 = 3, n2 = 3, n3 = 3,

p =C 37C 37C 36

C 920= 0.145. ♦

1.7 Probleme rezolvate

Problema 1.12. Fie A, B, C trei evenimente. S a se scrie expresia pentru evenimentul ce const a în:

a) producerea numai evenimentului A;b) producerea unui singur eveniment;c) producerea a doar dou a evenimente;d) producerea tuturor celor trei evenimente;e) producerea a cel pu tin unui eveniment;f ) producerea a cel mult dou a evenimente.

Page 31: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 31/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 29

Rezolvare. a) A ∩ B ∩ C ;b)¡

A ∩ B ∩ C ¢ ∪ ¡B ∩ C ∩ A

¢ ∪ ¡C ∩ A ∩ B¢;

c)¡

A ∩ B ∩ C ¢ ∪ ¡B ∩ C ∩ A

¢ ∪ ¡C ∩ A ∩ B¢

;d) A ∩ B ∩ C ; e) A ∪ B ∪ C ; f ) A ∩ B ∩ C .

Problema 1.13. Fie A,B,C ⊂ Ω — trei evenimente ( Ω — spa tiul de selec tie). S a se determine care dintre urm atoarele afirma tii sunt adev arate:

a) A ∩ B ∩ C ⊂ (A ∩ B) ∪ (B ∩ C ) ∪ (C ∩ A);b) A

∪B = A

∪B;

c) A ∪ B ∪ C = A ∩ B ∩ C ;Rezolvare. a) Evenimentul A ∩ B ∩ C consta în producerea oricaruieveniment contrar producerii simultane a evenimentelor A, B si C .Pe de alta parte, evenimentul (A ∩ B) ∪ (B ∩ C ) ∪ (C ∩ A) consta înproducerea oricaror doua evenimente din cele trei si nu este exclusa niciproducerea simultana a tuturor trei, adica a evenimentului A ∩B ∩ C .Deci afirmatia este falsa.

b) Daca s-a produs evenimentul A ∪ B, înseamna ca s-a produscontrarul lui A sau contrarul lui B, deci se poate produce A, daca nucontrazice B sau se poate produce B, daca nu contrazice A. Pe de

alta parte, daca se produce evenimentul A ∪ B, înseamna ca nici A,nici B nu se pot produce. Afirmatia este falsa.

c) Evenimentele A ∪ B ∪ C si A∩B∩C sunt egale deoarece, ambeleexclud producerea oricarui dintre evenimentele A, B sau C si suntfavorabile producerii oricarui alt eveniment. Afirmatia este adevarata.

Problema poate fi rezolvata si grafic. De exemplu la punctul a)avem

Figura 1.4.

Problema 1.14. Care este probabilitatea c a, la aruncarea a dou a zaruri, produsul cifrelor este 6?

Page 32: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 32/364

30 CAPITOLUL 1. CÂMP DE PROBABILITATE

Rezolvare. Un rezultat posibil al experientei este o pereche de douacifre formata din cifrele 1, 2, 3, 4, 5, 6. Spatiul de selectie esteΩ = (1, 1) , (1, 2) , . . . , (1, 6) , (2, 1) , . . . , (6, 6). Numarul cazurilorposibile este 6 · 6 = 36. Cazurile favorabile sunt: (1, 6), (2, 3), (3, 2),

(6, 1). Deci probabilitatea evenimentului este p =4

36≈ 0.1111.

Problema 1.15. Care este probabilitatea ca la extragerea aleatoare a trei c ar ti dintr-un pachet de c ar ti s a fie doi a si? Dar la extragerea a patru c ar ti?

Rezolvare. Într-un pachet de 52 de carti sunt 4 asi. Trei carti pot fiextrase în C 352 =

52 · 51 · 50

3 · 2 · 1= 22100 moduri, deci numarul cazurilor

posibile este 22100. Din 4 asi pot fi alesi 2 în C 24 =4 · 3

2 · 1= 6 moduri.

Din restul de 48 de carti mai este aleasa una la întâmplare, deci sunt 48de moduri. Prin urmare, numarul cazurilor favorabile este 6·48 = 288.

Probabilitatea evenimentului va fi p =288

22100≈ 0.01303. În al doilea

caz avem

p =C 2

4C 2

48C 452

=

4 · 3

2 · 1

·48 · 47

2 · 152 · 51 · 50 · 48

4 · 3 · 2 · 1

=6 · 1128

270725 ≈ 0.025.

Problema 1.16. Care este probabilitatea ca la împ˘ ar tirea în dou a p˘ ar ti egale a unui pachet de c ar ti, în fiecare din cele dou a p˘ ar ti s a fie exact doi a si?

Rezolvare. Rationând ca în problema precedenta obtinem

p =C 24C 2648

C 2652=

6 · 27385657281648

495918532948104≈ 0.3313.

Problema 1.17. De câte ori trebuie aruncate dou a monede, pentru ca probabilitatea apari tiei a dou a steme s a fie cel pu tin 0.98.

Rezolvare. Probabilitatea ca la aruncarea a doua monezi sa nu apara

doua steme este 1 − 1

4=

3

4. La aruncarea de n ori a celor doua

monezi, probabilitatea ca sa nu apara cele doua steme esteµ

3

4

¶n

.

Deci la n aruncari evenimentul "aparitia a doua steme" se produce cu

Page 33: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 33/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 31

probabilitatea 1 −µ3

4

¶n. Obtinem inecuatia 1 −

µ34

¶n ≥ 0.98, de

unde n ≥ ln 0.02

ln 0.75≈ 13.6. Deci numarul minim de aruncari este 14.

Problema 1.18. Care este probabilitatea de a ghici 0, 1, 2, 3, 4, 5, 6dintre numerele "norocoase" la loto 6/49?

Rezolvare. Sa notam cu n numarul de numere ghicite, deci 6 − nnumere nu vor fi ghicite. Vor exista C n6 modalitati de a ghici cele nnumere dintre cele 6 numere extrase la loto. De asemenea vor exista

C

6

−n

43 modalit˘

ati de a selecta numerele necâstig˘

atoare r˘

amase. Con-form principiului multiplicarii vor exista C n6 C 6−n43 modalitati de a se-lecta cele n numere ghicite. Cum cele 6 numere câstigatoare pot fiextrase în C 649 moduri, rezulta ca probabilitatea de a ghici n numere

este pn =C n6 C 6−n43

C 649, adica

p0 =C 06C 643

C 649≈ 0.435965,

p1 =C 16C 543

C 649≈ 0.413094,

p2 =C 26C 443

C 649≈ 0.132378,

p3 =C 36C 343

C 649≈ 0.0176504 ≈ 1

57,

p4 =C 46C 243

C 649≈ 9.68620 · 10−4 ≈ 1

1033,

p5 =C 56C 143

C 649≈ 1.84499 · 10−5 ≈ 1

54201,

p6 =

C 66C 043

C 649 ≈ 7.15112 · 10−8

≈1

13983816 .

Problema 1.19. S a se determine probabilitatea ca un num ar de dou a cifre s a fie sau multiplu de 3, sau multiplu de 5, sau multiplu si de 3,si de 5.

Rezolvare. Fie n numarul de doua cifre. Atunci A = n... 3, B =

n... 5. Deoarece evenimentele A si B sunt compatibile, rezulta ca

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .

Page 34: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 34/364

32 CAPITOLUL 1. CÂMP DE PROBABILITATE

Exista 90 de numere de doua cifre: 10, 11, 12, ..., 99. Dintre ele 30sunt multiple de 3, 18 sunt multiple de 5, iar 6 sunt multiple si de 3 si

de 5. Deci P (A) =30

90, P (B) =

18

90, P (A ∩ B) =

6

90. Probabilitatea

cautata este

P (A ∪ B) =30

90+

18

90− 6

90=

42

90≈ 0.4667.

Problema 1.20. O urn a con tine 4 bile albe si 5 bile negre. Din urn a se extrag pe rând dou a bile. Care este probabilitatea c a ambele bile sunt albe?

Rezolvare. Fie A1 evenimentul ca la prima extragere bila este alba,iar A2 evenimentul ca la a doua extragere bila este alba. Se cere sase calculeze P (A1 ∩ A2). Deoarece P (A1 ∩ A2) = P (A1) P (A2 | A1),rezulta ca

P (A1 ∩ A2) =4

4 − 1

9 − 1=

4

3

8=

1

6≈ 0.1667.

Problema 1.21. Doi arca si trag simultan în aceea si tint a. Primul atinge tinta cu probabilitatea de 0.82, iar al doilea cu probabilitatea 0.86. Care este probabilitatea c a tinta va fi lovit a?

Rezolvare. Fie Ai evenimentul ca arcasul i atinge tinta. AvemP (A1) = 0.82, P (A2) = 0.86. Remarcam ca evenimentele A1 si A2

sunt independente, deci P (A1 ∩ A2) = P (A1) P (A2). Probabilitateaca tinta sa fie lovita este

P (A1 ∪ A2) = P (A1) + P (A2) − P (A1 ∩ A2) =

= P (A1) + P (A2) − P (A1) P (A2) =

= 0.82 + 0.86 − 0.82 · 0.86 = 0.9748.

Problema 1.22. Fiabilitatea a dou a p˘ ar ti componente ale unui sistem

este 0, 9, respectiv 0, 8. Care este probabilitatea c a: a) se defecteaz a doar prima component a; b) ambele componente.

Rezolvare. Fie evenimentele: A = s-a defectat prima componenta,B = s-a defectat a doua componenta. Avem P (A) = 1 − 0.9 = 0.1,P (B) = 1−0.8 = 0.2. Se cere sa se determine P

¡A ∩ B

¢si P (A ∩ B).

Avem

P ¡

A ∩ B¢

= P (A) P ¡

= 0.1 · 0.8 = 0.08.

P (A ∩ B) = P (A) P (B) = 0.1 · 0.2 = 0.02.

Page 35: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 35/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 33

Problema 1.23. Probabilitatea ca un calculator si o imprimant a s a func tioneze f ar a s a se defecteze în primul an de func tionare este de 0.95 si respectiv 0.60. Presupunând c a evenimentele sunt indepen-dente, s a se calculeze probabilit a tile ca în decurs de un an

a) ambele s a se defecteze,b) imprimanta s a se defecteze iar calculatorul nu,c) numai unul din ele s a se defecteze,d) ambele s a nu se defecteze,e) m acar unul din ele func tioneaz a f ar a s a se defecteze.

Rezolvare. Fie evenimentele:A = calculatorul nu se defecteaza în primul an ,

B = imprimanta nu se defecteaza în primul an .

Se cere sa se determine probabilitatile urmatoarelor evenimente:a) A∩B, b) A∩B, c)

¡A ∩ B

¢∪¡A ∩ B¢, d) A∩B, e) A∪B.

Tinând seama ca evenimentele A si B sunt independente, vomobtine:

a) P (A ∩ B) = P (A)P (B) = (1 − P (A))(1 − P (B)) =

= 0.05 · 0.4 = 0.02;

b) P (A ∩ B) = P (A)P (B) = P (A)(1 − P (B)) =

= 0.95 · 0.4 = 0.38;

c) P ¡¡

A ∩ B¢ ∪ ¡A ∩ B

¢¢= P

¡A ∩ B

¢+ P

¡A ∩ B

¢=

= P (A)P (B) + P (A)P (B) =

= P (A)(1 − P (B)) + (1 − P (A))P (B) =

= 0.95 · 0.4 + 0.05 · 0.6 = 0.41;

d) P (A ∩ B) = P (A)P (B) = 0.95 · 0.6 = 0.57;

e) P (A

∪B) = P (A) + P (B)

−P (A

∩B) =

= 0.95 + 0.6 − 0.95 · 0.6 = 0.98.

Problema 1.24. Trei strunguri produc un anumit tip de piese. 0.2% din piesele produse de primul strung, 0.3% din piesele produse de al doilea strung si 0.4% din piesele produse de al treilea strung sunt de-

fecte. S a se determine probabilitatea ca o pies a extras a dintr-un lot,compus din 1000 de piese produse de primul strung, 2000 piese pro-duse de al doilea strung si 3000 piese produse de al treilea strung, s a

fie defect a.

Page 36: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 36/364

34 CAPITOLUL 1. CÂMP DE PROBABILITATE

Rezolvare. Fie Ai evenimentul ca piesa defecta a fost produsa de

strungul i. Avem P (A1) =1000

1000 + 2000 + 3000=

1

6, P (A2) =

2000

6000=

1

3, P (A3) =

3000

6000=

1

2. Fie B evenimentul ca piesa ex-

trasa este defecta. Deci P (B | A1) = 0.002, P (B | A2) = 0.003,P (B | A3) = 0.004. Deoarece A1, A2, A3 formeaza un sistem com-plet de evenimente si B = (A1 ∩ B) ∪ (A2 ∩ B) ∪ (A3 ∩ B), rezultaca

P (B) = P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) =

=1

6· 0.002 +

1

3· 0.003 +

1

2· 0.004 ≈ 0.00333.

Problema 1.25. Probabilitatea ca creditul luat de la banc a de c atre persoane fizice s a fie returnat, este de 0.99 la primul credit, 0.95 la al doilea credit si 0.85 la cel de-al treilea credit. Stiind c a 60% din persoane au luat un singur credit, 30% au luat dou a credite si 10% au luat trei credite, care este probabilitatea ca un credit emis de c atre banc a s a fie returnat?

Rezolvare. Fie A1, A2, A3 evenimentele ca creditul solicitat esteprimul, al doilea, respectiv al treilea credit solicitat de persoana data,B evenimentele ca creditul este returnat. Avem P (A1) = 0.6, P (A2) =0.3, P (A3) = 0.1, P (B | A1) = 0.99, P (B | A2) = 0.95, P (B | A3) =0.85. Folosind formula probabilitatii totale obtinem

P (B) = 0.6 · 0.99 + 0.3 · 0.95 + 0.1 · 0.85 = 0.964.

Problema 1.26. Trei sec tii ale unei întreprinderi fabric a acela si tipde piese. Prima sec tie produce 40% din piese, a doua produce 45%,

iar a treia produce 15%. Sec tiile produc piese care corespund stan-dardului de calitate în propor tie de 70%, 80%, respectiv 85%. Care este probabilitatea ca o pies a oarecare s a fie conform a standardului de calitate? Stiind c a piesa este conform a standardului de calitate, care este probabilitatea s a fie produs a de prima sec tie? Dar de la a treia?

Rezolvare. Fie evenimente Ai = piesa este produsa la sectia i afabricii, B = piesa corespunde standardelor de calitate. AvemP (A1) = 0.4, P (A2) = 0.45, P (A3) = 0.15, P (B | A1) = 0.7,

Page 37: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 37/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 35

P (B | A2) = 0.8, P (B | A3) = 0.85. Conform formulei probabilitatiitotale avem

P (B) = 0.4 · 0.7 + 0.45 · 0.8 + 0.15 · 0.85 = 0.7675.

Evenimentul ca piesa sa fie produsa de prima sectie, stiind ca eaeste conforma standardelor de calitate este A1 | B. Folosind formulalui Bayes obtinem:

P (A1 | B) =P (A1) P (B | A1)

P (B)=

0.4 · 0.7

0.7675= 0.36482

iar proobabitatea în cea de a doua situatie este:

P (A3 | B) =P (A3) P (B | A3)

P (B)=

0.15 · 0.85

0.7675= 0.16612.

Problema 1.27. Patru arca si trag în aceea si tint a. Probabilitatea ca fiecare arca s s a loveasc a tinta este respectiv 0.8, 0.5, 0.4, 0.7. Dac a tinta a fost lovit a de trei ori, care este probabilitatea c a al patrulea arca s nu love ste tinta?

Rezolvare. Fie Ai, i = 1, 4 evenimentul ca arcasul i nu loveste tinta,B evenimentul ca tinta este lovita de 3 ori. Calculam probabilitatile catinta a fost lovita de trei dintre cei patru arcasi în fiecare din cazurileposibile:

P (B | A1) = P ¡

A1 ∩ A2 ∩ A3 ∩ A4

¢= P

¡A1

¢P ¡

A2

¢P ¡

A3

¢P (A4) =

= 0.7 · 0.5 · 0.4 · (1 − 0.8) = 0.028,

P (B | A2) = P ¡

A1 ∩ A2 ∩ A3 ∩ A4

¢= P

¡A1

¢P (A2)P

¡A3

¢P ¡

A4

¢=

= 0.7 · (1 − 0.5) · 0.4 · 0.8 = 0.112,

P (B | A3) = P ¡A1 ∩ A2 ∩ A3 ∩ A4¢ = P ¡A1¢P ¡A2¢P (A3)P ¡A4¢ =

= 0.7 · 0.5 · (1 − 0.4) · 0.8 = 0.168,P (B | A4) = P

¡A1 ∩ A2 ∩ A3 ∩ A4

¢= P (A1)P

¡A2

¢P ¡

A3

¢P ¡

A4

¢=

= (1 − 0.7) · 0.5 · 0.4 · 0.8 = 0.048.

Acum calculam probabilitatea ceruta

P (A4 | B) =P (A4) P (B | A4)4P

i=1

P (Ai) P (B | A4)

=

Page 38: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 38/364

36 CAPITOLUL 1. CÂMP DE PROBABILITATE

= 0.3 · 0.0480.2 · 0.028 + 0.5 · 0.112 + 0.6 · 0.168 + 0.3 · 0.048

=

=0.0144

0.1768≈ 0.08145.

Problema 1.28. În nou a urne se afl a câte 3 bile albe si 3 bile negre,iar în a zecea se afl a 5 bile albe si o bil a neagr a. Din una din urne a

fost extras a o bil a. Dac a bila extras a este alb˘ a, care este probabilitatea c a ea a fost extras a din urna a zecea?

Rezolvare. Fie Ai, i = 1, 10 evenimentul ca din urna i este extrasa o

bila, B evenimentul ca bila extrasa este alba. Avem deci P (Ai) =

1

10 ,i = 1, 10, P (B | Ai) =

3

3 + 3=

1

2, i = 1, 9 si P (B | A10) =

5

5 + 1=

5

6.

Conform formulei Bayes avem

P (A10 | B) =P (A10) P (B | A10)10Pi=1

P (Ai) P (B | Ai)

=

=110 · 5

6

9 · 110

· 12

+ 110

· 56

=5

32= 0.15625.

Problema 1.29. O moned a se arunc a de 10 de ori. Care este prob-abilitatea ca stema s a apar a a) de 4 pân a la 6 ori;b) cel pu tin o dat a.

Rezolvare. Probabilitatea se va calcula conform schemei lui BernoulliP n,k = C kn p

kq n−k, unde n este numarul de experiente (n = 10), knumarul de aparitii al stemei, p este probabilitatea de aparitie a stemeila o aruncare a monezii ( p = 0.5), iar q este probabilitatea evenimen-tului contrar, adica a aparitiei valorii (q = 1 − p = 0.5). Avem deci

P 10,k = C k10 ·1

2k·

1

210−k=

C k10

210

. Obtinem urmatoarele probabilitati:

P 10,0 =C 010210

=1

1024,

P 10,1 =C 110210

=10

1024, P 10,6 =

C 610210

=210

1024,

P 10,2 =C 210210

=45

1024, P 10,7 =

C 710210

=120

1024,

P 10,3 =C 310210

=120

1024, P 10,8 =

C 810210

=45

1024,

Page 39: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 39/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 37

P 10,4 =C 410210

=210

1024, P 10,9 =

C 910210

=10

1024,

P 10,5 =C 510210

=252

1024, P 10,10 =

C 1010210

=1

1024,

a) Probabilitatea ceruta este P 10,4 + P 10,5 + P 10,6 =672

1024≈ 0.6563.

b) Probabilitatea ceruta este

P 10,1 + P 10,2 + · · · + P 10,10 = 1 − P 10,0 =1023

1024≈ 0.9990.

Problema 1.30. La o tombol a sunt 100 de bilete dintre care 25 sunt câ stig atoare. Câte bilete trebuie cump˘ arate pentru ca printre biletele cump˘ arate cu probabilitatea de 0.95 s a fie si cel pu tin un bilet câ stig a-tor?

Rezolvare. Fie n numarul de bilete cumparate, p probabilitatea ca

un bilet sa fie câstigator ( p =25

100= 0.25 ⇒ q = 0.75). Probabilitatea

ca printre biletele cumparate sa fie cel putin unul câstigator este P =1 − P n,0 ≥ 0.95. Avem

1−q n ≥ 0, 95 ⇔ q n ≤ 0.05 ⇔ n ln 0.75 ≤ ln 0.05 ⇔ n ≥ ln 0.05ln 0.75 ≈ 10.4

Deci numarul minim de bilete este 11.

Problema 1.31. O întreprindere are 100 de salaria ti. Ace stia pot lua masa la cele dou a cantine ale întreprinderii, iar probabilitatea de a alege fiecare din ele este aceea si. Câte locuri trebuie s a aib˘ a fiecare cantin a pentru a putea deservi, cu probabilitatea de cel pu tin 0, 95, pe toti cei veni ti la cantin a.

Rezolvare. Avem n = 100, p = q = 0.5. Trebuie determinat k astfelîncât

kPi=0

P n,i =kPi=0

C in piq n−i ≥ 0.95. Urmatorul program în Matlab va

calcula k:

% numar minim locuri cantina

clear;

clc;

n=100;

p=0.5;

Page 40: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 40/364

38 CAPITOLUL 1. CÂMP DE PROBABILITATE

q=0.5;

P=0.95;

S=0;

for i=0:n

Pni=mfun(’binomial’,n,i)*p^i*q^(n-i);

S=S+Pni;

if S>=P

k=i;

break

end

endfprintf(’%d’,k);

Rulând programul obtinem k = 58. Rulând programul cu P =0.99 obtinem k = 62. Deci, marind numarul de locuri cu doar 4,probabilitatea va creste pâna la 0.99.

Urmatorul program în Mathematica va calcula k. Comanda <<Statistics‘DiscreteDistributions‘ deschide pachetul de distributii dis-crete din Mathematica deoarece vom folosi distributia binomiala pen-tru a calcula probabilitatile.

<<Statistics ‘DiscreteDistributions‘f[k_] := PDF[BinomialDistribution[100, 0.5], k]S:=0(i=0;Label[incep];S+=f[i];i++;

If[S<0.95,Goto[incep],Print[i-1],Print[S]]);

580.955687S:=0(i=0;Label[incep1];S+=f[i];i++;

If[S<0.99,Goto[incep1],

Print[i-1],Print[S]]);620.993984

Problema 1.32. S a se g aseasc a cel mai probabil num ar de apari tii al fe tei " 6" la aruncarea de 50 de ori a unui zar.

Rezolvare. Avem deci n = 50, p =1

6, q =

5

6. Pentru a gasi k0

astfel încât P n,k0 sa fie maxima, vom folosi inegalitatea np − q ≤ k0 ≤

Page 41: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 41/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 39

np + p. Avem deci 456

≤ k0 ≤ 516

, adica 7.5 ≤ k0 ≤ 8.5, de unde

rezulta k0 = 8. Probabilitatea ca fata "6" sa apara de 8 ori este

P 50,8 = C 8501

68

542

642≈ 0.1510.

Problema 1.33. Un test gril a con tine 10 intreb˘ ari cu variantele de r aspuns "da" sau "nu". Daca o persoan a va bifa aleator r aspunsurile,care va fi num arul cel mai probabil de r aspunsuri corecte si care este probabilitatea acestui eveniment?

Rezolvare. Procedând ca si în problema precedenta obtinem: n = 10, p = q =

1

2,

9

2≤ k0 ≤ 11

2, adica k0 = 5. Probabilitatea ca numarul de

raspunsuri corecte sa fie 5 este P 10,5 = C 5101

210=

63

256≈ 0.2461.

Problema 1.34. Un zar este aruncat de 6 ori. Care este probabili-tatea ca fiecare fa t a s a apar a exact o singur a dat a?

Rezolvare. Avem n = 6 numarul de aruncari, k1 = k2 = · · · =k6 = 1 numarul de aparitii al fetelor zarului si p1 = p2 = · · · =

p6 =

1

6 probabilitatea de aparitie a fiecarei fete. Conform generalizariiformulei lui Bernoulli avem

P n,k1,k2,...,k6 =n!

k1!k2! · · · k6! pk11 pk22 · · · pk66 = 6!

1

66≈ 0.01543.

Problema 1.35. O urn a con tine o bil a alb˘ a, una neagr a si una rosie.Din urn a se extrage cu revenire o bil a de 7 ori. Care este probabilitatea ca bila alb˘ a si cea neagr a s a fie extrase de cel pu tin 3 ori fiecare?

Rezolvare. Probabilitatea ceruta va fi egala cu suma probabilitatilor

a trei evenimente: bilele alb˘

a si neagr˘

a apar de câte 3 ori, bila albaapare de 4 ori si cea neagra de 3 ori, bila alba apare de 3 ori si ceaneagra de 4 ori. Avem

P = P 7,3,3,1 + P 7,4,3,0 + P 7,3,4,0 =

=7!

3!3!1!·

1

33·

1

33·

1

31+

7!

4!3!·

1

34·

1

33+

7!

3!4!·

1

33·

1

34=

=7!

3!3!37

µ1 +

1

4+

1

4

¶=

70

729≈ 0.09602.

Page 42: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 42/364

40 CAPITOLUL 1. CÂMP DE PROBABILITATE

Problema 1.36. Dintr-o urn a ce con tine 100 de bile numerotate de la 1 la 100 se extrag cu revenire 10 bile. Care este probabilitatea s a fie extrase cel mult dou a bile cu numere multiple de 7? S a se simuleze pe calculator experimentul.

Rezolvare. Din cele 100 de bile, 14 bile sunt numerotate cu numeremultiple de 7. Deci probabilitatea ca la o extragere sa fie extrasa o

astfel de bila este p =14

100. Probabilitatea ca sa fie extrase cel mult 2

bile este

P = P 10,0 + P 10,1 + P 10,2 == C 010 p

0 (1 − p)10 + C 110 p1 (1 − p)9 + C 210 p

2 (1 − p)8 =

= 0.2213 + 0.3603 + 0.2639 = 0.8455.

Urmatorul program simuleaza acest experiment. Pentru a obtineo estimare a probabilitatii, experimentul se simuleaza de un numar deori. Probabilitatea evenimentului se aproximeaza cu frecventa rela-tiva de producere a evenimentului într-un numar mare de simulari aleexperimentului.

% Schema lui Bernoulli

% Probabilitatea aparitiei a cel mult doua bile% cu numere multiple de 7

clear;

clc;

n_ex=10000;

n_ar=10;

p=14/100;

q=1-p;

ne=0;

for i1=1:n_ex

nb=0;for i2=1:n_ar

bila=floor(rand*100)+1;

if floor(bila/7)==bila/7

nb=nb+1;

end

end

if nb<=2

ne=ne+1;

Page 43: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 43/364

CAPITOLUL 1. CÂMP DE PROBABILITATE 41

end

end

fprintf(’frecventa relativa =%g’,ne/n_ex);

Rulând de mai multe ori acest program obtinem estimari ale pro-babilitatii evenimentului cum ar fi: 0.8444, 0.8475, 0.8443, 0.8451 etc.

Aceeasi secventa realizata cu Mathematica

<<Statistics‘DiscreteDistributions‘f[k_]:=PDF[BinomialDistribution[10, 0.14],k]f[0]+f[1]+f[2]

0.84547ndlist=BinomialDistribution[1000, 0.14];t1=Table[ Random[ndlist], 1000];(i=1;Label[inc];

t1[[i]]=t1[[i]]-7 IntegerPart[t1[[i]]/7];i++;If[i<=1000,Goto[inc]])

test=Count[t1,0]139p1=N[test/1000]0.139

fsim[k_]:=PDF[BinomialDistribution[10,p1],k]N[fsim[0]+fsim[1]+fsim[2]]0.847918

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. Notiunea de spatiu de selectie si eveniment atasate unei expe-riente aleatoare.

2. Notiunea de probabilitate si calculul probabilit˘

atii unui eveni-ment dintr-un spatiu discret de selectie. Definitia probabilitatiiîntr-un câmp de evenimente.

3. Utilizarea principiului multiplicarii, a permutarilor, a aranja-mentelor si combinarilor pentru a numara cazurile posibile sicazurile favorabile.

4. Determinarea incompatibilitatii evenimentelor si folosirea incom-patibilitatii în calculul probabilitatii reuniunii a doua evenimente.

Page 44: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 44/364

42 CAPITOLUL 1. CÂMP DE PROBABILITATE

5. Calculul probabilitatii unei reuniuni si intersectii de evenimente.

6. Interpretarea si calcularea probabilitatii conditionate.

7. Determinarea independentei evenimentelor si folosirea indepen-dentei la calculul probabilitatii unei intersectii de evenimente.

8. Folosirea teoremei lui Bayes la rezolvarea unor probleme.

9. Folosirea formulei probabilitatii totale la rezolvarea unor prob-leme.

Page 45: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 45/364

Capitolul 2

Variabile aleatoare discrete

2.1 Definitia variabilei aleatoare

Una din notiunile fundamentele ale teoriei probabilitatilor este ceade variabila aleatoare. Teoria clasica a probabilitatilor opereaza, înprincipal, cu evenimente, iar teoria moderna prefera, unde este posibil,sa studieze variabile aleatoare. Intuitiv, o variabila aleatoare atribuie ovaloare numerica oricarui caz posibil al experientei considerate. Prac-

tic toate marimile fizice, tehnice, economice, întâlnite în inginerie, suntvariabile aleatoare.Fie F,Ω, P un câmp de probabilitate.

Definitia 2.1. FunctiaX : Ω→ R

se numeste variabil a aleatoare daca

∀x ∈ R ω ∈ Ω | X (ω) ≤ x ∈ F. (2.1)

Aceasta definitie justifica afirmatia ca toate marimile masurabilesunt variabile aleatoare. Pentru simplitate, vom nota

ω ∈ Ω | X (ω) ≤ x = X ≤ x.

Observatia 2.1. Relatia ω ∈ Ω | X (ω) < x ∈ F semnifica de faptca pentru orice x ∈ R se poate calcula probabilitatea ca X sa ia valorimai mici sau egale cu x, adica exista P (X ≤ x).

Definitia 2.2. Se numeste vector aleator n-dimensional orice n-upluX = (X 1, X 2, . . . , X n) având cele n componente, X 1, X 2, . . . , X n, vari-abile aleatoare.

43

Page 46: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 46/364

44 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

2.2 Variabile aleatoare discrete

Definitia 2.3. Fie F,Ω este un câmp finit de evenimente. Oricefunctie X : Ω→ R este o variabil a aleatoare discret a .

Fie Ω = ω1, ω2, . . . . Distributia unei variabile aleatoare discreteX consta în descrierea probabilitatilor asociate valorilor posibile alelui X . Distributia este data de un tabel al tuturor valorilor posibileale variabilei aleatoare împreuna cu probabilitatea cu care este luatafiecare valoare. Uneori este convenabil sa prezentam aceste probabili-tati cu ajutorul unor formule.

Notând xi = X (ωi), i ≥ 1, valorile distincte, E i = ω ∈ Ω |X (ω) = xi si pi = P (E i), se obtin toate valorile posibile ale lui X precum si probabilitatile cu care acestea sunt luate. Aceste evenimenteformeaza un sistem complet de evenimente deoarece pentru i 6= j,E i ∩ E j = ∅ si

Si≥1

E i = Ω. Evident 0 ≤ pi ≤ 1 siPi≥1

pi = 1 deoarecePi≥1

pi =Pi≥1

P (E i) = P (Si≥1

E i) = P (Ω) = 1.

Variabilei aleatoare X i se poate asocia o matrice cu doua linii,numita matricea (tabloul) de reparti tie a lui X , de forma:

X : µx1 x2 . . . xn . . . p1 p2 . . . pn . . .¶ (2.2)

unde pe prima linie sunt scrise valorile distincte ale lui X si pe linia adoua probabilitatile cu care sunt luate aceste valori.

Trebuie retinut ca pentru o variabila aleatoare prezinta interes doarvalorile ei si probabilitatile cu care sunt luate aceste valori.

Exemplul 2.1. O urna contine 5 bile albe si 4 bile negre. Din urnase extrag 4 bile. Fie X variabila aleatoare care ia ca valori numarulde bile albe extrase. Sa se gaseasca tabelul de repartitie a variabileialeatoare X .

Rezolvare. Variabila aleatoare X poate lua urmatoarele valori: 0, 1,2, 3, 4. Probabilitatile cu care X ia aceste valori sunt:

p0 = P (X = 0) =C 05C 44

C 49=

1

126, p1 = P (X = 1) =

C 15C 34C 49

=20

126,

p2 = P (X = 2) =C 25C 24

C 49=

60

126, p3 = P (X = 3) =

C 35C 14C 49

=40

126,

p4 = P (X = 4) =C 45C 04

C 49=

5

126.

Page 47: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 47/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 45

Tabloul de repartitie al variabilei aleatoare X este

X :

Ã0 1 2 3 41

126

20

126

60

126

40

126

5

126

!.

Observam ca pi ≥ 0 si5P

i=0

pi =126

126= 1. ♦

Observatia 2.2. Dupa cum se vede denumirea de variabil a aleatoare data acestei notiuni nu are nimic aleator, ea este perfect determinatade evenimentele lui Ω. De asemenea ea nu este o variabila ci este ofunctie asa cum rezulta din definitie.

2.3 Functia de repartitie a v. a. discrete

În Exemplul 2.1 ne poate interesa probabilitatea de a se extrage,de exemplu, cel putin trei bile albe, adica P (X ≤ 3). Acest evenimenteste format din reuniunea evenimentelor X = 0, X = 1, X = 2si X = 3. Evident, aceste evenimente sunt incompatibile. Atunci

P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) =

=1

126+

20

126+

60

126+

40

126=

121

126.

Acest exemplu ne arata ca uneori este util sa cunoastem P (X ≤ 3).Pentru v. a. discrete cu valorile x1, . . . , xn,... evenimentele X = x1,. . . , X = xn,. . . sunt incompatibile si deci

P (X ≤ x) =

Pxi≤xP (X = xi) .

Definitia 2.4. Fie o v. a. discreta cu matricea de repartitie

X :

µx1 x2 . . . xn . . . p1 p2 . . . pn . . .

¶.

Definim func tia de reparti tie pentru v. a. discreta data, functia

F (x) = P (X ≤ x) =Pxi≤x

P (X = xi) .

Page 48: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 48/364

46 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Functia de repartitie pentru v. a. discreta are urmatoarele pro-prietati:

1. 0 ≤ F (x) ≤ 1.2. Daca x ≤ y, atunci F (x) ≤ F (y).Functia de repartitie pentru v. a. discreta cu un numar finit de

valori este o functie scara data de relatia:

F (x) =

0, daca x < x1, p1, daca x1 ≤ x < x2, p1 + p2, daca x2 ≤ x < x3,... p1 + · · · + pn−1, daca xn−1 ≤ x < xn,1, daca xn ≤ x.

Graficul acestei functii este o functie scara. În acest caz functia de

repartitie mai poate fi scrisa F (x) =nXi=1

piθ(x − xi), unde θ este

func tia treapt a unitate a lui Heaviside ,

θ(x) = ½1, x ≥ 00, x < 0.

Problema 2.1. Fie variabila aleatoare X cu valorile egale cu num arul de puncte obtinut la aruncarea unui zar. S a se calculeze si apoi s a se reprezinte grafic func tia de reparti tie.

Rezolvare. Tabloul de repartitie al variabilei aleatoare X este

X :

Ã1 2 3 4 5 61

6

1

6

1

6

1

6

1

6

1

6

!.

Conform definitiei functiei de repartitie avem F (x) = P (X ≤ x).

Deci

F (x) =

0, x < 11/6, 1 ≤ x < 22/6, 2 ≤ x < 33/6, 3 ≤ x < 44/6, 4 ≤ x < 55/6, 5 ≤ x < 61, x ≥ 6

Graficul functiei de repartitie este reprezentat în figura 2.1.

Page 49: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 49/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 47

Figura 2.1.

2.4 Operatii cu v. a. discrete

Date variabilele aleatoare discrete X si Y , cu ele se pot efectua ope-ratiile aritmetice obisnuite. Presupunem ca avem tabelele de repartitieale celor doua variabile aleatoare. Prezentam operatii cu v. a. în cazulX (Ω) finit.

X :

µx1 x2 . . . xm

p1 p2 . . . pm ¶, Y :

µy1 y2 . . . ynq 1 q 2 . . . q n ¶

.

Variabila aleatoare X + Y ia valoarea xi + y j pe submultimeaX + Y = xi + y j.

Daca X + Y = xi + y j = ∅, variabila aleatoare X +Y ia valoareaxi + y j cu probabilitatea zero si aceasta nu se trece în tabel.

Daca notam P (X + Y = xi + y j) = pij, i = 1, m, j = 1, n atuncitabelul de repartitie al variabilei aleatoare X + Y va fi

X + Y :

µx1 + y1 x1 + y2 . . . x1 + yn . . . xm + yn

p11 p12 . . . p1n . . . pmn

¶. (2.3)

Pentru produs vom avea

XY :

µx1y1 x1y2 . . . x1yn . . . xmynq 11 q 12 . . . q 1n . . . q mn

¶. (2.4)

unde P (XY = xiy j) = q ij , daca P (XY = xiy j) 6= 0.Observam ca

nX j=1

pij = pi,mXi=1

pij = q j , (2.5)

Page 50: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 50/364

48 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

nX j=1

q ij = pi,mXi=1

q ij = q j . (2.6)

Într-adevar,

pi = P (X = xi) = P (X = xi ∩Ω) =

= P (X = xi ∩ (Y = y1 ∪ · · · ∪ Y = yn)) =

=P ((X =xi ∩ Y =y1) ∪ · · · ∪ (X =xi ∩ Y =yn)) =nP

j=1

pij.

Analog se demonstreaza si celelate relatii. În ambele cazuri tabelulde repartitie are cel mult mn coloane.

Operatiile se extind si în cazul variabilelor aleatoare cu un numarinfinit, dar numarabil, de valori.

Observatia 2.3. În cazul particular Y = a = const, deoarece pij =P (X = xi, Y = a) = P (X = xi ∩Ω) = P (X = xi) = pi, avem:

a + X :

µa + x1 a + x2 . . . a + xm

p1 p2 . . . pm

¶,

aX : µ ax1 ax2 . . . axm

p1 p2 . . . pm¶ .

Problema 2.2. Probabilitatea extragerii unei bile albe dintr-o urn a este p. Din aceast a urn a se fac dou a extrageri, punându-se bila înapoi în urn a dup˘ a extragere. Se consider a variabilele aleatoare X 1 si X 2,prima reprezentând num arul de bile albe obtinute la prima extragere si a doua num arul de bile albe de la a doua extragere. S a se scrie tabloul de reparti tie al variabilelor aleatoare discrete X 1, X 2, X 1+X 2, X 1X 2.

Rezolvare. Dac˘

a X 1 : µ 0 1

q p ¶, X 2 : µ 0 1

q p ¶, q = 1 − p, atunciX 1 + X 2 :

µ0 1 2q 2 2 pq p2

¶deoarece

P (X 1 + X 2 = 0) = P (X 1 = 0, X 2 = 0) = P (X 1 = 0)P (X 2 = 0) = q 2,

P (X 1 + X 2 = 1) = P (X 1 = 1, X 2 = 0 ∪ X 1 = 0, X 2 = 1) = 2 pq,

P (X 1 + X 2 = 2) = P (X 1 = 1, X 2 = 1) = P (X 1 = 1)P (X 2 = 2) = p2,

P (X 1 + X 2 = 0) = P (X 1 = 0, X 2 = 0) = q 2.

Page 51: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 51/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 49

Interpretarea pe care o putem da variabilei aleatoare X 1 + X 2 este:valorile variabilei aleatoare reprezinta num arul de bile albe care pot fi extrase din urn a în urma celor dou a extrageri prezentate în enunt. Lafel,

X 1X 2 :

µ0 1

2 pq + q 2 p2

¶,

deoarece

P (X 1X 2 = 0) = P (X 1 = 0, X 2 = 0 ∪ X 1 = 1, X 2 = 0)∪

∪ X 1 = 0, X 2 = 1) = 2 pq + q

2

,P (X 1X 2 = 1) = P (X 1 = 1, X 2 = 1) = p2.

Interpretarea pe care o putem da variabilei aleatoare X 1X 2 este:variabila ia valoarea 0 dac a s-a extras m acar o bil a neagr a (contrarul evenimentului c a ambele bile extrase sunt albe) si valoarea 1 dac a am-bele bile extrase sunt albe . ♦

Definitia 2.5. Doua v. a. X si Y se numesc independente daca pentruorice valori reale xi si y j evenimente de forma X = xi si Y = y j,i = 1, m, j = 1, n, sunt independente, adica

P (X = xi ∩ Y = y j) = P (X = xi) P (Y = y j) .

2.5 Caracteristici numerice ale v. a. dis-

crete

Definitia 2.6. Fie o v. a. discreta X , având matricea de repartitie deforma (2.2) pentru care seria

Pn≥1xi pi este convergenta. În acest caz

definim media lui X

M [X ] =Xn≥1

xi pi = m,

iar daca seriaPn≥1

x2i pi este convergenta definim momentul îni tial de

ordin doi M £

X 2¤

=Xn≥1

x2i pi

Page 52: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 52/364

50 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Definitia 2.7. O v. a. discreta X , având matricea de repartitie de

forma (2.2) pentru care seria∞Pi=1

(xi − m)2 pi este convergenta. În acest

caz definim dispersia

D [X ] =Xi≥1

(xi − m)2 pi.

Definitia 2.8. O v. a. discreta X , având matricea de repartitie deforma (2.2) admite moment de ordin k daca seria

Pn≥1xki pi este conver-

genta. În acest caz definim momentul ini tial de ordin k al lui X

M £

X k¤

=Xn≥1

xki pi

si momentul centrat de ordin k al v. a. X

M h

(X − M [X ])ki

=Xn≥1

(xi − M [X ])k pi.

Observatia 2.4. În cazul în care variabilele aleatoare au un numarfinit de valori atunci toate caracteristicile numerice introduse se reducla sume finite. Rezulta ca orice v. a. cu un numar finit de valoriadmite, de exemplu, medie si dispersie.

Sintetizam notiunile introduse în urmatorul tabel.

V. a. discrete cu V. a. discrete cu un nr. infinit un nr. finit de val. num arabil de val.Tabelul v. a.

X :

µx1 x2 . . . xn

p1 p2 . . . pn

¶X :

µx1 x2 . . . xn . . . p1 p2 . . . pn . . .

Media Daca

∞Xi=1

xi pi este conv.,

M [X ] =nXi=1

xi pi = m M [X ] =∞Xi=1

xi pi = m

Dispersia Daca∞Xi=1

(xi − m)2 pi este conv.

D [X ] =nXi=1

(xi − m)2 pi D [X ] =∞Xi=1

(xi − m)2 pi

Page 53: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 53/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 51

Alte caracteristici numerice

Momentul initial de ordin k Daca∞Xi=1

xki pi este convergenta

M £

X k¤

=nXi=1

xki pi M

£X k¤

=∞Xi=1

xki pi

Momentul centrat de ordin k Daca∞Xi=1

(xi − m)k pi este conv.

M h(X

−m)ki =

n

Xi=1

(xi

−m)k pi M h(X

−m)ki =

Xi=1

(xi

−m)k pi

Observatia 2.5. Dispersia este momentul centrat de ordin doi.

Definitia 2.9. Se numeste abatere medie p˘ atratic a σ =p

D [X ].

Problema 2.3. Demonstra ti c a

D [X ] =Xi≥1

x2i pi −

µXi≥1

xi pi

¶2

= M £

X 2¤− [M [X ]]2 .

Rezolvare. Într-adevar,

D[X ] =nXi=1

(xi − M [X ])2 pi =

=nXi=1

x2i pi − 2M [X ]

nXi=1

pixi + M [X ]2 =

= M £

X 2¤− 2M [X ]2 + M [X ]2 = M

£X 2¤− (M [X ])2. ♦

Definitia 2.10. Variabila aleatoare X − M [X ] se numeste abaterea de la medie a variabilei aleatoare X .

Exercitiul 2.1. Variabilele aleatoare discrete simple din Problema2.2, X 1 si X 2, având repartitiile:

X 1, X 2 :

µ0 1q p

¶,

au valoarea medie M [X i] = 1 · p + 0 · q = p, i = 1, 2, iar

X 1 + X 2 :

µ0 1 2q 2 2 pq p2

¶, X 1X 2 :

µ0 1

2 pq + q 2 p2

Page 54: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 54/364

52 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

au media

M [X 1 + X 2] = 2 pq + 2 p2 = 2 p, M [X 1X 2] = p2.

Calculam si dispersiile:

M [X 2i ] = p, D[X i] = p2 − p = pq,

M [(X 1 + X 2)2] = 12 · 2 pq + 22 · p2,

D[X 1 + X 2] = 2 pq + 4 p2 − 4 p2 = 2 pq,

D[X 1X 2] = M [(X 1X 2)2]

−(M [X 1X 2])2 = p2

− p4 = p2q 2. ♦

Observatia 2.6. Denumirea de medie este îndreptatita daca tinemseama de sensul ei practic. Presupunem ca am repetat de N ori oexperienta care ne-a condus la variabila aleatoare X . Daca valoareax1 este luata de n1 ori, valoarea x2 de n2 ori,..., valoarea xm de nm ori,unde n1 + n2 + · · · + nm = N , atunci suma valorilor luate de variabilaaleatoare X este n1x1 + n2x2 + · · · + nmxm, iar media aritmetica avalorilor luate de X va fi

n1x1 + n2x2 + · · · + nmxm

N =

n1

N x1 +

n2

N x2 + · · · +

nm

N xm.

Dar n1

N = p1 reprezinta raportul dintre numarul cazurilor în care s-a

luat valoarea x1 si numarul total de experimentari, adica p1. La feln2

N = p2, . . . ,

nm

N = pm. Media lui X ne arata la ce valoare putem sa

ne asteptam pentru media aritmetica a unui mare numar de valori alelui X , obtinute în urma repetarii experientei date.

2.5.1 Proprietati ale mediei

1. Valoarea medie a unei variabile aleatoare care admite medie estecuprinsa între cea mai mica si cea mai mare dintre valorile posi-bile ale variabilei aleatoare. Fie a =inf

ixi si A = sup

ixi.

Atunci

M [X ] =Xi≥1

xi pi ≥ aXi≥1

pi = a,

M [X ] =Xi≥1

xi pi ≤ AXi≥1

pi = A,

⇔ a ≤ M [X ] ≤ A.

Page 55: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 55/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 53

2. Daca X si Y sunt variabile aleatoare discrete care admit medieatunci

M [X + Y ] = M [X ] + M [Y ]

Într-adevar, folosind relatiile (2.5)

M [X +Y ] =Xi≥1

X j≥1

(xi+y j) pij =Xi≥1

xi

X j≥1

pij +X j≥1

y jXi≥1

pij =

=

Xi≥1xi pi +

X j≥1y jq j = M [X ] + M [Y ].

3. Daca X si Y sunt variabile aleatoare discrete independente, careadmit medie, atunci media produsului este egala cu produsulmediilor variabilelor considerate:

M [XY ] = M [X ]M [Y ].

FieM [XY ] =

Xi≥1 X j≥1xiy j pij.

Daca variabilele sunt independente, se produc simplificari im-portante deoarece putem scrie pij = piq j si atunci

M [XY ] =Xi≥1

X j≥1

xiy j piq j =

µXi≥1

xi pi

¶µX j≥1

y jq j

¶= M [X ]M [Y ].

5. Daca X este o variabila aleatoare discreta care admite medie sia ∈ R o constanta, atunci au loc relatiile:

M [a + X ] = M [a] + M [X ] = a + M [X ],M [aX ] =

Xi≥1

(axi) pi = aM [X ].

Exercitiul 2.2. Media variabilei aleatoare X − M [X ], abaterea de lamedie, este nula.

Rezolvare. Într-adevar, M [X − M [X ]] = M [X ]−M [X ] = 0, tinândseama de Proprietatile 2 si 5.

Page 56: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 56/364

54 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

2.5.2 Proprietati ale dispersiei

1. Dispersia unei constante este nula deoarece, tinând seama deproprietatile mediei, D[c] = M [c2] − (M [c])2 = 0.

2. D[aX ] = a2D[X ] deoarece

D[aX ] = M £

a2X 2¤− (M [aX ])2 =

= a2¡

M [X 2] − (M [X ])2¢

= a2D[X ].

3. Daca variabilele aleatoare X 1, X 2, . . . , X k sunt independente,atunci dispersia sumei este egala cu suma dispersiilor.

D[X 1 + X 2 + · · · + X k] = D[X 1] + D[X 2] + · · · + D[X k].

Demonstram pentru doua variabile aleatoare. Într-adevar, fie Y == X 1 + X 2 atunci

D[Y ] = M [Y 2] − (M [Y ])2 = M [(X 1 + X 2)2] − (M [X 1 + X 2])2 =

= M [X 21 + X 22 + 2X 1X 2] − (M [X 1] + M [X 2])2 =

= M [X 21 ] + M [X 22 ] + 2M [X 1X 2] − (M [X 1])2−− 2M [X 1]M [X 2] − (M [X 2])2 =

= M [X 21 ] − (M [X 1])2 + M [X 22 ] − (M [X 2])2 = D[X 1] + D[X 2]

Pentru n variabile demonstratia se face prin inductie.

4. Doua variabile aleatoare care difera printr-o constanta au dis-persiile egale, adica daca X = Y + c atunci D[X ] = D[Y ].

Mai general, combinând Proprietatile 2 si 3, avem

D "k

Xi=1

aiX i# =k

Xi=1

a2

i

D[X i].

În particular, D[X − Y ] = D[X ] + D[Y ].

Observatia 2.7. Exista variabile aleatoare discrete cu un numar in-finit, dar numarabil, de valori care nu au medie (deci nici dispersie),de exemplu daca consideram v. a.

X :

µ1! 2! . . . n! . . .12

122

. . . 12n

. . .

Page 57: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 57/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 55

seriaXn≥1

n!2n

este divergenta conform criteriului raportului

limn→∞

¯¯an+1

an

¯¯ = lim

n→∞(n + 1)!

2n+1

2n

n!= ∞ > 1.

Sintetizam proprietatile mediei si dispersiei în urmatorul tabel:

Media Dispersia1. Media constantei este 1. Dispersia constantei esteegala cu constanta. zero.

X : µ c

1 ¶ , M [X ] = c X : µ c

1 ¶ , D[X ] = 02. Media sumei a doua 2. Daca v. a. sunt indepen-v. a. este egala cu dente atunci dispersia su-suma mediilor. mei v. a. este suma disp.M [X + Y ] = M [X ] + M [Y ] D[X + Y ] = D[X ] + D[Y ]3. M [X + c] = M [X ] + c 3. D[X + c] = D[X ]4. M [cX ] = cM [X ] 4. D[cX ] = c2D[X ]5. Daca v. a. sunt indepen- 5. Nu exista o proprietatedente atunci media produ- similara pentru disp.sului este egala cu produ-

sul mediilor.M [XY ] = M [X ]M [Y ]

Aratam ca dispersia unei variabile aleatoare X este, într-un anumesens, cea mai buna valoare care caracterizeaza împrastierea valorilorx1, x2, . . . , xn sau, cu alte cuvinte, M [X ] este punctul cel mai potrivitfata de care trebuie sa masuram devierile acestor valori. Acest lucrurezulta din urmatoarea propozitie.

Propozitia 2.1. Dac a X este o variabil a aleatoare care ia valorile x1, x2, . . . , xn, . . . cu probabilit a tile p1, p2, . . . , pn, . . . , iar m este me-dia, atunci

D[X ] =Xi≥1

pi(xi − m)2 ≤Xi≥1

pi(xi − x)2, ∀x ∈ R.

Demonstratie. Putem scrie xi − x = (xi − m) + (m − x), i = 1, n si

pi(xi − x)2 =Xi≥1

pi[(xi − m) + (m − x)]2 =

=Xi≥1

pi(xi − m)2 + 2(m − x)Xi≥1

pi(xi − m) + (m − x)2 =

Page 58: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 58/364

56 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

=Xi≥1

pi(xi − m)2 + 2(m − x)(m − m) + (m − x)2 =

= D[X ] + (m − x)2 ≤ D[X ]. ¤

Definitia 2.11. Fie X si Y doua variabile aleatoare care admit mediesi dispersie. Covarian ta (sau corela tia ) lui X si Y este numarul real

cov(X, Y ) = M [(X − M [X ]) (Y − M [Y ])] .

În cazul în care cov(X, Y ) = 0 se spune ca X si Y sunt necorelate .

Covrianta masoara relatia dintre doua variabile aleatoare.Exemplul 2.2. Fie X o variabila aleatoare cu D[X ] > 0. Fie Y = 3X si fie Z = −4X . Atunci M [Y ] = 3M [X ] , M [Z ] = −4M [X ]. Atunci

cov(X, Y ) = M [(X − M [X ]) (Y − M [Y ])] =

= M [(X − M [X ])(3X − 3M [X ])] = 3M £

(X − M [X ])2¤

=

= 3D[X ].

în timp ce

cov(X, Z ) = M [(X − M [X ]) (Z − M [Z ])] == M [(X − M [X ]) (−4X + 4M [X ])] =

= −4M £

(X − M [X ])2¤

= −4D[X ].

Observa ca cov(X, Y ) > 0 în timp ce cov(X, Z ) < 0. Intuitiv,aceasta ne indica faptul ca daca cov(X, Y ) > 0 atunci Y creste, întimp ce X creste si daca cov(X, Z ) < 0, Z descreste, în timp se X creste.

Teorema 2.1. Fie X si Y dou a variabile aleatoare care admit medie.Atunci:

a) cov(X, Y ) = M [XY ] − M [X ] M [Y ].b) dac a X si Y sunt independente, atunci X si Y sunt necorelate.

Reciproca nu este adev arat a.

Demonstratie. a)

cov(X, Y ) = M [XY − Y M [X ] − XM [Y ] + M [X ] M [Y ]] =

= M [XY ] − M [X ] M [Y ] − M [Y ] M [X ] + M [X ] M [Y ] =

= M [XY ] − M [X ] M [Y ] .

Page 59: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 59/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 57

b) Daca X si Y sunt independente, atunci

M [XY ] = M [X ]M [Y ] ⇒ cov(X, Y ) = 0. ¤

Teorema 2.2. Fie X si Y dou a variabile aleatoare care admit medie si dispersie. Atunci: D[X + Y ] = D[X ] + D[Y ] + 2cov(X, Y ).

Demonstratie.

D[X + Y ] = M

£(X + Y − M [X + Y ])2

¤=

= M £((X − M [X ]) + (Y − M [Y ]))

2¤ == M

£(X − M [X ])2 + (Y − M [Y ])2 + 2 (X − M [X ]) (Y − M [Y ])

¤=

= M £

(X − M [X ])2¤

+ M £

(Y − M [Y ])2¤

+

+2M [(X − M [X ]) (Y − M [Y ])] = D[X ] + D[Y ] + 2cov(X, Y ). ¤

Problema 2.4. Demonstra ti proprietatea de liniaritate a covarian tei,adic a fie X, Y si Z trei variabilae aleatoare si a, b ∈ R. Atunci:

cov(aX + bY,Z ) = acov(X, Z ) + bcov(Y, Y ).

O alta notiune pe care o vom folosi la statistica este coeficientulde corelatie.

Definitia 2.12. Fie X si Y doua variabile aleatoare cu 0 < D[X ],D[Y ] < ∞. Coeficientul de corela tie este numarul real

rX,Y =cov(X, Y )p

D [X ]p

D [Y ].

Exemplul 2.3. Reluam Exemplul 2.2. Calculam coeficientii de core-latie.

rX,Y =cov(X, Y )p

D [X ]p

D [Y ]=

3D[X ]p D [X ]

p 9D [X ]

= 1,

rX,Z =cov(X, Z )p

D [X ]p

D [Z ]=

−4D[X ]p D [X ]

p 16D [Z ]

= −1.

Intuitiv, aceasta ne indica faptul ca daca rX,Y > 0 atunci Y creste,în timp ce X creste si daca rX,Z < 0, Z descreste, în timp se X creste.Remarcam ca factorii 3 si −4 dispar, ceea ce este esential este semnul.

Page 60: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 60/364

58 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Vom prezenta la statistica doua rezultate importante ale coeficien-tului de corelatie si anume:

1. |rX,Y | ≤ 1 echivalenta cu |cov(X, Y )| ≤ p D [X ]

p D [Y ] si

2. |rX,Y | = 1 daca si numai daca cele doua variabile aleatoare suntîntr-o dependenta liniara, adica

X − M [X ] =cov(X, Y )

D [Y ](Y − M [Y ]).

Teorema 2.3. (Inegalitatea lui Cebâ sev). Fie X o variabil a aleatoare care admite medie si dispersie finite. Atunci, oricare ar fi ε > 0, are

loc inegalitatea

P (|X − m| < ε) ≥ 1 − D[X ]

ε2, m = M [X ]. (2.7)

Demonstratie. Facem observatia ca aceasta inegalitate da o margineinferioara pentru probabilitatea ca abaterea absoluta a unei variabilealeatoare cu dispersia cunoscuta sa fie mai mica decât un numar dat.

Pentru demonstratie consideram v. a.

X : µx1 x2 . . . xn

p1 p2 . . . pn ¶în care presupunem ca am scris valorile în ordine crescatoare, si deciasa vor scrise si valorile |xi − M [X ]| ; i = 1, . . . , n, adica

|x1 − M [X ]| ≤ |x2 − M [X ]| ≤ · · · ≤ |xn − M [X ]| .

Daca luam un ε > 0 arbitrar, unele din valorile |xi − M [X ]|;i = 1, . . . , n, vor mai mari sau egale cu ε, altele mai mici. Existaun j astfel încât

|x1

−M [X ]|

≤· · ·

≤|x j

−M [X ]| < ε

≤|x j+1

−M [X ]|

≤≤ · · · ≤ |xn − M [X ]| .

Aceste inegalitati se mai pot scrie

(x1 − M [X ])2 ≤ · · · ≤ (x j − M [X ])2 < ε2 ≤ (x j+1 − M [X ])2 ≤≤ · · · ≤ (xn − M [X ])2 .

În expresia dispersiei inlocuim cu 0 toti (xi − M [X ])2 < ε2 si cuε2 toti (xi − M [X ])2 ≥ ε2,

Page 61: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 61/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 59

D[X ] =nXi=1

pi(xi − m)2 ≥ε2nX

i= j+1

pi,

deci

D[X ]

ε2≥

nXi= j+1

pi, 1 − D[X ]

ε2≤ 1 −

nXi= j+1

pi = P (|X − M [X ]| < ε)

care este echivalenta cu inegalitatea (2.7). ¤

O forma echivalenta a teoremei este: daca media distributiei X este m si abaterea medie patratica este σ =

p D[X ], probabilitatea

ca valorile variabilei aleatoare sa fie mai departe de medie cu cel putin

kσ este cel mult1

k2,

P (|X − m| ≥ kσ) <1

k2. (2.8)

Daca luam ε = kσ în inegalitatea (2.7), se obtine

P (|X − m| < kσ) ≥ 1 − 1

k2sau

P (m − kσ < X < m + kσ) ≥ 1 − 1

k2.

Dar evenimentele |X − m| < kσ si |X − m| ≥ kσ sunt contrare,rezulta (2.8).

Pentru k = 3, de exemplu, obtinem

P (m − 3σ < X < m + 3σ) ≥ 1 −1

9 =8

9 = 0.88889.

Deci, cu o probabilitate cuprinsa între 0.88889 si 1, orice variabila iavalori cuprinse în intervalul (m − 3σ, m + 3σ).

Problema 2.5. Num arul clien tilor care viziteaz a un showroom sâm-b˘ ata diminea t a este o variabil a aleatoare cu media m = 18 si σ = 2.5.Cu ce probabilitate putem presupune c a num arul vizitatorilor va fi cuprins între 8 si 28 de clien ti.

Page 62: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 62/364

60 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Rezolvare. Deoarece

8 < X < 28 ⇒ −10 < X − 18 < 10 ⇒ ε = 10.

folosind relatia (2.7), obtinem:

P (| X − 18 |< 10) ≥ 0.9375,

deci probabilitatea ca numarul vizitatorilor sa fie cuprins între 8 si 28de clienti este de cel putin 0.9375. ♦

Avantajul inegalitatii lui Cebâsev este ca se poate aplica oricareidistributii pentru care media si abaterea medie patratica exista.Dezavantajul este ca aceasta inegaliate da o margine inferioara

a probabilitatii ca valorile variabilei aleatoare sa fie cuprinse într-uninterval de forma (m − ε, m + ε).

Definitia 2.13. Pentru p ∈ [0, 1], se numeste cuantila de ordin p,notata x p, pentru o v. a. X , având functia de repartitie F X , cel maimic numar x p care satisface inegalitatea

p

≤F X (x p).

Observatia 2.8. Folosind definitia functii de repartitie inversa putemscrie x p = F −1X ( p) = min x : p ≤ F X (x p).

Observatia 2.9. Daca F X este strict crescatoare si continua, atunciF −1X ( p) este unica valoare x p care satisface relatia

F X (x p) = p. (2.9)

Un caz particular este x0.5 = F −1X (0.5) si reprezinta mediana.

Observatia 2.10. În cazul v. a. discrete cu valorile x1 < x2 < · · · << xn, xi este cuantila de ordin in

a distributiei deoarece F X (xi) = in

siF X (x) < i

npentru x < xi. În general cuantila de ordin p este x p = xi,

undei − 1

n< p ≤ i

n. (2.10)

În cazul discret nu este sigur ca pentru orice p ∈ [0, 1] exista cuan-tila de ordin p. Daca însa existra o cuantila de ordin p atunci existao infinitate (intervalul ce separa doua valori posibile).

Page 63: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 63/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 61

2.6 Functia generatoare

În problemele în care apar variabile aleatoare nenegative se uti-lizeaza func tia generatoare a variabilei aleatoare X , GX (z) care sedefineste prin relatia

GX (z) =∞Xk=0

pkzk, (2.11)

unde P (X = k) = pk, k = 0, 1, 2, . . .. Deci cunoscând probabilitatile

pk putem determina functia generatoare. Deoarece∞

Pk=0

pk = 1, seria de

puteri (2.11) converge pentru |z| ≤ 1. Pentru |z| < 1 seria de puterise poate deriva termen cu termen si obtinem:

G( j)X (z) =

∞Xk= j

k(k − 1) · · · (k − j + 1) pkzk− j =∞Xk= j

C jk j! pkzk− j.

Daca în relatia de mai sus facem z = 0 obtinem

G( j)X (0) = j! p j sau p j =

1

j!G

( j)X (0).

Aceasta ne arata ca putem determina toate probabilitatile pk cuajutorul functiei generatoare. Din acesta cauza G( j)X se numeste functie

generatoare. În particular, luând z = 1 în G0X si în G00

X obtinemM [X ] = G0

X (1), M [X 2] = G0X (1) + G00

X (1), D [X ] = G0X (1) + G00

X (1)−− (G0

X (1))2.

2.7 Legi discrete de repartitie

Vom prezenta legi teoretice de repartitie a unor variabile aleatoarediscrete. Exista multe fenomene întâlnite în inginerie care "asculta"

de aceste legi în sensul ca anumite selectii de date experimentale suntorganizate dupa modele teoretice standard care trebuie cunoscute.Statisticianul apeleaza la rezultatele teoretice care îi orienteaza cal-culele si deciziile.

2.7.1 V. a. repartizata uniform

Cea mai simpla v. a. este cea care ia un numar finit de valori posi-bile, fiecare valoare fiind luata cu aceeasi probabilitate. O v. a. care

Page 64: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 64/364

62 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

ia n valori x1, x2, . . . , xn le ia cu aceeasi probabilitate 1n

. În acest caz

P (X = xi) =1

n.

Presupunem ca v. a. ia valorile întregi consecutive m, m + 1, m +

2, . . . , m + n − 1. V. a. va lua n valori fiecare cu probabilitatea1

n,

P (X = k) =1

n, m ≤ k ≤ m + n − 1. În acest caz

M [X ] =m+n−1

Pi=mi

1

n=

1

n

(m + n − 1)(m + n) − m(m − 1)

2= m+

n − 1

2,

iar

D [X ] = M £

X 2¤− (M [X ])2 =

=(n + m − 1)(n + m)(2n + 2m − 1) − (m − 1)m(2m − 1)

6n−

−µ

m +n − 1

2

¶2

=n2 − 1

12.

O v. a. discreta uniforma cu n valori o notam X ∈ UnifD [m, n].

Problema 2.6. Un sistem de comunica tii con tine 10 de linii externe.Fie X v. a. care ia ca valori num arul de linii care func tioneaz a la un moment dat. S a se determine mul timea valorilor lui X , media,dispersia si abaterea medie p˘ atratic a. S a se scrie tabloul de distribu tie al v. a. X , s a se calculeze P (X = 5), F X (6.5), cuantila de ordin 0.3si de ordin 0.35.

Rezolvare. V. a. X ia valoriile 1, 2, . . . , 10.

M [X ] =1 + 10

2= 5.5, D [X ] =

(10 − 1 + 1)2 − 1

12= 8.25,

σ =p

D[X ] =√

8.25 = 2.8723,

µ 1 2 3 4 5 6 7 8 9 10

110 110 110 110 110 110 110 110 110 110¶

P (X = 5) =1

10,

F X (6.5) = P (X ≤ 6.5) = P (X = 1) + P (X = 2) + P (X = 3) +

+P (X = 4) + P (X = 5) + P (X = 6) =6

10=

3

5,

x0.3 = min x : 0.3 ≤ F X (x) = 3,

x0.35 = min x : 0.35 ≤ F X (x) = 4.

Page 65: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 65/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 63

Secventa urmatoare rezolva problemele puse cu ajutorul Mathe-maticii. Comanda <<Statistics‘DiscreteDistributions‘ deschide pa-chetul care contine cinci distributii discrete: distributia discreta uni-forma, binomiala, geometrica, hipergeometrica, geometrica cu expo-nent negativ.

<<Statistics‘DiscreteDistributions‘Domain[DiscreteUniformDistribution[10]]1,2,3,4,5,6,7,8,9,10

Mean[DiscreteUniformDistribution[10]]11

2Variance[DiscreteUniformDistribution[10]]33

4N[%]8.25PDF[DiscreteUniformDistribution[10],5]1

10Table[PDF[DiscreteUniformDistribution[10],j],j,1,10]

110

, 110

, 110

, 110

, 110

, 110

, 110

, 110

, 110

, 110

CDF[DiscreteUniformDistribution[10],6.5]3

5Quantile[DiscreteUniformDistribution[10],0.3]3Quantile[DiscreteUniformDistribution[10],0.25]3

Comenzile:Domain[distrib,x] furnizeaza multimea valorilor v. a. corespunza-

toare distributiei numita distrib,Mean furnizeaza media,Variance furnizeaza dispersia,PDF[distrib,x] furnizeaza valoarea densitatii de probabilitate a v.

a. corespunzatoare distributiei numita distrib, calculata în punctul x,CDF[distrib,x] furnizeaza valoarea functiei de repartitie corespun-

zatoare distributiei numita distrib, calculata în punctul x,Quantile[disttrib,p] furnizeaza cuantila de ordin p a v. a. corespun-

zatoare distributiei numita distrib. ♦

Page 66: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 66/364

64 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

2.7.2 V. a. repartizata binomial

Evenimentele A si contrarul sau A se repeta de mai multe ori si seproduc cu aceeasi probabilitate, P (A) = p respectiv P (A) = q = 1− p.Probabilitatea producerii de k ori a evenimentului A fi C kn p

kq n−k, iarv. a. care ia ca valori numarul de produceri ale evenimentului A aretabloul de repartitie

X :

µ0 1 2 . . . n

C 0n p0q n C 1n p

1q n−1 C 2n p2q n−2 . . . C nn p

nq 0

¶.

În acest caz scriem X ∈ Bin[n, p]. Termenul de variabila aleatoarebinomiala provine din faptul ca probabilitatile sunt termenii succesividin dezvoltarea ( p + q )n.

Alegerile lui n si p determina unic repartitia binomiala; diferitealegeri conduc la diferite repartitii.

Demonstram ca M [X ] = np si D2[X ] = npq .Într-adevar, variabila aleatoare X poate fi vazuta ca suma a n vari-

abile aleatoare independente X i care iau valoarea 1 cu probabilitatea p, adica la a i-a repetare a experientei evenimentul A s-a produs, sivaloarea 0 cu probabilitatea q , adica la a i-a repetare a experientei

evenimentul A nu s-a produs

X i :

µ0 1q p

¶, i = 1,n , M [X i] = p.

Cu notatiile introduse, putem scrie

X = X 1 + X 2 + · · · + X n =nXi=1

X i,

M [X ] = M "n

Xi=1

X i# =n

Xi=1

M [X i] = np,

si, deoarece variabilele aleatoare X i, i = 1, n sunt independente,

D[X ] = D

"nXi=1

X i

#=

nXi=1

D[X i].

Deoarece

X 2i :

µ0 1q p

¶, M [X 2i ] = p,

Page 67: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 67/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 65

iar D[X i] = M [X 2i ] − (M [X i])2, rezulta

D2[X i] = p − p2 = pq si D[X ] = npq.

Exercitiul 2.3. Daca X ∈ Bin[n, p] atunci GX (z) = ( pz + q )n sideduceti cu ajutorul ei relatiile M [X ] = np, D2[X ] = npq .

Rezolvare. GX (z) =nP

k=0

C kn pkq n−kzk =

nPk=0

C kn ( pz)k q n−k = ( pz + q )n.

M [X ] = G0X (1) = np ( p + q )n−1 = np,

M [X 2] = G0X (1) + G00

X (1) = np + n(n − 1) p2 =

= np (1 + np − p) = np (np + q ) ,

D [X ] = G0X (1) + G00

X (1) − (G0X (1))

2=

= np (np + q ) − n2 p2 = npq. ♦

Problema 2.7. Un student urmeaz a s a sus tin a în sesiune 5 examene.Probabilitatea de a lua oricare dintre examene este 0.8. Se consider a variabila aleatoare X care descrie num arul de examene luate. S a se g aseasc a tabloul de reparti tie al v. a. X . S a se calculeze media si

dispersia v. a. X .Rezolvare. Variabila aleatoare X urmeaza o repartitie binomiala.Avem n = 5 (numarul de examene), p = 0.8 (probabilitatea de a luaexamenul), q = 0.2 (probabilitatea de a nu lua examenul), deci X ∈∈ Bin [5;0.8]. Folosind formula de calcul a probabilitatii evenimente-lor în cazul unei variabile aleatoare binomiale P (X = k) = C kn p

kq n−k,obtinem urmatorul tablou de repartitie pentru X :

X :

µ0 1 2 3 4 5

0.00032 0.0064 0.0512 0.2048 0.4096 0.32768¶.

Calculam 0.00032+0.0064+0.0512+0.2048+0.4096+0.32768 == 1.0, deci tabelul obtinut este tabelul unei v. a.

Cum M [X ] = np si D [X ] = npq , avem

M [X ] = 5 · 0.8 = 4, D [X ] = 5 · 0.8 · 0.2 = 0.8. ♦

Problemele în care se utilizeaza repartitia binomiala suntcele în care facem urmatoarele presupuneri:

Page 68: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 68/364

66 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

— sunt numai doua posibilitati pentru rezultatul experientei (suc-ces/insucces, realizari/nerealizari, bit corect/eronat, aparat bun/defectetc.),

— probabilitatea succesului este aceeasi pentru fiecare experienta,— sunt n repetari ale experientei, unde n este constant,— cele n experiente sunt independente.

Facem observatia ca în calculul factorialelor care intervin în com-binari, pentru n suficient de mare, se recomanda formula aproximativ a a lui Stirling ,

n! ≈ nn

e−n

√ 2nπ.De exemplu, comparam valoarea lui 20! = 2.4329×1018 cu cea cal-

culata aproximativ cu formula lui Stirling si obtinem 2020e−20√

40π == 2.4228 × 1018.

Secventa urmatoare realizeaza în Mathematica desenarea punctelorcare reprezinta valorile distributiei binomiale pentru n = 20 si p = 0.2si p = 0.5.

<<Statistics‘DiscreteDistributions‘f[k_]:=PDF[BinomialDistribution[20, 0.2],k]

tab1=Table[k,f[k],k,0,20];g[k_]:=PDF[BinomialDistribution[20, 0.5],k]tab2=Table[k,g[k],k,0,20];dd1=Graphics[PointSize[0.025],Map[Point,tab1]];dd2=Graphics[PointSize[0.015],Map[Point,tab2]];p1=ListPlot[tab1,DisplayFunction\[Rule]Identity];p2=ListPlot[tab2,DisplayFunction\[Rule]Identity];Show[dd1,dd2,p1,p2,Axes\[Rule]Automatic]

5 10 15 20

0.05

0.1

0.15

0.2

Figura 2.2.

Page 69: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 69/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 67

Graficul functiei de repartitie pentru v. a. X ∈ Bin[20, 0.5] este<<Statistics‘DiscreteDistributions‘

Plot[CDF[BinomialDistribution[20, 0.5],k],k,0,20]

5 10 15 20

0.2

0.4

0.6

0.8

1

Figura 2.3.

2.7.3 V. a. multinomiala

O generalizare a distributiei binomiale este repartitia obtinuta pen-tru modelul urmator: în urma unui experiment se pot realiza k eveni-mente diferite independente A1, A2, . . . , Ak. Aceste evenimente se pro-

duc cu probabilitatile p1, p2, . . . , pk,k

P j=1

p j = 1, 0

≤ p j

≤1. Se repeta

experienta de n ori si se constata ca evenimentul A j, j = 1, k s-arealizat de n j ori.

Teorema 2.4. Dac a definim v. a. X j egal a cu num arul de apari tii ale evenimentului A j în cele n probe, atunci:

P (X 1 = n1, X 2 =n2, . . . , X k =nk)=n!

n1!n2! · · · nk!( p1)n1 ( p2)n2 · · · ( pk)nk

cu n1 + n2 + · · · + nk = n si 0

≤n j

≤n.

Notam (X 1, X 2, . . . , X k) ∈ Multnom [n, p1, p2, . . . , pk].

Observatia 2.11. Repartitia depinde de k − 1 parametri.

Problema 2.8. Presupunem c a o urn a con tine 10 bile rosii, 20 de bile albe si 30 bile negre. Extragem 10 bile din urn a cu repunerea bilei extrase în urn a. S a se determine proobabilitatea ca s a obtinem 3 bile rosii, 4 bile albe si 3 bile negre.

Page 70: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 70/364

68 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Rezolvare. Deoarece extragerea se face cu repunerea bilei extrase înurna evenimentele sunt independente si deci:

P (X 1 =3, X 2 =4, X 3 =3)=10!

3!4!3!

µ10

60

¶3µ20

60

¶4µ30

60

¶3

=0.030007. ♦

2.7.4 V. a. repartizata binomial cu exponentnegativ

Facem observatia ca în cazul variabilei aleatoare binomiale valorileacestei variabile reprezinta numarul de realizari ale evenimentului Aîn urma repetarii de n ori a experientei. Deci num arul n de repet ari ele experien tei este fixat, iar num arul succeselor este aleator .

În cazul v. a. binomiale cu exponent negativ variabila ia ca valorinumarul de experiente necesare pentru a obtine m realizari. În acestcaz num arul realiz arilor ale evenimentului A este fixat, iar num arul repet arilor evenimentului A este aleator. V. a. X este descrisa adeseaca timpul de asteptare pentru obtinerea a m succese în experienteBernoulli.

Se spune ca variabila aleatoare X are repartitie binomiala cu expo-nent negativ, si scriem aceasta X ∈ NegBin [m, p] cu parametrii m si p, (m = 1, 2, . . . , 0 < p < 1), daca X ia valorile r = m, m+1, m+2, . . .iar

P (X = r) = C m−1r−1 pmq r−m, q = 1 − p.

Acesta repartitie apare în modele de tipul urmator: sa presupunemca s-a efectuat un numar de observatii independente, în cursul fiecareiobservatii evenimentul A (de exemplu nefunctionarea unui subansam-blu al unui aparat) poate sa se produca cu probabilitatea p. Ob-servatiile continua pâna când evenimentul se produce de m ori si se

cauta probabilitatea pentru ca aceasta sa se produca exact de m oriîn decursul a r observatii.Evenimentul X = r se scrie ca intersectie a doua evenimente:— evenimenul B1 care consta în faptul ca în primele r−1 observatii

evenimentul A se produce de m − 1 ori si— evenimentul B2 care consta în faptul ca în observatia r se produce

evenimentul A.Din schema lui Bernoulli se deduce ca probabilitatea evenimentului

B1 este P (B1) = C m−1r−1 pm−1q r−m iar probabilitatea evenimentului B2

Page 71: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 71/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 69

este egala cu p, P (B2) = p. Deci

P (X = r) = P (B1 ∩ B2) = P (B1)P (B2) =

= C m−1r−1 pm−1q r−m p = C m−1r−1 pmq r−m.

Numele acestei repartitii provine din faptul ca probabilitatea cau-tata este coeficient în dezvoltarea în serie a luiµ

1

p− q

p

¶−m=

∞Xr=m

C m−1r−1 pmq r−m. (2.12)

Justific˘

am aceast˘

a relatie:1

1 − x=

∞Xk=0

xk, pentru |x| < 1,

µ1

1 − x

¶0

=1

(1 − x)2=

∞Xk=1

kxk−1,

2

(1 − x)3=

∞Xk=2

k(k − 1)xk−2 ⇒ 1

(1 − x)3=

∞Xk=2

C 2kxk−2.

Se demonstreaza prin inductie ca1

(1 − x)m

=∞

Pr=m−1C m−1r xr−m+1.

Trecem r în r − 1 si obtinem (1 − x)−m =∞P

r=m

C m−1r−1 xr−m care

reprezinta dezvoltarea în serie binomiala cu putere negativa. Trecemx → q si obtinemµ

1

p− q

p

¶−m= pm(1 − q )−m = pm

∞Xr=m

C m−1r−1 q r−m =∞X

k=m

C m−1r−1 pmq r−m.

Observam ca definirea acestei variabile aleatoare este corecta de-oarece P (X = r) > 0 si

Pr=mC m−1r−1 pmq r−m = 1.

Calculam functia generatoare.

GX (z) =∞X

r=m

C m−1r−1 pmq r−m (z)r =

=∞X

r=m

C m−1r−1 ( pz)m (qz)r−m =

µ1

pz− zq

pz

¶−m,

G0X (z) = m

µ1

pz− q

p

¶−m−11

pz2, G0

X (1) =m

p⇒ M [X ] =

m

p,

Page 72: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 72/364

Page 73: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 73/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 71

P (X = 7) = C 36 (0.1)4 (0.9)3 = 7.29 × 10−5 6 · 5 · 42 · 3

= 0.001458

etc.

M [X ] =m

p=

4

0.1= 40, deci cam la 40 de mesaje se obtin patru

mesaje eronate. ♦

Printr-o secventa similara celei de la repartitia binomiala desenamcu Mathematica distributia repartitiei binomiale cu exponent nega-tiv, înlocuind BinomialDistribution cu NegativeBinomialDistribution

(figura 2.4).

5 10 15 20

0.01

0.02

0.03

Figura 2.4.

2.7.5 V. a. repartizata geometric

Spre deosebire de variabila aleatoare binomiala care apare cândfixam un numar de repetari ale unei experiente A, în cazul variabileigeometrice numaram numarul m de efectuari ale experientei pân a la prima realizare a evenimentului A (experiente de tip Bernoulli,

adica independente si repetate în aceleasi conditii). V. a. X esteuneori descrisa ca "timpul de asteptare" pentru un succes în expe-riente Bernoulli. În acest caz variabila aleatoare X ia valorile X = k,k = 1, 2, . . . , m , . . . si avem

P (X = k) = p (1 − p)k−1 , k = 1, 2, 3, . . . ,

unde P (A) = p este probabilitatea de realizare a evenimentului A.Scriem ca X ∈ Geom [ p].

Page 74: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 74/364

72 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Calculam media si dispersia variabilei aleatoare. Notam q = 1− p.Calculam functia generatoare pentru |qz| < 1.

GX (z) =∞Xk=1

pkzk =∞Xk=1

pz (qz)k−1 =pz

1 − qz,

G0X (z) =

p

(1 − qz)2, G0

X (1) =1

p⇒ M [X ] =

1

p.

G00X (z) =

2 pq

(1 − qz)3, G00

X (1) =2q

p2⇒ D[X ] =

2q

p2+

1

p−µ

1

p

¶2

=q

p2.

Problema 2.10. Calculatorul A transmite un mesaj calculatorului B. Mesajul este codat astfel încât B detecteaz a când se produc erori în cursul transmiterii mesajului. Dac a B detecteaz a o eroare cere cal-culatorului A retransmiterea mesajului. Dac a probabilitatea ca trans-miterea mesajului s a fie eronat a este p = 0.1, care este probabilitatea ca mesajul s a necesite mai mult de dou a transmisii.

Rezolvare. Fiecare transmitere a mesajului urmeaza o repartitie bi-nomiala cu probabilitatea ca mesajul sa fie corect q = 1 − p. Expe-rientele se repeta pâna când prima transmisie este corecta. Probabil-itatea ca mesajul sa necesite mai mult de doua transmisii este

P (X > 2) = p2q + p3q + · · · = p2q 1

1 − p= p2 = 10−2.

Media variabilei aleatoare din acest exercitiu este M [X ] =1

0.1=

10, iar dispersia este D [X ] =0.9

0.01= 90.

Interpretarea este urmatoarea: media aritmetica este 10, deci laun numar mare de transmisii numarul mediu de transmisii pâna laprimul mesaj eronat este 10. ♦

Problemele în care se utilizeaza repartitia geometrica suntcele în care facem urmatoarele presupuneri:

— sunt numai doua posibilitati pentru rezultatul experientei (suc-ces/insucces, realizari/nerealizari, bit corect/eronat, aparat bun/defectetc.),

— probabilitatea succesului este aceeasi pentru fiecare experienta,— numarul efectuarilor experientei k, pâna la prima realizare, este

variabil,— cele k experiente sunt independente.

Page 75: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 75/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 73

2.7.6 V. a. repartizata hipergeometric

Fie o urna care contine N bile albe si negre, k ≤ N dintre ele suntalbe si N − k negre. Se extrag n ≤ N bile aleator (f ara revenireabilei în urna). Acestea se pot extrage în C nN moduri. Fie X variabilaaleatoare care ia ca valori numarul de bile albe extrase.

X :

0 1 . . . i . . . minn, k

C 0kC nN −kC nN

C 1kC n−1N −kC nN

. . .C ikC n−iN −k

C nN . . .

C minn,ka C

n−minn,kb

C nN

.

Folosim notatia X ∈ Hip [n,k,N ]. Caracteristicile numerice alevariabilei aleatoare X sunt

M [X ] =kn

N = np, D[X ] =

np(1 − p)(N − n)

N − 1,

unde p =k

N .

Media se poate calcula astfel: ca si în cazul binomial, variabilaaleatoare hipergeometrica poate fi scrisa sub forma unei sume de vari-abile aleatoare. Sa notam cu X 1 numarul de succese la prima ex-tragere, cu X 2 numarul de succese obtinute la a doua extragere etc.

Tabloul de repartitie al variabilei X 1 esteX 1 :

µ0 1q p

¶.

Vom arata ca si celelalte variabile aleatoare X i, i = 2, n, au aceeasirepartitie. Pentru aceasta calculam probabilitatea obtinerii unui suc-ces la extractia de ordin i, atunci când se fac extrageri f ara revenireaobiectului în multime. Numarul cazurilor posibile Ai

N . Numarulcazurilor favorabile coincide cu numarul de moduri în care pot fiobtinute i obiecte astfel încât pe locul i sa fie succes. Un succes poatefi obtinut în k moduri.

Celelalte i−1 locuri pot fi ocupate în Ai−1N −1 moduri, în total kAi−1

N −1cazuri favorabile. Probabilitatea catata va fi deci

kAi−1N −1

AiN

=k(N − 1)(N − 2) · · · (N − i + 1)

N (N − 1) · · · (N − i + 1)=

k

N = p.

Rezulta ca X i are repartitia X i :

µ0 1q p

¶. Din relatiile

X = X 1 + X 2 + · · · + X n si M [X 1] = M [X 2] = · · · = M [X n] = p,

Page 76: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 76/364

74 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

rezultaM [X ] = np.

Ca si în cazul v. a. binomiale, X se scrie ca o suma de variabile

aleatoare având aceeasi repartitieµ

0 1q p

¶. Deosebirea este esentiala:

în cazul repartitiei hipergeometrice, variabilele aleatoare nu sunt in-dependente. Din aceasta cauza nu putem calcula dispersia variabileialeatoare X ca suma dispersiilor variabilelor aleatoare X i.

Teorema 2.5. Dac a X este o variabil a aleatoare repartizat a hiperge-

ometric cu parametrii N , k, n, X ∈ Hip [n,k,N ], pentru care

P (X = i) =C ikC n−iN −k

C nN ,

atunci

limN →∞

C ikC n−iN −kC nN

= C in piq n−i, (2.13)

unde p =k

N , q = 1− p si deci pentru valori mari ale lui N , o variabil a

aleatoare repartizat a hipergeometric poate fi aproximat a cu o variabil a repartizat a binomial a Bin£

n, kN

¤.

Demonstratie.

C ikC n−iN −kC nN

=

= k(k−1)···(k−i+1)i!

(N −k)(N −k−1)···(N −k−n+i−1)(n−i)!

n!N ···(N −n+1)

=

= n!i!(n−i)!

k(k−1)···(k−i+1)(N −k)(N −k−1)···(N −k−n+i−1)N ···(N −n+1)

=

= C inkN

k−1N · · · k−i+1

N N −kN

N −k−1N · · · N −k−n+i−1

N N n

N ···(N −n+1) =

= C inkN

k−1N · · · k−i+1

N N −kN

N −k−1N · · · N −k−n+i−1

N N n

N ···(N −n+1)=

= C in p( p − 1N

) · · · ( p − i−1N

)q (q − 1N

) · · · (q − n−i+1N

) N n

N ···(N −n+1).

Trecând la limita obtinem (2.13). ¤

Prin programul de mai jos din Mathematica observam acurateteaaproximarii unei v. a. Hip [20, 5, 100], cu distributia repartizata bino-mial Bin [20, 0.05].

<<Statistics‘DiscreteDistributions‘

Page 77: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 77/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 75

f[k_]:=PDF[BinomialDistribution[20, 0.05],k]tab1=Table[k,f[k],k,0,15];g[k_]:=PDF[HypergeometricDistribution[20,5,100],k]tab2=Table[k,g[k],k,0,15];<<Graphics‘MultipleListPlot‘MultipleListPlot[tab1,tab2,

PlotStyle->GrayLevel[0],Dashing[Dot,Dash],SymbolShape->PlotSymbol[Box],PlotSymbol[Triangle],SymbolStyle->GrayLevel[0],GrayLevel[.4]]

2 4 6 8 10 12 14

0.1

0.2

0.3

0.4

Figura 2.5.

2.7.7 V. a. repartizat˘a Poisson

Distributia Poisson se foloseste ca model pentru evenimente a carornumar de repetare nu are o limita superioara. Spunem ca variabilaaleatoare X urmeaza o distributie Poisson, cu paramatru λ ∈ R+,X ∈ Pois [λ], daca tabloul sau de repartitie este

X :

µ0 1 2 . . . k . . .

e−λ λ1!

e−λ λ2

2!e−λ . . . λk

k!e−λ . . .

¶.

Folosim notatia P (k; λ) =λk

k!e−λ. Evident P (k; λ) > 0 si

Pk=0

λk

k!e−λ = 1.

Proprietati ale repartitiei Poisson.P1. Media repartitiei Poisson este aceeasi cu dispersia repartitiei si

egala cu λ: M [X ] = D[X ] = λ. Aceasta este o particularitateremarcabila si este o modalitate de a recunoaste ca un fenomenurmeaza o repartitie Poisson. Într-adevar

M [X ] =∞Xk=0

kλk

k!e−λ = λe−λ

∞Xk=1

kλk−1

(k − 1)!= λe−λeλ = λ.

Page 78: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 78/364

76 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Pentru calculul dispersiei folosim formula D[X ] = M [X 2]−(M [X ])2.

M [X 2] = e−λ∞Xk=1

k2 λk

k!= e−λ

à ∞Xk=2

(k2 − k)λk

k!+

∞Xk=1

kλk

k!

!=

= e−λÃ

λ2∞Xk=2

λk−2

(k − 2)!+ λ

∞Xk=1

λk−1

(k − 1)!

!= λ2 + λ,

D[X ] = λ2 + λ − λ2 = λ.

P2. Repartitia Poisson se obtine ca un caz limita a repartitiei bino-miale când n → ∞ si p scade astfel încât np = λ = const (îngeneral, n > 30, p ∈ (0;0.1)).

Repartitia Poisson a aparut odata cu studiul variabilelor aleatoa-re cu un numar foarte mare de valori. Exemple clasice de astfelde variabile aleatoare sunt cele legate de evenimentele careapar rar într-un interval de timp, ca de exemplu:

— numarul de particule emise de o suprafata radioactiva într-uninterval de timp;

— numarul de bacterii într-un centimetru cub de apa;

— numarul accidentelor dintr-o fabrica în decurs de o saptamâna;

— numarul masinilor care trec printr-un anumit loc într-un in-terval de timp;

— numarul cererilor de I/O la o retea de calculatoare într-uninterval de timp.

Toate aceste procese se numesc Poisson si ele vor fi studiateîn Capitolul Procese Stochastice. În aceste cazuri λ este pro-portionala cu durata intervalului de timp (adica λ = tw, w co-

eficient de proportionalitate). Parametrul w =λ

tse mai nu-

meste parametru de intensitate, reprezentând media numaruluide evenimente care se produc în unitatea de timp.

P3. Deoarece repartitia Poisson se întâlneste în cazul evenimentelorcare se întîmpla rar (n mare, np = const, rezulta p mic), ea maipoarta denumirea de legea evenimentelor rare .

Page 79: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 79/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 77

Teorema 2.6. Dac a X urmeaz a o reparti tie binomial a atunci

limn→∞

C kn pkq n−k =

λk

k!e−λ,

unde np = λ = const.

Demonstratie.

limn→∞

C kn pkq n−k = lim

n→∞n(n − 1) · · · (n − k + 1)

k!

µλ

n

¶k µ1 − λ

n

¶n−k=

= λk

k!limn→∞

n(n − 1) · · · (n − k + 1)nk

µ1 − λ

n

¶n−k= λk

k!e−λ. ¤

Observatia 2.12. Teorema afirma ca experimentele Bernoulli cu pro-babilitate de succes din ce în ce mai mica se apropie de legea Poissonde repartitie cu parametul λ = np.

Teorema 2.6 ne permite sa aproximam probabilitatile unei repar-titii binomiale.

Problema 2.11. O fabric a produce becuri si d a 5% rebut. S a se

aproximeze probabilitatea ca într-o cutie de 100 de becuri s a existe cel mult trei becuri defecte?

Rezolvare. Presupunând indepependenta, avem de-a face cu o vari-abila aleatoare repatizata binomial cu p = 0.05 si n = 100. Dacadorim sa calculam probabilitatea cu ajutorul schemei binomiale, dupa

calcule laborioase obtinem3P

k=0

C k100(0.05)k(0.95)100−k = 0.25784. Daca

aproximam X cu o variabila aleatoare repartizata Poisson, obtinem

λ = 100 × 0.05 = 5,

3Xk=0

5ke−5

k! = 0.26503.

Prin programul de mai jos din Mathematica observam acurateteaaproximarii unei v. a. X ∈ Bin [100; 0.05] cu distributia repartizataPoisson de parametru λ = 0.05.

<<Statistics‘DiscreteDistributions‘f[k_]:=PDF[BinomialDistribution[100, 0.05],k]tab1=Table[k,f[k],k,0,20];

Page 80: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 80/364

78 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

g[k_]:=PDF[PoissonDistribution[5],k]tab2=Table[k,g[k],k,0,20];<<Graphics‘MultipleListPlot‘MultipleListPlot[tab1,tab2,

PlotStyle\[Rule]GrayLevel[0],Dashing[Dot,Dash],SymbolShape\[Rule]PlotSymbol[Box],PlotSymbol[Triangle],SymbolStyle\[Rule]GrayLevel[0],GrayLevel[.5]];

5 10 15 20

0.025

0.05

0.075

0.1

0.125

0.15

0.175

Figura 2.6.♦

2.8 Probleme rezolvateProblema 2.12. O urn a con tine 5 bile albe si 4 bile negre. Din urn a se extrag 4 bile. Fie X num arul de bile albe extrase. S a se g aseasc a reparti tia variabile aleatoare X .

Rezolvare. Variabila aleatoare X poate lua urmatoarele valori: 0, 1,2, 3, 4. Probabilitatile cu care X ia aceste valori sunt:

P 0 = P (X =0) =C 05C 44

C 49=

1

126,

P 1 = P (X =1) = C 1

5C 3

4C 49

= 20126

, P 3 = P (X =3) = C 3

5C 1

4C 49

= 40126

,

P 2 = P (X =2) =C 25C 24

C 49=

60

126, P 4 = P (X =4) =

C 45C 04C 49

=5

126,

Tabloul de repartitie al variabilei aleatoare X este

X :

Ã0 1 2 3 41

126

20

126

60

126

40

126

5

126

!.

Page 81: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 81/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 79

Întrucât evenimentele E i = X = i, i = 0, 4, formeaza un sistem

complet de evenimente, trebuie ca5P

i=0

P (E i) = 1, conditie care într-

adevar se verifica:5P

i=0

P i =126

126= 1.

Problema 2.13. Se arunc a o moned a de dou a ori. S a se g aseasc a reparti tia variabilei aleatoare X , valorile c areia sunt num arul de apari-tii al stemei.

Rezolvare. Fie evenimetele E i, i = 1, 2, care constau în aparitiastemei la aruncarea i a monezii. Avem P (E 1) = P ¡E 1

¢ = P (E 2) =

P ¡

E 2¢

=1

2. Deci

P (X = 0) = P ¡

E 1 ∩ E 2¢

=1

1

2=

1

4;

P (X = 1) = P ¡¡

E 1 ∩ E 2¢ ∪ ¡E 1 ∩ E 2

¢¢=

1

1

2+

1

1

2=

1

2;

P (X = 2) = P (E 1 ∩ E 2) =1

1

2=

1

4.

Tabloul de repartitie al lui X este

X :

Ã0 1 21

4

1

2

1

4

!.

Problema 2.14. Fie variabilele aleatoare X si Y cu reparti tiile:

X :

µ−1 0 10.3 0.4 0.3

¶, Y :

µ0 1 2

0.2 0.3 0.5

¶.

S a se calculeze tablourile de reparti tie ale variabilelor aleatoare X +Y ,X · Y , 10 · X , X 2.

Rezolvare. Fie variabila aleatoare X + Y . Valorile posibile ale eisunt −1, 0, 1, 2, 3. Tinând seama ca X si Y sunt variabile aleatoareindependente, avem

P (X +Y =−1) = P (X =−1∩Y =0) = P (X =−1) P (Y =0) =

= 0.3 · 0.2 = 0.06;

P (X +Y =0) = P ((X = −1∩Y = 1)∪(X = 0∩Y = 0)) =

= 0.3 · 0.3 + 0.4 · 0.2 = 0.17;

Page 82: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 82/364

80 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

P (X +Y =1) = P ¡ (X = −1∩Y = 2)∪(X = 0∩Y = 1)∪∪(X = 1∩Y = 0)

¢=

= 0.3 · 0.5 + 0.4 · 0.3 + 0.3 · 0.2 = 0.33;

P (X +Y =2) = P ((X = 1∩Y = 1)∪(X = 0∩Y = 2)) =

= 0.3 · 0.3 + 0.4 · 0.5 = 0.29;

P (X +Y =3) = P (X = 1∩Y = 2) =

= 0.3 · 0.5 = 0.15.

Deci

X + Y : µ−1 0 1 2 30.06 0.17 0.33 0.29 0.15¶ .

În mod similar se obtine repartitia variabilei aleatoare X · Y :

X · Y :

µ −2 −1 0 1 20.3 · 0.5 0.3 · 0.3 0.4 + 0.2 − 0.08 0.3 · 0.3 0.3 · 0.5

¶⇔

X · Y :

µ−2 −1 0 1 20.15 0.09 0.52 0.09 0.15

¶.

Variabila aleatoare 10 · X va lua valorile −10, 0, 10, iar repartitia eieste

10 · X : µ−10 0 100.3 0.4 0.3¶ .

Fie variabila aleatoare X 2. Avem

P ¡

X 2 = 0¢

= P (X = 0) = 0.4;

P ¡

X 2 = 1¢

= P (X = −1 ∪ X = 1) = 0.3 + 0.3 = 0.6.

Repartitia ei este

X 2 :

µ0 1

0.4 0.6

¶.

Problema 2.15. Un zar se arunc a de dou a ori. Se de fi ne ste vari-

abila aleatoare, valorile c areia sunt diferen ta dintre num arul de puncte obtinut la prima aruncare si num arul de puncte obtinut la a doua arun-care. S a se scrie tabloul de reparti tie al variabilei aleatoare.

Rezolvare. Fie X 1 si X 2 variabilele aleatoare cu valorile egale cunumarul de puncte la prima, respectiv a doua aruncare a zarului.Avem

X 1, X 2 :

Ã1 2 3 4 5 61

6

1

6

1

6

1

6

1

6

1

6

!.

Page 83: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 83/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 81

Trebuie de calculat repartitia variabilei aleatoare X 1 − X 2. Avem

P (X 1 − X 2 = −5) = P (X 1 = 1 ∩ X 2 = 6) =

=1

1

6=

1

36;

P (X 1 − X 2 = −4) = P ((X 1 = 1 ∩ X 2 = 5) ∪∪ (X 1 = 2 ∩ X 2 = 6)) =

=1

1

6+

1

1

6=

2

36=

1

18;

P (X 1 − X 2 = −3) = P ((X 1 = 1 ∩ X 2 = 4) ∪ · · · ∪∪ (X 1 = 3 ∩ X 2 = 6)) =

= 3 ·1

1

6=

3

36=

1

12;

P (X 1 − X 2 = −2) = P ((X 1 = 1 ∩ X 2 = 3) ∪ · · · ∪∪ (X 1 = 4 ∩ X 2 = 6)) =

= 4 ·1

1

6=

4

36=

1

9;

P (X 1 − X 2 = −1) = P ((X 1 = 1 ∩ X 2 = 2) ∪ · · · ∪∪ (X 1 = 5 ∩ X 2 = 6)) =

= 5 ·1

1

6=

5

36;

P (X 1 − X 2 = 0) = P ((X 1 = 1 ∩ X 2 = 1) ∪ · · · ∪∪ (X 1 = 6 ∩ X 2 = 6)) =

= 6 ·1

1

6=

6

36=

1

6;

P (X 1 − X 2 = 1) = P ((X 1 = 2 ∩ X 2 = 1) ∪ · · · ∪∪ (X 1 = 6 ∩ X 2 = 5)) =

= 5 ·1

1

6=

5

36;

P (X 1 − X 2 = 2) = P ((X 1 = 3 ∩ X 2 = 1) ∪ · · · ∪∪ (X 1 = 6 ∩ X 2 = 4)) =

= 4 ·1

1

6=

4

36=

1

9;

Page 84: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 84/364

82 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

P (X 1 − X 2 = 3) = P ((X 1 = 4 ∩ X 2 = 1) ∪ · · · ∪∪ (X 1 = 6 ∩ X 2 = 3)) =

= 3 ·1

1

6=

3

36=

1

12;

P (X 1 − X 2 = 4) = P ((X 1 = 5 ∩ X 2 = 1) ∪∪ (X 1 = 6 ∩ X 2 = 2)) =

=1

1

6+

1

1

6=

2

36=

1

18;

P (X 1

−X 2 = 5) = P (X 1 = 1

∩X 2 = 5) =

= 16

· 16

= 136

.

Tabloul de repartitie al variabilei aleatoare X 1 − X 2 este

X 1 − X 2 :

à −5 −4 −3 −2 −1 0 1 2 3 4 51

36

1

18

1

12

1

9

5

36

1

6

5

36

1

9

1

12

1

18

1

36

!.

Problema 2.16. Un zar este aruncat de 10 ori. Fie X variabila aleatoare, valorile c areia sunt num arul de apari tii al fe tei "6". S a se

calculeze în Matlab probabilit a tile corespunz atoare fiec arui num ar de apari tii, valorile func tiei de reparti tie si s a se reprezinte grafic cele dou a func tii. S a se calculeze P (X < 4), P (X > 6), P (3 ≤ X < 7),P (3 < X ≤ 7).

Rezolvare. Valorile variabilei aleatoare X sunt 0, 1, . . . , 10. Proba-bilitatile corespunzatoare se calculeaza conform formulei P (X = k) =

C kn pkq n−k, unde n = 10 este numarul de aruncari, p =

1

6este probabili-

tatea aparitiei fetei "6" la o aruncare a zarului, iar q =5

6este proba-

bilitatea aparitiei altei fete. Formula de calcul ia forma P (X = k) =C k10510−k

610. Valoarea functiei de repartitie în punctul x = k, k = 0, 10

se va calcula astfel F (0) = 0, F (k) = F (k − 1) + P (X = k − 1),k = 1, 10. Probabilitatile celor patru evenimente vor fi P (X < 4) =F (4), P (X > 6) = 1 − F (6 + 1), P (3 ≤ X < 7) = F (7) − F (3),P (3 < X ≤ 7) = F (7 + 1) − F (3 + 1).

Urmatorul program în Matlab face aceste calcule si afiseaza grafi-cele.

Page 85: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 85/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 83

% Aruncarea zarului

% Probabilitatea aparitiei fetei "6"

% Functia de repartitie

clear;

clc;

format short g;

n=10;

p=1/6;

q=5/6;

X=0:n;

for k=0:nP(k+1)=mfun(’binomial’,n,k)*p^k*q^(n-k);

end

F(1)=0;

for k=1:n

F(k+1)=F(k)+P(k);

end

fprintf(’ k P(X=k) F(k)\n’);

for k=0:n

fprintf(’%2g %14g %10.6g\n’,X(k+1), P(k+1), F(k+1));

endfprintf(’P(X<4)=%g\n’,F(4+1));

fprintf(’P(X>6)=%g\n’,1-F(6+1+1));

fprintf(’P(3<=X<7)=%g\n’,F(7+1)-F(3+1));

fprintf(’P(3<X<=7)=%g\n’,F(7+1+1)-F(3+1+1));

subplot(1,2,1)

stem(X,P);

title(’Probabilitatile evenimentelor’);

xlabel(’x’); ylabel(’f(x)’);grid;

subplot(1,2,2);

hold on;for k=1:n

plot([X(k) X(k+1)], [F(k+1) F(k+1)]);

end;

title(’Functia de repartitie’);

axis([0 10 0 1.1]);

xlabel(’x’); ylabel(’F(x)’);grid;

hold off;

Rezultatele afisate de catre program sunt

Page 86: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 86/364

84 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

k P (X = k) F (k)0 0.161506 01 0.323011 0.1615062 0.29071 0.4845173 0.155045 0.7752274 0.0542659 0.9302725 0.0130238 0.9845386 0.00217064 0.9975627 0.000248073 0.9997328 1.86054e

−005 0.999981

9 8.26909e − 007 0.99999910 1.65382e − 008 1

P (X < 4) = 0.930272P (X > 6) = 0.000267521P (3 <= X < 7) = 0.224506P (3 < X <= 7) = 0.0697084

Graficele functiei probabilitatilor si functiei de repartitie sunt repre-zentate în figura 2.7.

0 2 4 6 8 100

0.05

0.1

0.15

0.2

0.25

0.3

0.35

Functia probabilitatilor

x

f ( x )

0 2 4 6 8 100

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 2.7.

Problema 2.17. Tabloul de reparti tie al unei variabile aleatoare dis-crete este

X :

µ1 2 3 4 5 6 7 8 9 10

0.05 0.08 0.12 0.16 0.2 0.14 0.09 0.07 0.05 0.04

¶.

Page 87: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 87/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 85

S a se calculeze media, dispersia si abaterea medie p˘ atratic a a v. a. X .

Rezolvare. Conform definitiei media si dispersia lui X sunt M [X ] =

=nPi=1

xi pi, respectiv D [X ] = M [X 2] − M [X ]2. Urmatorul tabel

contine rezultatele calculelor:

xi pi xi pi x2i x2

i pi1 0.05 0.05 1 0.052 0.08 0.16 4 0.323 0.12 0.36 9 1.08

4 0.16 0.64 16 2.565 0.20 1.00 25 5.006 0.14 0.84 36 5.047 0.09 0.63 49 4.418 0.07 0.56 64 4.489 0.05 0.45 81 4.05

10 0.04 0.40 100 4.00P1.00 5.09 30.99

Avem M [X ] =5.09, D[X ]=30.99−5.092 ≈ 5.08, σ[X ]≈√ 5.08≈2.25.

Problema 2.18. Se consider a variabilele aleatoare independente X si Y :

X :

µ1 2 3

0.3 0.5 0.2

¶, Y :

µ−1 0 1 20.4 0.3 0.2 0.1

¶.

S a se calculeze M [X ], D [X ], M [Y ], D [Y ], M [X + Y ], D [X + Y ],M [XY ], D [XY ] si s a se verifice c a

M [X + Y ] = M [X ] + M [Y ] , M [XY ] = M [X ] M [Y ] ,

D [X + Y ] = D [X ] + D [Y ] .

Rezolvare. Aplicând formulele mediei si dispersiei, obtinemM [X ] = 1.9, D [X ] = 0.49, M [Y ] = 0, D [Y ] = 1.

Procedând ca în Problema 2.14 obtinem tablourile de repartitie:

X +Y :

µ0 1 2 3 4 5

0.12 0.29 0.29 0.19 0.09 0.02

¶,

XY :

µ −3 −2 −1 0 1 2 3 4 60.08 0.20 0.12 0.30 0.06 0.13 0.04 0.05 0.02

¶.

Page 88: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 88/364

86 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Obtinem apoi

M [X +Y ] = 1.9, D [X +Y ] = 1.49, M [XY ] = 0, D [XY ] = 4.1.

Egalitatile privind media si dispersia se verifica:

M [X + Y ] = 1.9 = 1.9 + 0 = M [X ] + M [Y ] ,

M [XY ] = 0 = 1.9 · 0 = M [X ] M [Y ] ,

D [X + Y ] = 1.49 = 0.49 + 1 = D [X ] + D [Y ] .

Problema 2.19. Dintr-o urn a, ce con tine 10 bile albe si 6 bile negre,

se extrag f ar a revenire 5 bile. Fie X num arul de bile albe extrase. S a se calculeze M [X ] si D [X ].

Rezolvare. Valorile variabilei aleatoare X sunt 0, 1, 2, 3, 4 si 5. Sacalculam probabilitatile corespunzatoare fiecarei valori. Problema seîncadreaza în cazul schemei hipergeometrice. Avem:

P (X = 0) =C 010C 56

C 516=

1

728, P (X = 3) =

C 310C 26C 516

=300

728,

P (X = 1) =C 110C 46

C 516=

25

728, P (X = 4) =

C 410C 16C 516

=210

728,

P (X = 2) =C 210C 36

C 516=

150

728, P (X = 5) =

C 510C 06C 516

=42

728.

Deci tabloul de repartitie al lui X este

X :

Ã0 1 2 3 4 51

728

25

728

150

728

300

728

210

728

42

728

!.

Aplicând apoi formulele mediei si dispersiei unei variabile aleatoarediscrete, gasim

M [X ] =

nXi=1

xi pi = 3.125,

D [X ] = M £

X 2¤− M [X ]2 = 10.625 − 3.1252 ≈ 0.859.

Problema 2.20. O moned a se arunc a de 20 de ori. Variabila aleatoare X indic a num arul de apari tii al stemei. S a se determine tabloul de reparti tie al v. a. X . S a se determine func tia de reparti tie a v. a. X .S a se calculeze M [X ], D [X ] si σ [X ]. Folosind func tia de reparti tie,s a se calculeze probabilit a tile P (8 ≤ X ≤ 12), P (5 ≤ X ≤ 15).

Page 89: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 89/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 87

Rezolvare. Variabila aleatoare X este repartizata binomial. Proba-bilitatea cu care X ia o valoare oarecare este P (X = k) = C kn p

kq n−k,

unde n = 20 este numarul de experiente, p = q =1

2sunt proba-

bilitatile de aparitie a celor doua fete ale monezii la o aruncare, iark = 0, 20 parcurge multimea valorilor lui X . Urmatorul program înMatlab determina tabloul de repartitie al v. a. X .

% Aruncarea monezii

% Probabilitatea aparitiei stemei

% Functia de repartitie

clear;clc;

format short g;

n=20;

p=1/2;

q=1/2;

X=0:n;

for k=0:n

P(k+1)=mfun(’binomial’,n,k)*p^k*q^(n-k);

end

F(1)=0;for k=1:n

F(k+1)=F(k)+P(k);

end

fprintf(’ k P(X=k) F(k)\n’);

for k=0:n

fprintf(’%2g %14g %14.6g\n’,X(k+1), P(k+1), F(k+1));

end

m=sum(X.*P);

d=sum(X.^2.*P)-m^2;

s=sqrt(d);fprintf(’M[X]=%g\n’,m);

fprintf(’D[X]=%g\n’,d);

fprintf(’sigma[X]=%g\n’,s);

fprintf(’P(8<=X<=12)=%g\n’,F(12+1+1)-F(8+1));

fprintf(’P(5<=X<=15)=%g\n’,F(15+1+1)-F(5+1));

subplot(1,2,1)

stem(X,P);

title(’Functia probabilitatilor’);

Page 90: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 90/364

88 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

xlabel(’x’); ylabel(’f(x)’);grid;

subplot(1,2,2);

hold on;

for k=1:n

plot([X(k) X(k+1)], [F(k+1) F(k+1)]);

end;

title(’Functia de repartitie’);

axis([0 20 0 1.1]);

xlabel(’x’); ylabel(’f(x)’);grid;

hold off;

Rezultatele obtinute la rularea programului sunt

k P (X = k) F (k)0 9.53674e − 007 01 1.90735e − 005 9.53674e − 0072 0.000181198 2.00272e − 0053 0.00108719 0.0002012254 0.00462055 0.001288415 0.0147858 0.005908976 0.0369644 0.0206947

7 0.0739288 0.05765918 0.120134 0.1315889 0.160179 0.251722

10 0.176197 0.41190111 0.160179 0.58809912 0.120134 0.74827813 0.0739288 0.86841214 0.0369644 0.94234115 0.0147858 0.97930516 0.00462055 0.994091

17 0.00108719 0.99871218 0.000181198 0.99979919 1.90735e − 005 0.9999820 9.53674e − 007 0.999999

M [X ] = 10D[X ] = 5sigma[X ] = 2.23607P (8 <= X <= 12) = 0.736824P (5 <= X <= 15) = 0.988182

Page 91: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 91/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 89

Graficele sunt reprezentate în figura 2.8.

0 5 10 15 200

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Functia probabilitatilor

x

f ( x )

0 5 10 15 200

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 2.8.

Problema 2.21. În cadrul alegerilor un partid a acumulat 15% din voturi. Câte persoane în medie este necesar de chestionat dup˘ a vot pentru a g asi un num ar de 100 de voturi acordate partidului dat.

Rezolvare. Probabilitatea ca o persoana sa fi votat cu partidul dat es-te p = 0.15. Variabila aleatoare X cu valorile egale cu numarul de per-soane chestionate are repartitie geometrica, deci X ∈ Geom (0, 15).

Media variabile aleatoare X este M [X ] =1

p=

1

0.15=

20

3≈ 6.67.

Numarul de persoane necesar de chestionat este 100M [X ] ≈ 100 ·6.67 = 667.

Problema 2.22. S a se reprezinte grafic func tia de probabilitate si func tia de reparti tie a unei variabile aleatoare X repartizate geometric cu p = 0.2.

Rezolvare. Cum multimea valorilor variabilei aleatoare este N∗, nelimitam la a calcula tabloul de repartitie al lui X pentru primele n =20 valori. Urmatorul program în Matlab calculeaza si afiseaza graficfunctia de probabilitate si functia de repartitie ale lui X .

Page 92: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 92/364

90 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

% Functia de probabilitate si

% functia de repartitie ale unei

% variabile repartizate geometric

clear;

clc;

format short g;

n=20;

p=1/5;

q=4/5;

X=1:n;for k=1:n

P(k)=p*q^(k-1);

end

F(1)=0;

for k=1:n-1

F(k+1)=F(k)+P(k);

end

fprintf(’ k P(X=k) F(k)\n’);

for k=1:nfprintf(’%2g %14g %14.6g\n’,X(k), P(k), F(k));

end

subplot(1,2,1)

stem(X,P);

title(’Functia de probabilitate’);

xlabel(’x’); ylabel(’f(x)’);grid;

subplot(1,2,2);

hold on;

for k=1:nplot([X(k)-1 X(k)], [F(k) F(k)]);

end;

title(’Functia de repartitie’);

axis([0 20 0 1.1]);

xlabel(’x’); ylabel(’F(x)’);grid;

hold off;

Se obtin urmatoarele rezultate:

Page 93: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 93/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 91

k P (X = k) F (k)1 0.2 02 0.16 0.23 0.128 0.364 0.1024 0.4885 0.08192 0.59046 0.065536 0.672327 0.0524288 0.7378568 0.041943 0.7902859 0.0335544 0.832228

10 0.0268435 0.86578211 0.0214748 0.89262612 0.0171799 0.91410113 0.0137439 0.93128114 0.0109951 0.94502415 0.00879609 0.9560216 0.00703687 0.96481617 0.0056295 0.97185318 0.0045036 0.97748219 0.00360288 0.981986

20 0.0028823 0.985588

0 5 10 15 200

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

Functia de probabilitate

x

f ( x )

0 5 10 15 200

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 2.9.

Secventa de program Mathematica:

Page 94: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 94/364

92 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

<<Statistics‘DiscreteDistributions‘f[k_]:=PDF[GeometricDistribution[ 0.2],k]tab1=Table[k,f[k],k,0,20];dd1=Graphics[PointSize[0.025],Map[Point,tab1]];p1=ListPlot[tab1,DisplayFunction\[Rule]Identity];Show[dd1,p1,Axes\[Rule]Automatic];

5 10 15 20

0.05

0.1

0.15

0.2

Figura 2.10.Plot[CDF[GeometricDistribution[0.2], k],

k, 0, 20, AxesOrigin -> Automatic,PlotRange -> 0, 1, AspectRatio -> 1];

5 10 15 20

0.2

0.4

0.6

0.8

1

Figura 2.11.

Problema 2.23. Într-un magazin intr a în medie în fiecare minut trei

Page 95: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 95/364

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 93

persoane. S a se calculeze probabilitatea ca într-un minut în magazin a) s a nu intre nici o persoan a; b) s a intre 2 persoane; c) s a intre cel pu tin 2 persoane.

Rezolvare. Variabila aleatoare X cu valorile egale cu numarul depersoane are repartitie Poisson. Fie λ parametrul repartitiei. Cummedia persoanelor intrate în magazin într-un minut este 3, rezulta caM [X ] = 3 = λ. Este necesar sa se calculeze P (X = 0), P (X = 2),P (X ≥ 2). Probabilitatea ca X sa ia o valoare oarecare k ∈ N este

P (X = k) =

λk

k! e−λ

. Calculând primele câteva coloane ale tablouluide repartitie, obtinem

X :

µ0 1 2 3 . . .

0.04979 0.14936 0.22404 0.22404

¶.

Avem deci

P (X = 0) = 0.04979, P (X = 2) = 0.22404,

P (X ≥ 2) = 1 − P (X < 2) = 1 − (0.04979 + 0.14936) = 0.80085.

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. Notiunea de variabila aleatoare discreta.

2. Determinarea functiei de repartitie a variabilei aleatoare dis-crete.

3. Calculul mediei si dispersiei unei variabile aleatoare discrete.

4. Folosirea inegalitatii lui Cebâsev.

5. Determinarea probabilitatilor folosind functia de repartitie.

6. Întelegerea sensului fiecarei v. a. discret distribuite.

7. Selectarea v. a. discrete potrivite aplicatiei studiate.

Page 96: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 96/364

94 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

Sintetizam în urmatorul tabel v. a. discrete studiate:Repartitia pi M [X ] D [X ] Observatii

uniformdiscreta

X ∈ UnifD [m, n]

1n

m + n−12

n2−112

binomialaX ∈ Bin [n, p]

C in piq n−i np npq

limn→∞

C in piq n−i =

= λi

i! e−λ

np = λ

binomiala cu

exponentnegativX ∈NegBin[m,p]

C m−1m+i−1 pmq i m p mq p2

hiper-geometrica

X ∈ Hip [n,k,N ]

C ikC n−iN −kC nN

np np(1− p)(N −n)N −1

limN →∞

C ikC n−iN −k

C nN =

= C kn pkq n−k

PoissonX ∈ Pois [λ]

λi

i!e−λ λ λ

geometricaX ∈ Geom [ p]

pq i−11

p

q

p2

Page 97: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 97/364

Capitolul 3

Variabile aleatoare continue

3.1 Functia de repartitie

În cele ce urmeaza F,Ω, P este un câmp de probabilitate.

Definitia 3.1. Fie X o v. a. Se numeste func tie de reparti tie a lui X (sau func tie de distribu tie cumulativ a ) functia reala

F X : R→ [0, 1] , F X (x) = P (X ≤ x). (3.1)

Rezulta ca oricarui numar real x i se asociaza prin functia de repar-titie F un numar care reprezinta probabilitatea ca valorile lui X sa fiemai mici sau egale cu x si acest lucru este posibil deoarece în definitiav. a. X avem X ≤ x ∈ F.

Observatia 3.1. Unele tratate de teoria probabilitatilor definesc func-tia de repartitie prin formula

F X (x) = P (X < x), ∀x ∈ R.

În cele ce urmeaza vom folosi formula (3.1) în definirea functiei derepartitie, în parte si datorita faptului ca softul utilizat, Matlab si

Mathematica, folosesc aceeasi abordare.Pentru a demonstra proprietatile functiei de repartitie vom folosi

urmatoarea propozitie:

Propozitia 3.1. a) Fie A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ An+1 ⊂ · · · un sir cresc ator de evenimente si A =

Sn≥1

An. Atunci P (A) = limn→∞

P (An).

b) Fie B1 ⊃ B2 ⊃ · · · ⊃ Bn ⊃ Bn+1 ⊃ · · · un sir descresc ator de evenimente si B =

Tn≥1

Bn. Atunci P (B) = limn→∞

P (Bn).

95

Page 98: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 98/364

96 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Demonstratie. a) Putem scrie

A = A1 ∪ (A2 \ A1) ∪ (A3 \ A2) ∪ · · · ∪ (An \ An−1) ∪ . . . ,

unde termenii reuniunilor sunt evenimente incompatibile. Atunci,tinând seama de proprietatile probabilitatii obtinem:

P (A) = P (A1) + (P (A2) − P (A1)) + (P (A3) − P (A2)) + · · · +

+ (P (An) − P (An−1)) + · · · = P (A1) +∞

Xn=2

(P (An) − P (An−1)) =

= P (A1) + limk→∞

kXn=2

(P (An) − P (An−1)) = limk→∞

P (Ak).

b) Fie An = Bn, n ≥ 1 si A = B. Sirul An astfel construit este unsir crescator si A = B =

Tn≥1

Bn =Sn≥1

Bn =Sn≥1

An. Conform a) avem

P (A) = limn→∞

P (An).

Rezulta 1 − P (B) = limn→∞

(1 − P (Bn)) = 1 − limn→∞

P (Bn). ¤

Teorema 3.1. Urm atoarele afirma tii sunt adev arate:

1. Daca x1 ≤ x2, atunci F X (x1) ≤ F X (x2), ∀x1, x2 ∈ R;

2. F X (x + 0) = limxn&x

F (xn) = F X (x), ∀x ∈ R (F X este continua la

dreapta);

3. limx→−∞

F X (x) = 0;

4. limx

→+

F X (x) = 1.

Demonstratie. 1. Observam ca daca x1 ≤ x2 atunci X ≤ x1 ⊂⊂ X ≤ x2 si aplicând monotonia functiei de probabilitate rezulta

F X (x1) = P (X ≤ x1) ≤ P (X ≤ x2) = F X (x2).

Pentru demonstrarea 2, 3 si 4 este nevoie de proprietatea de conti-nuitate a probabilitatii. Aceata proprietate este formulata în Propozi-tia 3.1.

Page 99: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 99/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 97

2. Pentru orice x ∈ R avem

F X (x + 0) = limn→∞

F X

µx +

1

n

¶= lim

n→∞P

µX ≤ x +

1

n

¶=

= limn→∞

P

µ Tn≥1

½X ≤ x +

1

n

¾¶= P (X ≤ x) = F X (x).

Am folosit faptul ca

X ≤ x + 1 ⊇ ½X ≤ x +1

2¾ ⊇ · · · ⊇ ½X ≤ x +1

n¾ ⊇ . . . ,

∞Tn=1

©X ≤ x + 1

n

ª= X ≤ x si proprietatea de continuitate a proba-

bilitatii.3. Fie Bn = X ≤ −n. Atunci

limx→−∞

F X (x) = limn→∞

F X (−n) = limn→∞

P (X ≤ −n) = limn→∞

P (Bn).

Dar (Bn) este un sir descrescator de evenimente si∞Tn=1

Bn = ∅. Rezulta,

aplicând proprietatea de continuitate a probabilitatii,

limx→−∞

F X (x) = limn→∞

P (Bn) = limn→∞

P

µ ∞Tn=1

Bn

¶= P (∅) = 0.

4. Fie An = X < n. Observam ca (An) este un sir crescator

de evenimente,∞Sn=1

An = Ω (epuizeaza toate valorile v. a. X ) si

datorita continuitatii lui P obtinem limx→+∞

F X (x) = limn→+∞

F X (n) =

limn→∞

P (An) = limn→∞

P

µ ∞

Sn=1

An

¶= P (Ω) = 1. ¤

Teorema 3.2. Fie F X : R → [0, 1] func tia de reparti tie a unei v. a.X . Atunci pentru orice numere reale a < b avem:

a) P (X > a) = 1 − F X (a),P (X < a) = F X (a − 0),P (X ≥ a) = 1 − F X (a − 0).

b) P (a ≤ X < b) = F X (b − 0) − F X (a − 0),P (a < X < b) = F X (b − 0) − F X (a),P (a < X ≤ b) = F X (b) − F X (a),P (a ≤ X ≤ b) = F X (b) − F X (a − 0).

Page 100: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 100/364

98 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Demonstratie.a) P (X > a) = P (X ≤ a) = 1 − P (X ≤ a) = 1 − F X (a),

P (X < a) = P

µ∞Ti=1

©X ≤ a − 1

n

ª¶= F X (a − 0),

P (X ≥ a) = P (X < a) = 1 − P (X < a) = 1 − F X (a − 0).b) a ≤ X < b = X < b \ X < a, X < a ⊂ X < b ⇒

P (a ≤ X < b) = F X (b − 0) − F X (a − 0). Analog rezulta si celelalterelatii. ¤

Exercitiul 3.1. Sa presupunem ca pentru o v. a. Y functia de repar-

titie este

F Y (x) =

0 pentru x ≤ 0x2

2pentru 0 < x < 1

1 pentru x ≥ 1.

.

Sa se calculeze P ¡

Y < 12

¢si P

¡Y 2 ≥ 1

2

¢.

Rezolvare. P ¡

Y < 12

¢= F Y

¡12− 0

¢= F Y

¡12

¢= 1

8,

P

µY 2 ≥ 1

2

¶= 1 − P

µY 2 <

1

2

¶= 1 − P

µ− 1√

2< Y <

1√ 2

¶=

= 1 − F Y µ 1√

2− 0¶ + F Y

µ− 1√ 2¶ = 1 − 1

4+ 0 = 3

4. ♦

3.2 Densitatea de probabilitate

Definitia 3.2. Spunem ca v. a. X este de tip continuu cu densitatea de probabilitate f X : R → R daca functia de repartitie F X : R → R

este continua, derivabila pe subintervale si f X (x) = F 0X (x) în punctelede derivabilitate.

Proprietatile densitatii de probabilitate

Teorema 3.3. Fie X o v. a. continu a cu densitatea de probabilitate f X . Atunci:

a) f X (x) ≥ 0, ∀x ∈ R,

b) F X (x) =

Z x−∞

f X (t)dt, (3.2)

c)

Z ∞−∞

f X (x)dx = 1, (3.3)

Page 101: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 101/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 99

d) P (a < X ≤ b) =Z ba

f X (x)dx, ∀a, b ∈ R, a < b. (3.4)

Demonstratie. a) Deoarece F X este monoton crescatoare conformTeoremei 3.1, rezulta ca derivata ei este pozitiva adica f X (x) ≥ 0,∀x ∈ R.

b) f X (x) = F 0X (x) ⇒Z x−∞

F 0X (x)dt =

Z x−∞

f X (t)dt ⇒

F X (x) − limx

→−∞

F X (x) = Z x

−∞

f X (t)dt ⇒ F X (x) = Z x

−∞

f X (t)dt.

c) F X (x) =

Z x−∞

f X (t)dt ⇒ limx→+∞

F X (x) = limx→+∞

Z x−∞

f X (t)dt ⇒

1 =

Z ∞−∞

f X (x)dx.

d) Demonstram P (a < X ≤ b) =bR a

f X (x)dx. Într-avevar,

P (a < X ≤

b) = F X

(b)−

F X

(a) =

=

Z b−∞

f X (t)dt −Z a−∞

f X (t)dt =

Z ba

f X (t)dt. ¤

Observam ca f este utilizata pentru a calcula o arie care reprezintaprobabilitatea ca v. a. X sa ia valori în intervalul (a, b].

Observatia 3.2. În cazul v. a. continue, oricare ar fi x ∈ R, avemP (X = x) = 0. Deoarece în orice punct probabilitatea este zero nufacem distinctie între < si ≤,

P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = P (a ≤ X ≤ b).

3.3 Caracteristici numerice ale v. a. con-

tinue

Definitia 3.3. Fie X o v. a. având densitatea de probabilitate f .Definim

Page 102: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 102/364

100 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Media: M [X ] =Z ∞−∞

xf (x)dx = m,

Dispersia: D [X ] =

Z ∞−∞

(x − M [X ])2 f (x)dx,

Abaterea medie p˘ atratic a: σ =p

D [X ],în ipoteza ca integralele respective sunt convergente.

La fel se definesc, în ipoteza ca integralele respective sunt conver-gente,

Momentul (ini tial) de ordin k: k ≥ 1, M

£X k

¤=

Z ∞

−∞

xkf (x)dx,

Momentul centrat de ordin k: k ≥ 1,

M £

(X − m)k¤

=

Z ∞−∞

(x − M [X ])k f (x)dx.

Observatia 3.3. Momentul centrat de ordinul trei , M [(X − m)3],caracterizeaza asimetria graficului densitatii de probabilitate a v. a.X în raport cu dreapta de ecuatie x = M [X ]. Se utilizeaza coeficientul

de asimetrie α =M [(X −m)3]

σ3.

Momentul centrat de ordinul patru , M [(X − m)4], îndica gradul

de aplatizare al graficul densitatii de repartitie a lui X . Se utilizeazacoeficientul de boltire β =

M [(X −m)4]σ4

. Pentru comparatie se folosestecurba de repartitie normala pentru care β = 3. Marimea = β − 3reprezinta diferenta de boltire a unei repartitii studiate fata de repar-titia normala si se numeste exces .

Definitia 3.4. Se numeste moda v. a. X acea valoare a v. a. pentrucare densitatea de probabilitate are valoare maxima.

Observatia 3.4. Daca X este o v. a. de tip continuu cu densitateade probabilitate f, atunci f 0(x

m) = 0, f 00(x

m) < 0.

Definitia 3.5. Numim mediana v. a. X acea valoare x0.5 a lui X pentru care

P (X ≤ x0.5) = 0.5.

Aceasta relatie se poate scrie, daca cunostem densitatea de proba-

bilitate, de forma F (x0.5) =

Z x0.5−∞

f (x)dx = 0.5, adica dreapta x = x0.5

împarte aria cuprinsa între graficul lui f si axa Ox în doua parti egale.

Page 103: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 103/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 101

Propozitia 3.2. (Inegalitatea lui Cebâ sev) Dac a variabila aleatoare X este de tip continuu cu media m si dispersia σ2, atunci are loc

P (|X − m| < ε) ≥ 1 − σ2

ε2, ∀ε > 0, (3.5)

sau echivalent

P (|X − m| ≥ ε) <σ2

ε2, ∀ε > 0.

Demonstratie. Dispersia este data de

σ

2

= Z ∞−∞(x − m)

2

f (x)dx =

=

Z m−ε−∞

(x − m)2f (x)dx +

Z m+ε

m−ε(x − m)2f (x)dx +

Z +∞m+ε

(x − m)2f (x)dx.

Din faptul ca x /∈ (m − ε, m + ε), rezulta (x − m)2 ≥ ε2 si dispersiapoate fi minorata prin

σ2 ≥ ε2µZ m−ε

−∞f (x)dx +

Z ∞m+ε

f (x)dx

¶= ε2

µ1 −

Z m+

m−εf (x)dx

¶,

deoarece∞

R −∞

f (x)dx = 1. Ultima paranteza se poate scrie

σ2 ≥ ε2 (1 − P (|X − m| < ε)) ,

care este echivalenta cu relatia (3.5). ¤

Problema 3.1. Timpul mediu de r aspuns al unui calculator este de 15 secunde pentru o anumit a opera tie, cu abaterea medie p˘ atratic a 3secunde. Estima ti probabilitatea ca timpul de r aspuns s a se abat a cu mai pu tin de 5 secunde fa t a de medie.

Rezolvare. Vom folosi inegalitatea lui Cebâsev. Avem

P (|X − 15| < 5) ≥ 1 −9

25 = 0.64. ♦

Definitia 3.6. Sirul X nn∈N converge în probabilitate catre X (vom

folosi notatia X nprob−→ X ) daca

∀ε > 0 : limn→∞

P (ω ∈ Ω | |X n(ω) − X (ω)| > ε) = 0 (3.6)

sau, echivalent,

∀ε > 0 : limn→∞

P (ω ∈ Ω | |X n(ω) − X (ω)| ≤ ε) = 1. (3.7)

Page 104: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 104/364

102 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Una din cele mai importante aplicatii ale convergentei în probabi-litate este forma slaba a legii numerelor mari a lui Bernoulli.

Corolarul 3.1. Fie X n un sir de v. a. având medie si dispersie astfelîncât lim

n→∞D [X n] = 0. Atunci X n − M [X n]

prob−→ 0 (convergenta în

probabilitate).

Demonstratie. Se stie ca sirul de v. a. (X n) converge în probabilitatecatre X daca ∀ε > 0, lim

n→∞P (|X n − X | ≥ ε) = 0.

În cazul acestui corolar avem aplicând inegalitatea lui Cebâsev,ε > 0, 0 ≤ lim

n→∞P (|X n − M [X n]| ≥ ε) ≤ lim

n→∞D[X n]ε2

= 0. Rezultatulse obtine aplicând lema clestelui. ¤

Teorema 3.4. (Forma slab a a legii numerelor mari a lui Bernoulli) Fie X n un sir de v. a. independente având aceea si medie si dispersiile egal majorate (adic a exist a C > 0 astfel încât ∀n ≥ 1, D [X n] ≤ C ).

Atunci ½

1

n(X 1 + · · · + X n)

¾prob−→ m (în probabilitate).

Demonstratie. Stim ca M [X i] = m, D [X i] ≤ C . Notam

Y n = 1n

(X 1 + · · · + X n) si, deoarece v. a. sunt independente, avemM [Y n] = m si

D [Y n] =1

n2D [X 1 + · · · + X n] ≤ 1

n2(D [X 1] + · · · + D [X n]) ≤ C

n→ 0.

Aplicând Corolarul 3.1 rezulta ca

Y n − M [Y n] =1

n(X 1 + · · · + X n) − m → 0

(convergenta în probabilitate). ¤

Observatia 3.5. Daca v. a. X n sunt identic distribuite si indepen-dente nu mai este necesara conditia ca dispersiile sa fie egal majorate.

Exemplul 3.1. Presupunem ca se efectueaza serii de experiente Ber-noulli cu P (A) = p. Pentru orice n notam

X n =

½1 daca la experimentul n se produce A0 daca la experimentul n nu se produce A

.

Page 105: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 105/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 103

Matricea de repartitie a lui X n este X n :µ1 0

p 1− p

¶, deci M [X n] = p,

D [X n] = p(1− p). Conform legii numerelor mari a lui Bernoulli rezulta

ca1

n(X 1 + · · · + X n) → p.

Dar X 1 + · · · + X n reprezinta numarul de realizari ale lui A dupaprimele n experimente, adica frecventa relativa lui A, notata în statis-

tica cu f n(A). Am aratat astfel ca f n(A)prob−→ p, deci un rezultat de

stabilitate statistica. ♦

Ca aplicatie la legea numerelor mari analizam urmatoarea prob-lema:

Problema 3.2. În dou a spitale, S1 si S2 sunt 20 si respectiv 200 de na steri pe zi. Num ar am într-un an zilele din fiecare spital în care s-au n ascut mai mult de 60% b˘ aie ti într-o zi. Care spital are mai multe astfel de zile, stiind c a probabilitatea de a se na ste o fat a sau un b˘ aiat este aceea si?

Rezolvare. Raspunsul la aceasta întrebare este legat de legea nu-merelor mari care spune ca probabilitatea este mai mare în S 1 deoarece

num˘

arul nasterilor într-o zifi

ind mai mare în S 2, frecventa relativ˘

aa numarului de baieti nascuti tinde catre probabilitatea de a se nasteun baiat, adica la 0.5.

Vom folosi simularea pentru a verifica acest raspuns. Notam cu 1nasterea unui baiat si cu 0 nasterea unei fete într-o zi. Pentru a calculaprocentul de baieti dintr-o lista de zile simulate cu nasteri, vom definifunctia f .

f[x_] := Module[sum,sum = Apply[Plus, x];boys = sum/Length[x] // N]

Putem simula modelul nasterilor copiilor cu o distributie Bernoullicu p = 0.5. Încarcam pachetul <<Statistics‘DiscreteDistributions‘ sisimulam 20 de nasteri pe zi pe parcursul a 365 de zile folosind Ran-domArray împreuna cu BernoulliDistribution. Datele obtinute vor finotate sp1 pentru spitalul S 1 si sp2 pentru spitalul S 2.

<< Statistics‘DiscreteDistributions‘sp1 = RandomArray[BernoulliDistribution[0.5], 365, 20];Short[sp1, 5]0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1,

Page 106: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 106/364

104 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1,<<361>>, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1,1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0

Comanda Short afiseaza 5 zile simulate si anume primele doua siultimele trei. Rezultatul din prima zi, de exemplu, îl interpretamastfel: s-au nascut doua fete, apoi un baiat, doua fete, patru baietietc.

Pentru a determina procentul de baieti din fiecare zi folosim Mappentru a aplica f listei sp1. Dupa ce încarcam pachetul <<Statistics‘DataManipulation‘, folosim BinCounts pentru a determina numarulzilelor în care s-au nascut mai mult de 60% baieti.

boys1 = Map[f, sp1];BinCounts[boys1,0,1,.1]0,3,15,76,116,108,40,7,0,0BinCounts[boys1,0.6,1,0.4]47Acelasi procedeu îl aplicam pentru simularea nasterilor din al doilea

spital.

sp2=RandomArray[BernoulliDistribution[0.5],365,200];

boys2=Map[f,sp2];BinCounts[boys2,0,1,.1]0,0,0,0,203,162,0,0,0,0BinCounts[boys2,0.6,1,0.4]0.

La o a doua simulare vom obtine

sp1=RandomArray[BernoulliDistribution[0.5],365,20];Short[sp1,5]1,0,1,1,1,1,1,1,0,0,0,1,1,0,0,1,0,0,0,1,1,0,0,1,1,1,1,1,0,1,1,0,1,1,0,0, 1,1,1,0,<<361>>,

1,1,1,1,0,1,1,0,1,0,1,1,0,0,0,0,0,1,1,1,1,1,1,0,0,1,1,0,1,0,0,0,1,0,0,0,1,1,0,0boys1=Map[f,sp1];BinCounts[boys1,0,1,.1]0,1,17,73,113,103,52,5,1,0BinCounts[boys1,0.6,1,0.4]58sp2=RandomArray[BernoulliDistribution[0.5],365,200];Take[sp2,2]

Page 107: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 107/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 105

0,1,1,0,0,0,1,0,1,0,0,0,0,1,1,0,1,0,0,0,1,1,1,0,1,0,0,0,0,1,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,1,1,0,0,1,0,0,0,1,0,1,0,1,1,0,1,1,1,1,0,0,1,1,0,0,1,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,1,0,0,1,0,0,1,0,1,0,1,0,1,1,1,0,0,0,1,1,0,0,1,1,1,1,1,1,0,0,1,1,0,0,0,0,0,0,0,0,1,0,0,1,1,1,1,1,0,0,1,1,1,1,1,0,0,1,0,1,1,0,0,1,1,0,1,0,0,0,0,1,1,0,0,1,0,0,1,0,1,1,0,1,0,0,0,1,0,0,0,0,0,1,0,1,0,1,1,0,0,1,0,1,0,1,1,0,0,1,1,1,1,0,0,0,1,0,0,0,0,0,0,1,0,1,0,1,0,0,0,0,1,0,1,1,0,0,0,0,0,1,0,0,1,0,1,0,1,0,1,0,1,0,0,0,1,1,1,0,1,1,1,1,0,0,0,1,0,1,1,0,1,0,1,1,0,0,0,1,0,0,0,1,1,1,1,1,1,1,0,1,0,1,1,0,1,0,1,0,0,0,1,0,1,1,0,1,0,0,1,0,0,0,0,0,0,1,1,0,1,0,1,1,0,1,1,0,0,0,1,0,0,1,0,0,1,1,1,1,0,1,0,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,0,1,0,0,0,0,0,1,1,1,0,1,0,1,1,0,0,0,1,1,0,1,0,0,0,1,1,0,1,0,1,0,1,1,0,1,1,1,1,0,1,1,1,0,0,0,0,0,0,1,1,0,0boys2=Map[f,sp2];BinCounts[boys2,0,1,.1]0,0,0,2,195,167,1,0,0,0BinCounts[boys2,0.6,1,0.4]1

3.4 Legi clasice de repartitie

3.4.1 V. a. distribuita uniform

Cea mai simpla v. a. continua este cea repartizata uniform.

Definitia 3.7. Se spune ca v. a. X este distribuita uniform pe inter-valul [a, b], a < b, notat X ∼ Unif [a, b], daca densitatea de probabil-itate este de forma

f X : R

→R, f X (x) = (

1

b−

a, daca x ∈ [a, b]

0, în caz contrar.

Teorema 3.5. Dac a v. a. X este distribuit a uniform pe intervalul [a, b], a < b, atunci

F X (x) =

0, dac a x < ax − a

b − a, dac a x ∈ [a, b]

1, dac a x > b

, M [X ] =a + b

2, D [X ] =

(b − a)2

12.

Page 108: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 108/364

106 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Demonstratie. Calculam functia de repartitie.

Pentru x < a ⇒ F X (x) =

Z x−∞

f X (t)dt = 0,

Pentu x ∈ [a, b] ⇒ F X (x) =

Z x−∞

f X (t)dt =

Z xa

1

b − adt =

x − a

b − a,

Pentru x > b ⇒ F X (x) =

Z x−∞

f X (t)dt =

Z ba

1

b − adt = 1, deci

F X (x) =

0, daca x < ax − a

b−

a, daca x ∈ [a, b]

1, daca x > b

.

M [X ] =

Z ∞−∞

xf (x) dx =

Z ∞−∞

x

b − adx =

a + b

2,

D [X ] =

Z ∞−∞

(x − M [X ])2 f (x)dx =

=

Z ba

µx − a + b

2

¶2 1

b − adx =

(b − a)2

12. ¤

Exemplul 3.2. Începând cu ora 5 dimineata la fiecare jumatate deora exista o cursa de la localitatea U la localitatea V. Presupunemca la fiecare cursa exista locuri libere în plus fata de cele rezervate.O persoana vrea sa se deplaseze de la localitatea U la localitatea V.Ea ajunge la un moment arbitrar între orele 8.45 si 9.45. Care esteprobabilitatea ca sa astepte:

a) cel mult 10 minute,b) cel putin 15 minute.

Rezolvare. Pentru ca persoana ajunge la un moment arbitrar lapunctul de plecare între orele 8.45 si 9.45, v. a. X care ia ca valori

momentul în care a ajuns persoana este distribuita uniform pe inter-valul [0, 60],

f (x) =

½160

, x ∈ [0, 60]0, x /∈ [0, 60]

.

a) pentru ca persoana sa astepte cel mult 10 minute trebuie saajunga cu 10 minute inainte de plecarea cursei, adica între orele 8.50 si9 sau 9.20 si 9.30. Aceasta înseamna ca 5 ≤ X ≤ 15 sau 35 ≤ X ≤ 45,

P (5 ≤ X ≤ 15 ∪ 35 ≤ X ≤ 45) =

Page 109: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 109/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 107

= P (5 ≤ X ≤ 15) + P (35 ≤ X ≤ 45) =Z 155

dx60

+Z 4535

dx60

=13

.

b) pentru ca persoana sa astepte cel putin 15 minute daca ajungela locul de plecare între orele 9 si 9.15 sau 9.30 si 9.45. Rezulta ca15 ≤ X ≤ 30 sau 45 ≤ X ≤ 60,

P (15 ≤ X ≤ 30 ∪ 45 ≤ X ≤ 60) =

= P (15 ≤ X ≤ 30) + P (45 ≤ X ≤ 60) =

Z 3015

dx

60+

Z 6045

dx

60=

1

2.♦

3.4.2 V. a. distribuita exponential

Definitia 3.8. O variabila aleatoare X este distribuita exponen tial cu parametrul λ > 0, si se scrie X ∈ Exp [λ] daca are densitatea deprobabilitate de forma

f : R→ R, f (x) =

½0, daca x ≤ 0

λe−λx, daca x > 0.(3.8)

53.752.51.250

5

3.75

2.5

1.25

0

xx

Figura 3.1.

În figura 3.1 sunt desenate graficele densitatilor de probabilitatepentru valorile parametrului λ = 1 (negru), 2 (verde) si 5 (rosu).

Denumirea de v. a. distribuita exponential provine de la faptulca densitatea de probabilitate este exprimata cu ajutorul unei functiiexponentiale. Lasam ca exercitiu demonstrarea urmatorului rezultat.

Teorema 3.6. Dac a X este o v. a. distribuit a exponen tial

F X (x) =

½0, dac a x ≤ 0

1 − e−λx, dac a x > 0,

Page 110: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 110/364

108 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

atunci M [X ] = 1λ

, D [X ] = 1λ2 .

În figura 3.2 sunt desenate graficele functiei de repartitie pentruvalorile parametrului λ = 1, 2 si 5.

52.50-2.5-5

1

0.75

0.5

0.25

0

x

y

x

y

Figura 3.2.

O proprietate importanta a distributiei exponentiale este legata deprobabilitatile conditionate si anume proprietatea acestei v. a. de anu avea memorie.

Exemplul 3.3. Fie X v. a. care ia ca valori timpul scurs intre douadetectari ale particulelor de catre contorul Geiger (acest contor de-tecteaza radiatiile naturale α,β,γ , masoara radioactivitatea mediuluiînconjurator). Aceasta v. a. urmeaza o distributie exponentiala cumedia M [X ] = 1.4 minute. Probabilitatea de a detecta o particulaîn decurs de 30 secunde (adica 0.5 minute) de la pornirea detectoruluieste

P (X ≤ 0.5) = F X (0.5) = 1 − e−0.51.4 = 0.3.

Facem un nou experiment si oprim contorul. Pornim din nou con-torul si asteptam trei minute f ara a detecta o particula. Care este

probabilitatea ca particula sa fie detectata în urmatoarele 30 de se-cunde?

Rezolvare. Probabilitatea ceruta este, tinând seama de definitiaprobabilitatilor conditionate,

P (X < 3.5 | X > 3) =P (3 < X < 3.5)

P (X > 3)=

=F X (3.5) − F X (3)

1 − F X (3)=

e−31.4 − e−

3.51.4

e−31.4

= 0.3.

Page 111: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 111/364

Page 112: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 112/364

110 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Proprietatea de pierdere a memoriei a distributiei exponentialene spune ca dispozitivele nu se uzeaza. Daca apar în functionareadispozitivelor unele uzari mecanice, nu mai poate fi modelat timpulde functionare a unui dipozitiv cu ajutorul acestei distributii si sefoloseste în practica o alta distributie si anume distributia Weibull.

3.4.3 V. a. distribuita Weibull

Distributia Weibull Weib(n,a,b), a ∈ R, b > 0, este utilizata în pescara larga în inginerie la modelarea numarului de defecte care apar

la diferite dispozitive care se uzeaza în timp, care descresc o data cutimpul (la unii semiconductori) sau care se produc datorita unor socuriexterioare sistemului. Aceasta distributie mai este folosita si în teoriasigurantei.

Definitia 3.9. V. a. X este distribuita Weibull , X ∈ Weib(a, b) dacaare densitatea de probabilitate

f (x) =

( a

b

¡xb

¢a−1e−(x

b )a

, x > 0

0, x ≤ 0.

Desenam graficul distributiei Weibull pentru valorile a = 1, b = 1(negru), a = 2, b = 3 (rosu), a = 2, b = 6 (verde), a = 3, b = 6(albastru) (figura 3.4).

107.552.50

1

0.75

0.5

0.25

0

yy

Figura 3.4.

Teorema 3.8. Dac a X ∈ Weib(a, b) atunci F X (x) = 1 − e−(xb )

a

,

M [X ] = bΓ

µ1 +

1

a

¶, D [X ] = b2Γ2

µ1 +

2

a

¶−µ

µ1 +

1

a

¶¶2

.

Page 113: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 113/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 111

Demonstratie. M [X ] =Z ∞0

x ab

³xb

´a−1e−(x

b )adx. Facem schim-

barea de variabila u =¡xb

¢a ⇒ x = (u)1a b, dx = 1

au1a−1bdu, de unde

rezulta ca

M [X ] =

Z ∞0

a

ba

³u

1a b´a

e−u1

au

1a−1bdu = b

Z ∞0

u1ae−udu = bΓ

µ1 +

1

a

¶.

Analog, folosind faptul ca D [X ] = M [X 2] − (M [X ])2 se obtineexpresia dispersiei. ¤

Exercitiul 3.2. Timpul de defectare în ore a unui sistem mecaniceste modelat cu ajutorul unei v. a. Weibull cu a = 2, b = 500 ore.Determinati timpul mediu pâna la prima defectare.

Rezolvare. Din expresia mediei rezulta ca

M [X ] = bΓ

µ1 +

1

a

¶= 500 · Γ(

3

2) = 500 ·

1

2Γ(

1

2) = 250

√ π = 443.11.

Sa determinam probabilitatea ca defectarea sa se produca dupa 500de ore.

P (X > 500) = 1 − P (X ≤ 500) = 1 − F X (500) = e−1 = 0.36788.

Concluzia: doar 36% din sisteme se defecteaza dupa 500 de ore.Graficul densitatii de probabilitate în acest caz este prezentat în figu-ra 3.5. ♦

10007505002500

0.0015

0.00125

0.001

0.00075

0.0005

0.00025

0

x

y

x

y

Figura 3.5.

Observatia 3.6. Pentru a = 1, b = 1 se obtine distributia expo-nentiala.

Page 114: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 114/364

112 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

3.4.4 V. a. distribuita gama

O generalizare a distributiei exponentiale este distributia gama.Reamintim functia gama si câteva proprietati ale acesteia.

Se numeste functie gama , functia Γ( p)=

Z ∞0

x p−1e−xdx, unde p > 0.

Functia are proprietatea Γ( p) = ( p − 1)Γ( p − 1). Daca p ∈ N atunciΓ( p) = ( p−1)!. Functia gama poate fi interpretata ca o generalizare afactorialului pentru valori reale pozitive. De asemenea Γ(1) = 0! = 1,Γ

¡12¢

=√

π.

Definitia 3.10. O variabila aleatoare X este distribuit a gama cuparametrii λ si p, X ∈ Gama [ p, λ] daca are densitatea de probabilitatede forma:

f X (x) =

λ px p−1e−λx

Γ( p), x > 0

0, x ≤ 0.

Graficul densitatii de probabilitate pentru functia gama si pentrudiferite valori ale lui λ si p este prezentat în figura 3.6, λ = 1, p = 1(negru), λ = 2, p = 2 (rosu), λ = 1.5, p = 2 (verde).

53.752.51.250

1

0.75

0.5

0.25

0

xx

Figura 3.6.

Pentru p = 1 se obtine distributia exponentiala, Gama [1, λ] =Exp [λ].

Teorema 3.9. Dac a X este o v. a. distribuit a gama, atunci

M [X ] =p

λ, D [X ] =

p

λ2 .

Page 115: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 115/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 113

Demonstratie.

M [X ] =

Z ∞−∞

xf (x)dx =1

Γ( p)

Z ∞0

x · λ px p−1e−λxdx =

=1

Γ( p)

Z ∞0

(λx) p e−λxdx =1

Γ( p)

Z ∞0

t pe−tdt

λ=Γ( p + 1)

λΓ( p)=

p

λ,

Rezultat se obtine, facând schimbarea de variabila λx = t, λdx =dt. Pentru dispersie folosim relatia D [X ] = M [X 2] − (M [X ])2. Dar

M £X 2¤ = Z ∞

−∞x2f (x)dx =

1

Γ( p) Z ∞

0

x2 · λ px p−1e−λxdx =

=1

λΓ( p)

Z ∞0

(λx) p+1 e−λxdx =1

λΓ( p)

Z ∞0

t p+1e−tdt

λ=

=Γ( p + 2)

λ2Γ( p)

=p( p + 1)

λ2 .

De aici rezulta ca D [X ] =p( p + 1)

λ2 −³ p

λ

´2=

p

λ2 . ¤

Distributia gama este folosita pentru a modela timpul de functio-nare a unor aparate. Este utilizata pentru a modela diferite situatii

fizice, de exemplu timpul de asteptare.Pentru λ = 12

si p = 12

, 1, 32

, 2, . . . se obtin diferite cazuri particulareale distributiei χ2 (hi-patrat) care este folosita în statistica pentru de-terminarea intervalelor de încredere si verificarea ipotezelor statisticede care ne vom ocupa în capitolele urmatoare.

3.4.5 V. a. distribuita normal

Definitia 3.11. O v. a. continua X este distribuita normal cu parame-trii m si σ > 0, si se scrie X ∈ N [m, σ] daca densitatea de probabi-litate este

f : R→ R, f (x) = 1σ√

2πe−

(x−m)22σ2 . (3.9)

Exercitiul 3.3. Sa se verifice ca functia definita de (3.9) are propri-etatile densitatii de probabilitate.

Rezolvare. 1. Observam ca f (x) ≥ 0, ∀x ∈ R.2. Facând schimbarea de variabila x−m = σy si folosind integrala

cunoscuta∞R −∞

e−y2

2 dz =√

2π, se obtine ca∞R −∞

f (x)dx = 1. ♦

Page 116: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 116/364

114 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Folosind aceeasi schimbare de variabila la calculul integralelor careapar în definitia mediei si dispesiei obtinem ca M [X ] = m, D[X ] = σ2.

Graficul lui f este reprezentat în figura 3.9 pentru valorile lui msi σ specificate. Se constata ca acesta este simetric fata de dreaptax = m, pentru x = m functia f are maxim egal cu f (m) = 1

σ√ 2π

, iarpunctele m±σ sunt puncte de inflexiune. Pentru σ constant si m vari-abil, graficul se transleaza corespunzator. Daca m este constant, iar σvariabil se constata ca punctul de maxim variaza invers proportionalîn raport cu σ. În figura 3.9 este desenat graficul densitatii de pro-babilitate normale pentru m = 0, σ2 = 0.2 (visiniu), m = 0, σ2 = 1

(rosu), m = 0, σ2 = 0.5 (verde), m = 0, σ2 = 5 (mustar), m = 3,σ2 = 5 (galben) si m = 3, σ2 = 1 (albastru).

107.552.50-2.5-5

0.8

0.6

0.4

0.2

0

x

y

x

y

Figura 3.9.

Daca m = 0 si σ = 1 atunci scriem X ∈ N [0, 1] si numim o astfelde v. a. normala standard sau normala redus a .

Consideram urmatoarea functie cunoscuta

Φ : R

→R, Φ(x) =

1

√ 2π Z x

−∞e−

12t2dt (3.10)

numita functia lui Laplace.Fie X o v. a. distribuita normal cu media nula si dispersia 1.

Atunci, conform relatiei (3.9), densitatea de probabilitate a lui X este

f (x) =1√ 2π

e−12x2 (graficul ei este reprezentat în figura 3.10), deci

functia de repartitie a lui X va fi, conform relatiei (3.2),

F (x) =1√ 2π

Z x−∞

e−12t2dt = Φ(x), ∀x ∈ R.

Page 117: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 117/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 115

52.50-2.5-5

0.3

0.2

0.1

0

x

y

x

y

Figura 3.10.Observam ca

M £

(X − 0)3¤

= 1√ 2π

∞R −∞

(t − 0)3 e−12 t

2dt = 0.0 ⇒ graficul este

simetric.

M £

(X − 0)4¤

=1√ 2π

∞R −∞

t4e−12 t

2dt = 3.0.

Graficul functiei de repartitie este, pentru aceleati valori ca aledensitatii de probabilitate, m = 0, σ2 = 0.2; m = 0, σ2 = 1; m = 0,σ2 = 0.5; m = 0, σ2 = 5; m = 3, σ2 = 5 si m = 3, σ2 = 1 (figura 3.11).

107.552.50-2.5-5

1

0.75

0.5

0.25

0

x

y

x

y

Figura 3.11.

Observatia 3.7. Observam caΦ(x) este aria dintre curba y = 1√ 2π

e−12x2

si axa Ox pâna la punctul de abscisa x, iar întreaga arie de sub clopoteste egala cu 1. Datorita simetriei graficului se observa, din figura3.10, ca aria cuprinsa între curba si axa Ox, de la −∞ pâna la −xeste egala cu aria cuprinsa între curba si axa Ox, de la x pâna la ∞.Rezulta ca

Φ(−x) = 1 −Φ(x), (3.11)

relatie care ne va fi utila într-o serie de aplicatii.

Page 118: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 118/364

116 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Deci Φ(x) este functia de repartitie a unei v. a. distribuita normalX ∈ N [0, 1]. Din cauza importantei în statistica a acestei functii ease gaseste tabelata. Tabelul din Anexa 1 furnizeaza valorile functieide repartitie pentru distributia normala standard, Φ(x) = P (X ≤ x).Urmatorul exemplu ilustreaza modul în care se foloseste tabelul.

Exemplul 3.5. Fie X ∈ N [0, 1] . Sa se calculeze P (X ≤ 1.5) . Se ur-mareste în coloana lui x valoarea 1.5. Probabilitatea se va citi pe liniacorespunzatoare valorii 1.5, pe coloana etichetata 0.00, adica 0.933193.Pentru calculul P (X ≤ 1.53) se va citi probabilitatea de pe linia lui

1.5, coloana etichetata cu 0.03 (1.53 = 1.5 + 0.03) , adica 0.936992.Probabilitatile care nu sunt de forma P (X ≤ x) se calculeaza folosindregulile de baza ale probabilitatilor si simetria distributiei normalestandard. Pentru valorile negative se tine seama de formula (3.11).

Graficul functiei Φ este prezentat în figura 3.12.

52.50-2.5-5

1

0.75

0.5

0.25

0

x

y

x

y

Figura 3.12.

Avem limn→∞

Φ(x) = 1, limn→−∞

Φ(x) = 0.

Exercitiul 3.4. Daca X ∈ N [m, σ] atunci Y = 1σ

(X − m) ∈ N [0, 1].

Rezolvare. Exprimam functia de repartitie a v. a. Y cu ajutorulfunctiei de repartitie a v. a. X

F Y (x) = P (Y ≤ x) = P

µ1

σ(X − m) ≤ x

¶=

= P (X ≤ m + xσ) = F X (m + xσ) .

Page 119: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 119/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 117

Densitatea de probabilitate a lui Y va fi

f Y (x) = f X (m + xσ)σ =1

σ√

2πe−

(m+xσ−m)2

2σ2 σ =1√ 2π

e−x2

2 ,

deci Y va fi repartizata normal standard. ♦

Teorema 3.10. Fie X ∈ N [0, 1] si a < b.Atunci

P (a < X ≤ b) = Φ(b) −Φ(a),

iar dac a X

∈N [m, σ] atunci

P (a < X ≤ b) = Φ

µb − m

σ

¶−Φ

µa − m

σ

¶. (3.12)

Demonstratie. Folosim Teorema 3.2 si tinem seama de definitia luiΦ (x). Pentru partea a doua tinem seama de exercitiul 3.4. ¤

Teorema 3.11. Dac a X ∈ N [m, σ] atunci

P (m − σ ≤ X ≤ m + σ) ≈ 0.6827,

P (m − 2σ ≤ X ≤ m + 2σ) ≈ 0.9545,

P (m − 3σ ≤ X ≤ m + 3σ) ≈ 0.9973,

deci aproape sigur valorile lui X sunt cuprinse în intervalul [m − 3σ, m + 3σ] (Regula celor trei sigma).

Demonstratie. Demonstram ultima relatie. Celelalte relatii se demon-streaza analog. Folosim formula (3.12) si obtinem:

P (m − 3σ ≤ X ≤ m + 3σ) = Φ¡m+3σ−m

σ

¢−Φ ¡m−3σ−mσ

¢=

= Φ(3) −Φ(−3) = 0.998650 − 0.001350 = 0.9973. ¤

<<Statistics‘ContinuousDistributions‘N[CDF[NormalDistribution[0,1],1]-CDF[NormalDistribution[0,1],-1]]0.682689N[CDF[NormalDistribution[0,1],2]-CDF[NormalDistribution[0,1],-2]]0.9545CDF[NormalDistribution[0,1],3]-CDF[NormalDistribution[0,1],-3]12

³1 + Erf

h3√ 2

i´− 1

2Erf

h3√ 2

iN[%]0.9973

Page 120: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 120/364

118 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Exercitiul 3.5. Sa presupunem ca dimensiunea admisibila a diame-trelor d ale unor piese circulare este 10 − 12 mm si ca pentru un lotde piese diametrul mediu este m = 11.4 mm, iar abaterea medie pa-tratica este σ = 0.7 mm. Ne propunem sa determinam probabilitateade a avea, în acel lot, piese cu diametru ≤ 10 mm si probabilitatea dea avea, în acel lot, piese cu diametru > 12 mm.

Rezolvare.

d ∈ N [11.4; 0.7] ⇒ P (d ≤ 10) = Φ

¡10−11.4

0.7

¢= Φ(−2) = 0.02275

P (d> 12)=1−Φ ¡12−11.40.7 ¢= 1

−Φ(0.85714)=1

−0.80432=0.19568.♦

Densitatea de probabilitate în acest caz este f (x)= 10.7√ 2π

e−(x−11.4)2

2·0.72

cu graficul desenat mai jos:

1412108

0.5

0.375

0.25

0.125

0

x

y

x

y

Figura 3.13

Secventa urmatoare calculeaza probabilitatile din exercitiu cu Mathe-matica.

<<Statistics‘ContinuousDistributions‘CDF[NormalDistribution[11.4,0.7],10]0.02275011-CDF[NormalDistribution[11.4,0.7],12]0.195683. ♦

Exercitiul 3.6. Intensitatea curentului care trece printr-o bobinaurmeaza o distributie normala cu media de 10 miliamperi si dispersiade 4 miliamperi. Care este probabilitatea ca intensitatea sa depaseasca13 miliamperi? Care este probabilitatea ca intensitatea curentului safie cuprinsa între 9 si 11 miliamperi? Sa se determine valoarea c aintensitatii curentului pentru care P (X < c) = 0.98.

Page 121: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 121/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 119

Rezolvare. Fie X valoarea intensitatii în miliamperi, X ∈ N [10; 2] .Se cere probabilitatea

P (X > 13) = 1−Φ¡13−102

¢= 1−Φ(1.5) = 1−0.93319 = 0.06681.

P (9 < X < 11) = Φ¡11−10

2

¢−Φ ¡9−102

¢= Φ (0.5) −Φ (−0.5) =

= 0.691462 − 0.308538 = 0.382 92.

P (X < c) = 0.98 ⇒ Φ¡c−102

¢= 0.98.

Utilizând tabelul functiei Laplace obtinem c−102

=2.06⇒c =14.12.

<< Statistics‘ContinuousDistributions‘1 - CDF[NormalDistribution[10, 2], 13]

1 + 12

³−1 − Erf

h3

2√ 2

i´N[%]0.0668072CDF[NormalDistribution[10,2],11]-CDF[NormalDistribution[10,2],9]12

³−1 + Erf

h1

2√ 2

i´+ 1

2

³1 + Erf

h1

2√ 2

i´N[%]0.382925Quantile[NormalDistribution[10,2],0.98]

14.1075. ♦Distributia normala este folosita pentru a aproxima multe alte dis-

tributii si, la rândul lor, alte distributii sunt utilizate pentru a aprox-ima distributia normala. Distributia normala apare adesea în modeleprobabilistice din lumea reala. Multe masuratori privind durata deviata a organismelor sau a diferitelor aparate urmeaza o distributienormala.

3.4.6 Functia caracteristica

Definitia 3.12. Fie X o v. a. cu densitatea de probabilitate f . Functia

ϕX (t) = M £

e jtX ¤

=

Z ∞−∞

e jtxf (x)dx,

se numeste func tia caracteristic a corespunzatoare v. a. X .

Teorema 3.12. Dac a X este o v. a. cu func tia caracteristic a ϕX (t),atunci

1. ϕX (0) = 1,

Page 122: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 122/364

120 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

2. ϕX (t) =∞Xn=0

M [X n]

n!( jt)n, M [X n] =

ϕ(n)(0)

jn, unde M [X n]

reprezint a momentul ini tial de ordin n.3. Dac a a, b ∈ R⇒ ϕaX +b(t) = e jbtϕX (at).4. Dac a X si Y sunt v. a. independente, atunci ϕX +Y (t) =

ϕX (t)ϕY (t).

Demonstratie. 1. ϕX (0) =∞R −∞

e j0xf (x)dx =∞R −∞

f (x)dx = 1.

2. Folosim dezvoltarea în serie a functiei exponentiale e jtx si se

înlocuieste în definitia functiei generatoare,

ϕX (t) =

Z ∞−∞

f (x)dx +jt

1!

Z ∞−∞

xf (x)dx +( jt)2

2!

Z ∞∞

x2f (x)dx + · · · +

+( jt)n

n!

Z ∞∞

xnf (x)dx + · · · =∞Xn=0

( jt)n

n!M [X n] .

3. ϕaX +b(t) =∞R −∞

e jtax+ jtbf (x) = e jtb∞R −∞

e jtaxf (x) = ebtϕX (at).

4. ϕX +Y (t) = M £e jt(X +Y )¤ = M £e jtX e jtY ¤ = M £e jtX ¤M £e jtY ¤ =

ϕX (t)ϕY (t), unde am tinut seama de independenta v. a. care a permisscrierea relatiei relativ la medie. ¤

Exercitiul 3.7. Sa se determine functia caracteristica pentru v. a.X ∈ Exp [λ].

Rezolvare.

ϕX (t) =

Z ∞−∞

e jtxλeλxdx = λ

Z ∞0

e( jt−λ)xdx =λe( jt−λ)x

jt − λ

¯¯∞0

t − λ

deorece λ > 0 si ¯e( jt−λ)x¯ = |e jtx| ¯e−λx¯ = e−λxx→∞

→0. ♦

Exercitiul 3.8. Sa se determine functia caracteristica pentru v. a.X ∈ Gama [ p, λ] .

Rezolvare.

ϕX (t) =

Z ∞−∞

e jtxϕX (t) =λ p

Γ( p)

Z ∞−∞

e jtxx p−1e−λxdx =

=λ p

Γ( p)

Z ∞−∞

e( jt−λ)xx p−1dx.

Page 123: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 123/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 121

Facem schimbarea de variabila u = − ( jt − λ) x si obtinem

ϕX (t) =λ p

Γ( p)

Z ∞−∞

e−uu p−1

(λ − jt) pdx =

λ p

(λ − jt) p.

Sa calculam media si dispersia cu ajutorul functiei caracteristice.

ϕ0X (t) =

µλ p

(λ− jt) p

¶0

=pλ p j

(λ− jt) p+1 ⇒ ϕ0X (0) =

pj

λ⇒ M [X ] =

p

λ.

ϕ00X (t) =

p( p + 1)λ p j2

(λ−

jt) p+2 ⇒ M £X 2¤ =p( p + 1)

λ2

D [X ] = M £

X 2¤− (M [X ])2 =

p

λ2 . ♦

Pachetul din Mathematica <<Statistics‘ContinuousDistributions‘contine comenzi pentru a lucra cu urmatoarele distributii continue:beta, Cauchy, hi-patrat, exponentiala, Student, gama, normala, log-normala, Pareto, Rayleigh, uniforma, Weibull etc.

Informatii despre o anumita distributie putem afla utilizând HelpBrowser ca si o serie de functii care opereaza cu ele. Prezentam osecvebnta de program în Mathematica prin care obtinem o serie de

informatii despre repartitia normal˘

a (de exemplu).<<Statistics‘ContinuousDistributions‘Domain[NormalDistribution[3,2]]Interval[−∞,∞]PDF[NormalDistribution[3,2],x]

e−18 (−3+x)2

2√

2πCDF[NormalDistribution[3,2],x]12

³1 + Erf

h−3+x2√ 2

i´CharacteristicFunction[NormalDistribution[3,2],z]

e3iz−2z2

Mean[NormalDistribution[3,2]]3Variance[NormalDistribution[3,2]]4StandardDeviation[NormalDistribution[3,2]]2Quantile[NormalDistribution[0,1],0.5]0

Page 124: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 124/364

122 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Exemplul 3.6. Fie X ∈ Pois [λ] si Y ∈ Pois [µ], variabile aleatoareindependente. Demonstrati ca X + Y ∈ Pois [λ + µ].

Rezolvare. Determinam functia caracteristica a lui X ∈ Pois [λ].

ϕX (t) = M £

e jtX ¤

=∞Xk=0

e jtke−λλk

k!= e−λ

∞Xk=0

(e jtλ)k

k!= eλ(ejt−1).

Deoarece v. a. sunt independente

ϕX +Y

(t) = ϕX

(t)ϕY

(t) = eλ(ejt−1)eµ(ejt−1) = e(λ+µ)(ejt−1).

Deoarece functia caracteristica determina complet functia de repartitierezulta ca X + Y este o variabila Poisson de parametru λ + µ. ♦

Exemplul 3.7. Sa se determine functia caracteristica pentru v. a.X ∈ N [m, σ] .

Rezolvare.

ϕX (t) = M

£e jtX

¤=

1

σ√

2π Z ∞

−∞e jtxe−

(x−m)2

2σ2 dx.

Facem schimbarea de variabila y = x − mσ

⇒ dx = σdy

ϕX (t) =1

σ√

Z ∞−∞

e jt(m+σy)−y2

2 σdy =e jtm√

Z ∞−∞

e−y2−2jtyσ+j2t2σ2

2 e−t2σ2

2 dy =

=e jtm−

t2σ2

2√ 2π

Z ∞−∞

e−(y−jtσ)2

2 dy = e jtm−t2σ2

2 .

Am folosit

Z ∞

−∞e−

(y−jtσ)2

2 dy = Z ∞

−∞e−

u2

2 du =√

2π.

Cunoscând functia caracteristica se pot determina:

M [X ] =ϕ0X (0)

j= m, M

£X 2¤

=ϕ00X (0)

j2= m2 + σ2,

D [X ] = M £

X 2¤− (M [X ])2 = σ2. ♦

Exemplul 3.8. Fie X ∈ N [m1, σ1] si Y ∈ N [m2, σ2] doua v. a.

independente. Atunci X + Y ∈ N h

m1 + m2,p

σ21 + σ2

2

i.

Page 125: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 125/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 123

Rezolvare.

ϕX (t) = e jtm1− t2σ212 , ϕY (t) = e jtm2− t2σ22

2 ,

ϕX +Y (t) = ϕX (t)ϕY (t) = e jtm1− t2σ212 e jtm2− t2σ22

2 =

= e jt(m1+m2)−t2(σ21+σ22)

2 = e jtm−t2σ2

2

cu m = m1 + m2, σ =p

σ21 + σ2

2. ♦

Exemplul 3.9. Dac˘

a X 1, X 2, . . . , X n sunt V. a. in dependente, nor-male de tip N [m, σ] , atunci 1n

(X 1 + X 2 + · · · + X n) este o v. a. nor-

mala, 1n

(X 1 + X 2 + · · · + X n) ∈ N h

m, σ√ n

i.

Rezolvare. Ca în Exemplul 3.8 gasim

ϕX 1+X 2+···+X n(t) = e jtnm−t2nσ2

2 .

Folosind Teorema 3.12, punctul 3,

ϕ 1n(X 1+X 2+···+X n)(t) = ϕX 1+X 2+···+X n

¡ tn¢ = e jtm−

t2σ2

2n = e jtm−1

2(σ

n)

2

t2

. ♦

3.4.7 V. a. distribuita hi-patrat χ2(n)

Definitia 3.13. O variabila aleatoare X este distribuita hi-p˘ atrat cu n grade de libertate , X ∈ χ2(n) daca are densitatea de probabilitatede forma:

f (x) =

1

2n2Γ

¡n2

¢xn2−1e−

x2 , x > 0

0, x

≤0

.

Pentru aceasta v. a. avem M [X ] = n, D [X ] = 2n.Graficul densitatii de probabilitate pentru functia χ2 cu n grade

de libertate, n = 1 (negru), n = 4 (maro), n = 10 (rosu) si n = 20(albastru) este prezentat în figura 3.7. Valorile functiei de repartitiesunt tabelate, în functie de gradele de libertate.

Exemplul 3.10. Sa se determine functia caracteristica a v. a. dis-tribuita χ2(n).

Page 126: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 126/364

124 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

2520151050

0.3

0.2

0.1

0

x

y

x

y

Figura 3.7.

Rezolvare. Fie X ∈ χ2(n).

ϕX (t) =1

2n2Γ¡n2

¢ Z ∞0

e jtxxn2−1e−

x2 dx =

1

2n2Γ¡n2

¢ Z ∞0

xn2−1e−

1−2jt2 xdx.

Facem schimbarea de variabila u =2 jt − 1

2x ⇒ x =

2

1 − 2 jtu ⇒

dx =2

1

−2 jt

du.

ϕX (t) =1

2n2Γ¡n2

¢ Z ∞0

µu

2

1 − 2 jt

¶n2−1

e−u2

1 − 2 jtdu =

=1

(1 − 2 jt)n2 Γ

¡n2

¢ Z ∞0

un2−1e−udu =

1

(1 − 2 jt)n2

. ♦

La distributia χ2(n) se poate ajunge plecând de la distributii nor-male:

Propozitia 3.3. Fie n v. a. X 1, X 2, . . . , X n independente, care urmeaz a

o distribu tie normal a standard, N [0, 1]. Atunci v. a. Y =nPi=1

X 2i ∈χ2(n) (urmeaz a o distribu tie hi-p˘ atrat cu n grade de libertate).

Demonstratie. Fie F i functia de repartitie a v. a. X 2i . Avem:

F i(x) = P ¡

X 2i ≤ x¢

= P ¡−√

x ≤ X i ≤ √ x¢

=

=1√ 2π

Z √ x−√ x

e−t2

2 dt =2√ 2π

Z √ x0

e−t2

2 dt.

Page 127: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 127/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 125

Prin derivare determinam densitatile de probabilitate ale lui X 2i ,

f i(x) = F 0i (x) =2√ 2π

e−x2

1

2√

x=

1

Γ¡12

¢x−12 e−

x2 ,

deci X 2i ∈ χ2(1).Deoarece X 21 , X 22 , . . . , X 2n sunt independente, rezulta ca

ϕX 21+X 22+···+X 2n(t) = ϕX 21

(t)ϕX 22(t) · · · ϕX 2n

(t) =

= (1 − 2it)−12 · · · (1 − 2it)−

12 = (1 − 2it)−

n2

care este tocmai functia caracteristica a unei v. a. care urmeaza odistributie hi-patrat cu n grade de libertate. ¤

Distributia hi-patrat se întâlneste în statistica la testarea ipotezelorstatistice.

3.4.8 V. a. distribuita Student

Definitia 3.14. O v. a. X este distribuita Student cu n grade de liber-tate , X ∈ T (n) (notatie consacrata), daca densitatea de probabilitateeste

f (x) =

Γµn + 1

Γ

³n

2

´√ nπ

µ1 +

x2

n

¶−n+12

, x ∈ R.

Pentru aceasta v. a. avem M [X ] = 0, D [X ] =n

n − 2, n > 2.

Graficul densitatii de probabilitate pentru functia Student cu ngrade de libertate, n = 1, n = 5 si n = 12 este prezentat în figura 3.8.

52.50-2.5-5

0.3

0.2

0.1

0

x

y

x

y

Figura 3.8.

Page 128: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 128/364

126 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

În aparenta, graficul distributiei Student este similar distributieinormale standard: amândoua sunt simetrice si unimodulare, maximuleste atins în x = 0. Daca n → ∞ distributia Student aproximeazadistributia normala standard.

În Capitolul 5, Exemplul 5.3, vom demonstra ca o v. a. distribuitaStudent este raportul dintre o v. a. distribuita normal standard si o

v. a. de formaq

Y n

unde Y ∈ χ2(n). În Capitolul 8 vom prezentamodul de calcul, cu ajutorul tabelelor, a valorilor functiei de repartitieStudent.

Cea mai importanta aplicatie a distributiei Student este în statis-tica la construirea ipotezelor statistice si a intervalelor de încrederepentru medie pentru una sau mai multe populatii. În practica, chiardaca populatiile nu urmeaza o distributie normala, se obtin rezultatebune daca media distributiilor urmeaza aproximativ o distributie nor-mala.

3.4.9 Functii de v. a.

Consideram cazul în care v. a. X este discret a si notam P (X = x)=f X (x). Fie Y =h(X ) functia bijectiva care stabileste legatura dintre

valorile lui X si Y . Fie x = h−1(y) solutia unica a ecuatiei y = h(x).V. a. Y va lua valorile y când X va lua valorile x = h−1(y). Atunci

f Y (y) = P (Y = y) = P (X = h−1(y)) = f X (h−1(y)).

Exercitiul 3.9. Fie X o variabila aleatoare distribuita geometric încare P (X = k) = p (1 − p)k−1, k = 1, 2, 3, . . .. Ne intereseaza dis-tributia lui X 2.

Rezolvare. Notam f X (k) = p (1 − p)k−1. Deoarece X ≥ 0, functiay = x2 este bijectiva pentru x ≥ 0 ⇒ x =

√ y ⇒ h−1(y) =

√ y.

f Y (y) = f ¡h−1(y)¢ = p (1 − p)√ y , y = 0, 1, 4, 9, 16, . . . ♦

Consideram cazul în care v. a. X este continu a. Fie X v. a. avândfunctia de repartitie F X . Daca Y = h(X ) este o functie bijectiva,atunci functia de repartitie a v. a. Y este complet determinata. Fiex = h−1(y) solutia unica a ecuatiei y = h(x). Într-adevar, daca h estestrict crescatoare, atunci:

F Y (y) = P (Y < y) = P (h(X )< y) = P ¡

X < h−1(y)¢

= F X

¡h−1(y)

¢.

Page 129: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 129/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 127

Daca h este strict descrescatoare, atunci:

F Y (y) = P (Y < y) = P (h(X ) < y) = P ¡

X > h−1(y)¢

=

= 1 − F X

¡h−1(y) + 0

¢.

Teorema 3.13. Fie h : R→ R este o func tie monoton a, derivabil a si h0(x) 6= 0, deci ecua tia h(x) = y are solu tia unic a x = h−1(y). Atunci densitatea de probabilitate a v. a. Y = h(X ) este:

f Y (y) = f X (h−1(y)) ¯¡h−1(y)¢0

¯ .

Demonstratie. Daca h este monoton crescatoare atunci

f Y (y) =dF Y (y)

dy=

d (F X (h−1(y)))

dy=

dF X (h−1(y))

dy

d (h−1(y))

dy=

= f X (h−1(y))¡

h−1(y)¢0

,

iar daca h este monoton descrescatoare atunci

f Y (y) =dF Y (y)

dy=

d (1 − F X (h−1(y)))

dy=

= −dF X (h−1(y))

dy

d (h−1(y))

dy= −f X (h−1(y))

¡h−1(y)

¢0. ¤

Exercitiul 3.10. Fie X ∼ Unif [0, 1] si Y = 3X . Care este densitateade probabilitate a v. a. Y ?

Rezolvare. X are densitatea de probabilitate data de

f X (x) =

½1, daca x ∈ [0, 1]0, în caz contrar

,

Y = h(X ) = 3X , unde h(x) = 3x, h0(x) = 3 > 0 ⇒ h functie continuasi monoton crescatoare, deci bijectiva. Rezulta ca

F Y (y) = P (Y < y) = P (3X < y) = P ³

X <y

3

´= F X

³y

3

´⇒

f Y (y) = F 0Y (y) =³

F X

³y

3

´´0= f X

³y

3

´ 1

3=

( 1

3, daca y ∈ [0, 3]

0, în caz contrar..

De aici rezulta ca Y ∼ Unif [0, 3]. ♦

Page 130: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 130/364

128 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Exercitiul 3.11. Fie X ∼ Unif [1, 2] si Y = 1X

. Care este densitatea

de probabilitate a v. a. Y ?

Rezolvare. Y = h(X ) =1

X , unde h(x) =

1

x, h0(x) = − 1

x2< 0 ⇒

h functie monoton continua si descrescatoare, deci bijectiva ⇒ x =1

y.

F Y (y) = P (Y <y) = P

µ1

X <y

¶= P

µX >

1

y¶= 1 − F X µ

1

y+ 0

¶⇒

f Y (y) = F 0Y (y) =

µ1 − F X

µ1

y+ 0

¶¶0

= −f X

µ1

y

¶µ1

y

¶0

=

=

1

y2, daca

1

2≤ y ≤ 1

0, în caz contrar.. ♦

Observatia 3.8. Daca X este o v. a. continua si h este o functie

continua, stim ca Y = h(X ) este o v. a. si M [h(X )] =∞

R −∞h(x)f (x)dx.

3.4.10 Repartitia lognormala

Daca X este o v. a. care urmeaza o distributie normala, intereseazadistributia v. a. Y = eX . În acest caz se spune ca Y urmeaza odistributie lognormala. Numele vine de la transformarea X = ln Y ,adica logaritmul natural al lui Y urmeaza o distributie normala.

Facem obervatia ca domeniul lui Y este (0, ∞). Daca X ∈ N [m, σ]atunci

F Y (y) = P (Y ≤y)=P ¡

eX ≤y¢

=P (X ≤ ln(y))=F X (ln y)=Φ¡ ln y−m

σ

¢.

Densitatea de probabilitate este

f Y (y) = f X (ln y)1

y=

1

yσ√

2πe−

(ln y−m)2

2σ2 , 0 < y < ∞.

În acest caz M [X ] = em+σ2

2 , D [X ] = e2m+σ2³

eσ2 − 1

´.

Page 131: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 131/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 129

53.752.51.25

0.8

0.6

0.4

0.2

0

x

y

x

y

Figura 3.14.Este trasat graficul pentru m = 1, σ = 1 (negru), m = 1, σ = 0.5

(rosu), m = 0, σ = 1 (verde), m = 0, σ = 1.5 (albastru).

Problema 3.3. Durata de via t a a unui laser cu semiconductori urmea-z a o distribu tie lognormal a cu m = 10 ore si σ = 1.5 ore. Care este probabilitatea ca durata de via t a s a dep˘ a seasc a 10000 ore? Care este durata de via t a satisf acut a cu o probabilitate de 0.99?

Rezolvare. Fie X variabila aleatoare care ia ca valori durata de viata

în ore a unui laser cu semiconductori si care urmeaza o distributielognormala cu m = 10 ore si abaterea medie patratica σ = 1.5 ore.

P (X > 10000) = 1 − P (X ≤ 10000) = 1 −Φ ¡ ln10000−101.5

¢=

= 1 −Φ (−0.52644) = 1 − 0.2993 = 0.7007.

Determinam x astfel încât P (X > x) = 0.99. Avem

1 −Φ

¡lnx−10

1.5

¢= 0.99 ⇒ Φ

¡lnx−10

1.5

¢= 0.01 ⇒

⇒lnx−10

1.5

≈ −2.3263

⇒x

≈672.2.

Deci, cu probabilitatea de 0.99 durata de viata a laserului va depasi672.2 ore.

<<Statistics‘ContinuousDistributions‘

1-CDF[LogNormalDistribution[10,1.5],10000]0.700709Quantile[LogNormalDistribution[10,1.5],0.01]672.148 ♦

Page 132: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 132/364

130 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

3.5 Fiabilitate

În sensul cel mai larg, fiabilitatea reprezinta proprietatea unui dis-pozitiv de a-si îndeplini functia specifica în conditii de exploatare date.O analiza a fiabilitatii pune în evidenta:

— fiabilitatea precalculata, care se evalueaza pornind de la con-ceptia dispozitivului si a componentelor sale;

— fiabilitate tehnica (nominala) determinata în urma încercarilorîn conditii de fabrica;

— fiabilitate de exploatare, determinata de conditiile reale de ex-

ploatare, cu luarea în considerare a actiunii complexe a tuturor facto-rilor ce influenteaza functonarea.

Fiabilitatea poate exprimata cantitativ prin parametrii de fiabili-tate. Determinarea lor se face în practica în urma prelucrarii statisticea datelor. Cel mai frecvent utilizata este probabilitatea functionariif ara defectiune într-un interval de timp. Intervalul de timp în caresistemul functioneaza f ara defectiuni este o variabila aleatoare pe careo notam cu T .

Definitia 3.15. Numim func tie de fiabilitate sau reliabilitate functia

R : R+ → [0; 1], definita prin

R(t) = P (T > t).

Observam ca 1 − R(t) este functia de repartitie, care în sensulfiabilitatii masoara probabilitatea ca pâna la momentul t sa aparao defectiune. Functia F (t) = 1 − R(t) se mai numeste func tie de nesiguran t a . În strânsa legatura cu proprietatile functiei F (t), putemenunta pe cele ale lui R.

1. R(0) = 1,

2. limt→∞R(t) = 0,3. t1 < t2 ⇒ R(t1) > R(t2),4. Daca f este densitatea de probabilitate pentru variabila T ,

f (t) = −R0(t).Observam ca la momentul initial functia de fiabilitate este maxi-

ma, iar nesiguranta minima. Daca t → ∞ se produce fenomenulinvers. Vom presupune ca se poate preciza o functie, numita rat a de defectare si notata r, cu proprietatea ca r(t)∆t este probabilitatea caîn intervalul (t, t +∆t) sa apara o defectiune, daca pâna la momentul

Page 133: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 133/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 131

t, dispozitivul a functionat. Conditia din definitie este o probabilitateconditionata:

r(t)∆t = P (t < T ≤ t +∆t | T > t) =P (t < T ≤ t +∆t)

P (T > t)=

=F (t +∆t) − F (t)

R(t)= −R (t +∆t) − R(t)

R(t).

În ultima relatie împartim prin t si trecem la limita pentru t → 0.

Dac˘

a aceast˘

a limit˘

a exist˘

a, g˘

asim ecuatia diferential˘

a

−R0(t)

R(t)= r(t),

cu conditia initiala R(0) = 1 care are ca solutie

R(t) = e−

tR 0

r(s)ds.(3.13)

Exemplul 3.11. Rata de defectare a unui utilaj este r(t) = 0.1. Cuce probabilitate dispozitivul functioneaza cel putin 10 ore?

Rezolvare. Înlocuim în (3.13) r(t) = 0.1 si observam ca dispozitivulfunctioneaza cel putin 10 ore este evenimentul T ≥ 10, deci

R(10) = e−

10R 0

0.1ds= 0.36788. ♦

În general variatia defectiunilor unui dispozitiv se poate împarti întrei perioade:1. perioada initiala în care apar defectiuni datorate erorilor de

fabricatie si se face rodajul;2. perioada de functionare care începe dupa rodaj, cînd numarul

defectiunilor scade, ramânând practic constant (maturitatea), pentrucare se poate utiliza distributta exponentiala;

3. perioada în care intensitatea de defectare creste continuu, da-torita uzurii (batrânetea).

Page 134: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 134/364

132 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

3.6 Probleme rezolvate

Problema 3.4. Un strung produce un anumit tip de piese. Lungimea pieselor este o variabil a aleatoare cu media egal a cu 50 cm si abaterea medie p˘ atratic a 0.015 cm. S a se estimeze probabilitatea ca abaterea lungimii piesei de la valoarea medie nu dep˘ a seasc a 0.02 cm. Ce valoare nu va dep˘ asi abaterea cu probabilitatea de 0.9.

Rezolvare. Fie X lungimea piesei. Aplicând inegalitatea Cebâsevobtinem

P (|X − M [X ]| < ε) > 1 −D [X ]

ε2 ⇔P (|X − 50| < 0.02) > 1 − 0.0152

0.022= 0.4375.

Din 1 − D [X ]

ε2= 0.9 gasim ε ≈ 0.047, adica

P (|X − 50| < 0.047) > 0.9.

Problema 3.5. S a se simuleze in Matlab un experiment de aruncare a monezii. S a se calculeze frecventa relativ a a apari tiei stemei si s a

se compare cu probabilitatea apari tiei stemei.Rezolvare. Pentru simularea aruncarii monezii se va folosi functiarand care returneaza valori aleatoare din intervalul (0, 1). Cum pro-

babilitatea aparitiei stemei este1

2, daca functia returneaza o valoare

mai mica ca1

2se va considera ca, la simularea experimentului, apare

stema. Frecventa relativa se va calcula pentru n = i · 1000, undei = 1, 100. Programul afiseaza graficul frecventei relative si valoareaei obtinuta la simularea de 100000 a experimentului.

% Frecventa relativa de aparitie% a stemei la aruncarea monezii

clear;

clc;

S=0;

for i=1:100

for j=1:1000

if rand<0.5

%apare stema

Page 135: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 135/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 133

S=S+1;

end;

end;

f(i)=S/(i*1000);

end;

plot(f);

title(’Frecventa relativa’);

grid;

fprintf(’frecventa relativa este %g\n’,S/100000);

Cum experimentul este aleator, rezultatele sale difera de la o si-mulare la alta. Un rezultat posibil este

0 10 20 30 40 50 60 70 80 90 1000.49

0.492

0.494

0.496

0.498

0.5

0.502

0.504

0.506

Frecventa relativa

Figura 3.15

Frecventa relativa este 0.50027

Putem observa ca, în conformitate cu legea numerelor mari, frec-venta relativa converge catre probabilitatea evenimentului.

Problema 3.6. Folosind Mathematica, s a se simuleze aruncarea unei monede de 10 ori, apoi de 1000 de ori si 100 000 de ori. S a se numere de câte ori au ap˘ arut cele dou a fe te ale zarului si s a se trag a concluziile.

Rezolvare. Aruncarea monedei este un experiment care consta înrealizarea unui eveniment Bernoulli cu p = 0.5. Simulam aruncaremonedei de 10 ori folosind distributia Bernoulli.

Page 136: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 136/364

134 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

<<Statistics‘DiscreteDistributions‘arunc=RandomArray[BernoulliDistribution[0.5],10]0,1,1,0,1,1,0,0,1,1

Cu ajutorul pachetului <<Statistics‘DataManipulation‘ si a comen-zii Frequencies determinam câte valori de 0 si câte valori de 1, core-spunzator celor doua fete ale monedei, s-au obtinut.

<<Statistics‘DataManipulation‘Frequencies[arunc]4,0,6,1

arunc10=RandomArray[BernoulliDistribution[0.5],1000];Frequencies[arunc10]496,0,504,1arunc1000=RandomArray[BernoulliDistribution[0.5],100000];Frequencies[arunc1000]50120,0,49880,1

Observam ca pentru numarul aruncarilor tot mai mare, frecventarelativa se apropie de probabilitatea 0.5.

Problema 3.7. Folosind Mathematica, s a se simuleze aruncare unui zar de 12 ori si apoi aruncarea a dou a zaruri de 100 de ori.

Rezolvare. Aruncarea unui zar poate fi modelata folosind distributiauniform discreta, prezentata în Capitolul 2, care ia sase valori, 1, 2, 3,4, 5 si 6.

Simularea primului experiment:

<<Statistics‘DiscreteDistributions‘arunc=RandomArray[DiscreteUniformDistribution[6],12]3,3,5,6,4,6,4,2,3,4,6,2<<Statistics‘DataManipulation‘Frequencies[arunc]

2,2,3,3,3,4,1,5,3,6arunc1=RandomArray[DiscreteUniformDistribution[6],6000];Frequencies[arunc1]1005,1,1005,2,1029,3,1010,4,977,5,974,6arunc2=RandomArray[DiscreteUniformDistribution[6],100,2]2,6,4,1,1,4,1,3,3,6,1,6,2,1,4,4,6,4,2,3,4,4,3,4,3,6,5,3,1,1,6,2,4,5,4,4,5,2,5,6,2,1,4,6,4,2,1,2,2,5,5,4,2,2,1,4,4,5,1,4,5,6,4,6,5,2,3,5,1,2,5,1,4,2,6,5,3,5,6,2,6,6,4,2,1,3,5,1,2,4,6,6,4,3,2,3,

Page 137: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 137/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 135

3,3,3,6,5,5,6,5,6,5,4,4,1,4,1,2,2,3,3,4,4,3,4,6,6,2,6,6,4,2,2,6,4,1,2,3,5,2,4,4,3,3,4,3,5,1,6,4,6,1,3,4,2,2,5,3,1,4,4,1,1,1,1,6,1,5,6,2,6,2,3,3,2,2,6,6,5,3,5,5,6,6,2,4,5,2,6,1,5,6,3,3,3,6,1,2,3,4,1,1,4,6,4,5

Folosind Map împreuna cu comenzile Apply si Plus gasim suna nu-merelor de pe cele doua zaruri.

sums=Map[Apply[Plus,#]&,arunc2]8,5,5,4,9,7,3,8,10,5,8,7,9,8,2,8,9,8,7,11,3,10,6,3,7,9,4,5,9,5,11,10,7,8,3,6,\6,11,8,8,12,6,4,6,6,12,7,5,6,9,10,11,11,8,5,3,5,7,7,10,8,12,6,8,5,5,7,8,6,7,6,\10,7,7,4,8,5,5,2,7,6,8,8,6,4,12,8,10,12,6,7,7,11,6,9,3,7,2,10,9

Folosim Frequencies pentru a determina frecventa fiecarei sume.Frequencies[sums]3,2,6,3,5,4,12,5,14,6,16,7,17,8,8,9,8,10,6,11,5,12

Problema 3.8. Se consider a o vaiabil a aleatoare continu a X cu func tia de reparti tie

F (x) =

0, x ≤ 0,x2, 0 < x ≤ 1,1, x > 1.

S a se calculeze probabilitatea c a:a) v. a. X va lua valori din intervalul (1/3, 2/3);b) în 4 experien te X va lua o data o valoare din intervalul (1/4, 1/2)

si o dat a din intervalul (1/2, 3/4);c) în 3 experien te X va lua valori doar din intervalul (3/4, 1).

Rezolvare. În cazul variabilelor aleatoare continue probabilitatea caacestea sa ia valori dintr-un interval oarecare este

P (a < X < b) = F (b) − F (a) .

a) P µ1

3< X < 2

3

¶= F

µ23

¶− F µ1

3

¶= 4

9− 1

9= 1

3.

b) Se vor calcula mai întâi probabilitatile ca X sa ia valori în fiecaredin cele doua intervale:

p1 = P

µ1

4< X <

1

2

¶= F

µ1

2

¶− F

µ1

4

¶=

1

4− 1

16=

3

16,

p2 = P

µ1

2< X <

3

4

¶= F

µ3

4

¶− F

µ1

2

¶=

9

16− 1

4=

5

16.

Page 138: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 138/364

136 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Probabilitatea cautata este

p = p1 p2 (1 − p1 − p2)2 =15

1024≈ 0, 0146.

c) Probabilitatea ca3

4< X < 1 este

p3 = P

µ3

4< X < 1

¶= F (1) − F

µ3

4

¶= 1 − 9

16=

7

16,

iar probabilitatea ceruta este

p = p33 =

343

4096≈ 0, 0837.

Problema 3.9. Se consider a func tia

F (x) =

0, x < 1,ln x, 1 ≤ x < e,1, x ≥ e.

Este func tia F (x) func tie de reparti tie a unei variabile aleatoare con-tinue X ? În caz a fi rmativ s a se g aseasc a densitatea de reparti tie a lui X . S a se reprezinte grafic cele dou a func tii.

Rezolvare. Observam caa) F (x) este monoton crescatoare;b) lim

x→−∞F (x) = 0; lim

x→+∞= 1;

c) ∀x ∈ R, F (x + 0) = F (x) (functia este continua la dreapta înorice punct x ∈ R).

Prin urmare F (x) este functie de repartitie a unei variabile aleatoareoarecare X . Analizam daca este functia de repartitie a unei variabile

aleatoare continue.Observam ca F (x) este continua peR si este derivabila peR\ 1, e.

Avem

F 0 (x) =

0, x < 1,1

x, 1 < x < e,

0, x > e.

În punctele x ∈ 1, e functia F 0 (x) nu este definita. Prin urmarepentru x ∈ R\ 1, e avem f (x) = F 0 (x), iar în punctele x ∈ 1, e

Page 139: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 139/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 137

putem considera, de exemplu, f (x) = F 0 (x + 0), adica

f (x) =

0, x < 1,1

x, 1 ≤ x < e,

0, x ≥ e.

Calculând valorile lui f (x) si F (x) într-un numar de puncte dinintervalul (0, 4), construim cele doua grafice (figura 3.16).

0 1 2 3 4

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Functia de repartitie

0 1 2 3 4

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Densitatea de repartitie

Figura 3.16

Problema 3.10. Este dat a func tia

f (x) = ½0, x ≤ 0,αe−2x, x > 0.

S a se g aseasc a valorile parametrului α, pentru care f (x) este den-sitatea de reparti tie a unei variabile aleatoare X continue. S a se g aseasc a func tia de reparti tie a lui X . S a se calculeze probabilitatea P (1 < X < 2), folosind func tia de reparti tie F (x) si folosind densi-tatea de reparti tie f (x).

Rezolvare. Pentru ca f (x) sa fie densitate de repartitie este necesarca

Page 140: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 140/364

Page 141: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 141/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 139

(triunghiul din figur a este echilateral).S a se g aseasc a expresia densit a tii, func tia de reparti tie si probabi-

litatea P ¡−a

2< X < a

2

¢.

Rezolvare. Deoarece+∞R −∞

f (x) dx = 1, rezulta ca aria triunghiului

echilateral, care are latura 2a este 1. Pe de alta parte aria triunghiuluieste S 4 =

√ 3(2a)2

4= a2

√ 3, de unde rezulta a = 1

4√ 3 . Pentru a obtineexpresia lui f (x) este necesar de calculat f (0), care este înaltimeatriunghiului. Înaltimea unui triunghi echilateral cu latura 2

4√ 3 este√ 32 ·

24√ 3 =

4

√ 3. Cunoscând coordonatele vârfurilor triunghiului, putemscrie expresia functiei f (x):

f (x) =

0, x ≤ − 14√ 3 ,√

3x + 4√

3, − 14√ 3 < x ≤ 0,

−√ 3x + 4

√ 3, 0 < x ≤ 1

4√ 3 ,

0, x > 14√ 3 .

Aplicând formula F (x) =xR

−∞f (t) dt, gasim

F (x) =

0, x ≤ −14√ 3 ,

( 4√ 3x+1)2

2, − 1

4√ 3 < x ≤ 0,

−( 4√ 3x−1)2

2+ 1, 0 < x ≤ 1

4√ 3 ,

1, x > 14√ 3 .

Probabilitatea ceruta este

P ¡−a

2< X < a

2

¢= P

³− 1

2 4√ 3 < X < 1

2 4√ 3

´=

= F ³ 1

2 4√ 3´−F ³−

1

2 4√ 3´ =7

8 −1

8

=3

4

.

Problema 3.12. O variabil a aleatoare X are densitatea de reparti tie

f (x) =

0, x /∈ (−a, a) ,1

π√

a2 − x2, x ∈ (−a, a) ,

unde a > 0. S a se calculeze func tia de reparti tie, media, dispersia,abaterea medie p˘ atratic a, asimetria, excesul, mediana, moda, cuan-tilele de ordinul 1

4ale lui X .

Page 142: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 142/364

140 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Solutie. Functia de repartitie a v. a. X este

F (x) =

Z x−∞

f (t) dt =

0, x ≤ −a,1

2+

1

πarcsin

x

a, −a < x < a,

1, x ≥ a.

Aplicând pentru fiecare dintre caracteristicle numerice formula,obtinem urmatoarele rezultate.

Media v. a. X :

M [X ] = Z +∞−∞ xf (x) dx =

1

πZ a−a

x dx

√ a2 − x2 = 0.

Dispersia v. a. X :

D [X ] = M £

X 2¤− M [X ]2 =

2

π

Z a0

x2dx√ a2 − x2

=a2

2.

Abaterea medie patratica:

σ [X ] =p

D [X ] =a√

2.

Pentru a calcula asimetria si excesul este necesar de calculat mo-mentele centrate de ordinul 3 si 4:

µ3 [X ] =

Z +∞−∞

(x − M [X ])3 f (x) dx =1

π

Z a−a

x3 dx√ a2 − x2

= 0;

µ4 [X ] =

Z +∞−∞

(x − M [X ])4 f (x) dx =2

π

Z a0

x4dx√ a2 − x2

=3a4

8.

Asimetria v. a. X :

α =µ3 [X ]

σ3 [X ]= 0.

Excesul v. a. X :

=µ4 [X ]

σ4 [X ]− 3 =

3a4

8a4

4

− 3 = −3

2.

În cazul variabilelor aleatoare continue moda este valoarea lui X cu densitatea de probabilitate maxima, deci

Mo [X ] = 0.

Page 143: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 143/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 141

Mediana:

P (X < Me [X ]) =1

2⇒ F (Me [X ]) =

1

2⇒ Me [X ] = 0.

Cuantilele:

P ¡

X < x1/4

¢=

1

4⇒ F

¡x1/4

¢=

1

4⇒ x1/4 = − a√

2,

P ¡

X < x2/4

¢=

1

2⇒ x2/4 = Me [X ] = 0,

P ¡X < x3/4¢ =3

4 ⇒F ¡x3/4¢ =

3

4 ⇒x3/4 =

a

√ 2.

Problema 3.13. Variabilele aleatoare X si Y au densitat a tile de reparti tie

f X (x) =

( 1

2, x ∈ [0, 2] ,

0, x /∈ [0, 2] ;f Y (x) =

½0, x < 0,e−x, x ≥ 0.

S a se calculeze M [X + Y ], M [XY ], M [X 2], M [X + Y 2] si D [X + Y ].

Rezolvare. Variabila aleatoare X are repartitie uniforma, deci M [X ] =0 + 2

2 = 1, D[X ] =

(2

−0)2

12 =

1

3 . Variabila aleatoare Y are repartitieexponentiala cu λ = 1, deci M [Y ] =

1

λ= 1, D [Y ] =

1

λ2 = 1. Cum

X si Y sunt variabile aleatoare independente, rezulta ca M [X + Y ] =M [X ] + M [Y ], M [XY ] = M [X ] M [Y ], D [X + Y ] = D [X ] + D [Y ].Avem, deci M [X + Y ] = 1 + 1, M [XY ] = 1 · 1 = 1, D [X + Y ] =1

3+ 1 =

4

3. Sa calculam M [X 2] si M [X + Y 2]:

M

£X 2

¤=

Z +∞

−∞x2f X (x) dx =

1

2 Z 2

0

x2dx =4

3.

M £

X + Y 2¤

= M [X ] + M £

Y 2¤

= 1 +Z +∞−∞

x2f Y (x) dx =

= 1 +

Z +∞0

x2e−xdx = 1 + 2 = 3.

Problema 3.14. O variabil a aleatoare X are reparti tie uniform a pe intervalul [a, b]. S a se calculeze M [X ] si D [X ]. S a se g aseasc a P ¡

X > 3a+b4

¢, P

¡X < a+2b

3

¢, P

¡2a+b3

< X < a+4b5

¢,

P (|X − M [X ]| < σ [X ]).

Page 144: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 144/364

Page 145: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 145/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 143

= F á√ 3 + 1¢ b + ¡√ 3 − 1¢ a

2√

3

!−F

á√ 3 − 1¢ b + ¡√ 3 + 1¢ a

2√

3

!=

=

√ 3 + 1

2√

3−

√ 3 − 1

2√

3=

1√ 3

.

Problema 3.15. O variabil a aleatoare X are reparti tie uniform a pe intervalul [1, 3]. S a se g aseasc a densitatea de probabilitate a variabilei aleatoare Y = X 2 + 1.

Rezolvare. Densitatea de probabilitate a v. a. X este

f X (x) =

( 1

2, x ∈ [1, 3] ,

0, x /∈ [1, 3] ,

iar functia de repartitie a lui X este

F X (x) =

0, x < 1,x

2, 1 ≤ x ≤ 3,

1, x > 3.

Calcul˘

am func¸tia de reparti

¸tie a v. a. Y

F Y (x) = P (Y < x) = P ¡

X 2 + 1 < x¢

= P ¡

X <√

x − 1¢

=

= F X

¡√ x − 1

¢,

apoi densitatea de repartitie

f Y (x) = F 0Y (x) =¡

F X

¡√ x − 1

¢¢0= f X

¡√ x − 1

¢·

1

2√

x − 1=

=

1

4√

x − 1, x ∈ [2, 10] ,

0, x /∈ [2, 10] .

Am folosit faptul ca pe intervalul [1, 3] functia ϕ (x) = x2 + 1 esteinversabila si ϕ (x) ∈ [2, 10].

Problema 3.16. S a se construiasc a graficele densit a tii de probabil-itate si func tiei de reparti tie pentru urm atoarele valori ale mediei si dispersiei unei variabile aleatoare repartizate normal: m = 0, σ2 = 1;

m = 0, σ2 = 1/4; m = 2, σ2 = 1; m = −2, σ2 =1

2.

Page 146: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 146/364

144 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Rezolvare. Urmatorul program în Matlab calculeaza valorile celordoua functii într-un numar n = 100 de puncte din intervalul [m − 3σ,m+3σ] si construiste apoi graficele. Se poate observa cum se modificagraficele densitatii de probabilitate la modificarea parametrilor m si σ.

% Densitatea de probabilitate si

% functia de repartitie ale unei variabile

% aleatoare repartizata normal

clear;

clc;

n=100; m1=0;

sigma1=1;

m2=0;

sigma2=1/2;

m3=2;

sigma3=1;

m4=-2;

sigma4=1/sqrt(2);

x1=[(m1-3*sigma1):6*sigma1/n:(m1+3*sigma1)];

f1=pdf(’norm’,x1,m1,sigma1);

F1=cdf(’norm’,x1,m1,sigma1);

x2=[(m2-3*sigma2):6*sigma2/n:(m2+3*sigma2)];

f2=pdf(’norm’,x2,m2,sigma2);

F2=cdf(’norm’,x2,m2,sigma2);

x3=[(m3-3*sigma3):6*sigma3/n:(m3+3*sigma3)];

f3=pdf(’norm’,x3,m3,sigma3);

F3=cdf(’norm’,x3,m3,sigma3);

x4=[(m4-3*sigma4):6*sigma4/n:(m4+3*sigma4)];

f4=pdf(’norm’,x4,m4,sigma4);

F4=cdf(’norm’,x4,m4,sigma4);

subplot(2,1,1)plot(x1,f1,’b’,x2,f2,’r’,x3,f3,’g’,x4,f4,’c’);

title(’Densitatea de probabilitate’);

xlabel(’x’); ylabel(’f(x)’);grid;

subplot(2,1,2);

plot(x1,F1,’b’,x2,F2,’r’,x3,F3,’g’,x4,F4,’c’);

title(’Functia de repartitie’);

xlabel(’x’); ylabel(’F(x)’);grid;

Page 147: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 147/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 145

-5 -4 -3 -2 -1 0 1 2 3 4 50

0.2

0.4

0.6

0.8

Densitatea de probabilitate

x

f ( x )

-5 -4 -3 -2 -1 0 1 2 3 4 50

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 3.18.

Acelasi lucru realizat cu Mathematica

<<Statistics‘ContinuousDistributions‘

<<Graphics‘Graphics‘m=0;sigma=1;f1[x_]:=PDF[NormalDistribution[m,sigma],x]g1=Plot[f1[x],x,m-3 sigma,m+3 sigma]h1[x_] := CDF[NormalDistribution[m, sigma], x]s1 = Plot[h1[x], x, -4, 4]m=0;sigma=1/2;f2[x_]:=PDF[NormalDistribution[m,sigma],x]

g2=Plot[f2[x],x,m-3 sigma,m+3 sigma]h2[x_] := CDF[NormalDistribution[m, sigma], x]s2 = Plot[h2[x], x, -4, 4]m=2;sigma=1;f3[x_]:=PDF[NormalDistribution[m,sigma],x]g3=Plot[f3[x],x,m-3 sigma,m+3 sigma]h3[x_] := CDF[NormalDistribution[m, sigma], x]s3 = Plot[h3[x], x, -5, 5]

Page 148: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 148/364

146 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

m=-2;sigma=1/Sqrt[2];f4[x_]:=PDF[NormalDistribution[m,sigma],x]g4=Plot[f4[x],x,m-3 sigma,m+3 sigma]h4[x_] := CDF[NormalDistribution[m, sigma], x]s4 = Plot[h4[x], x, -5, 5]Show[g1, g2, g3, g4, AxesLabel -> "x", "y"]

-4 -2 2 4x

0.2

0.4

0.6

0.8

y

Show[s1, s2, s3, s4, AxesLabel -> "x", "y"]

-4 -2 2 4x

0.2

0.4

0.6

0.8

1

y

Problema 3.17. O variabil a aleatoare X are reparti tie normal a cu media m = 1 si abaterea medie p˘ atratic a σ = 2. S a se calculeze P (X < 0), P (X > 3), P (1 < X < 2).

Rezolvare. Daca X ∈ N (m = 1, σ2 = 4), atunci

f (x) =

1

2√ 2π e−(x−1)2

8 , x ∈ RF (x) =

1

2√

Z x−∞

e−(t−1)2

8 dt, x ∈ R.

Remarcam ca F (x) poate fi exprimata prin functia de repartitieΦ(x) =1√ 2π

xR −∞

e−t2

2 dt a unei variabile aleatoare normale reduse (functia lui

Laplace) sau prin funtia erorilor erf (x) =2√ π

xR 0

e−t2dt:

Page 149: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 149/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 147

F (x) = Φµx − m

σ

¶= Φ

µx − 12

¶=

=1

2

µ1 + erf

µx − m

σ√

2

¶¶=

1

2

µ1 + erf

µx − 1

2√

2

¶¶.

Folosind Φ (x) sau erf (x) putem calcula probabilitatile cerute

P (X < 0) = Φ

µ−1

2

¶= 1 −Φ

µ1

2

¶,

P (X < 0) =

1

2 µ1 + erf µ−1

2√ 2¶¶ =

1

2 µ1 − erf µ 1

2√ 2¶¶ ,

P (X > 3) = 1 −Φ (1) =1

2

µ1 − erf

µ1√

2

¶¶,

P (1 < X < 2) = Φ

µ1

2

¶−Φ (0) =

1

2

µerf

µ1

2√

2

¶− erf (0)

¶.

Urmatorul program în Matlab calculeaza probabilitatile celor trei eveni-mente, ilustrând folosirea tuturor celor trei functii: F (x), Φ (x), erf (x).

% Probabilitatile unor evenimente

% calculate in cateva moduriclear;

clc;

format short g;

n=100;

m=1;

sigma=2;

fprintf(’P(X<0)=%g\n’,cdf(’norm’,0,m,sigma));

fprintf(’P(X<0)=%g\n’,cdf(’norm’,(0-m)/sigma,0,1));

fprintf(’P(X<0)=%g\n’,(1+erf((0-m)/sigma/sqrt(2)))/2);

fprintf(’P(X>3)=%g\n’,1-cdf(’norm’,3,m,sigma));fprintf(’P(X>3)=%g\n’,1-cdf(’norm’,(3-m)/sigma,0,1));

fprintf(’P(X>3)=%g\n’,(1-erf((3-m)/sigma/sqrt(2)))/2);

fprintf(’P(1<X<2)=%g\n’,cdf(’norm’,2,m,sigma)-

cdf(’norm’,1,m,sigma));

fprintf(’P(1<X<2)=%g\n’,cdf(’norm’,(2-m)/sigma,0,1)-

cdf(’norm’,(1-m)/sigma,0,1));

fprintf(’P(1<X<2)=%g\n’,(erf((2-m)/sigma/sqrt(2))-

erf((1-m)/sigma/sqrt(2)))/2);

Page 150: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 150/364

148 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Rezultatele afisate de program sunt:

P (X < 0) = 0.308538P (X < 0) = 0.308538P (X < 0) = 0.308538P (X > 3) = 0.158655P (X > 3) = 0.158655P (X > 3) = 0.158655P (1 < X < 2) = 0.191462P (1 < X < 2) = 0.191462P (1 < X < 2) = 0.191462

Problema 3.18. Pre tul unei ac tiuni poate fi considerat având repar-ti tie normal a cu media 10.25 lei si abaterea medie p˘ atratic a σ = 0.55lei. S a se calculeze probabilitatea ca pre tul unei ac tiuni a) s a de-p˘ a seasc a 11.00 lei; b) s a fie mai mic de 9.75 lei; c) s a fie situat între 10.10 lei si 10.40 lei.

Rezolvare. Aplicând binecunoscutele formule, obtinem:

P (X > 11) = 1 − F (11) = 1 −Φµ

11 − 10.25

0.55

¶=

= 1 −Φ

(1.3636) = 1 − 0, 91366 = 0.086341;P (X < 9.5) = F (9.5) = Φ

µ9.5 − 10.25

0.55

¶=

= Φ (−0.909) = 0.18165;

P (10.1 < X < 10.4) = F (10.4) − F (10.1) = Φ (0.2727)

−Φ (−0.2727) = 0.60747 − 0.39253 = 0.21494.

Problema 3.19. O variabil a aleatoare X are densitatea de probabi-litate de forma f (x) = αex

2+x. S a se determine tipul reparti tiei v. a.X . S a se g aseasc a parametrul α, media si dispersia lui X .

Rezolvare. Variabila aleatoare X are repartitie normala. Transfor-mam f (x) pentru a gasi m si σ:

f (x) = αex2+x = αe(x+ 1

2)2− 1

4 =α

e1/4e(x+ 1

2)2

.

Pentru ca f (x) sa fie densitate de probabilitate trebuie caα

e1/4=

1√ 2π

, adica α =e1/4√

2π, de unde obtinem M [X ] = m = −1

2, D [X ] =

σ2 = 1.

Page 151: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 151/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 149

Problema 3.20. S a se calculeze media si dispersia unei variabile aleatoare repartizate exponen tial.

Rezolvare. O variabila aleatoare X repartizata exponential are den-sitatea de repartitie

f (x) =

½0, x ≤ 0,λe−λx, x > 0.

Aplicând formulele mediei si dispersiei, obtinem

M [X ] =Z +∞−∞

xf (x) dx = λZ +∞0

xe−λxdx = −λx + 1λ

e−λx¯+∞0

= 1λ

;

D[X ] =

Z +∞−∞

x2f (x) dx −µ

1

λ

¶2

= λ

Z +∞0

x2e−λxdx − 1

λ2 =

= −λ2x2 + 2λx + 2

λ2 e−λx¯¯+∞0

=2

λ2 − 1

λ2 =1

λ2 .

Problema 3.21. Timpul de a steptare în sta tie a autobuzului are repar-ti tie exponen tial a cu media de a steptare 10 minute. S a se determine probabilitatea c a timpul de a steptare a) va dep˘ a si 20 minute; b) va fi mai mic de 5 minute; c) va fi cuprins între 5 si 15 minute. S a se afi seze graficele densit a tii de probabilitate si a func tiei de reparti tie ale timpului de a steptare.

Rezolvare. Deoarece M [X ] = 10 =1

λ, rezulta ca λ =

1

10. Deci

f (x) =

(0, x ≤ 0,1

10e−

x10 , x > 0,

F (x) =

½0, x ≤ 0,1 − e−

x10 , x > 0.

Avem apoiP (X > 20) = 1 − F (20) , P (X < 5) = F (5) ,

P (5 < X < 15) = F (15) − F (5)

Urmatorul program în Matlab afiseaza graficele functiilor si calculeazaprobabilitatile celor trei evenimente:

% Densitatea de probabilitate si

% functia de repartitie ale

Page 152: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 152/364

150 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

% unei variabile aleatoare exponentiale

clear;

clc;

format short g;

lambda=1/10;

x=0:50;

f=pdf(’exp’,x,1/lambda);

%f=lambda*exp(-lambda*x);

F=cdf(’exp’,x,1/lambda);

subplot(2,1,1)

plot(x,f);title(’Densitatea de probabilitate’);

xlabel(’x’); ylabel(’f(x)’);grid;

subplot(2,1,2);

plot(x,F);

title(’Functia de repartitie’);

xlabel(’x’); ylabel(’F(x)’);grid;

fprintf(’P(X>20)=%g\n’,1-cdf(’exp’,20,1/lambda));

fprintf(’P(X<5)=%g\n’,cdf(’exp’,5,1/lambda));

fprintf(’P(5<X<15)=%g\n’,cdf(’exp’,15,1/lambda)

-cdf(’exp’,5,1/lambda));

Obtinem rezultatele:

P (X > 20) = 0.135335P (X < 5) = 0.393469P (5 < X < 15) = 0.3834

Graficele functiilor sunt reprezentate în figura 3.21.

Problema 3.22. Timpul de bun a func tionare a dou a componente de baz a ale unui aparat este repartizat exponen tial cu media egal a cu 8000ore, respectiv 10000 ore. S a se calculeze probabilitatea c a timp de 15000 ore de la momentul punerii în func tiune a aparatului a) nu se defecteaz a nici o component a; b) se defectez a o component a; c) se defecteaz a ambele componente.

Rezolvare. Fie X ∈ Exp (1/8000), Y ∈ Exp (1/10000) timpii debuna functionare ai celor doua componente. Functiile de repartitie alevariabilelor aleatoare sunt

F X (x) = 1 − e−x

8000 , F Y (x) = 1 − e−x

10000 .

Page 153: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 153/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 151

0 5 10 15 20 25 30 35 40 45 500

0.02

0.04

0.06

0.08

0.1

Densitatea de probabilitate

x

f ( x )

0 5 10 15 20 25 30 35 40 45 500

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 3.21.

Fie pi, i = 1, 2 probabilitatea ca componenta i va functiona cel putin15000 ore, adica

p1 = P (X > 15000) = 1 − F X (15000) = 0.1533,

p2 = P (Y > 15000) = 1 − F Y (15000) = 0.2231.

Avem apoi

P (X > 15000 ∩ Y > 15000) = p1 p2 = 0.0342,

P (X > 15000 ∪ X > 15000) = p1 (1 − p2) + p2 (1 − p1) = 0.3080,

P (X < 15000 ∩ Y < 15000) = (1 − p1) (1 − p2) = 0.6578.

Problema 3.23. Venitul lunar al unei persoane X ce activeaz a într-un domeniu dat are reparti tie lognormal a cu parametrii m = 7.5 si σ = 0.5. S a se g aseasc a venitul mediu al persoanelor din domeniul respectiv. S a se g aseasc a cota parte a persoanelor cu venit mai mare de 3000 lei. S a se construiasc a graficele densit a tii de probabilitate si

func tiei de reparti tie ale lui X .

Rezolvare. Daca X ∈ LogN (m, σ), atunci

M [X ] = em+σ2/2 = 2048.78.

Page 154: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 154/364

152 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Densitatea de repartitie a lui X este

f (x) =

0, x ≤ 0,1

xσ√

2πe−

(lnx−m)2

2σ2 , x > 0,

iar functia de repartitie este

F (x) =

0, x ≤ 0,x

R 01

tσ√

2πe−

(ln t−m)2

2σ2 dt, x > 0,=

=

0, x ≤ 0,

Φ

µln x − m

σ

¶, x > 0,

=

=

0, x ≤ 01

2

µ1 + erf

µln x − m

σ√

2

¶¶, x > 0.

Deci

P (X > 3000) = 1 −Φµln 3000 − 7.5

0.5 ¶ = 1 − 0.8444 = 0.1556.

0 500 1000 1500 2000 2500 3000 3500 4000 4500 50000

2

4

6x 10

-4 Densitatea de probabilitate

x

f ( x )

0 500 1000 1500 2000 2500 3000 3500 4000 4500 50000

0.2

0.4

0.6

0.8

1

Functia de repartitie

x

F ( x )

Figura 3.22.

Page 155: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 155/364

CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 153

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. Notiunea de variabila aleatoare continua.

2. Definitia si proprietatile densitatii de probabilitate si a functieide repartitie.

3. Calculul probabilitatilor folosinde densitatea de probabilitate sifolosind functia de repartitie.

4. Calculul mediei si dispersiei unei variabile aleatoare continue.

5. Selectarea v. a. continue potrivite aplicatiei studiate.

6. Standardizarea v. a. normale.

Sintetizam în urmatorul tabel v. a. continue studiate:

repartitiadensitatea deprobabilitate

M [X ] D [X ]

uniforma

X ∈ Unif [a, b] ½ 1b

−a , x

∈[a, b]

0, x /∈ [a, b]

a + b

2

(b

−a)2

12exponentialaX ∈ Exp [λ]

½0, x ≤ 0

λe−λx, x > 0

1

λ

1

λ2

WeibullWeib(n,a,b)

(ab

¡xb

¢a−1e−(x

b )a

, x > 00, x ≤ 0

bΓ¡

1 + 1a

¢ b2Γ2¡

1 + 2a

¢−− ¡

bΓ¡

1 + 1a

¢¢2gama

X ∈ Gama [ p, λ]

(λpxp−1e−λx

Γ( p) , x > 0

0, x ≤ 0

p

λ

p

λ2

hi-patratX ∈ χ2(n)

1

2n2 Γ

¡n2

¢xn2−1e−

x2 , x > 0

0, x

≤0

n 2n

StudentX ∈ T (n)

Γ¡n+1

Γ¡n2

¢√ nπ

µ1 +

x2

n

¶−n+12

0n

n − 2, n > 2

normalaX ∈ N [m, σ]

1σ√ 2π

e−(x−m)2

2σ2 m σ2

lognormalaX ∈ LogN [m, σ]

1

xσ√

2πe−

(lnx−m)2

2σ2 , x > 0 em+σ2

2 e2m+σ2³

eσ2 − 1

´

Page 156: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 156/364

154 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

Page 157: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 157/364

Capitolul 4

Teorema limita centrala

Teorema limita centrala este una dintre cele mai importante teo-reme din teoria probabilitatilor. Intuitiv, torema afirma ca suma unuinumar mare de v. a. independente, identic distribuite (i.i.d.), standar-dizate (cu media 0 si dispersia 1) poate fi aproximata de o distributienormala. Rezulta importanta acestei distributii, desi densitatea sade probabilitate are o forma care pare complicata. Teorema limitacentrala mai poarta denumirea de miracolul lui Gauss.

Fie X 1, X 2, . . . , X n, . . . un sir de v. a. independente si identic dis-tribuite cu M [X i] = m si D [X i] = σ2, i ∈ N∗. Fie S n = X 1 + X 2+

+. . .+X n si M n =1

nS n. Teorema limita centrala da informatii asupra

v. a.

Z n =S n − nm

σ√

n=

n (M n − m)

n σ√ n

=M n − m

σ√ n

=(M n − m)

√ n

σ.

Deoarece M [M n] = m, D [M n] =σ2

n, deducem ca M [Z n] = 0 si

D [Z n] = 1. Aceata v. a. se numeste standardizata, deci sirul Z n este

versiunea standardizata a sirului M n.Teorema 4.1. (Teorema limit a central a) Fie (X n)n∈N un sir de v. a.i.i.d. cu M [X i] = m si D [X i] = σ2, i ∈ N∗. Atunci pentru orice numere reale a < b, avem

limn→∞

P (a ≤ Z n ≤ b) =1√ 2π

Z ba

e−12x

2

dx. (4.1)

O varianta a teoremei limita centrala este urmatoarea:

155

Page 158: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 158/364

Page 159: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 159/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 157

<< Graphics‘Graphics‘histnorm[aleat2_, n_, i_, med2_] :=

(amin = Min[med2]; amax = Max[med2];h = N[(amax - amin)/(1 + Log[2, n])];r = (amax - amin)/h;vec = amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,

amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h, amin + 9 h,amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h,amin + 15 h;

freqq12 = BinCounts[med2, amin, amax, h];

ghh = Histogram[freqq12, FrequencyData -> True,HistogramCategories -> amin, amin + h, amin + 2 h, amin + 3 h,amin + 4 h, amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h,amin + 9 h, amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h,amin + 14 h, amin + 15 h,

Ticks -> IntervalCenters, HistogramCategories -> Automatic,HistogramScale -> 1, DisplayFunction -> Identity];

m = N[Mean[med2]];sigma = 16/Sqrt[i];hh[x_] := PDF[NormalDistribution[m, sigma], x];

pn = Plot[hh[x], x, m - 3 sigma, m + 3 sigma,DisplayFunction -> Identity];Show[pn, ghh])

gg = histnorm[aleat, n, 3, med]Show[GraphicsArray[gg]]

100 120 140

0.01

0.02

0.03

0.04

Figura 4.1.

b) Calculam dispersia fiecarui esantion din cele 10000 de esantioanesi le folosim pentru a reprezenta histograma.

var = Map[Variance, aleat];

Page 160: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 160/364

158 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

Take[var, 5]207.195,431.381,90.8446,50.2826,1010.54amin = Min[var];amax = Max[var];h = N[(amax - amin)/(1 + Log[2, n])];r = (amax - amin)/h14.2877vec = amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,

amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h, amin + 9 h,amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h,

amin + 15 h;freqq1 = BinCounts[var, amin, amax, h]5258,2499,1150,603,257,123,55,26,10,9,3,3,1,1,1ghh = Histogram[freqq1, FrequencyData -> True,

HistogramCategories -> amin, amin + h, amin + 2 h, amin + 3 h,amin + 4 h, amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h,amin + 9 h, amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h,amin + 14 h, amin + 15 h,

Ticks -> IntervalCenters, HistogramCategories -> Automatic,HistogramScale -> 1]

286.002 667.312 1048.62 1429.93 1811.24 2192.55 2573.86

0.0005

0.001

0.0015

0.002

0.0025

Figura 4.2.

Facem observatia ca dipersia esantionului poate fi modelata de odistributie proportionala cu distributia hi-patrat cu 2 grade de liber-tate. ♦

Exemplul 4.2. Selectam 5 000 de esantioane de dimensiuni 2, 3, 4, 5,10 si 1000, respectiv, dintr-o populatie care urmeaza o repartitie uni-forma pe intrevalul [95, 105] . Sa se studieze normalitatea esantioanelormediilor în cazurile considerate.

Page 161: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 161/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 159

Rezolvare. Generam sirurile de numere aleatoare<< Statistics‘ContinuousDistributions‘aleat2 = RandomArray[UniformDistribution[95, 105], 5000, 2];aleat3 = RandomArray[UniformDistribution[95, 105], 5000, 3];aleat4 = RandomArray[UniformDistribution[95, 105], 5000, 4];aleat5 = RandomArray[UniformDistribution[95, 105], 5000, 5];aleat10 = RandomArray[UniformDistribution[95, 105], 5000, 10];aleat1000 = RandomArray[UniformDistribution[95,105],5000,1000];Folosim comenzile Map împreuna cu Mean pentru a calcula media

fiecarui esantion.med2 = Map[Mean, aleat2];med3 = Map[Mean, aleat3];med4 = Map[Mean, aleat4];med5 = Map[Mean, aleat5];med10 = Map[Mean, aleat10];med1000 = Map[Mean, aleat1000];n = Length[med2]5000Pentru fiecare esantion desenam histograma si repartitia normala

respectiva.<< Graphics‘Graphics‘histnorm[aleat2_, n_, med2_] :=

(amin = Min[med2]; amax = Max[med2];h = N[(amax - amin)/(1 + Log[2, n])];r = (amax - amin)/h;vec = amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,

amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h, amin + 9 h,amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h;

freqq12 = BinCounts[ med2, amin, amax, h];

ghh = Histogram[freqq12, FrequencyData -> True,HistogramCategories -> amin, amin + h, amin + 2 h, amin + 3 h,

amin + 4 h, amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h,amin + 9 h, amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h,amin + 14 h,

Ticks -> IntervalCenters, HistogramCategories -> Automatic,HistogramScale -> 1, DisplayFunction -> Identity];m = N[Mean[med2]]; sigma = N[StandardDeviation[med2]];hh[x_] := PDF[NormalDistribution[m, sigma], x];

Page 162: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 162/364

160 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

pn = Plot[hh[x], x, m - 3 sigma, m + 3 sigma, DisplayFunction-> Identity];

Show[pn, ghh])g2 = histnorm[aleat2, n, med2]g3 = histnorm[aleat3, n, med3];g4 = histnorm[aleat4, n, med4];g5 = histnorm[aleat5, n, med5];g10 = histnorm[aleat10, n, med10];g1000 = histnorm[aleat1000, n, med1000];Show[GraphicsArray[g2, g3, g4, g5, g10, g1000]]

98 99 100 101 102 103

0.1

0.2

0.3

0.4

99.7 99.8 99.9 100.1100.2100.3

1

2

3

4

98 100 102 104

0.05

0.1

0.15

0.2

0.25

98 100 102 104

0.05

0.1

0.15

0.2

0.25

0.3

96 98 100 102 104 106

0.05

0.1

0.15

0.2

98 100 102 104

0.05

0.1

0.15

0.2

Figura 4.3..

Rezultatul nu este afisat deoarece am inclus DisplayFunction ->Identity în functia construita, iar graficele au fost redate folosind Showîmpreuna cu GraphicsArray. ♦

Exemplul 4.3. Selectam 5 000 de esantioane de dimensiuni 2, 3, 25,30, 50 si respectiv 100 dintr-o populatie care urmeaza o distributieexponentiala cu media 2. Sa se studieze normalitatea esantioanelormediilor în cazurile considerate.

Rezolvare. Media 2 implica λ = 0.5.<< Statistics‘ContinuousDistributions‘aleat2 = RandomArray[ExponentialDistribution[0.5], 5000, 2];aleat3 = RandomArray[ExponentialDistribution[0.5], 5000, 3];aleat25 = RandomArray[ExponentialDistribution[0.5], 5000, 25];

Page 163: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 163/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 161

aleat30 = RandomArray[ExponentialDistribution[0.5], 5000, 30];aleat50 = RandomArray[ExponentialDistribution[0.5], 5000, 50];aleat100 = RandomArray[ExponentialDistribution[0.5], 5000, 100];med2 = Map[Mean, aleat2];med3 = Map[Mean, aleat3];med25 = Map[Mean, aleat25];med30 = Map[Mean, aleat30];med50 = Map[Mean, aleat50];med100 = Map[Mean, aleat100];n = Length[med2]

5000<< Graphics‘Graphics‘histnorm[aleat2_, n_, med2_] :=

(amin = Min[med2]; amax = Max[med2];h = N[(amax - amin)/(1 + Log[2, n])];r = (amax - amin)/h;vec = amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,

amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h, amin + 9 h,amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h;

freqq12 = BinCounts[med2, amin, amax, h];

ghh = Histogram[freqq12, FrequencyData -> True,HistogramCategories -> amin, amin + h, amin + 2 h,

amin + 3 h, amin + 4 h, amin + 5 h, amin + 6 h, amin + 7 h,amin + 8 h, amin + 9 h, amin + 10 h, amin + 11 h, amin + 12 h,amin + 13 h, amin + 14 h,

Ticks -> IntervalCenters, HistogramCategories -> Automatic,HistogramScale -> 1, DisplayFunction -> Identity];m = N[Mean[med2]]; sigma = N[StandardDeviation[med2]];hh[x_] := PDF[NormalDistribution[m, sigma], x];pn = Plot[hh[x], x, m - 3 sigma, m + 3 sigma,

DisplayFunction -> Identity];Show[pn, ghh])

g2 = histnorm[aleat2, n, med2];g3 = histnorm[aleat3, n, med3];g4 = histnorm[aleat25, n, med25];g5 = histnorm[aleat30, n, med30];g10 = histnorm[aleat50, n, med50];g100 = histnorm[aleat100, n, med100];Show[GraphicsArray[g2, g3, g4, g5, g10, g100]]

Page 164: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 164/364

162 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

1.5 2.5 3

0.2

0.4

0.6

0.8

1

1.2

1.4

1.25 1.5 1.75 2.25 2.5 2.75

0.5

1

1.5

2

1.5 2 2.5 3 3.5 4

0.2

0.4

0.6

0.8

1

1.5 2 2.5 3 3.5 4

0.2

0.4

0.6

0.8

1

-2 2 4 6 8 10 12

0.05

0.1

0.15

0.2

0.25

0.3

2 4 6 8

0.05

0.1

0.15

0.2

0.25

0.3

0.35

Figura 4.4.

Observam ca natura exponentiala a distributiei mediei populatieieste aparenta pentru esantioane de dimensiune 2 si 3, iar cînd dimen-siunea esantionului creste distributia devine tot mai normala. ♦

4.1 Aplicatii ale teoremei limit˘a centraleProblema 4.1. Determinarea volumului unei selectii bernoul-

liene care s˘ a permit a aplicarea legii numerelor mari. Pre-supunem c a se realizeaz a experimente de tip Bernoulli în care un eveni-ment A se produce cu probabilitatea p. Ne intereseaz a s a determin am num arul minim de repet ari ale experien tei astfel încât s a putem aplica legea numerelor mari a lui Bernoulii (s a putem afirma c a probabili-tatea ca, în modul, diferen ta dintre frecven ta relativ a a evenimentului A în n repet ari ale experien tei, si p este mai mare decât un ε > 0, este

mai mic a decât un num ar δ dat).Rezolvare. Notam cu X k variabila aleatoare care ia valoarea 1 dacala experienta cu numarul de ordine k se produce evenimentul A si0 daca nu se produce A. Avem P (A) = p, q = 1 − p. Variabilelealeatoare (X k)k∈N∗ sunt independente. Atunci valoare lui S n = X 1 +X 2 + . . . + X n reprezinta numarul de succese a lui A în urma efectuariia n experiente. S n este o v. a. distribuita binomial, S n ∈ Bin(n, p).1

nS n este frecventa relativa de realizare a evenimentului A în primele

Page 165: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 165/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 163

n probe independente si se mai noteaza f n(A) = 1n

S n. M £1n

S n¤

= p,

D£1n

S n¤

= pq

n. Legea numerelor mari a lui Bernoulli afirma ca

1

nS n→ p,

decilimn→∞

P

µ¯¯ 1

nS n − p

¯¯ > ε

¶= 0,

DarP

µ¯¯1

nS n − p

¯¯ > ε

¶<

pq

nε2< δ,

δ fiind dat. Relatia ne permite sa determinam o margine inferioara

pentru volumul selectiei n. Deoarece pq = p(1 − p) ≤1

4 , rezulta ca pq

nε2< δ ⇒ n >

pq

δε2si max

p

pq

δε2=

1

4δε2⇒ n >

1

4δε2.

Aceast a margine inferioar a este mai mult decât este necesar pentrua putea aplica legea numerelor mari a lui Bernoulli. Putem verificaaceasta aplicând teorema limita centrala deoarece v. a. ale sirului(X n)n∈N∗ au aceeasi repartitie (binomiala) si sunt independente. Apli-carea acestei teoreme ne permite sa calculam probabilitatea exactapentru

P µ¯ 1nS n − p¯ > ε¶ = P ï 1nS n −

pp pqn

¯ > εr n pq ! =

=1−P

ï¯ 1nS n− pp

pqn

¯¯≤ε

r n

pq

!=1−

·Φ

µε

r n

pq

¶−Φ

µ−ε

r n

pq

¶=

= 2Φ

µ−ε

r n

pq

¶< δ.

Notam z = ε

r n

pq ; problema este sa se determine z0 astfel încât

2Φ(−

z) < 2Φ(−

z0) = δ ⇒Φ(

−z0) =

δ

2, si n astfel încât εr n pq

= z0.

Rezulta n =z20 pq

ε2si deci max

p,q

z2 pq

ε2=

z2

4ε2, adica

n ≥ z20

4ε2. (4.2)

Într-adevar, daca luam ε = 0.02 si δ = 0.05 obtinem, conform Legiinumerelor mari n > 1

4·0.022·0.05= 125000. Deci, Φ(−z0) = 0.05

2= 0.025,

adica z0 = 1.96 si deci n > 1.962

4·0.022= 2401. ♦

Page 166: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 166/364

164 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

Problema 4.2. Pentru a estima probabilitatea unui eveniment A, se efectueaz a un sir de experien te Bernoulli. Se observ a frecven ta relativ a a evenimentului A. De câte ori trebuie repetat evenimentul A astfel încât cu o probabilitate de 0.95 frecven ta relativ a s a difere de p = P (A)cu 0.01?

Rezolvare. Fiind experiente Bernoulli, media M [X ] = p si dispersiaD[X ] = p(1− p). Evident ca p(1− p) ≤ 1/4 pentru 0 ≤ p ≤ 1. Folosimrezultatele exercitiului anterior si tinem seama ca ε = 0.01 si δ = 0.05.

Obtinem n >1

4δε2= 1

4·0.05·0.012= 50000.

Aceasta evaluare s-a obtinut utilizând inegalitatea lui Cebâsevcare da niste evaluari destul de grosiere. Vom obtine o alta evalu-

are utilizând teorema limita centrala: n ≥ z20

4ε2unde Φ(−z0) = 0.05

2=

0.975 ⇒ −z0 = −1.96 ⇒ n > 1.962

4·0.012= 9604. ♦

Problema 4.3. S a se determine num arul minim de arunc ari ale unei monede care s a asigure cel pu tin cu o probabilitate de 0.9 ca diferen ta dintre frecven ta relativ a obtinut a si probabilitatea de apari tie a unei

fe te s a fie mai mic a în valoare absolut a decât 0.2.

Rezolvare. Folosind inegalitate lui Cebâsev obtinem,

P

µ¯¯f n(A) − 1

2

¯¯ < 0.2

¶> 0.9. (4.3)

Conform relatiei (4.2) avem ε = 0.2, δ = 1 − 0.9 = 0.1 si deci n >1

4δε2= 1

4·0.1·0.22= 62.5, n > 63. Cel putin 63 de aruncari asigura

P

µ¯¯S 63

63− 1

2

¯¯ < 0.2

¶> 0.9.

Putem determina intervalul în care variaza frecventa relativa astfelîncât (4.3) sa fie satisf acuta si deci frecventa absoluta pentru un anu-

mit n ≥ 63,¯¯k

n− 1

2

¯¯ < 0.2 ⇔ 0.3 <

k

n< 0.7 ⇔ n × 0.3 < k < n × 0.7.

Daca n = 63 rezulta 18 < k < 44. Deci din 63 aruncari, numarularuncarilor reusite este cuprins între 18 si 44, atunci (4.3) este sat-isf acuta, adica am determinat intervalul în care se situeaza numarulcazurilor favorabile aparitiei unei aceleiasi fete, aceasta având loc cuprobabilitatea de cel putin 0.9. ♦

Page 167: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 167/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 165

Problema 4.4. O central a electric a trebuie s a deserveasc a o re tea de 10000 de aparate. Probabilitatea func tion arii unui aparat în perioada de vârf a consumului de energie electric a, este de 0.7. S a se fac a analiza economic a necesar a proiect arii centralei.

Rezolvare. Pentru a determina capacitatea centralei pot fi adoptatecriterii diferite:

1. sa construim centrala astfel încât în orice moment cele 10 000de aparate sa functioneze simultan;

2. sa se determine capacitatea centralei astfel încât cu o probabi-

litate suficient de mare, consumul obisnuit s˘

a fie asigurat cu energianecesara unei bune functionari.Fie X o variabila aleatoare care ia ca valori numarul de aparate care

pot functiona în perioada de vârf a consumului de energie electrica.Aceasta variabila aleatoare are o repartitie binomiala cu

n = 10000, p = 0.7, M [X ] = np = 7000,

D[X ] = npq = 2100,p

D[X ] = 45.83 ≈ 46,

Adoptam cea de a doua solutie: sa determinam capacitatea centraleiastfel încât cu o probabilitate de 0.99 functionarea sa fie normala.

Folosim Teorema Moivre-Laplace cu a = −∞.

P

Ã1n

S n − pp pqn

≤ b

!= 0.999 = Φ(b) ⇔ b = 3.09

S n − 10000 × 0.7√ 10000 × 0.7 × 0.3

≤ 3.09.

S n = 7000 +√

10000 × 0.7 × 0.3 · 3.09 = 7141.6 ≈ 7142 se numestecoeficient de simultaneitate si este indicat sa se faca constructia cen-tralei pentru el. Daca centrala se construieste pentru 10000 de aparatecare sa functioneze simultan, cu o probabilitate de 0.01, un numar de10000 − 7142 = 2858 aparate ramân nefolosite. ♦

Problema 4.5. O fabric a are în stoc 1660 tone dintr-o materie prim a.Stiind c a zilnic se consum a în medie 13.33 t cu abaterea 1.2 t, cu ce probabilitate aceast a cantitate ajunge pentru 4 luni.

Rezolvare. Notam cu X i variabila aleatoare care ia ca valori con-sumul zilei i, i = 1, 120. Avem

M [X i] = 13.33,p

D[X i] = 1.2.

Page 168: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 168/364

166 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

În 120 de zile se consuma X =120Pi=1

X i. Ne aflam în cazul general în

care nu se cunoa ste reparti tia variabilei aleatoare X i. Sa determinamP (X < 1660).

M [X ] = nm = 120 × 13.33 = 1599.6,

D[X ] =√

nσ2 =√

nσ =√

120 · 1.2 = 13.1,

P (X < 1660) = P

µX − 1599.6

13.1<

1660 − 1599.6

13.1

¶= 0.999.

Se poate deci presupune ca aproape sigur cantitatea de materie primaeste suficienta. ♦

Problema 4.6. Aplica tie la sondaje de opinie. Presupunem c a se realizeaz a experimente de tip Bernoulli în care un eveniment A se produce cu probabilitatea p. Not am cu X k variabila aleatoare care ia valoarea 1 dac a la experien ta cu num arul de ordine k se produce eveni-mentu A si 0 dac a nu se produce A. Variabilele aleatoare (X k)k≥1 sunt independente. Atunci S n = X 1 + X 2 + . . . + X n reprezint a num arul total de realiz ari ale evenimentului A, deci num arul de succese ale lui A în urma efectu arii a n experien te. S n este o v. a. repartizat a bino-

mial, S n ∈ Bin(n, p). V. a. (X n)n∈N au aceea si reparti tie (binomial a).Ne intereseaz a s a calcul am între ce limite poate varia S n astfel încât succesul s a se produc a cu o probabilitate dat a.

Rezolvare. Notam cu Z n =S n − np√

npq . Conform teoremei limita

centrala rezulta ca pentru orice a < b si n suficient de mare,

P (a ≤ Z n ≤ b) =1√ 2π

Z ba

e−12x2dx = Φ(b) −Φ(a).

Pentru orice α < β , avem α ≤ S n ≤ β daca si numai dacaα − np√

npq ≤ Z n ≤ β − np√

npq .

Notândα − np√

npq = a,

β − np√ npq

= b, rezulta ca

P (α ≤ S n ≤ β ) = Φ

µβ − np√

npq

¶−Φ

µα − np√

npq

Page 169: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 169/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 167

si deci

P (np + a√

npq ≤ S n ≤ np + b√

npq ) ∼= Φ(b) −Φ(a).

În particular, pentru a = −b (b > 0) rezulta formula

P (np − b√

npq ≤ S n ≤ np + b√

npq ) ∼= 2 ·Φ(b) − 1, (4.4)

pentru n >> 1 (unii statisticieni recomanda npq ≥ 10 ).Aceasta formula este utilizata în sondaje astfel. Consideram o po-

pula¸tie statistic

˘

a uman˘

a c˘

areia îi cerem opinia într-o anumit˘

a chesti-une: ce echipa de fotbal, ce partid, ce televiziune etc prefera. Nu toatalumea poate fi consultata si atunci se realizeaza un sondaj pe esan-tioane restrânse, alese cu obiectivitate. Sa presupunem ca se consultan persoane si notam cu S n numarul de persoane care se pronunta pen-tru (succes); se determina parametrul p ca fiind frecventa de succes.

Cu ajutorul lui se determina intervalul de succes pentru populatiastudiata.

De exemplu, pentru b = 2.17 avem Φ(b) = 0.985 deci 2 ·Φ(b) −1 =0.97 si conform (4.4), se realizeaza cu eroare sub 3% evenimentul

S n ∈ [np − 2.17√ npq ≤ S n ≤ np + 2.17√ npq ] ;

pentru b = 1.96 avem 2·Φ(b)−1 = 0.952 si conform (4.4), se realizeazacu eroare sub 5% evenimentul

S n ∈ [np − 1.96√

npq ≤ S n ≤ np + 1.96√

npq ] .

Problema 4.7. Dintr-un sondaj realizat într-un ora s a rezultat c a dintr-un e santion de 1000 votan ti 600 ar vota cu partidul X. Cu oeroare de sub 3% s a se estimeze câ ti dintre cei 1.2 milioane de votan ti ar vota pentru X. Dar cu o eroare de 5%? Dar de 1%?

Rezolvare. Avem p = 6001000

= 0.6 si q = 0.4, n = 1200000 si deoarece2 · Φ(b) − 1 = 0.97 rezulta Φ(b) = 0.985 ⇒ b = 2.17, deci numarulcerut este cuprims între np − 2.17

√ npq si np + 2.17

√ npq adica între

1200000 · 0.6 − 2.17√

1200000 · 0.6 · 0.4 = 718840

si1200000 · 0.6 + 2.17

√ 1200000 · 0.6 · 0.4 = 721160.

Page 170: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 170/364

168 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

Daca 2 · Φ(b) − 1 = 0.95 rezulta Φ(b) = 0.975 ⇒ b = 1.96, decinumarul cerut este cuprims între

1200000 · 0.6 − 1.96√

1200000 · 0.6 · 0.4 = 718950

si1200000 · 0.6 + 1.96

√ 1200000 · 0.6 · 0.4 = 721050.

Daca 2 · Φ(b) − 1 = 0.99 rezulta Φ(b) = 0.995 ⇒ b = 2.57, decinumarul cerut este cuprims între

1200000 · 0.6 − 2.57√ 1200000 · 0.6 · 0.4 = 718620

si1200000 · 0.6 + 2.57

√ 1200000 · 0.6 · 0.4 = 721380.

Observam ca o eroare mai mica implica un interval mai mare.Rezolvarea cu Mathematica:p = 0.6;n = 1200000;<< Statistics‘ContinuousDistributions‘

eroare = 0.05;q1 = Quantile[NormalDistribution[0, 1], (2 - eroare)/2]1.95996inmin = n p - q1 Sqrt[n p (1 - p)]718948inmax = n p + q1 Sqrt[n p (1 - p)]721052eroare = 0.01;q2 = Quantile[NormalDistribution[0, 1], (2 - eroare)/2]2.57583

inmin = n p - q2 Sqrt[n p (1 - p)]718618inmax = n p + q2 Sqrt[n p (1 - p)]721382Facem observatia ca diferentele apar datorita erorilor de aproxi-

mare.

Problema 4.8. O moned a este aruncat a de 1000 de ori. Cu o proba-bilitate de 0.95 în ce interval se va situa num arul de apari tii al stemei?

Page 171: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 171/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 169

Rezolvare. Probabilitatea de aparitie a stemei la o aruncare este

p =1

2. Fie X variabila aleatoare egala cu numarul de aparitii al stemei

la aruncarea de n = 1000 de ori a monezii. X poate fi aproximat cuo variabila aleatoare normala având media m = np = 500 si dispersiaσ2 = np (1 − p) = 250. Prin urmare

P

µ¯

¯X − m

σ

¯

¯< ε

¶= 2Φ (ε) − 1 = 0.95.

De unde g˘

asimΦ

(ε) = 0.975 si apoi ε = 1.96.Deci X ∈ [m − εσ,m + εσ], adica X ∈ [402, 598].

Problema 4.9. Probabilitatea de producere a unui eveniment oare-care în cadrul unei experien te este de 0.1. În cadrul a n experien te evenimentul s-a produs de 100 ori. S a se determine intervalul pentru num arul de experien te cu o probabilitate de a) 0.95, b) 0.99.

Rezolvare. Experientele considerate sunt experiente Bernoulli cu pro-babilitatea de succes p = 0.1. Consideram variabilele aleatoare X i

X i :µ1 0

p 1 − p

¶, i = 1, n.

AvemM [X i] = p

not= m, D [X i] = p (1 − p)

not= σ2.

Variabila aleatoare X =nPi=1

X i poate fi aproximata cu o variabila

aleatoare normala cu media mn = np si dispersia nσ2 = np (1 − p).Avem

P ï X − npp

np (1 − p)

¯< ε

!= 0.95.

Pe de alta parte

P

ï¯ X − npp

np (1 − p)

¯¯ < ε

!= 2Φ (ε) − 1 = 0.95 ⇔

⇔ Φ (ε) = 0.975 ⇔ ε = 1.96.

Page 172: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 172/364

170 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

Cum X = 100 rezulta ca

100 − npp np (1 − p)

=100 − 1

10n

310

√ n

= 1.96 ⇒ n = 830,

100 − npp np (1 − p)

=100 − 1

10n

310

√ n

= −1.96 ⇒ n = 1204.

În concluzie 830 ≤ n ≤ 1204.Procedând analog pentru probabilitatea 0.99, obtinem

(ε) − 1 = 0.99 ⇔ Φ(ε) = 0.995 ⇔ ε = 2.575,¯

¯ 100 − npp np (1 − p)

¯¯ = ±2.575 ⇒ n1 = 783, n2 = 1275

si deci 783 ≤ n ≤ 1275.

4.1.1 Aproximarea v. a. binomiale printr-o v. a.normala

Fie X o v. a. discreta repartizata binomial cu parametrii p si n

(deci M [X ] = np, D [X ] = npq ) si k ∈ N , k ≤ n. Sa se calculezeP (X = k) si P (X ≤ k) folosind teorema limita centrala (pentru nsuficient de mare si pq nu foarte mic).

Conform teoremei limita centrala X ∈ N ¡

np,√

npq ¢

si deci

P (X = k) = P ¡

X ∈ £k − 1

2, k + 1

2

¤¢=

= Φ

µk + 1

2− np√

npq

¶−Φ

µk − 1

2− np√

npq

¶.

Adaugarea lui 0.5 la k se numeste corectie prin continuitate. Afost pentru îmbunatatirea aproximatiei.

La fel P (X ≤ k) = P ¡

X ≤ k + 12

¢= Φ

µk + 12 − np√ npq

¶.

Problema 4.10. La un canal de comunicare digital presupunem c a v. a. care ia ca valori num arul bi tilor erona ti primi ti poate fi modelat a de o v. a. distribuit a binomial.

a) Presupunem c a probabilitatea de a obtine un bit eronat este de 10−5. Dac a 16 milioane de bi ti au fost transmi si, care este probabili-tatea ca cel mult 150 s a fie erona ti?

Page 173: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 173/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 171

b) Presupunem c a probabilitatea de a obtine un bit eronat este de 10−1. Dac a 50 de bi ti au fost transmi si, care este probabilitatea ca cel mult 2 s a fie erona ti? Compara ti aceast a probabilitate cu ce obtinut a prin aproximarea cu distribu tia normal a.

c) În condi tiile de la punctul b), calcula ti probabilitatea de a avea exact 5 bi ti erona ti prin cele dou a metode.

Rezolvare. a) Fie X v. a. repartizata binomial care ia ca valorinumarul de biti care au fost transmisi eronat în cursul transmisiei celor16 milioane de biti.

P (X ≤ 150) =150Xi=0

C i16000000¡

10−5¢i ¡

1 − 10−5¢16000000−i

.

Evident, aceasta probabilitate este foarte greu de calculat. Vomfolosi distributia normala care furniza o buna aproximare pentru proba-bilitatea cautata. Deoarece n = 16000000 si p = 10−5, atunci repar-titia normala care aproximeaza are m = 160 si σ = 12.469. Din ur-matoarea secventa observam ca repartitia normala realizeaza în acestcaz o foarte buna aproximare.

n = 16000000;

p = N[10^(-5)]

0.00001

m = N[n p]

160

sigma= N[Sqrt[n p(1 - p)]]

12.649

<< Statistics‘ContinuousDistributions‘

<< Statistics‘DiscreteDistributions‘

hh[x_] := PDF[NormalDistribution[m, sigma], x]f[k_] := PDF[BinomialDistribution[n, p], k]

tab1 = Table[k, f[k], k, 10, 250];

p1 = Plot[hh[x], x, m - 3 sigma, m + 3 sigma, DisplayFunction ->Identity];

<< Graphics‘Graphics‘

p2 = Graphics[PointSize[0.015], Map[Point, tab1]]

Show[p1, p2]

Page 174: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 174/364

Page 175: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 175/364

CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A 173

0.186336Observam ca aproximarea este înca suficient de buna.

Problema 4.11. Se arunc a o moned a si probabilitatea de a obtine banul este 0.6. Se arunc a moneda de 1000 ori. Care este probabilitatea de a obtine banul de 650 de ori?

Rezolvare. Fie X v. a. care ia ca valori numarul de aparitii ale ban-ului în cele 1000 de aruncari. Evident X ∈ Bin [10000; 0.6]. Conformteoremei limita centrala X ∈ N (600, 240).

P (X = 650) = P ¡X

∈ £650

−1

2

, 650 + 1

2¤¢ =

= Φ

µ650 + 1

2− 600√

240

¶−Φ

µ650 − 1

2− 600√

240

¶=

= Φ (3.25) −Φ (3.19) = 0.999423 − 0.999289 = 0.000134. ♦

O v. a. distribuita binomial se aproximeaza cu o v. a. distribuitanormal daca np > 5, nq > 5.

Conditii pentru aproximarea distributiei hipergeometrice si bino-miale:

distributia ≈ distributia ≈ distributiahipergeo-

metrica

n

N < 0.1 binomial˘

a

np > 5

n(1 − p) > 5 normal˘

a

4.1.2 Aproximarea v. a. Poisson printr-o v. a.normala

Reamintim ca distributia Poisson s-a dezvoltat ca limita a dis-tributiei binomiale când numarul experimentelor tinde la infinit. Deaceea apare logic ca sa utilizam distributia normala pentru a aproximaprobabilitati Poisson. Fie X o v. a. discreta repartizata Poisson cuparametru λ. Atunci M [X ] = λ, D [X ] = λ. Conform teoremei lim-

ita centrala X ∈ N ³λ, √ λ´. Sa se calculeze P (X = k) si P (X ≤ k)pentru k numar natural.

P (X = k) = P ¡

X ∈ £k − 1

2, k + 1

2

¤¢=

= Φ

µk + 1

2− λ√

λ

¶−Φ

µk − 1

2− λ√

λ

¶.

Analog P (X ≤ k) = P ¡

X ≤ k + 12

¢= Φ

³k+ 1

2−λ√ λ

´.

Aproximarea este buna daca λ > 5.

Page 176: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 176/364

174 CAPITOLUL 4. TEOREMA LIMIT A CENTRAL˘ A

Problema 4.12. Statistica arat a c a la o unitate de asigur ari se pri-mesc în medie 300 de reclama tii pe an. Fie X v. a. care ia ca valori num arul de reclama tii pe an, presupus a repartizat a Poisson. S a se determine probabilitatea ca s a primeasc a cel pu tin 351 de reclama tii pe an.

Rezolvare. Fie X ∈ Poiss [λ], λ = 300,

P (X ≥ 351) = 1 − P (X ≤ 351) = 1 −Φµ

351.5 − 300√ 300

¶=

= 1 −Φ (2.9734) = 1 − 0.99853 = 0.00147.

<< Statistics‘ContinuousDistributions‘m = 300sigma = Sqrt[300]30010

√ 3

N[%]17.32051 - CDF[NormalDistribution[300, 17.3205 ], 351]0.00161745 ♦

Dupa un studiu atent al acestui capitol retinem ca teorema limitacentrala permite aproximarea, în anumite conditii, a diferitelor dis-tributii prin distributii normale, ceea ce este foarte util în simulareaexperimentelor.

Page 177: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 177/364

Capitolul 5

Vectori aleatori

5.1 Variabile aleatoare bidimensionale

În aplicatiile practice ale teoriei probabilitatilor se întâlnesc adeseaprobleme în care rezultatele nu pot fi descrise de o variabila aleatoare,ci de doua sau mai multe, ele formând un vector aleator.

De exemplu, într-un anumit experiment ne intereseaza sa masuramatât viteza cât si directia particulelor atomice emise de o suprafata.

Acestea sunt date de perechile (v, θ), unde θ este marimea unghiuluiorientat în raport cu sistemul de referinta si v viteza. Acestea pot fistudiate ca un vector aleator.

Definitia 5.1. Se numeste vector aleator n-dimensional orice n-upluX = (X 1, X 2, . . . , X n) având cele n componente, X 1, X 2, . . . , X n,variabile aleatoare.

Pentru simplitate, vom considera vectori aleatori (vec. a. ) bidi-mensionali.

Definitia 5.2. Vec. a. bidimensional X = (X 1, X 2) se numeste dis-cret daca multimea valorilor v. a. (X 1, X 2) este cel mult numarabila.

Orice vec. a. discret simpl bidimensional X = (X 1, X 2) se con-sidera ca un v. a. de componente X 1 si X 2. Daca v. a. X 1 si X 2 iauun numar finit de valori, atunci valorile lui Y sunt perechile ordonate(xi, y j) pe care le ia cu probabilitatea pij = P (X 1 = xi si X 2 = y j) .Obtinem urmatorul tablou bidimensional de repartitie:

175

Page 178: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 178/364

176 CAPITOLUL 5. VECTORI ALEATORI

X 1/X 2 y1 y2 . . . yn P (X 1 = xi)x1 p11 p12 . . . p1n p1·

x2 p21 p22 . . . p2n p2·...

......

......

...xm pm1 pm2 . . . pmn pm·

P (X 2 = y j) p·1 p·2 . . . p·n 1

în care 0 ≤ pij ≤ 1.Din faptul ca evenimentele X 1 = xi, X 2 = y j, i = 1, m, j = 1, n,

formeaza un sistem complet de evenimente, rezulta ca suma probabil-

itatilor din tabel este 1,mXi=1

nX j=1

pij = 1,

unde pij = P (X 1 = xi si X 2 = y j) .

Am notatn

Xk=1

pik = pi·, i = 1, m,m

Xk=1

pkj = p· j, j = 1, n,

cantitati care se numesc probabilit a ti marginale . Deoarece

X 1 = xi = X 1 = xiTµ

nS j=1

X 2 = y j

¶=

nS j=1

X 1 = xi, X 2 = y j

rezulta ca

P (X 1 = xi) =nX

j=1

pij = pi., P (X 2 = y j) =mXi=1

pij = p.j.

Definitia 5.3. Variabila aleatoare X 1 conditionata de X 2 = y j are

repartitiaµx1 . . . xi . . . xm

P (x1 | y j) . . . P (xi | y j) . . . P (xm | y j)

¶unde am notat cu P (xi | y j) probabilitatea condi tionat a :

P (xi | y j) = P (X 1 = xi | X 2 = y j) =

P (X 1 = xi ∩ X 2 = y j)

P (X 2 = y j)=

pij p· j

.(5.1)

Page 179: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 179/364

Page 180: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 180/364

178 CAPITOLUL 5. VECTORI ALEATORI

Observatia 5.1. Putem atasa vec. a. (X 1, X 2) tabloul de repartitiedat de legile de probabilitate conditionata:

X 1 | X 2 = y j :

µx1 x2 . . . xi . . . xm p1j p·j

p2j p·j

. . . pij p·j

. . . pmj

p·j

¶,

si respectiv

X 2 | X 1 = xi : µy1 y2 . . . y j . . . ym pi1 pi·

pi2 pi·

. . . pij pi·

. . . pin pi· ¶ .

Deci avem n legi conditionate ale variabilei aleatoare X 1 corespunza-toare celor n valori ale variabilei aleatoare X 2 si respectiv m legi deprobabilitate ale variabilei aleatoare X 2 conditionate de cele m valoriale lui X 1.

Exemplul 5.1. Sunt studiate mai multe tipuri de tranzactii în functiede modurile de realizare. Tipurile de tranzactii sunt în numar de cincisi sunt notate x1, x2, . . . , x5. Modurile de realizare a fiecarei tranzactiipot fi în numar de sapte, notate y1, y2, . . . , y7. Numarul operatiilor de

fiecare tip de tranzactie sunt date în urmatorul tabel:X 1/X 2 y1 y2 y3 y4 y5 y6 y7

x1 43 23 11 12 0 0 0 89x2 44 4 3 1 0 1 0 53x3 4 11 0 0 0 1 0 16x4 5 130 120 0 10 0 0 265x5 4 0 0 0 0 0 1 5

100 168 134 13 10 2 1 428

V. a. X 1 se ia ca valori tipurile de tranzactii, în numar de cinci,

notate x1, x2, . . . , x5 iar X 2 ia ca valori modurile de realizare a tran-zactiilor notate y1, y2, . . . , y7.Sa se scrie tabloul de repartitie a vec. a. (X 1, X 2) , legile de prob-

abilitate marginale pentru vec. a. (X 1, X 2) , legea de probabilitateconditionata X 2|X 1 = x2

Rezolvare. Observam ca X 1 si X 2 sunt v. a. discrete cu un numarfinit de valori, iar numarul valorilor vec. a. (X 1, X 2) va fi si el finit.

În exemplul dat tabloul bidimensional de repartitie este

Page 181: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 181/364

CAPITOLUL 5. VECTORI ALEATORI 179

X 1/X 2 y1 y2 y3 y4 y5 y6 y7 P (X 1 = xi)

x143428

23428

11428

12428

0 0 0 89428

x244428

4428

3428

1428

0 1428

0 53428

x34

42811428

0 0 0 1428

0 16428

x45

428130428

120428

0 10428

0 0 265428

x54

4280 0 0 0 0 1

4285

428

P (X 2 = y j) 100428

168428

134428

13428

10428

2428

1428

1

În acest caz avem v. a. marginale sunt

X 1 :

Ãx1 x2 x3 x4 x5

89428

53428

16428

265428

5428

!

X 2 :

Ãy1 y2 y3 y4 y5 y6 y7100428

168428

134428

13428

10428

2428

1428

!.

În acest caz avem v. a. marginale sunt

X 1 :

Ãx1 x2 x3 x4 x5

89428

53428

16428

265428

5428

!

X 2 :

Ãy1 y2 y3 y4 y5 y6 y7100428

168428

134428

13428

10428

2428

1428

!.

Legea de probabilitate conditionata X 2|X 1 = x2

X 2|X 1 = x2 : y1 y2 y3 y4 y5 y6 y7

p21

p2·

p22

p2·

p23

p2·

p24

p2·

p25

p2·

p26

p2·

p27

p2·

,

X 2|X 1 = x2 :

y1 y2 y3 y4 y5 y6 y74442853428

442853428

342853428

142853428

053428

142853428

053428

,

X 2|X 1 = x2 :

Ãy1 y2 y3 y4 y5 y6 y7

4453

453

353

153

0 153

0

!. ♦

Page 182: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 182/364

180 CAPITOLUL 5. VECTORI ALEATORI

5.2 Functia de repartitie a unui vec. a. bi-dimensional

Presupunem ca avem doua v. a. X 1 si X 2

Definitia 5.5. Fie un vec. a. bidimensional X = (X 1, X 2). Senumeste func tie de reparti tie a lui X functia reala

F X : R2 → [0, 1] , F X (x, y) = P (X 1 ≤ x, X 2 ≤ y).

Definitia 5.6. Fie vec. a. discret X = (X 1, X 2) . Functia de repartitieeste definita de

F X (x, y) = P (X 1 ≤ x, X 2 ≤ y) =

=Xxi≤x

Xyj≤y

P (X 1 = xi si X 2 = y j) =Xxi≤x

Xyj≤y

pij.

Definitia 5.7. Vec. a. bidimensional X = (X 1, X 2) se numeste con-tinuu cu densitatea de probabilitate f X : R2 → R daca functia derepartitie F X : R2 → R este continua si derivabila pe portiuni si

f X (x, y) = ∂ 2

F X (x, y)∂x∂y

.

Teorema 5.1. Urm atoarele afirma tii sunt adev arate:1. F X (x, y) este monoton cresc atoare în raport cu fiecare variabil a,2. F X (x, y) este continu a la dreapta în raport cu fiecare variabil a,3. lim

x→−∞,y→−∞

F X (x, y) = 0, limx→∞,y→∞

F X (x, y) = 1.

Teorema 5.2. Fie vec. a. bidimensional X = (X 1, X 2) cu densitatea de probabilitate f X . Atunci:

a) f X (x, y) ≥ 0, ∀(x, y) ∈ R2,

b)∞R −∞

∞R −∞

f X (x, y)dxdy = 1,

c) F X (x, y) = P (X 1 ≤ x, X 2 ≤ y) =xR −∞

yR −∞

f X (u, v)dudv

sau pentru orice domeniu D ⊂ R2,

P ((X 1, X 2) ∈ D) =

ZZ D

f X (x, y)dxdy

Page 183: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 183/364

CAPITOLUL 5. VECTORI ALEATORI 181

d) dac a a ≤ b si c ≤ d atunci

P (a < X 1 ≤ b,c < X 2 ≤ d) = F X (b, d)−F X (a, d)−F X (b, c)+F X (a, c)

sau

P (a < X 1 ≤ b, c < X 2 ≤ d) =

Z ba

Z dc

f X (x, y)dxdy.

Definitia 5.8. Fie vec. a. bidimensional X = (X 1, X 2) si f X (x, y)

densitatea sa de probabilitate. Functiile

f X 1(x) =

Z ∞−∞

f X (x, y)dy, f X 2(y) =

Z ∞−∞

f X (x, y)dx

se numesc densit a ti de probabilitate marginale .

Definitia 5.9. Fie vec. a. bidimensional X = (X 1, X 2) si f X (x, y)densitatea sa de probabilitate, iar f X 1(x) si f X 2(y) densitatile de prob-abilitate marginale. Variabilele aleatoare X 1 si X 2 sunt independente daca

f X (x, y) = f X 1(x)f X 2(y), ∀x,y.

Densitati de probabilitate conditionate.Fie vec. a. X = (X 1, X 2) cu densitatea de probabilitate f X (x, y).

Ne propunem sa determinam densitatea de probabilitate a v. a. X 1,conditionata de X 2 = y j .

Daca A1 = X 1 < x si A2 = y j − h < X 2 < y j + h atunci putemscrie

P (A1|A2) =P (X 1 < x ∩ y j − h < X 2 < y j + h)

P (y j

−h < X 2 < y j + h)

=

=

Z x−∞

duZ yj+hyj−h

f X (u, v)dvZ yj+hyj−h

f X 2(v)dv

,

unde f X 2(v) =∞R −∞

f X (u, v)du este densitatea de probabilitate marginala

a v. a. X 2.

Page 184: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 184/364

Page 185: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 185/364

CAPITOLUL 5. VECTORI ALEATORI 183

în cazul continuu.Dispersia:

D [X ] =mXi=1

nX j=1

(xi − M [X 1])2 (y j − M [X 2])2 pij,

daca X este vect. a. discret, respectiv

D [X ] =

Z ∞

−∞ Z ∞

−∞(x − M [X 1])2 (y − M [X 2])2 f X (x, y)dxdy,

daca X este vect. a. continuu.Se mai definesc dispersia lui X 1, si respectiv X 2:

D [X 1] =mXi=1

nX j=1

(xi − M [X 1])2 pij,

D [X 2] =mXi=1

nX j=1

(y j − M [X 2])2 pij,

în cazul discret si

D [X 1] =

Z ∞−∞

Z ∞−∞

(x − M [X 1])2 f X (x, y)dxdy,

D [X 2] =

Z ∞−∞

Z ∞−∞

(y − M [X 2])2 f X (x, y)dxdy,

în cazul continuu.În toate cazurile integralele improprii care intervin trebuie sa fie

convergente.

Întroducem media conditionata lui X 1 | X 2 = y j

M [X 1 | X 2 = y j] =mXi=1

xi pij p· j

în cazul discret si, respectiv,

M [X 1 | X 2 = y j] =

Z R

xf X 1|yj(x)dx =

Z R

xf X (x, y j)

f X 2(y j)dxdy

Page 186: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 186/364

184 CAPITOLUL 5. VECTORI ALEATORI

în cazul continuu.Dispersia conditionata X 1 | X 2 = y j

D [X 1 | X 2 = y j] =mXi=1

(xi − M [X 1 | X 2 = y j ])2pij p· j

.

în cazul discret si respectiv

D [X 1 | X 2 = y j] =

Z R

(xi − M [X 1 | X 2 = y j])2f X (x, y j)

f X 2(y j)dx.

în cazul continuu.Analog introducem notiunile medie si dispersie conditionata pentruX 2 | X 1 = xi.

5.4 Operatii cu v. a. continue

Distributia sumei a doua v. a. continue

Exercitiul 5.1. Sa se demonstreze ca suma a doua variabile aleatoareindependente are drept densitate de probabilitate produsul de con-

volutie a densitatilor de probabilitatea a celor doua v. a.Rezolvare. Fie X 1 si X 2 doua v. a. care au densitatile de probabili-tate f 1 respectiv f 2 si f X (x, y) densitatea de probabilitate a vectoruluiX = (X 1, X 2) . Notam cu Z = X 1 + X 2 iar h respectiv H densitateade probabilitate, respectiv functia de repartitie a lui Z .

Conform definitiei functiei de repartitie avem:

H (z) = P (Z ≤ z) = P ((X 1, X 2) ∈ S ) , ∀z ∈ Runde S = (x, y) ∈ R2, x + y < z . Deci H (z) =

ZZ S

f X (x, y)dxdy.

Figura 5.1.

Page 187: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 187/364

CAPITOLUL 5. VECTORI ALEATORI 185

Un punct arbitrar de pe dreapta de ecuatie x + y = z are coordo-natele (x, z − x). Inecuatia x + y < z reprezinta semiplanul S în care

x ∈ R si y ∈ (−∞, z − x) . Atunci H (z) =∞R −∞

dxz−xR −∞

f X (x, y)dxdy.

Derivând sub integrala în raport cu z, obtinem

h(z) = H 0(z) =

Z ∞−∞

f X (x, z − x)dx.

Daca v. a. X 1, X 2 sunt independente, adica f X (x, y) = f X 1(x)f X 2(y),atunci

h(z) =

Z ∞−∞

f X 1(x)f X 2(z − x)dx = (f X 1 ∗ f X 2)(z). ♦

Distributia câtului a doua v. a. continue

Exemplul 5.2. Sa se calculeze densitatea de probabilitate a câtuluia doua v. a. continue. Sa se particularizeze în cazul în care cele douav. a. sunt independente.

Rezolvare. Fie X 1 si X 2 doua v. a., X 2 6= 0, care au densitatile de

probabilitate f 1 respectiv f 2¸si f X (x, y) densitatea de probabilitatea vectorului X = (X 1, X 2). Notam cu Z =

X 1X 2

iar h respectiv H

densitatea de probabilitate, respectiv functia de repartitie a lui Z .Conform definitiei functiei de repartitie avem: ∀z ∈ R,

H (z) = P (Z ≤ z) =

Z y>0

Z x<zy

f X (x, y)dxdy +

Z y<0

Z x>zy

f X (x, y)dxdy =

=

∞Z 0

zyZ −∞

f X (x, y)dxdy +

0Z −∞

∞Z zy

f X (x, y)dxdy.

Prin derivare în raport cu z gasim

h(z) =

Z ∞−∞

|y| f X (zy,y)dy.

În particular, pentru X 1 si X 2 independente gasim

h(z) =

Z ∞−∞

|y| f X 1(zy)f X 2(y)dy. ♦

Page 188: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 188/364

186 CAPITOLUL 5. VECTORI ALEATORI

Exemplul 5.3. Fie v. a. X ∈ N [0, 1] si Y ∈ χ2(n). Sa se determinedensitatea de probabilitate a v. a.

a)q

Y n

si

b) Z = X √ Y n

.

Rezolvare.Densitatea de probabilitate a lui X ∈ N [0, 1] este

f X (x) =1√ 2π

e−x2

2

iar a lui Y ∈ χ2(n) este

f Y (x) =

1

2n2Γ¡n2

¢xn2−1e−

x2 , x > 0

0, x ≤ 0.

a) F √ Y n

(y) = P ³q

Y n

< y´

= P (Y < y2n) = F Y (y2n) , pentru

y > 0 si 0 pentru y < 0. Rezulta ca densitatea de probabilitate a luiq Y n

este

f √ Y n

(y) = ddy

F √ Y n

(y) = 2nyF 0Y (y2n) =

= 2nyf Y ¡

y2n¢

=2ny

2n2Γ¡n2

¢ ¡y2n¢n2−1 e−

y2n2 ,

deci

f √ Y n

(y) =

2ny

2n2Γ¡n2

¢ (y2n)n2−1 e−

y2n2 , y > 0

0, y ≤ 0.

b) Pentru Z = X √ Y n

avem densitatea de probabilitate, conform

Exercitiului 5.2,

f Z (z) =

Z ∞−∞

|y| f X (zy)f √ Y n

(y)dy =

=

Z ∞0

y1√ 2π

e−(zy)2

22ny

2n2Γ¡n2

¢ ¡y2n¢n2−1 e−

y2n2 dy =

=2 (n)

n2

2n+12 Γ

¡n2

¢√ π

Z ∞0

yne−(z2+n)y2

2 dy.

Page 189: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 189/364

CAPITOLUL 5. VECTORI ALEATORI 187

Facem schimbarea de variabila (z2+n)y22

= u, y = u12

q 2

z2+n

f Z (z) =2 (n)

n2

³q 2

z2+n

´n+1

2n+12 Γ

¡n2

¢√ π2

Z ∞0

e−uun+12 −1du =

Γ¡n+12

¢¡z2+nn

¢n+12Γ¡n2

¢√ nπ

,

f Z (z) =Γ¡n+12

¢Γ¡n2

¢√ nπ

µ1 +

z2

n

¶−n+12

.

Recunoastem în expresia acestei functii densitatea de probabilitatea v. a. distribuite Student, prezentata în Capitolul 3. ♦

Exercitiul 5.2. Fie X v. a. care ia ca valori timpul de asteptare pânacând un calculator se conecteaza la server (masurat în microsecunde)si Y v. a. care ia ca valori timpul de asteptare pâna când serverul au-torizeaza accesul (recunoaste calculatorul respectiv ca un user valid).Fiecare dintre aceste v. a. masoara timpul de asteptare de la ace-lasi moment de plecare si, în mod evident, X < Y. S-a constatat cadensitatea de probabilitate a vec. a. (X, Y ) este

f (X,Y )(x, y) = 6 × 10−6 exp(−0.001x − 0.002y)

pentru 0 < x < y si zero în rest.a) Sa se verifice proprietatile densitatii de probabilitate a vec. a.

bidimensional. Sa se scrie functia de repartitie.b) Sa se calculeze probabilitatea ca X ≤ 1000 si Y < 2000 si

P (1000 < X ≤ 2000, 1500 < Y ≤ 2500) .

c) Sa se calculeze densitatile de probabilitate marginale si probabi-litatea ca Y ≥ 2000 microsecunde. Sunt cele doua v. a. independente?

d) S˘

a se determine f Y |x(y) si s˘

a se particularizeze în cazul x = 1500.Sa se calculeze P (Y > 2000 | X = 1500) .

e) Sa se determine media conditionata lui Y pentru x = 1500.

f ) sunt variabilele aleatore X, Y independente?

Rezolvare. Regiunea în care probabilitatea este diferita de zero estedesenata mai de culoare neagra în figura de mai jos.

dom = Graphics[Polygon[Table[0, 0, 1, 1, 0, 1]]]

Show[dom, AspectRatio -> 1, Axes -> True, AxesLabel -> x, y]

Page 190: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 190/364

188 CAPITOLUL 5. VECTORI ALEATORI

0.2 0.4 0.6 0.8 1x

0.2

0.4

0.6

0.8

1

y

Figura 5.2.

a) Se verifica: f (X,Y )(x, y) ≥ 0,Z ∞−∞

Z ∞−∞

f (X,Y )(x, y)dxdy =

=

Z ∞0

µZ ∞x

6 × 10−6 exp(−0.001x − 0.002y) dy

¶dx = 1.

Integrate[2 10 (-6) E^(-0.001u - 0.002 v), u, 0, Infinity, v, u,

Infinity]1.Determinam functia de repartitie

F (x, y) =

Z x0

µZ yu

6 × 10−6 exp(−0.001u − 0.002v) dv

¶du =

= 1 − e−0.003x − 3e0.002y£

1 − e−0.001x¤

.

Verificam proprietatile functiei de repartitie. Observam ca F esteo functie continua, lim

x→−∞,y→−∞

F X (x, y) = 0 rezulta din definitia densitatii

de probabilitate, iar limx→∞,y→∞

F X (x, y) = 1 rezulta din calcul.

Calculat cu Mathematica obtinemF[x_, y_] := Integrate[6 10^(-6) E^(-0.001u - 0.002 v), u, 0, x,

v, u, y]F[x,y]1.-1.E^(-0.003x)-0.003E^(-0.002y)[1000.-1000.E^(-0.001x)]F[x, y] /. x ->∞, y ->∞1.

Page 191: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 191/364

CAPITOLUL 5. VECTORI ALEATORI 189

b) X < 1000, Y < 2000 are loc pe domeniul hasurat si calculamintegrala dubla pe acest domeniu pe care îl vom nota D.

P (X < 1000, Y < 2000) =

ZZ D

f (X,Y )(x, y)dxdy =

=

Z 10000

Z 2000x

f (X,Y )(x, y)dxdy =

= 6 × 10−6Z 10000

µZ 2000x

exp(−0.002y) dy

¶exp(−0.001x) dx =

= 6 × 10−6 Z 10000

exp(−0.002x) − exp(−4)0.002 exp(−0.001x) dx =

= 0.003

Z 10000

(exp(−0.003x) − exp(−4)exp(−0.001x)) dx =

= 0.003 ·

µ1 − e−3

0.003− e−4 ·

1 − e−1

0.001

¶= 0.91548

Integrate[2 10^(-6) E^(-0.001u - 0.002 v), u, 0, 1000, v, u, 2000]0.91548Aceasta probabilitate reprezina aria suprafetei desenate mai jos cu

Mathematica.Plot3D[2 10^(-6) E^(-0.001x - 0.002 y), x, 0, 1000, y, 0, 2000,Axes -> True, AxesLabel -> x, y, z]Suprafata este reprezentata în figura 5.3.

P (1000 < X ≤ 2000, 1500 < Y ≤ 2500) =

2000Z 1000

2500Z 1500

f (X,Y )(x, y)dxdy =

= 6 × 10−62000

Z 1000

2500

Z 1500

exp(

−0.001x

−0.002y) dxdy = 0.0300325

Integrate[6 10^(-6) Exp[-0.001x - 0.002 y], x, 1000, 2000,y, 1500, 2500]

0.0300325c) f X (x) =

Z ∞−∞

f (X,Y )(x, y)dy =

=

Z ∞x

6 × 10−6 exp(−0.001x − 0.002y) dy = 0.003 e−0.003x

Page 192: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 192/364

190 CAPITOLUL 5. VECTORI ALEATORI

0

200

400

600

800

1000

x

0

500

1000

1500

2000

y

0

5× 10-7

1× 10-6

1.5× 10-6

2× 10-6

z

0

200

400

600

800x

Figura 5.3.

pentru x > 0. Observam ca aceasta este o distributie exponentiala cuλ = 0.003

Plot[0.003Exp[-0.003x], x, 0, 1000]

200 400 600 800 1000

0.0005

0.001

0.0015

0.002

0.0025

0.003

Figura 5.4.

f Y (y) =

Z ∞−∞

f (X,Y )(x, y)dy =

Z y0

6 × 10−6 exp(−0.001x − 0.002y) dx =

= 0.006e−0.002 y¡

1 − 1 e−0.001 y¢

pentru y > 0.Plot[-0.006 Exp[-0.003 y] + 0.006 Exp[-0.002 y], y, 0, 5000,

PlotRange -> 0, 0.002]

Page 193: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 193/364

Page 194: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 194/364

192 CAPITOLUL 5. VECTORI ALEATORI

= 0.002e3Z ∞1500

y exp(−0.002 y) dy = 2000.

f ) Deoarece f (X,Y )(x, y) 6= f X (x)f Y (y), v. a. nu sunt indepen-dente. ♦

Exercitiul 5.3. În exercitiul 5.2 modificam densitatea de probabili-tate a vect. a. (X, Y ) astfel:

f (X,Y )(x, y) = 2 × 10−6 exp(−0.001x − 0.002y) pentru x ≥ 0, y ≥ 0.

Sunt v. a. X, Y independente?Sa se calculeze P (X > 1000, Y < 1000) .

Rezolvare. Densitatea de probabilitate marginala a lui X

f X (x) =

Z ∞0

2 × 10−6 exp(−0.001x − 0.002y) dy = 0.001 e−0.001x

pentru x ≥ 0.Densitatea de probabilitate marginala a lui Y

f Y (y) = Z ∞

0

2 × 10−6 exp(

−0.001x

−0.002y) dx = 0.002 e−0.002 y

pentru y ≥ 0.Observam ca f (X,Y )(x, y) = f X (x) f Y (y), deci v. a. X si Y sunt

independente.Pentru a calcula probabilitatea ceruta tinem seama ca v . a. sunt

independente si deci

P (X > 1000, Y < 1000) = P (X > 1000) P (Y < 1000) =

=

Z ∞1000

0.001 e−0.001xdx

Z 10000

0.002 e−0.002 ydy = e−1

¡1−e−2

¢= 0.31809.

Definitia 5.12. Fie vectorul aleator bidimensional X = (X 1, X 2) cuv. a. X 1, X 2 definite pe acelasi spatiu de selectie. Numim covarian t a sau corela tie caracteristica numerica

cov(X 1, X 2) = M [(X 1 − M [X 1]) (X 2 − M [X 2])] .

Propozitia 5.1. Are loc urm atoarea egalitate

cov (X 1, X 2) = M [X 1X 2] − M [X 1] M [X 2] . (5.2)

Page 195: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 195/364

CAPITOLUL 5. VECTORI ALEATORI 193

Demonstratie. Din calcul rezulta ca

cov(X 1, X 2) = M [(X 1 − M [X 1]) (X 2 − M [X 2])] =

= M [X 1X 2 − X 1M [X 2] − M [X 1] X 2 + M [X 1] M [X 2]]

Tinem seama de proprietatile mediei (media sumei este suma medi-ilor, media constantei este constanta) si obtinem

cov(X 1, X 2) = M [X 1X 2] − M [X 1] M [X 2] − M [X 1] M [X 2] +

+ M [X 1] M [X 2] = M [X 1X 2]

−M [X 1] M [X 2] . ¤

Exercitiul 5.4. Daca v. a. sunt independente atunci cov(X 1, X 2) = 0.

Rezolvare. Daca v. a. sunt independente, media produsului celor douav. a. este egala cu produsul mediilor si folosind relatia 5.2, rezulta con-cluzia. ♦

Definitia 5.13. Fie vec. a. bidimensional X = (X 1, X 2) cu v. a.X 1, X 2 definite pe acelasi spatiu de selectie. Numim coeficient de corela tie raportul

r (X 1, X 2) = cov(X 1, X 2)p D [X 1]

p D [X 2]

.

Exercitiul 5.5. Pentru suma a doua v. a. X 1, X 2 definite pe acelasispatiu de selectie.avem D [X 1 + X 2] = D [X 1]+D [X 2]+2cov(X 1, X 2).

Rezolvare.

D [X 1 + X 2] = M £

(X 1 + X 2 − M [X 1 + X 2])2¤

=

= M £((X 1 − M [X 1]) + (X 2 − M [X 2]))2¤ =

= M £ (X 1 − M [X 1])2 + (X 2 − M [X 2])2 ++ 2 (X 1 − M [X 1]) (X 2 − M [X 2])

¤=

= M £

(X 1 − M [X 1])2¤

+ M £

(X 2 − M [X 2])2¤

+

+ 2M [(X 1 − M [X 1]) (X 2 − M [X 2])] =

= D[X 1] + D[X 2] + 2 cov (X 1, X 2) . ♦

Exercitiul 5.6. Sa se scrie matricea covariantelor pentru un vec. a.bidimensional.

Page 196: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 196/364

194 CAPITOLUL 5. VECTORI ALEATORI

Rezolvare.Fie vectorul aleator bidimensional X = (X 1, X 2). Ma-tricea covariantelor este:µ

cov(X 1, X 1) cov (X 1, X 2)cov(X 2, X 1) cov (X 2, X 2)

¶. ♦

Din cauza simetriei covariantei observam ca matricea covarianteloreste simetrica. Daca X 1 si X 2 sunt v. a. independente, atunci ma-tricea covariantelor este o matrice diagonala, pe diagonala principalaaflându-se dispersiile celor doua v. a.

Mathematica contine pachetele <<Statistics‘MultiDiscreteDistribu-tions‘ si << Statistics‘MultiDescriptiveStatistics‘ care permite sa se lu-creze cu vectori aleatori discreti (vectori multinomiali, vectori bino-miali cu exponent negativ, vectori Poisson) si respectiv cu vectoriialeatori continui (vectori normali, Student etc.)

5.5 Repartitia normala bidimensionala

Definitia 5.14. Fie m1, m2, σ1, σ2 si ρ numere reale cu σ1, σ2 > 0 si−1 ≤ ρ ≤ 1. Vectorul aleator X = (X 1, X 2) care are densitatea de

probabililtatef X (x, y) = 1

2πσ1σ2√

1−ρ2·

· exp

½− 1

2√

1−ρ2

·³x−m1

σ1

´2

+³y−m2

σ2

´2− 2ρ

³x−m1

σ1

´³y−m2

σ2

´¸¾,

x, y ∈ R, este distrubuit normal. Se spune despre v. a. X 1, X 2 ca audensitatea de probabilitate normala bidimensionala.

Propozitia 5.2. X 1 ∈ N [m1, σ1] si X 2 ∈ N [m2, σ2] , deci sunt nor-mal distribuite.

Parametrul ρ masoara legatura care exista între X si Y.

Propozitia 5.3. Fie v. a. X 1, X 2 cu densitatea de probabilitate nor-mal a bidimensional a. Atunci r(X 1,X 2) = ρ.

Propozitia 5.4. Dac a v. a. X 1, X 2 cu densitatea de probabilitate nor-mal a bidimensional a sunt independente, atunci ρ = 0.

În Mathematica distributia normala multidimensionala se apeleazacu ajutorul comenzii MultinormalDistribution[mu, sigma] unde mu estevectorul mediilor si sigma matricea covariantelor.

Page 197: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 197/364

CAPITOLUL 5. VECTORI ALEATORI 195

Secventa de mai jos realizeaza graficul distributiei bidimensionalenormale standard.

<< Statistics‘MultinormalDistribution‘

mn = 0, 0;

sig = 1, 0, 0, 1;

f[x_, y_] := PDF[MultinormalDistribution[mn, sig], x, y]

f[x, y]

e1/2(−x2−y2)

2πPlot3D[f[x, y], x, -3, 3, y, -3, 3, PlotPoints -> 25]

Graficul distributiei este reprezentat în figura 5.6.

-2

0

2

-2

0

2

0

0.05

0.1

0.15

-2

0

2

Figura 5.6.

Redefinim matricea covariantelor astfel încât dispersiile sa nu fieegale.Clear[sig]

mn = 0, 0;

sig = 1, 0, 0, 2;

f[x_, y_] := PDF[MultinormalDistribution[mn, sig], x, y]

Plot3D[f[x, y], x, -3, 3, y, -3, 3, PlotPoints -> 25]

Graficul distributiei este reprezentat în figura 5.7.

Page 198: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 198/364

196 CAPITOLUL 5. VECTORI ALEATORI

-2

0

2

-2

0

2

0

0.025

0.05

0.075

0.1

-2

0

2

Figura 5.7.

<< Statistics‘MultinormalDistribution‘mn = 0, 0;sig = 1, 0.9, 0.9, 1;f[x_, y_] := PDF[MultinormalDistribution[mn, sig], x, y]Plot3D[f[x, y], x, -3, 3, y, -3, 3, PlotPoints -> 25, ViewPoint ->

1.2, 1.2, 1.2]

-2

0

2

-2

0

2

0

0.02

0.04

0.06

-2

0

2

0

2

Figura 5.8.

Graficul distributiei în cazul în care coeficientul de corelatie este0.8 este în figura 5.8.

Observam ca daca v. a. sunt independente graficul este clopotulsimetric daca dispersiile sunt egale si deformat daca v. a. nu suntindependente.

Page 199: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 199/364

CAPITOLUL 5. VECTORI ALEATORI 197

Exemplul 5.4. În tabelul de mai jos sunt date mediile a 15 studentila testele din timpul semestrului si media finala de la examen. Sase determine media celor doi vectori, matricea covariantelor. Sa sedeseneze graficul distributiei normale bidimensionale avînd vectorulmediilor si matricea covariantelor calculate anterior.

Test Medie Test Medie Test Medie5.667 5 8 9 8.334 88.667 9 7.667 9 9.667 99 8 10 10 7 77.667 9 9 10 4.667 46.667 8 6.334 7 8.667 10

Rezolvare.<< Statistics‘MultinormalDistribution‘test=5.667, 8.667, 9, 7.667, 6.667, 8, 7.667, 10, 9, 6.334, 8.334,

9.667, 7, 4.667, 8.667final=5, 9, 8, 9, 8, 9, 9, 10, 10, 7, 8, 9, 7, 4, 10sigma = CovarianceMatrix[Transpose[test, final]] // N2.25056, 2.31418, 2.31418, 3.12381mn = Mean[Transpose[test, final]] // N7.80027, 8.13333f[x_, y_] := PDF[MultinormalDistribution[mn, sig], x, y]Plot3D[f[x, y], x, 4, 11, y, 4, 11, PlotPoints -> 25]Graficul este reprezentat în figura 5.9.

-2

0

2

-2

0

2

0

0.025

0.05

0.075

0.1

-2

0

2

Figura 5.9.♦

Page 200: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 200/364

Page 201: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 201/364

Capitolul 6

Elemente de statistica

6.1 Populatii statistice

Statistica se poate defini ca fiind stiinta care se ocupa cu colectarea,prezentarea, clasificarea, analiza si interpretarea cantitativa a datelorsi cu aplicarea teoriei probabilitatilor în analiza si estimarea caracte-risticilor (parametrilor) populatiei.

Definitia 6.1. Popula tia statistic a este o multime de elemente supusacercetarii statistice. Un element al acestei populatii se numeste unitate statistic a .

Definitia 6.2. O proprietate comuna tuturor unitatilor statistice senumeste caracteristic a statistic a a populatiei.

Caracteristicile pot fi:- cantitative, daca pot fi cuantificate printr-un numar,- calitative, daca nu pot fi cuantificate printr-un numar, ci prin

aprecieri de tipul bun, foarte bun, mult, putin.

Definitia 6.3. Valoarea numerica a unei caracteristici cantitative,care se modifica de la o unitate statistica la alta, se numeste variabil a statistic a .

Definitia 6.4. O submultime a unei populatii statistice se numesteselec tie sau e santion .

De exemplu, daca se solicita opinia unei populatii într-o problemaoarecare este dificil sa fie consultata întreaga populatie si se recurgela extragerea unui esantion.

199

Page 202: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 202/364

Page 203: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 203/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 201

Teorema de mai jos pune în evidenta ca functiile de repartitie em-pirice aproximeaza oricât de bine functia reala de repartitie.

Teorema 6.1. Fie o populatie statistic a si X variabila aleatoare ata sa-t a ei cu functia de repartitie F . Pentru o selectie de volum n: (x1, x2,. . . , xn) construim ca mai sus func tia de reparti tie empiric a F ∗n . Atunci

∀ε > 0 : P |F (x) − F ∗n | ≥ εn→∞→ 0, ε fixat.

Demonstratie. Sa notam cu p = P (X <x) = F (x), si cu F ∗n(x) =kx

nfunctia de repartitie empirica. Definim v. a. Y 1, Y 2, . . . , Y n, astfelîncât Y j are valoarea 1 daca x j < x si 0 în caz contrar. VariabileleY 1, Y 2, . . . , Y n sunt independente (selectiile fiind independente) si audistributia µ

1 0 p 1 − p

¶.

Avem M [Y j] = p, D [Y j ] = p(1 − p). Evident v. a. Z n =1

n

nPi=1

Y i are

M [Z n] = p si dispersia D [Z n] =p(1 − p)

n.

Aplicam inegaliatea lui Cebâsev lui Z n si gasim

P |F (x) − F ∗n | ≥ ε = P |Z n − p| ≥ ε ≤ D [Z n]

ε2=

p(1 − p)

nn→∞→ 0.

¤

6.2 Reprezentarea grafica a datelor statis-

tice

O reprezentare a datelor statistice este sub forma histogramei. His-

tograma se construieste sub forma unor dreptunghiuri lipite, cu bazape Ox, marimea lor fiind egala la baza cu marimea intervaluilui devariatie respectiv. Înaltimea dreptunghiului va fi data de frecventacorespunzatoare fiecarui interval de variatie. Histograma arata formade repartitie, densitatea de repartitie a frecventelor si gradul de asime-trie.

Exemplul 6.1. Punctele obtinute de studenti care au promovat exa-menul de matematica si care cuantifica cunostintele lor sunt:

Page 204: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 204/364

202 CAPITOLUL 6. ELEMENTE DE STATISTIC A

64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62,58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77, 58, 62, 82,85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53, 60, 49, 68,74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68, 95, 94, 99,81, 81, 92, 88, 99, 81, 81

O reprezentare a acestor date este:

X 49 51 53 54 58 60 62 64 65 66 68 69ni 1 1 1 1 4 1 3 1 2 4 5 1X 70 71 72 73 74 75 76 77 78 79 80 81ni 3 5 2 2 2 1 3 3 7 1 1 4X 82 83 84 85 86 88 89 91 92 94 95 99ni 4 1 4 2 1 3 1 1 2 2 1 2

O alta reprezentare a datelor este data mai jos prin Mathema-tica. Reprezentarea prin bare se obtine folosind functia BarChart careeste continuta în pachetul <<Graphics‘Graphics‘. Întâi încarcam pa-chetul mentionat si apoi pachetul <<Statistics‘DataManipulation‘ care

ne permite folosirea comenzii Frequencies, Column pentru a numarafrecventele datelor studiate si a le organiza într-un vector.

pdata =64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84,92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77,58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53,60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68,95, 94, 99, 81, 81, 92, 88, 99, 81, 81;

<< Graphics‘Graphics‘

<< Statistics‘DataManipulation‘

freq = Frequencies[pdata]1,49, 1,51, 1,53, 1,54, 4,58, 1,60, 3,62, 1,64, 2,65,4,66, 5,68, 1,69, 3,70, 5,71, 2,72, 2,73, 2,74, 1,75, 3,76,3,77, 7,78, 1,79, 1,80, 4,81, 4,82, 1,83, 4,84, 2,85, 1,86,3,88, 1,89, 1,91, 2,92, 2,94, 1,95, 2,99

t = Column[freq, 1]

1, 1, 1, 1, 4, 1, 3, 1, 2, 4, 5, 1, 3, 5, 2, 2, 2, 1, 3, 3, 7, 1, 1, 4, 4, 1, 4, 2, 1,3, 1, 1, 2, 2, 1, 2

BarChart[t]

Page 205: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 205/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 203

1 2 3 4 5 6 7 8 9101112131415161718192021222324252627282930313233343536

1

2

3

4

5

6

7

Figura 6.1. ♦

În cazul variabilelor continue, datele se grupeaza într-un tablou deforma:

X [t1, t2) [t2, t3) · · · [tm, tm+1)n n1 n2 · · · nm

.

În acest caz X este variabila statistica, iar n j este numarul valorilorvariabilei statistice aflate în intervalul [t j, t j+1) si se numeste frecven ta

absolut a . La fel n =

mP j=1

n j este volumul selec tiei .

Frecven ta relativ a corespunzatoare întervalului [t j, t j+1) esten jn

si

reprezinta numarul valorilor variabilei statistice aflate în intervalul[t j, t j+1) împartit la volumul selectiei.

Analog se introduc si celelalte notiuni de frecventa absoluta cumu-lata, frecventa relativa cumulata etc.

6.2.1 Gruparea pe clase

În urma oricarei selectii de volum n dintr-o populatie de numerese obtine un sir finit de n numere numit serie statistic a (de volumn). Cum construim o densitate de probabilitate empirica? Pentru araspunde la aceasta întrebare grupam termenii unei serii statistice înintervale disjuncte: I 1, I 2, . . . , I r, dupa criterii mai mult sau mai putinsubiective.

Daca avem o selectie x1, x2, . . . , xn de volum n obtinute în urmamasurarii unor marimi fizice, tehnice, economice de care depinde evolu-tia unor procese sau fenomene, notam cu m = min

ixi si M = max

ixi.

Page 206: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 206/364

204 CAPITOLUL 6. ELEMENTE DE STATISTIC A

Organizam datele selectiei în grupe sau subintervale obtinute divizândintervalul [m, M ] într-un numar r de subintervale congruente (de ace-easi lungime). Pentru determinarea numarului de subintervale de gru-pare poate fi folosita formula lui H. A. Sturges :

r = [1 + 3.322 lg n] . (6.2)

Definitia 6.6. Se numeste pasul de histogram a numarul h =M − m

r.

Intervalele de grupare sunt astfel

I 1 = [m, m + h) , I 2 = [m + h, m + 2h) , . . . , I r = [m + (r − 1)h, M ] .

Formula lui Sturges (6.2) initial a fost scrisa sub forma echivalenta

r = 1 + log2 n. Într-adevar, avem log2 n =lg n

lg 2= log2 10lg n ≈

3.322 lg n.Notam cu n1 numarul acelor valori xi care sunt situate în intervalul

I 1, n2 numarul acelor valori xi care sunt situate în intervalul I 2, . . . , nr

numarul acelor valori xi care sunt situate în intervalul I r. Histogramaasociata selectiei x1, x2, . . . , xm este reuniunea dreptunghiurilor Dk =I k × [0, nk] (produs cartezian), pentru 1

≤k

≤r. Moda selectiei este

subgrupa (intervalul I k) ce corespunde dreptunghiului cel mai înalt.Deci datele selectiei x1, x2, . . . , xn se grupeaza în r grupe si ex-

ista posibilitatea de vizualizare: se alege un sistem ortogonal de axexOy, cu intervalul [m, M ] plasat pe axa Ox (cu originea O eventual înpunctul m). Pe intervalul I 1 se construieste dreptungiul de înaltimen1 si baza de lungime h, pe intervalul I 2 se construieste dreptungiulde înaltime n2 si baza de lungime h, etc. Intervalul I k pentru care nk

este maxim este moda selectiei. Daca doua subgrupe sunt la fel deînalte si detasate de celelalte, se spune ca selectia este bimodala (ex:figura 6.2).

6.2.2 Algoritmul pentru constructia histogramelor

Date initiale: x1, x2, . . . , xn.Pasul I. Se calculeaza m = min

ixi, M = max

ixi, r = [1 + 3.322 lg n]

si h =M − m

r.

Pasul II. Se determina intervalele I k = [m + (r − 1) h, m + rh) sifrecventele absolute nk, 1 ≤ k ≤ r.

Page 207: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 207/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 205

1 2 3 4 5 6 7 8 9

10

20

30

40

50

Figura 6.2.

Pasul III. Se constuiesc dreptunghiurile ce formeaza histogramaDk = I k × [0, nk], 1 ≤ k ≤ r.

Reluam Exemplul 6.1.Pasul I. M = max

ixi = 99, m = min

ixi = 49, n = 83,

r = [1 + 3.322 lg 83] = 7

h = M − mr

= 99 − 497

= 7.14286

Pasul II. Se determina intervalele I k si frecventele nk, 1 ≤ k ≤ 7.

I k [49, 56.1429) [56.1429, 63.2857) [63.2857, 70.4286)nk 3 8 16

I k [70.4286, 77.5714) [77.5714, 84.7143) [84.7143, 91.8571)nk 18 22 8

I k [91.8571; 99]

nk 7

Pasul III. Desenam histograma (figura 6.3).Realizam cu Mathematica desenul histogramei.pdata = 64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,

84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81;

Page 208: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 208/364

206 CAPITOLUL 6. ELEMENTE DE STATISTIC A

1 2 3 4 5 6 7

5

10

15

20

Figura 6.3.

Remarcam ca numarul datelor poate fi calculat cu Length.n = Length[pdata]83amin = Min[pdata]49amax = Max[pdata]

99r = IntegerPart[1 + Log[2, n]]7h = N[(amax - amin)/r]7.14286vec = amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,

amin + 5 h, amin + 6 h, amin + 7 h49, 56.1429, 63.2857, 70.4286, 77.5714, 84.7143, 91.8571, 99.<< Statistics‘DataManipulation‘Numararea punctajelor aflate in fiecare subinterval

freqq1 = BinCounts[aa, amin, amax, h]3, 8, 16, 18, 22, 8, 7<< Graphics‘Graphics‘Histogram[freqq1, FrequencyData -> True];În Mathematica putem realiza histograma scalata, astfel încît suma

ariilor dreptunghiurilor histogramei sa fie egala cu 1. Histograma sca-lata este utila atunci când vrem sa o suprapunem peste graficul uneidensitati de probabilitate în vederea intuirii acesteia. Vom face acestlucru pentru exercitiul studiat si vom testa daca putem emite ipoteza

Page 209: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 209/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 207

ca repartitia urmata de punctaje este normala.Histograma scalata:ghh = Histogram[freqq1, FrequencyData -> True,

HistogramCategories -> vec, Ticks -> IntervalCenters,HistogramScale -> 1];

63.2857 77.5714 91.8571

0.005

0.01

0.015

0.02

0.025

0.03

0.035

Figura 6.4

Sa suprapunem histograma scalata peste repartitia normala.<< Statistics‘ContinuousDistributions‘m = N[Mean[pdata]]75.0602sigma = N[StandardDeviation[pdata]]11.1271hh[x_] := PDF[NormalDistribution[m, sigma], x];pn = Plot[hh[x], x, m - 3 sigma, m + 3 sigma];Show[pn, ghh]Histograma este reprezentata în figura 6.5.Programul calculeaza media de selectie m = 75.0602 si abaterea

medie de selectie σ = 11.1271 necesare construirii graficului repartitieinormale (formulele de calcul sunt definite în sectiunea urmatoare).

Exemplul 6.2. Presupunem ca într-un atelier lucreaza 225 de munci-tori si ca s-a analizat într-o perioada de timp modul în care îsi reali-zeaza sarcinile. S-a constatat ca 10 dintre ei realizeaza 101%, etc.conform tabelului de mai jos

10 15 40 23 17 18 36 45 8 5 8101% 89% 85% 106% 127% 95% 105% 112% 117% 96% 80%

Page 210: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 210/364

Page 211: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 211/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 209

225r = IntegerPart[1 + Log[2, n]]8h = N[(ppmax - ppmin)/r]5.875tg = ppmin, ppmin + h, ppmin + 2 h, ppmin + 3 h, ppmin + 4 h,ppmin + 5 h, ppmin + 6 h, ppmin + 7 h, ppmin + 8 h80, 85.875, 91.75, 97.625, 103.5, 109.375, 115.25, 121.125, 127.frec = 48, 15, 23, 10, 59, 45, 8, 1748, 15, 23, 10, 59, 45, 8, 17<< Graphics‘Graphics‘Histogram[frec, FrequencyData -> True, HistogramCategories -> tg,

Ticks -> IntervalCenters, HistogramCategories -> Automatic]

82.9375 94.6875 106.438 118.188

10

20

30

40

50

60

Figura 6.6.

Ce concluzii se pot trage din analiza histogramei? În primele patrugrupe sunt persoanele care nu-si realizeaza sarcinile. Caracteristicanumerica numita moda este, pentru atelierul respectiv, "sa se reali-zeze sarcinile între 103.5% si 109.375%". 59 din cei 225 de muncitorisunt în moda. ♦

Unind cu o linie poligonala extremitatile perpendicularelor ridicateîn mijloacele intervalelor de variatie se obtine poligonul frecven telor (figura 6.7).

Daca pe ordonata se reprezinta frecventele relative se obtine prinacelasi procedeu poligonul frecventelor relative.

Page 212: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 212/364

210 CAPITOLUL 6. ELEMENTE DE STATISTIC A

82.9375 94.6875 106.438 118.188

10

20

30

40

50

60

Figura 6.7.

Histograma si poligonul frecventelor în cazul intervalelor de lungimineegale. În acest caz histograma se construieste reprezentând pentrufiecare clasa un dreptunghi cu arie egala cu frecventa relativa

ni

n. Ast-

fel baza dreptunghiului ∆i este [xi, xi+1) iar înaltimeani

n(xi+1 − xi),

i = 1, m − 1.

6.3 Caracteristici statistice ale datelor ex-

perimentale

Definitia 6.7. Daca avem o selectie x1, x2, . . . , xn de volum n, definim

media de selec tie (empiric a) ca fiind x =1

n(x1 + x2 + · · · + xn), adica

media aritmetica a celor n valori.Daca datele sunt organizate sub forma unui tabel (6.1) atunci me-

dia de selec tie este x = 1n

kPi=1

nixi, unde ni reprezinta frecventa ab-

soluta de aparitie a valorii xi a variabilei în selectia considerata sirP

i=1

ni = n.

În cazul datelor grupate xi se înlocuieste cu x∗i care este valoarea

din mijloc a intervalului [xi, xi+1) deci x =1

n

rPi=1

nix∗i , unde r este

numarul intervalelor.

Page 213: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 213/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 211

Teorema 6.2. Au loc rela tiile: x + c = x+c, kx = kx, x + y = x+y.

Mediana este valoarea α ∈ R astfel ca numarul de valori x j ≤ αeste egal cu numatul de valori x j ≥ α. Deci mediana împarte sirulordonat de date în doua parti egale. Daca sirul are 2k + 1 unitati,atunci mediana coincide cu unitatea de ordin k + 1, daca sirul are 2kunitati, mediana este media aritmetica a unitatilor de ordin k si k + 1.daca exista mai multe asemenea valori pentru α, atunci ele formeazaun interval si mediana este prin definitie mijlocul acestui interval.

Exemplul 6.3. Pentru sirul de date: 2.5, 3.7, 1.4, 0.2, 5.4, 8.9, 4.2

sirul ordonat este 0.2, 1.4, 2.5, 3.7, 4.2, 5.4, 8.9. Avem 2k + 1 = 7,apoi k = 3 si unitatea de ordin k + 1 = 4 este 3.7 care este mediana.♦

Daca xme = x atunci repartitia este simetrica.

Modul selec tiei . Pentru datele negrupate este valoarea observatacare are frecventa maxima. Pentru date grupate este o valoare dinclasa cu cel mai mare numar de observatii.

Dispersia de selec tie (empiric a) este σ2 =1

n

nPi=1

(xi − x)2.

Dispersia de selec tie modificat a este s2 =1

n − 1

n

Pi=1

(xi

−x)2.

Observam ca daca s2 este mic atunci datele difera unele de altelefoarte putin, daca s2 este mare, datele difera foarte mult.

Pentru date negrupate avem

s2 =

nPi=1

(xi − x)2

n − 1=

nPi=1

(x2i − 2xxi + x2)

n − 1=

nPi=1

x2i − 2x

nPi=1

xi + nx2

n − 1=

=

nPi=1

x2i − nx2

n−

1=

nPi=1

x2i − n2x2

n

n−

1=

nPi=1

x2i − 1

n

µnPi=1

xi

¶2

n−

1

=

nPi=1

x2i

n − 1− n

n − 1x2,

iar pentru date grupate

s2 =

rPi=1

nix∗2i − 1

n

µrP

i=1

nix∗i

¶2

n − 1=

rXi=1

ni

n − 1(x∗i − x)2 .

Page 214: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 214/364

212 CAPITOLUL 6. ELEMENTE DE STATISTIC A

Motivatia introducerii acestei dispersii o vom vedea ulterior în lega-tura cu conceptul de estimator nedeplasat.

x se mai numeste speran ta matematic a a selectiei, dispersia deselectie se mai numeste varian ta selectiei.

Amplitudinea unei serii statistice este diferenta dintre cea mai maresi cea mai mica valoare a variabilei A = xmax − xmin.

În cazul v. a. continue, amplitudinea este diferenta dintre limitasuperioara a ultimului interval si limita inferioara a primului.

Abaterea medie p˘ atratic a de selec tie este σ = p σ2

.Abaterea medie p˘ atratic a de selec tie modificata este s =√

s2.

Coeficientul de varia tie este v =

√ s2

x. O selectie de valori pozitive

se considera omogena daca v < 13

.

Toate aceste caracteristici statistice pot fi calculate cu comenzi dinMathemartica. S-a generat sirul st si pentru el calculam

st = 2.5, 3.7, 1.4, 0.2, 5.4, 8.9, 4.2;

n = Length[st]

7

Media de selectie

m = Mean[st]

3.75714

Dispersia de selectie modificata

v = Variance[st]

8.18952

Abaterea medie patratica de selectie

StandardDeviation[st]

2.86173

Mediana

Median[st]

3.7

Pentru Exemplul 6.2 vrem sa calculam media si dispersia. Cal-culele se organizeaza în felul urmator:

Page 215: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 215/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 213

x∗i ni x∗i nix∗i nin

(x∗i − x)2 nin−1 (x∗i − x)2

82.7 48 3969.6 17.643 309. 76 66.37788.1 15 1321.5 5.8733 148.84 9.967093.5 23 2150.5 9.5578 46.24 4.747998.9 10 989.0 4.3956 1.96 0.0875

104.3 59 6153.7 27.350 16.0 4.2143109.7 45 4936.5 21.94 88.36 17.751115.1 8 920.8 4.0924 219.04 7.8229120.5 0 0 0 408.04 0

125.1 17 2126.7 9.452 615.04 46.677P225 100.3 157.64

x =

rPi=1

nix∗i

rPi=1

ni

= 100.3, s2 = 157.64, s =√

157.64 = 12.555.

Se poate trage concluzia ca pe ansamblu sarcinile sunt realizate îngeneral, dar nu se poate spune nimic despre profitul atelierului.

Calculele organizate cu Mathematica

nr = 10, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8proc = 101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 8010, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 80ppmin = Min[proc]ppmax = Max[proc]80127n = Total[nr]225

r = IntegerPart[1 + Log[2, n]]8h = N[(ppmax - ppmin)/r]5.875tg = ppmin, ppmin + h, ppmin + 2 h, ppmin + 3 h, ppmin + 4 h,ppmin + 5 h, ppmin + 6 h, ppmin + 7 h, ppmin + 8 h80, 85.875, 91.75, 97.625, 103.5, 109.375, 115.25, 121.125, 127.frec = 48, 15, 23, 10, 59, 45, 8, 1748, 15, 23, 10, 59, 45, 8, 17

Page 216: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 216/364

214 CAPITOLUL 6. ELEMENTE DE STATISTIC A

Calculul medieim = Sum[(tg[[i]] + tg[[i + 1]])/2 frec[[i]], i, 1, 9]/n100.11Calculul dispersieiSum[((tg[[i]] + tg[[i + 1]])/2 - m)^2 frec[[i]], i, 1, 9]/(n - 1)156.712

6.4 Statistica a doua variabile

Am studiat caracteristici statistice ale unei singure marimi. Multedecizii statistice se bazeaza pe observarea relatiei dintre doua sau maimulte marimi. De exemplu relatia pret-calitate, profilul unei societaticomerciale în relatie cu reclama din presa, rezultatele la examene alestudentilor în relatie cu numarul orelor de studiu, preturile caselor înrelatie cu zona în care au fost construite, relatia dintre vârsta uneimasini si pretul de vânzare, relatia dintre cerere si oferta în diferitecazuri etc.

Fie X si Y doua v. a. si mp perechi de valori, (xi, y j) unde x1, x2, . . . ,

xm sunt valorile pentru X si valorile y1, y2, . . . , y p pentru Y .X/Y y1 y2 . . . y p

x1 n11 n12 . . . n1 p n1·

x2 n21 n22 . . . n2 p n2·...

......

......

...xm nm1 nm2 . . . nmp nm·

n·1 n·2 . . . n· p N

Se definesc urmatoarele marimi:

ni· =

p

X j=1

nij, n· j =m

Xi=1

nij, N =m

Xi=1

p

X j=1

nij.

Seria (xi, ni·) se numeste serie marginal a în X , iar seria (y j, n· j) senumeste serie marginal a în Y .

f i· =ni·

N , f · j =

n· j

N se numesc frecven te marginale , iar f ij =

nij

N se

numeste frecven t a dubl a .

x =

mPi=1

pP j=1

nijxi

N =

mPi=1

ni·xi

N si y =

mPi=1

pP j=1

nijy j

N =

pP j=1

n· jy j

N

Page 217: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 217/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 215

se numesc medii marginale .

σ2x =

mPi=1

pP j=1

nij (xi − x)2

N =

mPi=1

ni· (xi − x)2

N =

mPi=1

ni·x2i

N − x2

si

σ2y =

mPi=1

pP j=1

nij (xi − x)2

N =

pP j=1

n· j (y j − y)2

N =

pP j=1

n· jy2 j

N − y2

se numesc dispersii marginale .Covarianta este

cov (X, Y ) =

mPi=1

pP j=1

nij (xi − x) (y j − y)

N =

mPi=1

pP j=1

nijxiy j

N − xy.

Consideram doua selectii de acelasi volum n din doua populatiidiferite, v. a. X si Y de valori (x1, x2, . . . , xn) si respectiv (y1, y2, . . . , yn).Sunt mai multe metode de a studia relatia dintre doua v. a.

Una din metode este metoda evolutiva. Se porneste de la un modelsimplu, o dreapta si pe parcurs, daca este necesar, în pasi succesivi seadauga noi conditii modelului. Aceasta corespunde în mod natural ladezvoltatea obisnuita a teoriei de la simplu la complex.

Se evidentiaza n puncte M 1(x1, y1), M 2(x2, y2), . . . , M n(xn, yn) dinplanulR2 raportat la un reper ortonormat xOy. Aceste puncte formea-za un nor de date. Graficul astfel obtinut este numit diagram a de împr a stiere . Totodata se evidentiaza o tabela de date de tipul

x x1 x2 . . . xn

y y1 y2 . . . yn(6.3)

Fie x =1

n(x1 + x2 + · · · + xn) si y =

1

n(y1 + y2 + · · · + yn) medi-

ile de selectie ale datelor si punctul mediu M (x, y).Ecuatia unei drepte care sa treaca prin punctul M este y − y =

α (x − x), unde α este coeficientul unghiular. În general aceasta dreaptanu poate trece prin punctele M 1, M 2, . . . , M n. Daca ar trece prin toateacreste puncte ar rezulta ca yk − y = α (xk − x) pentru k = 1, n.Obtinem astfel un sistem de n ecuatii cu o singura necunoscuta, anume

Page 218: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 218/364

216 CAPITOLUL 6. ELEMENTE DE STATISTIC A

α, sistem care, în general, este incompatibil. Atunci vom impune nisteconditii mai putin restrictive; notam cu

εk = yk − y − α (xk − x) , k = 1, n

si în loc de a cere ca toti εk sa fie nuli, cerem sa fie simultan mici,punând conditia lui Gauss ca suma patratelor sa fie minima. Deter-minam pe m astfel încât expresia

E (α) =n

Xk=1

(yk − y − αxk + αx)2

sa fie minima. Conditia necesara este:

E 0(α) = 0 ⇒nX

k=1

2 (yk − y − αxk + αx) (−xk + x) = 0 ⇔

−nX

k=1

xkyk + ynX

k=1

xk + αnX

k=1

(xk)2 − αxnX

k=1

xk+

+xn

Xk=1

yk − nxy − αX n

Xk=1

xk + nα (x)2 = 0

ÎnlocuimnP

k=1

xk = nx sinP

k=1

yk = ny si obtinem:

α =

nPk=1

xkyk − nxy

nPk=1

(xk)2 − n (x)2. (6.4)

Se poate ar˘

ata c˘

a α =

nn

Pk=1

xkyk −n

Pk=1

xk

n

Pk=1

yk

nnP

k=1

(xk)2 −µ nPk=1

xk

¶2 =

cov(X, Y )

σ2x .

Definitia 6.8. Fiind data o tabela de valori (6.3), dreapta care treceprin punctul mediu M (x, y) si cu coeficientul unghiular (6.4) se nu-meste dreapta de regresie asociata tabelei (6.3) si are ecuatia

∆ : y − y = α(x − x), unde α =cov(X, Y )

σ2x

. (6.5)

Page 219: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 219/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 217

Observatia 6.1. În general relatia statistica între doua marimi alea-toare se numeste regresie, spre deosebire de relatiile algebrice saufunctionale. Pe baza regresiei se pot prezice valori ale uneia din marimicunoscând-o pe cealalta. Determinarea dreptei de regresie se numesteregresie liniara. Ideea lui Gauss prin care mai multe cantitati suntsimultan mici în modul daca suma patratelor lor este minima sta labaza metodei celor mai mici patrate.

Exemplul 6.4. Profitul anual al unei întreprinderi Y este legat devaloarea X a activelor sale. Luând 5 întreprinderi rentabile s-au con-

statat urmatoarela date (în mii de RON)x 10 20 30 40 50 activeley 1 3 2 5 4 profitul anual

.

Rezolvare. Ne propunem sa determinam dreapta de regresie. Avem

x =1

5(10 + 20 + 30 + 40 + 50) = 30, y =

1

5(1 + 3 + 2 + 5 + 4) = 3,

5Xk=1

xkyk = 10 + 60 + 60 + 200 + 200 = 530,

5Xk=1

(xk)2 = 100 + 400 + 900 + 1600 + 2500 = 5500 .

Conform (6.4) obtinem: α =530 − 5 · 30 · 3

5500 − 5 · 900= 0.08.

Dreapta de regresie va avea ecuatia

y − 3 = 0.08(x − 30) ⇔ y = 0.08x + 0.6.

Dreapta de regresie permite realizarea unor predictii. Pentru exem-plul considerat se poate prevedea ca pentru o întreprindere care are

active de 60 milioane RON profi

tul va fi y = 3 + 0.08(60 − 30) = 5.4milioane. ♦

a = 10, 20, 30, 40, 50;b = 1, 3, 2, 5, 4;<< Statistics‘MultiDescriptiveStatistics‘Correlation[a, b]45

dataplot = 10, 1, 20, 3, 30, 2, 40, 5, 50, 4;Pl1 = ListPlot[dataplot, Prolog -> AbsolutePointSize[5]]

Page 220: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 220/364

218 CAPITOLUL 6. ELEMENTE DE STATISTIC A

20 30 40 50

2

3

4

5

Figura 6.8.

-Graphics-Mean[dataplot]30, 3Variance[dataplot]250, 5

2

<< Statistics‘LinearRegression‘Fit[dataplot, 1, x, x]0.6 + 0.08 x

Am regasit ecuatia dreptei de regresie.Se pot studia regresii neliniare. De exemplu, determinarea unei

curbe y = f (a,b,c,x) cu parametri a,b,c care sa medieze printrepunctele M k(xk, yk), k = 1, n. Punând conditia ca yk − f (a,b,c,xk) sa

fie simultan mici, k = 1, n, functia E (a,b,c) =nP

k=1

(yk − f (a,b,c,xk))2

trebuie sa fie minima, deci este necesar ca∂E

∂a= 0,

∂E

∂b= 0,

∂E

∂c= 0.

De asemenea se pot studia regresii multuple între trei sau maimulte v. a., ceea ce conduce la cuburi de date.

Pentru a gasi o regresie neliniara se poate folosi pachetul << Statis-tics‘NonlinearFit‘.<< Statistics‘NonlinearFit‘NonlinearFit[dataplot, Exp[a x], x, a, RegressionReport ->BestFitParameters]e0.0315015x

NonlinearFit[dataplot, Sin[a x], x, a, RegressionReport ->BestFitParameters]sin[1.0142x]

Page 221: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 221/364

CAPITOLUL 6. ELEMENTE DE STATISTIC A 219

NonlinearFit[dataplot, b x^2, x, b, RegressionReport -> BestFit-Parameters]

0.00215526x2

NonlinearFit[dataplot, x^(2 a), x, a, RegressionReport ->BestFitParameters]x0.349662

Dreapta de regresie asociata unei tabele de date (6.3) exprima olegatura între doua v. a. X si Y , dar nu de tip cauzal (cauza-efect).Norul de date M k(xk, yk), 1 ≤ k ≤ n, da o prima indicatie vizuala,intuitiva; astfel, daca punctele respective sunt situate într-o banda

subtire, deci grupate în jurul dreptei de regresie, atunci între X si Y exista o relatie puternica (sau, cum se mai spune, corelatie).

Pentru a decide cu acuratete taria legaturii statistice dintre X siY se defineste un indicator cantitativ.

Definitia 6.9. Se numeste coe fi cient de corela tie liniar a asociat tabelei(6.3) de date numarul:

ρX,Y =cov (X, Y )

σxσy. (6.6)

Daca v. a. X si Y sunt independente, atunci cov(X, Y ) = 0 sirxy = 0.

Au loc relatiile cov(X − a, Y ) = cov(X, Y ) si cov(aX,bY ) =ab cov(X, Y ).

Teorema 6.3. Avem −1 ≤ ρX,Y ≤ 1 pentru orice tabel a de date (6.3).

Demonstratie. În general, pentru orice constante a, b avem

cov(X − a, Y − b) = cov(X, Y )

deci

cov

µX − x

σx,

Y − y

σy

¶=

1

σxσycov(X − x, Y − y) =

cov(X, Y )

σxσy= ρX,Y ,

conform relatiei (6.6).

Notam X 0 =X − x

σx, Y 0 =

Y − y

σysi obtinem astfel v. a. normate

cu media 0 si dispersia 1 si ρxy = cov(X 0, Y 0).

Page 222: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 222/364

220 CAPITOLUL 6. ELEMENTE DE STATISTIC A

Dar D [X 0 + Y 0] = D [X 0] + D [Y 0] + 2 cov(X 0, Y 0), deci

D [X 0] + D [Y 0] + 2 cov(X 0, Y 0) ≥ 0,

adica

1 + 1 + 2 cov(X 0, Y 0) ≥ 0 ⇒ cov(X 0, Y 0) ≥ −1 ⇒ ρxy ≥ −1.

Apoi D [X 0 − Y 0] = D [X 0] + D [Y 0] − 2cov(X 0, Y 0), deci

D [X 0] + D [Y 0] − 2 cov(X 0, Y 0) ≥ 0,

adica

1 + 1 − 2cov(X 0, Y 0) ≥ 0 ⇒ cov(X 0, Y 0) ≤ 1 ⇒ ρxy ≤ 1.¤

Exista o stânsa legatura între coeficientul unghiular al dreptei deregresie α si coeficientul de corelatie.

Teorema 6.4. Avem:α = ρX,Y

σy

σx. (6.7)

Interpretarea coeficientului de corelatie.— daca ρX,Y = 0 atunci X si Y sunt independente,— daca ρX,Y

∼= 0 norul de date nu se aseaza în jurul dreptei de

regresie.— daca ρX,Y = ±1 atunci datele, adica punctele M k, 1 ≤ k ≤ n sunt

coliniare. Daca ρX,Y este apropiat de 1, datele sunt în vecinatateadreptei de regresie; în acest caz α > 0 conform relatiei (6.7) decidreapta de regresie este crescatoare (daca valorile xk cresc, la fel yk).Daca ρX,Y este apropiat de −1, datele sunt în vecinatatea dreptei deregresie; în acest caz m < 0 conform relatiei (6.7) deci dreapta deregresie este descrescatoare (daca valorile xk descresc, la fel yk).

În cazul în care ρX,Y este apropiat de ρX,Y (respectiv −1) se spuneca între X si Y exista o corelatie buna pozitiva (respectiv negativa).

Daca ρX,Y este apropiat de 0 se poate decide absenta corelarii.

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. cum sa construim histograma,2. sa interpretam vizual datele,3. sa calculam si sa interpretam media de selectie, dispersia de

selectie, abaretea de selectie.

Page 223: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 223/364

Capitolul 7

Statistica inferentiala

Statistica inferentiala se concentraza asupra luarii deciziilor des-pre caracteristicele unei populatii bazate pe informatiile obtinute prinstudiul datelor uneia sau mai multor selectii aleatoare si pe calculeprobabilistice.

Statistica inferentiala se împarte în doua mari domenii:— estimarea parametrilor si— ipoteze statistice.

Metodele de inferenta se bazeaza pe respectarea caracterului aleatoral selectiei.

Fie X o v. a. cu legea de probabilitate f (x, θ), x ∈ R, θ ∈ Θ ⊂ R,care poate fi functia de frecventa, în cazul discret, respectiv densitateade probabilitate, în cazul continuu.

Definitia 7.1. Multimea legilor de probabilitate f (x, θ) care continparametrul necunoscut θ se numeste model probabilistic .

În practica exista numeroase astfel de familii de legi de proba-

bilitate care pot fi alese ca modele probabilistice: normala, expo-nentiala, Poisson etc. Alegerea unei astfel de familii, ca model alunui fenomen particular real se face pe baza experientei anterioare înstudiul fenomenelor asemanatoare sau în urma unui studiu preliminaral rezultatelor experientei sau observatiei.

În momentul în care am ales o lege de probabilitate de o anumitaforma, incertitudinea legata de rezultatul particular al experimen-tului s-a transferat în incertitudinea legata de valorile parametrului(parametrilor).

221

Page 224: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 224/364

222 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Definitia 7.2. Reparti tia selec tiei X = (X 1, X 2, . . . , X n) este definitaca repartitia comuna a variabilelor de selectie X 1, X 2, . . . , X n. Dacax1, x2, . . . , xn sunt valorile luate de variabilele de selctie X 1, X 2, . . . , X natunci legea de probabilitate a selec tiei este notata prin

f (x1, x2, . . . , xn; θ), (x1, x2, . . . , xn) ∈ Rn.

Repartitia selectiei depinde de θ si încorporeaza atât selectia câtsi modelul probabilistic.

Cea mai folosita forma de selectie este selectia aleatoare si este

bazata pe ideea experimentului aleator.Definitia 7.3. Vom spune ca (X 1, X 2, . . . , X n) este o selec tie aleatoare asupra v. a. X care are legea de probabilitate f (x, θ) daca X 1, X 2, . . . ,X n sunt independente si identic distribuite (i.i.d.) ca si X .

În cazul selectiei aleatoare legea de probabilitate a selectiei este

f (x1, x2, . . . , xn; θ) =nY

j=1

f (x j, θ).

O selectie aleatoare poate fi constituita prin repetarea unui exper-iment aleator de n ori. Realizarea selectiei aleatoare (datele obtinuteîn urma selectiei) se noteaza cu (x1, x2, . . . , xn) si multimea tuturorrealizarilor defineste spatiul observatiilor.

Definitia 7.4. Modelul probabilist f (x, θ) împreuna cu selectia alea-toare X = (X 1, X 2, . . . , X n) definesc modelul statistic .

Modelul statistic împreuna cu datele observate impun considerareaurmatoarelor întrebari:

1. datele observate sunt consistente cu modelul statistic postulat?

2. presupunând ca modelul statistic postulat este consistent cudatele observate, ce putem spune despre parametrii necunoscuti θ ∈Θ?

a) putem descreste incertitudinea asupra lui θ prin reducereaspatiului parametrilor Θ la Θ0 unde Θ0 este o submultime a lui Θ?(estimatie prin intervale de încredere)

b) putem descreste incertitudinea asupra lui θ prin alegereaunei valori particulare θ dinΘ ca având cea mai reprezentativa valoarea lui θ? (estimatie punctuala)

Page 225: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 225/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 223

c) putem considera întrebarea: θ apartine unei submultimi Θ0

a lui Θ? (verificarea ipotezelor statistice)3. presupunând ca a fost aleasa o valoare particulara θ reprezen-

tativa a lui θ, ce putem spune despre observatiile viitoare? (predictie)

Definitia 7.5. Data o populatie de volum N , se numeste statistic a a acelei populatii orice marime semnificativa calculata cu ajutoruldatelor obtinute dintr-un esantion aleator al acelei populatii.

Exemple de statistici frecvent folosite: media de selectie statistica,dispersia de selectie statistica, dispersia de selectie modificata.

Definitia 7.6. Pentru un parametru al repartitiei, se numeste es-timator al acelui parametru orice statistica care aproximeaza acelparametru.

Daca consideram selectia aleatoare X = (X 1, X 2, . . . , X n) cu dateleobtinute în urma selectiei (x1, x2, . . . , xn), vom nota estimatorul para-metrului θ cu θ = θ (x1, x2, . . . , xn) si atunci putem scrie

∀ε > 0 : limn→∞

P ³¯¯θ (x1, x2, . . . , xn) − θ

¯¯

> ε´

= 0

Cu alte cuvinte, pentru ε > 0 dat, pentru valori mari ale lui neste foarte putin probabil ca θ (x1, x2, . . . , xn) sa ia valori în afaraintervalului [θ − ε, θ + ε], adica este foarte putin probabil ca numarulθ (x1, x2, . . . , xn) sa fie în afara intervalului [θ−ε, θ +ε]. În aceste con-ditii, dupa un numar de n experiente, consideram pe θ (x1, x2, . . . , xn)ca o aproximatie buna pentru θ. Este posibil sa ne înselam, dar proba-bilitatea de a ne însela este mica, pentru n mare. Statistica nu ne oferaraspunsuri sigure ci doar aproximatii în care putem avea un grad maimic sau mai mare de încredere. Se accepta acele aproximatii în careavem un grad mai mare de încredere.

Se utilizeaza estim ari punctuale sau estim ari cu ajutorul inter-valelor de încredere . Estimatorul punctual atribuie o valoare parame-trului. Intervalele de încredere genereaza un interval în care parame-trul apartine cu un anumit nivel de încredere.

Exemplul 7.1. Consideram populatia diametrelor unor bile de rul-menti dintr-un lot. Ca statistica a acestei populatii se poate lua mediade selectie x a unui sir (x1, x2, . . . , xn) format de diametrele unui esan-tion de bile din acel lot. Considerând alt lot, media de selectie x vaavea alta valoare.

Page 226: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 226/364

224 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Exemplul 7.2. O societate de telefoane poate considera populatiatuturor abonatilor. Un esantion se poate obtine luând pe sarite dinlista abonatilor, de exemplu, din 25 în 25. Presupunem ca societateaeste interesata în estimarea unui parametru caracteristic; de exemplu,gradul de satisfactie g al abonatilor relativ la serviciile oferite de soc-itate. Se cere o apreciere cu note de la 1 la 5. Este solicitat r aspunsulabonatilor din esantionul ales si se obtine un estimator al lui g.

Daca, de exemplu, θ reprezinta media atunci putem considera ca

statistica a mediei, θ = X =X 1 + X 2 + · · · + X n

n

. Fie x1, x2, . . . , xn

sunt valorile luate de X 1, X 2, . . . , X n atunci estimatorul lui θ este θ =x = 1

n(x1 + x2 + · · · + xn). În conditiile în care masuratorile sunt

realizate cu acuratete si precizie rezonabile, atunci X 1, X 2, . . . , X n sepot considera independente si identic repartizate.

Vom prezenta exemple de modele statistce care apar adesea înpractica.

7.1 Modele statistice

Modelul BernoulliPresupunem ca X 1, X 2, . . . , X n este o selectie aleatoare a unei po-

pulatii care urmeaza o distributie Bernoulli cu parametrul θ ∈ [0, 1]necunoscut. Stim ca distributia Bernoulli poate fi utilizata la obser-varea unui articol, rezultat al unui proces industrial, caz în care X i = 1indica faptul ca articolul i este bun si X i = 0 daca articolul este de-fect. În studii medicale rezultatul X i = 1 indica faptul ca tratamentulaplicat pacientului i a avut succes iar X i = 0 în caz contrar. În acestecazuri vrem sa stim valoarea lui θ.

Spatiul parametrului θ este [0, 1]. Daca x1, x2, . . . , xn sunt valorile

luate de X 1, X 2, . . . , X n atunci func tia de frecven t a pentru X i estef (xi, θ) = θxi(1 − θ)1−xi ,

si reprezinta P (X = xi) , θ este parametrul necunoscut, iar legea deprobabilitate a selectiei este data de

nYi=1

f (xi, θ) =nYi=1

θxi(1 − θ)1−xi = θnx(1 − θ)n(1−x).

Page 227: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 227/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 225

Modelul PoissonPresupunem ca X 1, X 2, . . . , X n este o selectie aleatoare a unei po-

pulatii care urmeaza o distributie Poisson cu parametrul θ ∈ R+ ne-cunoscut. Stim ca distributia Repartitia Poisson a aparut odata custudiul variabilelor aleatoare cu un numar foarte mare de valori. Ex-emple clasice de astfel de variabile aleatoare sunt cele legate de eveni-mentele care apar rar într-un interval de timp. În aceste cazurivrem sa stim valoarea lui θ.

Spatiul parametrului θ este R+. Daca x1, x2, . . . , xn sunt valorileluate de X 1, X 2, . . . , X n atunci func tia de frecven t a pentru X i este

f (xi, θ) =θxi

xi!e−θ,

si reprezinta P (X = xi) , θ este parametrul necunoscut, iar legea deprobabilitate a selectiei este data de

nYi=1

f (xi, θ) =nYi=1

θxi

xi!e−θ =

θnx

x1!x2!...xn!en.

Modelul normalPresupunem ca X 1, X 2, . . . , X n este o selectie aleatoare a unei popu-

latii care urmeaza o distributie normala N (µ, σ) cu θ = (µ, σ) ∈R × R

+ necunoscuti, unde R+ = (0, ∞). De exemplu, putem aveaobservatii asupra înaltimii în centimetrii a unei populatii si intuim caeste rezonabil sa presupunem ca distributia înaltimii este normala cumedia si dispersia necunoscute. Daca x1, x2, . . . , xn sunt valorile luatede X 1, X 2, . . . , X n atunci densitatea de probabiltate a unui esantioneste data de

nYi=1

f (xi; µ, σ2) =¡

2πσ2¢−n

2 exp

µ− 1

2σ2

nXi=1

(xi − µ)2¶

DeoarecenXi=1

(xi − µ)2 = n (x − µ)2 +nXi=1

(xi − x)2 ,

unde x =1

n

nPi=1

xi este media de selectie si s2 =1

n − 1

nPi=1

(xi − x)2 este

dispersia de selectie modificata (deviatia standard), obtinemnYi=1

f (xi; µ, σ2) =¡

2πσ2¢−n

2 exp

µ− n

2σ2(x − µ)2 − n − 1

2σ2s2¶

. (7.1)

Page 228: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 228/364

226 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Ne putem pune întrebarea daca presupunerea ca înaltimea popu-latiei urmeaza o distributie normala este corecta. Aceasta ipotezatrebuie verificata. Procedurile care duc la verificarea unor astfel deipoteze se numesc teste statistice.

Modelul exponential

Presupunem ca timpul de viata a unui aparat este distribuit Exp [θ]unde θ ∈ (0, ∞) este necunoscut. Presupunem ca X 1, X 2, . . . , X n esteo selectie aleatoare a unei populatii care urmeaza o distributie ex-ponentiala. Daca x1, x2, . . . , xn sunt valorile luate de X 1, X 2, . . . , X n

atunci densitatea de probabiltate a unui esantion este data denYi=1

f (xi; θ) = θn exp −nxθ .

Modelul multinomial

În capitolul II am introdus distributia multinomiala. Aceasta apareîn aplicatii în care în urma unui experiment se pot realiza k evenimentediferite independente A1, A2, . . . , Ak. Aceste evenimente se produc cu

probabilitatile p1, p2, . . . , pk,

kP j=1 p j = 1, 0 ≤ p j ≤ 1.

Facem presupunerea ca, de exemplu, k = 3. În acest caz nu cunoas-tem parametrii ( p1, p2, p3). Daca x1, x2, x3 sunt valorile luate de X 1,X 2, X 3 atunci densitatea de probabiltate a unui esantion este data de

3Yi=1

f (xi; p1, p2, p3) = px11 px22 px33 .

Constructia histogramei si încercarea de a intui modelul statisticsunt metode folosite de statistician în încercarea de a studia distributiapopulatiei. Deseori nu este clar ce model statistic trebuie folosit. Maimult, daca am intuit modelul statistic, nu stim nimic despre valoareaparametrilor care intra în definitia modelului statistic. De exemplu,stim ca înaltimea urmeaza o distributie normala, dar nu stim mediasi dispersia. Folosind intuitia am putea presupune ca media poate fiaproximata cu x. Pentru a justifica aceasta alegere avem nevoie sastudiem estimatorii punctuali.

Page 229: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 229/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 227

7.2 Estimatori punctuali

Estimarea punctuala este valoarea atribuita unui parametru pebaza statisticii construite din esantion.

Definitia 7.7. Se considera o populatie de volum N si un parametruθ al acestei populatii. Fie X 1, X 2, . . . , X n este o selectie aleatoaredintr-un esantion reprezentativ (n << N ) al populatiei care ia valorilex1, x2, . . . , xn; un estimator punctual θ = θ (x1, x2, . . . , xn) a lui θ senumeste estimator nedeplasat sau absolut corect daca M [θ] = θ.

În practica se recomanda n ≥ 30 si n ≤ N 3

.

Definitia 7.8. Daca limn→∞

M [θ] = θ si limn→∞

D[θ] = 0 atunci θ este un

estimator corect sau deplasat al lui θ (în cazul estimatorului consistentlimita trebuie sa fie oricât de mica atunci când n creste).

Teorema 7.1. Dac a statistica θ (x1, x2, . . . , xn) este un estimator co-rect a lui θ atunci este un estimator al lui θ, adic a pentru orice ε > 0avem

limn→∞

P ³¯θ (x1, x2, . . . , xn)

−θ¯ > ε´ = 0.

Demonstratie. Conform inegalitatii lui Cebâsev,

P ³¯

θ (x1, x2, . . . , xn) − M [θ]¯

> ε´

≤ D[θ]

ε2,

dar limn→∞

M [θ] = θ si limn→∞

D[θ] = 0 de unde rezulta concluzia. ¤

Aratam ca statisticile introduse anterior sunt estimatori ale para-metrilor corespunzatori.

Teorema 7.2. Fie x1, x2, . . . , xn (n ≥ 2) o selec tie de valori ale vari-abilelor X 1, X 2, . . . , X n (v. a. independente si identic distribuite ca si X ). Not am

m = M [X ] media teoretic a,σ2 = D [X ] dispersia teoretic a,

X =1

n

nPi=1

X i media de selec tie,

σ2 =1

n

nPi=1

¡X i − X

¢2dispersia de selec tie si

Page 230: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 230/364

228 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

S 2 = 1n − 1

nPi=1

¡X i − X

¢2dispersia de selec tie modificat a.

Atunci media de selec tie X si dispersia de selec tie S 2 sunt estima-tori punctuali pentru media, respectiv dispersia teoretic a. În plus,

1. media de selec tie X este un estimator absolut corect al lui m;2. dispersia de selec tie σ2 este un estimator corect al lui σ2.3. dispersia de selec tie modi fi cat a S 2 este un estimator absolut

corect al lui σ2.

Demonstratie. 1. Trebuie verificate conditiile din definitia estima-torului absolut corect.

M £

X ¤

=1

nM

· nXi=1

X i

¸=

1

nnM [X ] = M [X ] .

X ¤

= D

·1

n

nXi=1

X i

¸=

1

n2D

· nXi=1

X i

¸=

1

n2

nXi=1

D [X i] =σ2

n.

2.M h

σ2i

=1

nM

· nXi=1

¡X i − X

¢2 ¸=

=1

n

M ·n

Xi=1

X 2i−

2X n

Xi=1

X i + nX 2¸ =

=1

nM

· nXi=1

X 2i − nX 2¸

= M

·1

n

nXi=1

X 2i

¸− M

hX

2i

.

Dar

M h

X 2i

=1

n2M

·µ nXi=1

X i

¶2¸=

1

n2M

· nXi=1

X 2i

¸+

2

n2

nXi<j

M [X iX j ] .

Apoi M [X 2i ] = M [X 2] si din ipoteza de independenta

M [X iX j] = M [X i] M [X j] = (M [X ])2 ,

rezultaM h

X 2i

=1

n2M £

X 2¤

+n − 1

n(M [X ])2 .

Deci

M h

σ2i

=1

nM £

X 2¤−

µ1

n2M £

X 2¤

+n − 1

n(M [X ])2

¶=

=n − 1

n

¡M £

X 2¤− (M [X ])2

¢=

n − 1

nσ2 → σ2.

Page 231: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 231/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 229

Rezulta ca σ2 nu estimeaza absolut corect dispersia v. a. X .

3. Retinem ca M h

σ2i

=n − 1

nσ2.

Rezulta ca M [S 2] = M

·n

n − 1σ2

¸= σ2. Se poate demonstra ca

S 2¤

=1

n

Ã1

n

nXi=1

¡X i − X

¢4 − n − 3

n − 1D [X ]2

!, (7.2)

de unde rezulta ca D [S 2] → 0. ¤

Observatia 7.1. Desi dispersia de selectie S 2 este un estimator nede-plasat a lui σ2, S este un estimator deplasat a lui σ. Pentru valori marin ≥ 10 se poate considera ca σ =

³1 + 1

[4(n−1)]

´S este un estimator

nedeplasat a lui σ.

Observatia 7.2. În practica se foloseste S 2 în locul lui σ2 deoarece darezultate mai bune dupa cum ne arata Teorema 7.2. Totusi formula(7.2) ne spune ca pentru n suficient de mare si statistica σ2 poate fifolosita ca estimator al dispersiei v.a. X .

Urmatorul tabel sintetizeaza relatia dintre parametrii necunoscuti

si estimatorii punctuali asociati. Astfel µ noteaza media, σ2 este dis-persia, p este probabilitatea repartitiei binomiale, p =

k

n, unde k este

numarul realizarilor într-un esantion de volum n, µ1 − µ2 estimeazadiferenta dintre mediile a doua esantioane independente a doua statis-tici aleatoare, p1 − p2 estimeaza diferenta dintre proportiile a douaesantioane independente a doua statistici aleatoare.

Param.nec.

Statistica Estim. punctual

µ X =

1

n

nPi=1 X i x =

1

n

nPi=1 xi

σ2 S 2 = 1n−1

nPi=1

¡X i − X

¢2s2 = 1

n−1nPi=1

(xi − x)2

p ˆ p = 1n

X ˆ p = 1n

x

µ1−µ2

X 1−X 2 =

= 1n1

n1Pi=1

X 1i− 1n2

n2Pi=1

X 2i

x1 − x2 =

= 1n1

n1Pi=1

x1i − 1n2

n2Pi=1

x2i

p1− p2 ˆ p1 − ˆ p2 = 1n1

X 1 − 1n2

X 2 ˆ p1 − ˆ p2 = 1n1

x1 − 1n2

x2

Page 232: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 232/364

230 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Observatia 7.3. Daca X ∈ Poiss [λ], atunci M [X ] = D [X ] = λ siatunci x si s2 sunt estimatorii nedeplasati pentru λ. Se pune întrebareape care îl vom alege. Cum dispersia este o masura a împrastierii,intuitia sugereaza sa-l alegem pe acela care are cea mai mica dispersiesi aceasta deoarece el are o repartitie mai concentrata în jurul lui λ.

Dintre doi estimatori nedeplasati θ si θ1 pentru acelasi parametruθ, se considera ca este mai precis cel care are dispersie mai mica.

Problema 7.1. Se fac m asur atori asupra elonga tiei a 15 piese de

otel, dintre care 6 au fost tratate cu metoda A si 9 au fost tratate cu metoda B. Rezultatele obtinute sunt:Cu metoda A: 28,29,25,28,24,26;Cu metoda B: 27,32,28,29,29,31,30,32,27.Variabilele aleatoare sunt repartizate normal: X 1, X 2, X 3, X 4, X 5,

X 6 ∈ N (µ1, σ), Y 1, Y 2, Y 3, Y 4, Y 5, Y 6, Y 7, Y 8, Y 9 ∈ N (µ2, 2σ) ( σ cunos-cut, µ1, µ2 necunoscu ti). S a se g aseasc a estimatori punctuali pentru µ1 si/sau µ2.

Rezolvare. x =1

6

(28 + 29 + 25 + 28 + 24 + 26) = 26 .667

y =1

9(27 + 32 + 28 + 29 + 29 + 31 + 30 + 32 + 27) = 29 .444.

Daca δ ∈ [0, 1] se considera µ = δx + (1 − δ ) y. Vedem daca µ esteestimator nedeplasat pentru µ1 sau pentru µ2. Deoarece

M [µ] = M £

δX + (1−δ ) Y ¤

= δM £

X ¤

+(1−δ ) M £

Y ¤

= δµ1+(1−δ ) µ2

observam ca µ este estimator nedeplasat pentru µ1 daca δ = 1 si

pentru µ2 dac˘

a δ = 0.Dispersia

D[µ]= D£

δX +(1−δ ) Y ¤

=δ 2D£

X ¤

+(1−δ )2 D£

Y ¤

=σ2£

δ 2+ 4(1−δ )2¤

care este minima pentru δ =4

5.

Astfel µ =4

526.667 +

1

529.444 = 27.222 poate fi considerat un

estimator atât pentru µ1 cât si pentru µ2. ♦

Page 233: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 233/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 231

Teorema 7.3. Fie X o v. a. cu media m si abaterea medie p˘ atratic a σ. Dac a x1, x2, . . . , xn (n ≥ 2) o selec tie de valori ale lui X (v. a. inde-pendente la fel distribuite ca si X ), atunci pentru n su fi cient de mare

se poate considera c a X ∈ N

µm,

σ√ n

¶.

Demonstratie. Conform teoremei limita centrala avem ca

S n = X 1 + X 2 + · · · + X n ⇒ S n ∈ N ¡

nm,σ√

.

Deoarece

M

·1

nS n

¸=

1

nnm = m, D

·1

nS n

¸=

1

n2nσ2 =

σ2

n,

rezulta ca1

nS n ∈ N

µm,

σ√ n

¶. ¤

Corolarul 7.1. În conditiile Teoremei 7.3 pentru orice a < b avem

P

¡a ≤ X < b

¢≈ Φ

Ãb − m

σ√ n

!−Φ

Ãa − m

σ√ n

!. (7.3)

Statisticienii recomanda folosirea formulei (7.3) pentru populatiistatistice de volum N si esantioane de volum n unde n ≥ 30 si n ≤ N

3.

Daca n < 30 formula este utila daca populatia initiala nu este departede a fi normal distribuita. Pentru esantioane mici statisticienii propun

o corectie care sa înlocuiascaσ√

nprin

σ√ n

r N − n

N − 1.

Problema 7.2. Consider am greut a tile popula tiei de 350 studen ti din-tr-o facultate s-a constatat c a media este m = 70 si abaterea media p˘ atratic a este σ = 10.

a) S a se determine probabilitatea ca un student luat la întâmplare s a cânt areasc a între 65 si 70 kg?

b) S a se determine probabilitatea ca media maselor s a fie între 65 si 75 kg.

c) S a se determine probabilitatea ca extr agând un e santion de 36 studen ti din acea popula tie, media e santionului s a fie cuprins a între 65 si 75 kg.

d) Extr agînd un e santion de 100 de studen ti care este probabilitatea ca media maselor s a fie sub 65 kg?

Page 234: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 234/364

232 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Rezolvare. a) Pobabilitatea ceruta nu poate fi calculata deoareceX = greutatea populatiei nu este repartizata normal.

La fel si la b).c) n = 36, m = 70, σX = 10√

36= 1.6667,

P ¡

65 ≤ X ≤ 75¢

= Φ

µ75 − 70

1. 6667

¶−Φ

µ65 − 70

1. 6667

¶=

= 0.9986 − 0.0014 = 0.9972.

d) n = 100, m = 70, σX =10√ 100 = 1,

P ¡

X ≤ 65¢

= Φ

µ65 − 70

1

¶= 0.0000003. ♦

7.3 Metoda momentelor

Ideea metodei este de a egala momentele distributiei cu momentelestatistice si de aici obtinem estimarea parametrilor. Momentele popu-latiei vor depinde de parametrii necunoscuti.

De exemplu momentul initial de ordin întâi este media, iar mediastatistica este momentul statistic de ordin întâi. Egalam acestea siobtinem estimarea punctuala µ = X . Deci media statistica este unestimator punctual al mediei populatiei.

Fie x1, x2, . . . , xn (n ≥ 2) o selectie de valori ale variabilelor X 1,X 2, . . . , X n care au o distributie exponentiala cu parametru λ. Avem

un singur parametru de estimat. Stim ca M [X ] =1

λ. De aici rezulta

ca1

λ= X ⇒ λ =

1

xeste un estimator punctual al parametrului λ

obtinut cu metoda momentelor.

Exemplul 7.3. Ca exemplu, presupunem ca este testat timpul deviata a unui modul electronic folosit în industria automobilelor. Tim-pul de viata urmeaza o distributie exponentiala. S-au f acut teste sis-au obtinut urmatoarele date: x1 = 11.96, x2 = 5.03, x3 = 67.40,x4 = 16.07, x5 = 31.50, x6 = 7.73, x7 = 11.10, x8 = 22.38. Deoarecex = 21.65, estimarea punctuala a parametrului λ obtinut cu metoda

momentelor este λ =1

21.65= 0.046189.

Page 235: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 235/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 233

Fie x1, x2, . . . , xn (n ≥ 2) o selectie de valori ale variabilelor X 1,X 2, . . . , X n care au o distributie normala de parametrii µ si σ. Înacest caz avem M [X ] = µ, M [X 2] = µ2 + σ2.

Rezulta ca

µ =1

n

Xi=1

xi, µ2 + σ2 =1

n

Xi=1

x2i ⇒ µ =

1

n

Xi=1

xi,

σ2 =1

n

Xi=1

x2i −

µ1

n

Xi=1

xi

¶2

⇒ σ2 =1

n

Xi=1

(xi − x)2 .

Reamintim ca acest estimator pentru σ2 este un estimator corect saudeplasat.

7.4 Metoda verosimilitatii maxime

Una din cele mai bune metode de a obtine un estimator punctualpentru un parametrul θ este metoda verosimilitatii maxime.

Metoda verosimilitatii maxime a fost dezvoltata în 1920 de mate-maticianul englez R. A Fisher si extinsa de Cramer, Rao si Wald.Este cea mai folosita metoda de estimare si joaca un rol important în

verificarea ipotezelor statistice.Fie v. a. X cu densitatea de probabilitate f (x, θ), unde θ este

parametrul necunoscut. Consideram o selectie X 1, X 2, . . . , X n i.i.d cuv. a. X si fie x1, x2, . . . , xn valorile variabilelor de selectie. Atunci

func tia de verosimilitate maxim a corespunzatoare selectiei este

L(x1, x2, . . . , xn; θ) =nY

j=1

f (x j , θ).

Aceasta functie se utilizeaza numai daca avem un singur parametru

necunoscut θ. Estimatorul de verosimilitate maxim˘

a este acea valoarea lui θ care maximizeaza functia L(x1, x2, . . . , xn; θ). În cazul uneiv. a. discrete interpretarea functiei este

L(x1, x2, . . . , xn; θ) = P (X 1 = x1, X 2 = x2, . . . , X n = xn) ,

adica reprezinta tocmai probabilitatea de a obtine în urma selectieivalorile x1, x2, . . . , xn.

Metoda verosimiltatii maxime consta în urmatorul principiu (axi-oma): valoarea ”cea mai verosimila” (cea mai potrivita în acest sens!)

Page 236: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 236/364

234 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

a parametrului este aceea pentru care functia L(x1, x2, . . . , xn; θ) estemaxima. Aceasta implica θ punct în care

∂L(x1, x2, . . . , xn; θ)

∂θ= 0. (7.4)

Ecuatia (7.4) în practica se dovedeste a fi dificila. De aceea sefoloseste observatia: L(x1, x2, . . . , xn; θ) este maxima daca si numaidaca ln L(x1, x2, . . . , xn; θ) este maxima.

Introducem functiile: logaritmul func tiei de verosimilitate

ln L(x1, x2, . . . , xn; θ) si func tia scor ∂L(x1, x2, . . . , xn; θ)

∂θ= s (x1, x2, . . . , xn; θ) .

Acestea încoporeaza aceeasi informatie ca si L(x1, x2, . . . , xn; θ).Daca avem oricare dintre ele putem sa o obtinem pe cealalta.

Definitia 7.9. tn (x1, x2, . . . , xn) : S → Θ se numeste estima tie de verosimilitate maxim a pentru parametrul θ daca este punct de maximpentru functia de verosimilitate, adica

ln L(x1, x2, . . . , xn; tn) ≥ ln L(x1, x2, . . . , xn; θ)

pentru toti θ ∈ Θ.

În cele ce urmeaza presupunem ca f (x, θ) este derivabila pâna la

ordinul doi inclusiv în raport cu θ. Atunci exista∂L(x1, x2, . . . , xn; θ)

∂θsi estimatia de verosimilitate maxima este solutie a ecuatiei

∂L(x1, x2, . . . , xn; θ)

∂θ= 0 (7.5)

sau a ecuatiei∂ ln L(x1, x2, . . . , xn; θ)

∂θ= 0. (7.6)

Fie aceasta solutie θ0. Pentru a fi estimator de verosimilitate maximatrebuie sa satisfaca si conditia

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2

¯¯θ=θ0

< 0.

Page 237: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 237/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 235

Definitia 7.10. Ecuatiile (7.5) si (7.6) se numesc ecua tii de vero-similitate .

Exemplul 7.4. Fie x1, x2, . . . , xn (n ≥ 2) o selectie de valori ale vari-abilelor X 1, X 2, . . . , X n care au o distributie binomilala, i. i. r. cu v.a. X ∈ Bernoulli [θ]. Atunci

f (x, θ) =

½θx(1 − θ)1−x, x = 0, 1

0, în rest..

θ este parametrul care trebuie estimat. Functia de verosimilitatemaxima este, pentru selectia f acuta,

L(x1, x2, . . . , xn; θ) = θx1(1 − θ)1−x1θx2(1 − θ)1−x2 . . . θxn(1 − θ)1−xn =

=nY

j=1

θxj(1 − θ)1−xj = θnx(1 − θ)n−nx.

Observam ca θ minimizeaza L(x1, x2, . . . , xn; θ) daca minimizeazasi ln L(x1, x2, . . . , xn; θ). Atunci

ln L(x1, x2, . . . , xn; θ) = nx ln θ + (n − nx)ln(1 − θ) .∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

nx

θ− n − nx

1 − θnx

θ− n − nx

1 − θ= 0 ⇒ θ = x.

De aici rezulta ca estimatorul de verosimilitate maxima pentru peste

θ =1

n

n

P j=1

x j . ♦

Exemplul 7.5. Fie x1, x2, . . . , xn (n ≥ 2) o selectie de valori ale vari-abilelor de selectieX 1, X 2, . . . , X n care au o distributie normala, i. i. d.cu v. a. X ∈ N (m, σ).

a) Daca σ2 este cunoscuta si media m este necunoscuta cu Θ = R,atunci functia de verosimilitate maxima este

L(x1, x2, . . . , xn; m) =

µ1

σ√

¶n

exp

(− 1

2σ2

nXi=1

(xi − m)2)

.

Page 238: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 238/364

236 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Deoarece functia ln L este strict crescatoare în L si valoarea lui m caremaximizeaza ln L(x1, x2, . . . , xn; m) maximizeaza si L(x1, x2, . . . , xn; m),este mai usor de lucrat cu logaritmul lui L decât cu L. Avem

ln L(x1, x2, . . . , xn; m) = −n

2ln 2π − n

2ln σ2 − 1

2σ2

nXi=1

(xi − m)2 .

Dar∂ ln L(x1, x2, . . . , xn; m)

∂m=

1

σ2

n

Xi=1

(xi − m) ,

deci 1σ2

nXi=1

(xi − m) = 0 ⇒ m = x.

Observam ca∂ 2 ln L(x1, x2, . . . , xn; m)

∂m2= − n

σ2≤ 0, ∀m ∈ R, deci

m = x este punct de maxim. Astfel tn (x1, x2, . . . , xn) = x este punctde verosimilitate maxima.

b) Daca m este cunoscuta si σ2 ∈ Θ = (0, ∞) este necunoscutfolosim forma functiei de verosimilitate maxima dedusa în (7.1) siobtinem

L(x1, x2, . . . , xn; m, σ2

) =

2πσ2¢−n

2 exp

(− 1

2σ2

nXi=1

(x − m)2 − n − 1

2σ2s2

)=

2πσ2¢−n

2 exp

(− 1

2σ2

nXi=1

(x − m)2)

exp

½−n − 1

2σ2s2¾

.

Fixam m = x si obtinem

L(x1, x2, . . . , xn; σ2) = ¡2πσ2¢−n2 exp½−

n − 1

2σ2

s2¾ ⇒ln L(x1, x2, . . . , xn; σ2) = −n

2ln 2π − n

2ln σ2 − n − 1

2σ2s2.

∂ ln L(x1, x2, . . . , xn; σ2)

∂σ2= − n

2σ2+

n − 1

2σ4s2,

∂ ln L(x1, x2, . . . , xn; σ2)

∂σ2= 0 ⇒ σ2 =

n − 1

ns2.

Page 239: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 239/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 237

Dar

d2 ln L

d (σ2)2(x1, x2, . . . , xn; σ2) =

n

2σ4− n − 1

σ6s2¯¯σ2=

n−1n

s2=

= −1

2

n3

s4 (n − 1)2≤ 0.

Rezulta ca σ2 este estimatorul de verosimilitate maxima.

Dac˘

a avem de estimat mai multi parametri 1, 2,...,p, cu X cudensitatea de probabilitate f (x, θ1, θ2,...,θ p), atunci în mod analog cucazul unui singur parametru, aplicam principiul verosimilitatii maxime.Consideram o selectie X 1, X 2, . . . , X n i.i.d cu v. a. X si fie x1, x2, . . . , xn

valorile variabilelor de selectie. Atunci func tia de verosimilitate ma-xim a corespunzatoare selectiei este

L(x1, x2, . . . , xn; θ1, θ2,...,θ p) =nY

j=1

f (x j , θ1, θ2,...,θ p).

Se aleg pentru parametri acele valori care maximizeaz˘

a functiade verosimilitate L(x1, x2, . . . , xn; θ1, θ2,...,θ p) sau ceea ce este acelasilucru acele valori care maximizeaza ln L(x1, x2, . . . , xn; θ1, θ2,...,θ p).

Aceasta implica:

∂ ln L(x1, x2, . . . , xn; θ1, θ2,...,θ p)

∂θ1= 0

∂ ln L(x1, x2, . . . , xn; θ1, θ2,...,θ p)

∂θ2= 0

· · ·∂ ln L(x1, x2, . . . , xn; θ1, θ2,...,θ p)

∂θ p = 0

(7.7)

si diferentiala de ordin doi, care este o forma patratica, calculata înpunctul (θ1, θ2,...,θ p) , solutie a sistemului (7.7), negativ definita.

Exemplul 7.6. Fie x1, x2, . . . , xn (n ≥ 2) o selectie de valori alevariabilelor de selectieX 1, X 2, . . . , X n care au o distributie normala,i. i. d. cu v. a. X ∈ N (m, σ). Daca m si σ2 sunt necunoscute,Θ= (m, σ2) |m∈R, σ2∈(0, ∞), atunci estimatorul de verosimilitate

Page 240: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 240/364

238 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

maxima ¡m, σ2¢ se obtine rezolvând sistemul

∂ ln L(x1, x2, . . . , xn; m, σ2)

∂m=

1

σ2

nXi=1

(xi − m) = 0

∂ ln L(x1, x2, . . . , xn; m, σ2)

∂σ2= 0

adica

1

σ2

n

Xi=1

(xi − m) = 0

− n

2σ2+

1

2 (σ2)2

nXi=1

(x − m)2 +n − 1

2 (σ2)2s2 = 0

.

Obtinem (m = x

σ2 =n − 1

ns2

Calculam

d2 ln L(x1, x2, . . . , xn; m, σ2) =∂ 2 ln L(x1, . . . , xn; m, σ2)

∂m

2dm2+

+2∂ 2 ln L(x1, . . . , xn; m, σ2)

∂m∂σ2dmdσ2 +

∂ 2 ln L(x1, . . . , xn; m, σ2)

(∂σ2)2¡

dσ2¢2

,

d2 ln L(x1, x2, . . . , xn; m, σ2) = − 1

σ2dm2 − n3

2(n − 1)2 (s2)2¡

dσ2¢2

care este o forma patratica, evident, negativ definita. De aici rezulta caµx,

n − 1

ns2¶

este unicul estimator de verosimilitate maxima pentru

(m, σ2). ♦

Exemplul 7.7. Presupunem ca timpul de viata a unui aparat estedistribuit Exp [θ] unde θ ∈ (0, ∞) este necunoscut. Bazându-ne pe oselectie (x1, x2, . . . , xn) de valori ale variabilelor X 1, X 2, . . . , X n careau o distributie exponentiala obtinem functia de verosimilitate

L(x1, x2, . . . , xn; θ) = θn exp −nxθ ⇒ln L(x1, x2, . . . , xn; θ) = n ln θ − nxθ ⇒

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

n

θ− nx ⇒ n

θ− nx = 0 ⇒ θ =

1

x.

Page 241: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 241/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 239

∂ 2 ln L

∂θ2 (x1, x2, . . . , xn; θ) = − n

θ2 ⇒∂ 2 ln L

∂θ2 (x1, x2, . . . , xn;1

x) = −n (x)2 ≤ 0 ⇒

θ = 1x

este estimatorul de verosimilitate maxima a lui θ. ♦

Folosim programul Mathematica ca sa ilustram grafic cum functi-oneaza metoda verosimilitatii maxime.

Generam un sir de 40 numere aleatoare distribuite exponential cu

parametrul θ = 0.04. Construim, utilizând numerele aleatoare genera-te, functia de verosimilitate maxima L(x1, x2, . . . , xn; θ), apoi functialn L(x1, x2, . . . , xn; θ), determinam estimatorul de verosimilitate maxi-ma si apoi desenam graficul functiei ln L(x1, x2, . . . , xn; θ)

<< Statistics‘ContinuousDistributions‘ex1 = RandomArray[ExponentialDistribution[0.04], 40];lvm[x_] := x^40 E^(-x Sum[ex1[[i]], i, 1, 40])lnlvm[x_] := Log[lvm[x]]Solve[D[lnlvm[x], x] == 0, x]x -> 0.0353324t1 = Plot[lnlvm[x], x, 0.02, 0.1, PlotStyle -> GrayLevel[0],AxesLabel -> "x value", "lnlvm[x]", PlotPoints -> 5000]

0.02 0.04 0.06 0.08x value

-200

-195

-190

-185

-180

-175

lnlvm@xD

Figura 7.1.

Am gasit, pe baza celor 40 de numere aleatoare generate, estima-torul de verosimilitate maxima θ = 0.0353324. Din grafic se observaca punctul de maxim este aproximativ cel gasit si ca functia este rela-tiv rotunda în regiunea maximului ceea ce ne sugereaza ca parametrulnu este estimat foarte precis.

Page 242: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 242/364

240 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

În continuare vom desena graficele a trei functii logaritmice deverosimilitate maxima, care au acelasi punct de maxim, dar care suntconstruite cu selectii diferite de volum respectiv 20, 100 si 500. Ob-servam cum devine graficul mai ascutit în punctul de maxim cu câtselectia este de volum mai mare.

<< Statistics‘ContinuousDistributions‘lm1[x_] := Log[x^20 E^(-566.0525746593293 x)]Solve[D[lm1[x], x] == 0, x]x -> 0.0353324lm2[x_] := Log[x^100 E^(-2830.2628732966464 x)]

Solve[D[lm2[x], x] == 0, x]x -> 0.0353324lm3[x_] := Log[x^500 E^(-14151.314366483233 x)]Solve[D[lm2[x], x] == 0, x]x -> 0.0353324<< Graphics‘Graphics‘DisplayTogether[

Plot[lm1[x], x, 0.001, 0.3, PlotStyle -> Hue[.06]],Plot[lm2[x], x, 0.001, 0.3, PlotStyle -> GrayLevel[0],

Dashing[.03]],

Plot[lm3[x], x, 0.001, 0.3, PlotStyle -> Hue[.6]]]

0.05 0.1 0.15 0.2 0.25 0.3

-4000

-3000

-2000

-1000

Figura 7.2. ♦

Exemplul 7.8. Considerând o selectie (x1, x2, . . . , xn) de valori alevariabilelor X 1, X 2, . . . , X n dintr-o populatie a carei caracteristica stu-diata urmeaza o distributie Poisson cu parametrul λ obtinem functiade verosimilitate

L(x1, x2, . . . , xn; θ) =θx1

x1!e−λ

θx2

x2!e−λ · · ·

θxn

xn!e−θ =

θ

nPi=1

xi

x1!x2! · · · xn!e−nθ

Page 243: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 243/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 241

ln L(x1, x2, . . . , xn; θ) = ln θ

nPi=1

xi − ln (x1!x2! · · · xn!) − nθ

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

nPi=1

xi

θ− n = 0 ⇒ θ =

nPi=1

xi

n= x,

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2 = −

nPi=1

xi

θ2 ,

∂ 2 ln L(x1, x2, . . . , xn; x)

∂θ

2 =

n2

x

< 0,

rezulta ca λ = x este estimatorul de verosimilitate maxima a lui λ. ♦

Ne punem întrebarea daca acest estimator este si cel mai eficient,în sensul ca are dispersia cea mai mica. La aceasta întrebare raspunsulîl gasim în teorema lui Rao-Cramer.

Teorema 7.4. (Rao-Cramer) Statistica θ (X 1, X 2, . . . , X n) este un es-timator cu dispersie minim a în mul timea estimatorilor absolut corec ti dac a

D [θ (X 1, X 2, . . . , X n)] =1

n

∞R −∞

³∂ ln f (x,θ)∂θ ´2 f (x, θ)dx

sau D [θ (X 1, X 2, . . . , X n)] =

1

n∞Pk=0

³∂ ln f (k,θ)

∂θ

´2f (k, θ)

dac a distribu tia este cu valori discrete.

Reluam Exemplul 7.8.

D [θ (X 1, X , . . . , X n)] = D

·1

n

n

Pi=1

X i

¸=

D [X ]

n=

θ

n.

f (k, θ) = θk

k!e−θ, ln f (x, θ) = −θ + k ln θ − ln k!, ∂ ln f (k, θ)

∂θ= −1 + k

θ.

Calculam∞Xk=0

µ∂ ln f (k, θ)

∂θ

¶2

f (k, θ) =∞Xk=0

µ−1 +

k

θ

¶2θk

k!e−θ =

=∞Xk=0

µ1 − 2

k

θ+

k2

θ2

¶θk

k!e−θ = e−θ

à ∞Xk=0

θk

k!− 2

∞Xk=0

k

θ

θk

k!+

∞Xk=0

k2

θ2θk

k!

!=

Page 244: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 244/364

242 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

= e−θà ∞X

k=0

θk

k!− 2

∞Xk=1

θk−1

(k − 1)!+

∞Xk=2

θk−2

(k − 1)!k!

=

= e−θÃ

eθ − 2eθ +∞Xk=2

θk−2

(k − 1)!(k − 1 + 1)

!=

= e−θµ

−eθ + eθ +1

θeθ¶

=1

θ.

Deci1

n ∞Pk=0

³∂ ln f (k,θ)∂θ

´2 f (k, θ)=

1

n 1θ

n.

Rezulta din teorema Rao-Cramer ca media de selectie este un estima-tor eficient al parametrului θ.

Studiem daca estimatorul obtinut în Exemplul 7.4.

f (k, θ) =

½θk(1 − θ)1−k, k = 0, 1

0, în rest..

De aici rezulta ca estimatorul de verosimilitate maxima pentru p este

θ = 1n

nP j=1

X j.

Calculamln f (k, θ) = k ln θ + (1 − k)ln(1 − θ),

1Xk=0

µ∂ ln f (k, θ)

∂θ

¶2

f (k, θ) =

= µ∂ ln f (0, θ)

∂θ ¶2

f (0, θ) + µ∂ ln f (1, θ)

∂θ ¶2

f (1, θ) =

=

µ1

1 − θ

¶2

(1 − θ) +

µ1

θ

¶2

θ =1

1 − θ+

1

θ=

1

θ (1 − θ).

Deci1X

k=0

µ∂ ln f (k, θ)

∂θ

¶2

f (k, θ) =1

n 1θ(1−θ)

=θ (1 − θ)

n.

Rezulta din teorema Rao-Cramer ca media de selectie este un es-timator eficient al parametrului θ.

Page 245: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 245/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 243

Exemplul 7.9. Consideram o populatie în care indivizii sunt îm-partiti în trei nivele: 1, 2 si 3. Mai mult, probabilitatea ca un individsa apartina unui nivel este respectiv p1 = θ, p2 = θ2, p3 = 1 − θ − θ2

unde este necunoscut. Observam ca trebuie sa impunem conditiile:

0 ≤ θ ≤ 1, 0 ≤ θ2 ≤ 1, 0 ≤ 1 − θ − θ2 ≤ 1 ⇒θ2 + θ − 1 ≤ 0 ⇒ θ ∈

h0,³√

5 − 1´

/2i

= [0, 0.61803] .

Asemenea modele apar în genetica, de exemplu în probleme legatede clasificarea indivizilor în diferite genotipuri. Pentru un esantion dedimensiune n (unde n este mic relativ la dimensiunea populatiei, asaca putem presupune v. a. independente si identic distribuite), functiade verosimilitate va fi

L(x1, x2, x3; θ) = θx1θ2x2¡

1 − θ − θ2¢x3 ,

unde xi reprezinta numarul de selectii apartinând clasei i, x1+x2+x3 =n.Atunci

ln L(x1, x2, x3; θ) = (x1 + 2x2) ln θ + x3 ln

¡1 − θ − θ2

¢si∂ ln L(x1, x2, x3; θ)

∂θ=

x1 + 2x2

θ− x3 (2θ + 1)

1 − θ − θ2 .

Estimatorul de verosimilitate maxima se obtine rezolvând ecuatia

x1 + 2x2

θ− x3 (2θ + 1)

1 − θ − θ2 = 0 ⇔−θ2 (x1 + 2x2 + 2x3) − (x1 + 2x2 + x3) θ + x1 + 2x2 = 0

si trebuie verificata conditia de limitare asupra lui θ.

Pentru ca valoare lui θ, θ sa fie un estimator de verosimilitatemaxima trebuie ca derivata de ordin doi calculata în θ sa fie negativa,

∂ 2 ln L(x1, x2, x3; θ)

∂θ2

¯¯θ=θ

= −x1 + 2x2

θ2 −

x3

³2θ

2+ 2θ + 3

´³

1 − θ − θ2´2 < 0.

De exemplu daca x1 = 70, x2 = 5, x3 = 25 ⇒ −130·θ2−105·θ+80 = 0rezulta [θ = −1.286 2] , [θ = 0.47847]

Page 246: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 246/364

244 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Alegem solutia pozitiva si mai mica decît ¡√ 5 − 1¢ /2 = 0.61803.Rezulta θ = 0.47847.

∂ 2 ln L(x1, x2, x3; θ)

∂θ2 = −80

θ2 − 25¡

2θ2 + 2θ + 3¢¡

1 − θ − θ2¢2 ⇒

∂ 2 ln L(s1, s2, . . . , sn; 0.47847)

∂θ2 =

= − 80

0.478472− 25(2 · 0.478472 + 2 · 0.47847 + 3)

(1 − 0.47847 − 0.478472)2= −1638.6

si deci estimatorul de verosimilitate va fi θ = 0.47847.

Rezolvam problema cu Mathematica (am notat parametrul θ cu x).Reduce[0≤x≤1,0≤1-x-x^2≤1,x]

0 ≤ x ≤ 1

2(−1 +

√ 5)

N[%]0. ≤ x ≤ 0.618034

lvm[x_] := x^70x^(10)(1-x-x^2)^25lvm[x]x80((1

−x

−x2)25)

N[Solve[D[Log[lvm[x]], x] == 0, x]]x − > −1.28616, x − > 0.478467

d2[x_] := Simplify[D[Log[lvm[x]], x, 2]]d2[x] /. x-> 0.478467-1638.57. ♦

Complicatii care pot aparea în folosirea functiei de verosi-militate maxima: nu este întotdeauna usor sa minimizam functia

de verosimilitate maxima deoarece ecuatia obtinuta∂L

∂θ= 0 poate fi

dificil de rezolvat. Mai mult, uneori nu este posibil sa determinam cumetode directe maximum lui L(θ). Exemplificam acest lucru:

Exemplul 7.10. Consideram X ∈ Unif [0, a], deci densitatea deprobabilitate va fi:

f (x) =

( 1

adaca x ∈ [0, a] ,

0 în rest.

Parametrul pe care vrem sa-l estimam este a.

Page 247: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 247/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 245

Rezolvare. Functia de verosimilitate maxima va fi L(a) =nQi=1

1a

= 1an

pentru 0 ≤ x1 ≤ a, 0 ≤ x2 ≤ a , . . . , 0 ≤ xn ≤ a. În acest caz graficulfunctiei de verosimilitate este

min ( xi)

Figura 7.3.

Punctul de verosimiltate maxima este într-un punct de disconti-

nuitate. Deoareced

da

µ1

an

¶= − n

an+16= 0 pentru ∀a > 0, iar a−n

este o functie descrescatoare în raport cu a > 1 (si crescatoare pentrua < 1), ceea ce indica faptul ca maximul functiei de verosimilitate este

atins în valoarea cea mai mica (respectiv cea mai mare). Figura arataca max L(a) = L(mini

(xi)) (respectiv max L(a) = L(max(xi)), deci un

estimator al lui a este a = min(xi) (respectiv maxi

(xi)).

Exemplul 7.11. Fie X 1, X 2, . . . , X n o selectie dintr-o populatie careurmeaza o distributie Gama de valori x1, x2, . . . , xn. Functia de verosi-militate maxima este, în acest caz,

L [r, λ] =nYi=1

λrxr−1i e−λxi

Γ(r),

ln L [r, λ] = lnà nYi=1

λr

xr−1

i e−λxi

Γ(r)! =

= nr ln λ + (r − 1)nXi=1

ln xi − n lnΓ(r) − λnXi=1

xi.

Derivatele functiilor de verosimilitate maxima sunt

∂L [r, λ]

∂r= n ln λ +

nXi=1

ln xi − nΓ0(r)

Γ(r),

Page 248: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 248/364

246 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

∂L [r, λ]

∂r=

nr

λ−

nXi=1

xi.

Egalam derivatele cu zero si vom avea un sistem de doua ecuatiicu doua necunoscute care trebuie rezolvat.

n ln λ +nPi=1

ln xi − nΓ0(r)

Γ(r)= 0

nr

λ−

n

Pi=1

xi = 0.

Sistemul este dificil de rezolvat. Sunt folosite diferite metode nu-merice si softuri pentru a rezolva sistemul. Solutionam problema cuMathematica.

<< Statistics‘ContinuousDistributions‘

ex1 = RandomArray[GammaDistribution[2., 1], 400];

Short[ex1, 4]

2.49901, 0.321189, 3.78343, 0.407012, <<393>>, 0.537742, 0.901422,3.66009

ss = Sum[Log[ex1[[i]]], i, 1, 400]149.796

ssr = Sum[ex1[[i]], i, 1, 400]

759.69

n = 400;

vmaxGa[r_, lam_] := n r Log[lam] + (r - 1) ss - n Log[Gamma[r]] -lam ssr

d1 = D[vmaxGa[r, lam], lam]

-759.6898125225405 + 400 r/lam

d2 = D[vmaxGa[r, lam], r]

149.796 + 400 Log[lam] - 400 PolyGamma[0, r]ec = d1 == 0, d2 == 0

-759.6898125225405 + 400 r/lam == 0,

149.79562794164252 + 400 Log[ lam] - 400 PolyGamma[0, r] == 0

FindRoot[ec, lam, 1.5, r, 0.5]

lam -> 1.06559, r -> 2.0238

<< Graphics‘Graphics3D‘

Plot3D[vmaxGa[r, lam], lam, 0.1, 4, r, 0.1, 10];

Page 249: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 249/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 247

1

2

3

4

2

4

6

8

10

-4000

-2000

0

1

2

3

Figura 7.4.

ContourPlot[vmaxGa[r, lam], lam, 0.1, 4, r, 0.1, 10,ContourLines -> False, Compiled -> True];

1 2 3 4

0

2

4

6

8

10

Figura 7.5.

Graficul a fost f acut pentru functia de verosimilitate maxima pen-tru distributia gama folosind 400 de numere aleatoare distribuite gamacu r = 2 si λ = 1. Primul grafic deseneaza suprafata generata defunctia de verosimilitate maxima, iar al doilea deseneaza suprafetede nivel. Din acest ultim desen observam ca functia de verosimiltatemaxima este maximizata în aproximativ λ = 1.06559, r = 2.0238.

Page 250: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 250/364

248 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

7.4.1 Probleme rezolvate

Problema 7.3. Fie o selec tie de valori (x1, x2, . . . , xn) ale variabilelor X 1, X 2, . . . , X n dintr-o popula tie a c arei caracteristic a studiat a urmeaz a o distribu tie uniform a pe intervalul [0, a] , a > 0.

a) S a se determine un estimator punctual al lui a folosind metoda momentelor.

b) S a se analizeze dac a estimatorul obtinut este nedeplasat.

Rezolvare.

a) X ∼ Unif [0, a] ⇒ f X : R→ R, f X (x) =( 1

a, daca x ∈ [0, a]

0, în caz contrar.

Avem M [X ] =a

2si X =

1

n

nPi=1

X i. Rezulta, conform metodei mo-

mentelor, caa

2=

1

n

nPi=1

X i. Deci a =2

n

nPi=1

X i este un estimator pentru

parametrul a.

b) Calculam M [a] = M

·2

n

nPi=1

X i

¸=

2

n

nPi=1

M [X i] = a. ♦

Problema 7.4. Se consider a func tia:

f : R→ R, f (x) =

½c(1 + θx), −1 ≤ x ≤ 1,

0, în rest.

a) S a se determine valoarea constantei c astfel încât f s a fie odensitate de probabilitate.

b) Care este estimatorul lui θ obtinut prin metoda momentelor? c) Ar ata ti c a θ = 3X este un estimator nedeplasat al lui θ.d) Determina ti estimatorul de verosimilitate maxim a a lui θ.

Rezolvare. a)1R −1

c(1 + θx)dx = 2c ⇒ c =1

2.

b) M [X ] =1

2

1R −1

(x + θx2)dx =1

3θ ⇒ 1

3θ = X , X =

1

n

nPi=1

X i,

θ = 3X .

c) M h

θi

= 3M £

X ¤

= 3M

·1

n

nPi=1

X i

¸=

3

n

nPi=1

M [X i] = θ.

Page 251: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 251/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 249

d)

L(x1, x2, . . . , xn; θ) =

µ1

2

¶n nYi=1

(1 + θxi) ,

ln L(x1, x2, . . . , xn; θ) = −n ln 2 +nXi=1

ln (1 + θxi) ,

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

nXi=1

xi

1 + θxi,

nXi=1

xi

1 + θxi= 0.

Determinarea estimatorului de verosimilitate maxima este dificila.În acest caz preferam o alta metoda pentru estimarea parametrului θ.♦

Problema 7.5. Fie o selec tie de valori (x1, x2, . . . , xn) ale variabilelor X 1, X 2, . . . , X n dintr-o popula tie a c arei caracteristic a studiat a urmea-z a o distribu tie cu densitatea de probabilitate

f (x) =

½(θ + 1)xθ, 0 ≤ x ≤ 1

0, în rest , θ > −1.

S a se determine estimatorul de verosimilitate maxim a.

Rezolvare.

L(x1, x2, . . . , xn; θ) =nYi=1

(θ + 1)xθi = (θ + 1)n

ÃnYi=1

xi

,

ln L(x1, x2, . . . , xn; θ) = n ln(θ + 1) + θnXi=1

ln (xi) ,

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

n

θ + 1+

nXi=1

ln (xi) ,

nθ + 1

+nXi=1

ln xi = 0 ⇒ θ = − nnPi=1

ln (xi)− 1.

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2 = − n

(θ + 1)2< 0, ∀θ 6= 1.

Estimatorul de verosimilitate maxima este θ = − nnPi=1

ln (xi)− 1. ♦

Page 252: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 252/364

250 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

Problema 7.6. Fie o selec tie de valori (x1, x2, . . . , xn) ale variabilelor X 1, X 2, . . . , X n dintr-o popula tie a c arei caracteristic a studiat a urmea-z a o distribu tie cu densitatea de probabilitate

f (x) =1

θ2xe−x/θ, 0 ≤ x < ∞.

S a se determine estimatorul de verosimilitate maxim a.

Rezolvare.

L(x1, x2, . . . , xn; θ) =

nYi=1

1

θ2xe−xi/θ

=

1

θ2n ÃnYi=1

xie−xi

θ ! =

=1

θ2n

ÃnYi=1

xi

!exp

µ−

nPi=1

xi

θ

¶=

1

θ2n

ÃnYi=1

xi

!e−

nxθ ,

ln L(x1, x2, . . . , xn; θ) = −2n ln θ +nXi=1

ln (xi) − nx

θ,

∂ ln L(x1, x2, . . . , xn; θ)

∂θ

=

−2n

θ

+nx

θ2 ,

−2n

θ

+nx

θ2 = 0

⇒θ =

1

2

x.

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2 =2n

θ2 − 2nx

θ3

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2

¯¯θ= 1

2x

= −8n

x2 < 0.

Estimatorul de verosimilitate maxima este θ =1

2x. ♦

Problema 7.7. Fie o selec tie de valori (x1, x2, . . . , xn) ale variabilelor X 1, X 2, . . . , X n dintr-o popula tie a c arei caracteristic a studiat a urmeaz a

o distribu tie Pareto [α], α ∈ (0, ∞) necunoscut. S a se determine un estimator de verosimiltate maxim a pentru α, dac a acesta exist a. (den-sitatea de probabilitate pentru o v. a. repartizat a Pareto este f (x) =½

α(1 + x)−α−1, x ≥ 00, x < 0.

).

Rezolvare.

L(x1, x2, . . . , xn; α) =nYi=1

α(1 + xi)−α−1 = αn

ÃnYi=1

(1 + xi)

!−α−1,

Page 253: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 253/364

CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A 251

ln L(x1, x2, . . . , xn; α) = n ln α + (−α − 1)nXi=1

ln(1 + xi),

∂ ln L(x1, x2, . . . , xn; α)

∂α=

n

α−

nXi=1

ln(1 + xi),

ln L(x1, x2, . . . , xn; α) = n ln α + (−α − 1)nXi=1

ln(1 + xi),

∂ ln L(x1, x2, . . . , xn; α)

∂α=

n

α−

n

Xi=1

ln(1 + xi),

n

α−

nXi=1

ln(1 + xi) = 0 ⇒ α =n

nPi=1

ln(1 + xi).

∂ 2 ln L(x1, x2, . . . , xn; α)

∂α2= − n

α2< 0. ♦

Problema 7.8. Conform legilor genetice ale lui Hardy-Weinberg, pro-por tia genotipurilor AA, Aa, aa este θ2, 2θ(1 − θ), (1 − θ)2 respectiv,unde θ ∈ [0, 1]. Facem o selec tie de volum n dintr-o popula tie ( n re-lativ mic în raport cu volumul popula tiei) si observ am c a x1 indivizi

apar tin genotipului AA, x2 indivizi apar tin genotipului Aa, x3 indivizi apar tin genotipului aa. S a se scrie func tia de verosimilitate maxim a,

func tia log de verosimilitate maxim a, func tia scor. S a se stabileasc a,dac a exist a, un estimator de verosimilitate maxim a pentru θ.

Rezolvare. Folosim modelul multinomial. Functia de verosimilitatemaxima

L(x1, x2, . . . , xn; θ) = θ2x1 (2θ(1 − θ))x2 (1 − θ)2x3 =

= 2x2θ2x1+x2 (1 − θ)x2+2x3 .

Functia log de verosimilitate maxima

ln L(x1, x2, . . . , xn; θ) = ln¡

θ2x1 (2θ(1 − θ))x2 (1 − θ)2x3¢

=

= x2 ln 2 + (2x1 + x2) ln θ + (x2 + 2x3)ln(1 − θ) .

Functia scor

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

2x1 + x2

θ− x2 + 2x3

1 − θ.

2x1 + x2

θ− x2 + 2x3

1 − θ= 0 ⇒ θ =

2x1 + x2

2x1 + 2x2 + 2x3.

Page 254: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 254/364

252 CAPITOLUL 7. STATISTIC A INFEREN TIAL˘ A

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2 = −2x1 + x2

θ2 − x2 + 2x3

(1 − θ)2< 0.

Estimatorul de verosimilitate maxima este θ =2x1 + x2

2x1 + 2x2 + 2x3. ♦

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. Conceptul general de estimare a parametrilor unei populatii.2. Proprietatile estimatorilor punctuali.3. Cum pot fi construiti estimatorii punctuali folosind metoda mo-

mentelor si metoda verosimilitatii maxime.

Page 255: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 255/364

Capitolul 8

Intervale de încredere

Am vazut cum poate fi estimat un parametru folosind datele furni-zate de un esantion. Parametrul din populatie nu este, în general, egalcu statistica calculata cu ajutorul esantionului. Ne punem problemacât este de buna aceasta estimare, adica vom calcula asa numita marjade eroare.

Presupunem ca studiem vâscozitatea unei anumite substante. Prinstudierea unui esantion s-a constatat ca media acestei caracteristici

este µ = x = 1000. Dac˘

a consider˘

am un alt esantion este aproapeimposibil sa obtinem aceeasi estimare numerica pentru media vâsco-zitatii. Nu putem spune nimic despre relatia dintre cele doua medii.Problema pe care o punem este urmatoarea: valoarea reala a vâscozi-tatii este cuprinsa între 900 si 1100 sau între 990 si 1100? Raspunsul laaceasta întrebare afecteaza deciziile ulterioare legate de acest proces.Marginile unui interval plauzibil pentru valorile mediei constituie uninterval estimat.

Acest interval unde banuim ca este situata valoarea reala a para-metrului populatiei studiate se numeste interval de încredere . Inter-valul de încredere consta din:

- un interval , obtinut cu ajutorul datelor furnizate de o selectie,- un nivel de încredere , care reprezinta probabilitatea ca intervalul

sa acopere valoarea reala a parametrului.Nivelul de încredere se precizeaza. De regula se considera 0.90 sau

mai mult. Se da de obicei α, unde nivelul de încredere este 1−α (0.95corespunde pragului de semnificatie α = 0.05).

Definitia 8.1. Se numeste interval de încredere pentru un parametruθ asociat unei populatii orice interval I = [a, b] pentru care se poate

253

Page 256: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 256/364

254 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

estima probabilitatea ca θ ∈ I . Daca α este un numar cuprins între0 si 1 si daca P (θ ∈ I ) ≥ 1 − α, se spune ca I este un interval deîncredere pentru θ cu un nivel de încredere 1 − α (sau echivalent, cuun nivel de încredere (1 − α)100% sau cu eroare sub α100%).

În cele ce urmeaza vom construi intervale de încredere numai pen-tru caracteristici care urmeaza o distributie normala

8.1 Intervale de încredere pentru medie

în cazul σ cunoscutPresupunem ca realizam o selectie populatie a carei caracteristica

studiata urmeaza o distributie normala, N [m, σ], cu σ cunoscut, mnecunoscut. Situatia este mai putin întâlnita în realitate deoarece înmod normal atât media cât si dispersia sunt necunoscute. Totusi vomprezenta în continuare si acest caz.

8.1.1 Constructia intervalului de încredere

Fie x1, x2, . . . , xn valorile variabilelor de selectie X 1, X 2, . . . , X n ob-tinute dintr-o populatie care urmeaza o distributie normala, N [m, σ],

σ > 0 cunoscut, m necunoscut. Stim ca Z =X − m

σ√ n

∈ N ([0, 1]. Din

aceasta cauza putem scrie, (evident z > 0),

P (|Z | ≤ z) = 1 − α ⇔ 1 − α = P

µm ∈

·X − z

σ√ n

, X + zσ√

n

¸¶⇔

1 − α = Φ (z) −Φ (−z) ⇔ 1 − α = 1 − 2Φ (−z) ⇔ Φ(−z) =α

2

Notamcu zα2

valoarea (pozitiva) a lui z obtinuta din relatiaΦ(

−z) =

= α2

. Pentru determinarea acestei valori se foloseste tabelul pentru

functia lui Laplace (a se vedea Anexa 1) sau programele Matlab sauMathematica.

De îndata ce selectia a fost realizata si a fost calculata media de

selectie x = 1n

nPi=1

xi se obtine intervalul,·x − zα

2

σ√ n

, x + zα2

σ√ n

¸(8.1)

Page 257: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 257/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 255

Suntem tentati sa spunem ca 1 − α este probabilitatea ca acestinterval sa cuprinda valoarea exacta a lui m, dar aceasta afirmatienu este corecta. Trebuie sa tinem seama de faptul ca întervalul deîncredere este un interval aleator, el depinde de selectia f acuta, deciextremitatile sale sunt v. a. Prin urmare interpretarea corecta a lui1−α este urmatoarea: daca, facem un numar foarte mare de selectii sicalculam de fiecare data întervalul de încredere cu nivelul de încredere1 − α, atunci (1 − α) 100% din aceste intervale vor contine valoareaexacta pentru m.

Observam ca intervalul de încredere pentru m este centrat în es-

timatia punctuala x. Când n creste se obtine un interval mai scurt pentru acelasi coeficient de încredere. Un interval de încredere maiscurt indica o mai mare încredere în x ca estimatie a lui m.

Reluam exemplul 6.1 din capitolul 6.

Exemplul 8.1. Punctajele obtinute de studenti care au promovatexamenul de matematica si care cuantifica cunostintele lor sunt:

64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62,58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77, 58, 62, 82,85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53, 60, 49, 68,

74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68, 95, 94, 99,81, 81, 92, 88, 99, 81, 81.

Se presupune ca se cunoaste σ = 10.99. Sa se construiasca inter-valele de încredere pentru medie cu nivelele de încredere de 90%, 95%si 99%.

Rezolvare. Am calculat x =1

83

83Pi=1

xi = 75.0602.

Calculam intervalele de încredere cu nivelul de încredere de 90%,95% si 99%.

Pentru 90% avem α = 0.1¸si

Φ(−z) = 0.05 ⇒ −z = −1.6449 ⇒ zα2

= 1.6449.

Atunci, conform (8.1), intervalul

I =

·x − zα

2

σ√ n

, x + zα2

σ√ n

¸= [73.0760; 77.0445] .

este un interval de încredere pentru m cu 90% nivel de încredere.

Page 258: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 258/364

256 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Pentru 95% avem α = 0.05 si Φ(−z) = 0.025 ⇒ zα2

= 1.9599.Intervalul de încredere pentru m este

I =

·x − 1.9599 ·

σ√ n

, x + 1.9599 ·σ√

n

¸= [72.6960; 77.4245] .

Pentru 99% avem α = 0.01 si Φ(−z) = 0.005 ⇒ zα2

= 2.5758,intervalul de încredere pentru m este

I =

·x − 2.5758 ·

σ√ n

, x + 2.5758 ·σ√

n

¸= [71.9530; 78.1675] .

Observam ca daca, de exemplu, nivelul de încredere este 0.95,atunci zα

2= 1.9599 trebuie sa lase la dreapta sa o arie egala cu

α

2= 0.025, iar la stânga o arie egala cu 1 − α

2= 1 − 0.025 = 0.975.

-4 -3 -1.96 -1 1 1.96 3 4

0.1

0.2

0.3

0.4

0.025 0.025

-4 -3 -1.96 -1 1 1.96 3 4

0.1

0.2

0.3

0.4

Figura 8.1.♦

Aceasta modalitate de determinare a intervalului de încredere sepoate sintetiza în testul Z.

Algoritmul testului Z

Presupunem data o selectie de valori independente (de volum n)dintr-o populatie de medie m necunoscuta si dispersie σ2 (σ > 0)cunoscuta.

Pasul 1. Se calculeaza x.

Pasul 2. Se considera statistica Z =X − m

σ√ n

.

Pasul 3. Pentru un nivel de încredere prescris (1 − α) · 100% sedetermina zα

2> 0 astfel încât Φ(−zα

2) =

α

2.

Page 259: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 259/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 257

Pasul 4. Se determina intervalul de încredere pentru m·x − zα

2

σ√ n

, x + zα2

σ√ n

¸.

Comparam intervalele obtinute în exemplul de mai sus în functiede nivelul de încredere

(1 − α) · 100%α

2zα2

·x − zα

2

σ√ n

, x + zα2

σ√ n

¸90% 0.05 1.6449 [73.0760; 77.0445]95% 0.025 1.9599 [72.6960; 77.4245]99% 0.005 2.5758 [71.9530; 78.1675]

Din tabel se observa ca lungimea intervalului este invers proportio-nala cu nivelul de încredere.

Calculam intervalele de încredere cu ajutorul softului Mathema-tica. Vom calcula întâi dupa formulele prezentate, apoi cu ajutorulcomenzilor specifice softului.

punc = 64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,

84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81;

n = Length[punc]m = N[Mean[punc]]8375.0602<< Statistics‘ContinuousDistributions‘Calculul intervalului de încredere pentru nivelul de incredere 90%,

95%, 99% urm arind algoritmul testului Z α = 0.1z = Quantile[NormalDistribution[0, 1], 1-0.05]1.64485imin = m - z 10.99/Sqrt[n]imax = m + z 10.99/Sqrt[n]73.076077.0444

α = 0.05

Page 260: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 260/364

258 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

z1 = Quantile[NormalDistribution[0, 1], 1-0.025]1.95996imin = m - z1 10.99/Sqrt[n]imax = m + z1 10.99/Sqrt[n]72.695977.4245

α = 0.01z2 = Quantile[NormalDistribution[0, 1], 1-0.005]2.57583

imin = m - z2 10.99/Sqrt[n]imax = m + z2 10.99/Sqrt[n]71.9529978.16748Calculul intervalului de încredere pentru nivelul de incredere 90%,

95%, 99% folosind comenzi specifice softului Mathematica . Acestecomenzi se gasesc în pachetul Statistics‘DescriptiveStatistics‘. Pachetuleste încarcat automat atunci când se scrie comanda

<<Statistics‘DescriptiveStatistics‘.Comenzile sunt:— NormalCI[mean, sd] furnizeaza un interval de încredere pentru

medie, centrat în mean si cu abaterea medie patratica sd, intervalcalculat cu ajutorul distributiei normale.

— MeanCI[data, KnownVariance -> var] furnizeaza un interval deîncredere pentru media esantionului numit data, interval calculat cuajutorul distributiei normale.

În ambele cazuri nivelul de încredere este considerat implicit este de95%. Daca dorim un interval de încredere cu un alt nivel de încrederefolosim optiunea ConfidenceLevel ->1-α.

<< Statistics‘ConfidenceIntervals‘NormalCI[m, 10.99/Sqrt[n], ConfidenceLevel -> 0.90]

73.076, 77.0444MeanCI[punc, KnownStandardDeviation -> 10.99,

ConfidenceLevel -> 0.90]73.076, 77.0444În aceasta secventa observam urmatorele: comanda NormalCI fur-

nizeaza acelasi interval de încredere ca si MeanCI[data, KnownVariance-> var].

Dam si secventele care genereaza intervale de încredere cu 95% si99% nivel de încredere.

Page 261: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 261/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 259

NormalCI[m, 10.99 /Sqrt[n]]

72.6959, 77.4246

MeanCI[punc, KnownStandardDeviation -> 10.99]

72.6959, 77.4246

NormalCI[m, 10.99 /Sqrt[n], ConfidenceLevel -> 0.99]

71.953, 78.1675

MeanCI[punc, KnownStandardDeviation -> 10.99,ConfidenceLevel -> 0.99]

71.953, 78.1675 ♦

Am putea spune ca 95% dintre studenti au punctajele cuprinseîn intervalul [72.6960; 77.4245]? Aceasta interpretare nu este corectadeoarece valoarea exacta a mediei nu este cunoscuta si afirmatia m ∈[72.6960; 77.4245] poate fi corecta sau nu deoarece intervalul de în-credere construit este aleator, el bazându-se pe o selectie aleatoare.

Interpretarea corecta este: daca facem un numar mare de selectiisi de fiecare data calculam intervalul de încredere pentru medie cunivelul de încredere de 95%, atunci în 95% din aceste intervale vor

contine valoarea corecta a mediei. Deci metoda folosita ne permitesa obtinem intervale pentru medie care vor contine în 95% din cazurivaloatrea corecta.

Alegerea nivelului de încredere este arbitrara. Ne punem prob-lema ce se întâmpla daca marim nivelul de încredere, de exemplu,la 99%? Este rezonabil sa dorim sa marim nivelul de încredere. Înacest caz, pentru exemplul considerat, intervalul de încredere va fi[71.9530; 78.1675], deci va fi mai mare decît în cazul nivelului de 95%.Daca dimensiunea esantionului si abaterea medie patratica sunt pas-trate constante, atunci un nivel mai înalt de încredere atrage un in-

terval de încredere mai mare.Lungimea intervaluilui de încredere este o masura a preciziei es-

timarii. Din cele prezentate rezulta ca precizia este invers proportio-nala cu nivelul de încredere. Este preferabil sa obtinem un intervalde încredere cît mai scurt pentru o problema pusa, dar cu un nivel deîncredere adecvat. Un mod de a atinge acest scop este alegerea dimen-siunii esantionului astfel încât cu ajutorul acestei selectii sa putemobtine un interval de încredere de lungime specificata si cu nivelul deîncredere dat.

Page 262: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 262/364

260 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

8.1.2 Alegerea dimensiunii esantionului

Observam ca lungimea intervaluilui de încredere este 2zα2

σ√ n

. Aceas-

ta înseamna ca folosind x ca estimare pentru m, eroarea E = |x − m| ≤zα2

σ√ n

cu un nivel de încredere de (1 − α) · 100%. Se poate alege în

acest caz n astfel încât cu un nivel de încredere de (1 − α) · 100%,eroarea pe care o facem estimând m cu x sa fie mai mica decât E .Daca consideram E = zα

2

σ√ n

atunci

n =·³σz α2

E

´2¸ + 1. (8.2)

Bineînteles se poate lua n ≥hz2α/2σ

2

E 2

i+ 1, dar formula (8.2) da va-

loarea minima pentru numarul n de date ale esantionului, care asigurao eroare prescrisa de estimare (sau, echivalent, un nivel prescris deîncredere).

Pentru Exemplul 8.1 dorim sa determinam volumul esantionuluiastfel încât cu un nivel de încredere de 95% eroarea pe care o facemestimând m cu x = 74 sa fie mai mica decît E = 0.5. Aplicând formula

obtinem n = 1856.<< Statistics‘ContinuousDistributions‘z1 = Quantile[NormalDistribution[0, 1], 1-0.025]1.95996σ = 10.99;ER = 0.5;IntegerPart[(σ z1/ER)^2] + 11856Daca micsoram eroarea, volumul esantionului creste.ER = 0.1;

IntegerPart[((σ z1)/ER)^2] + 146398Relatii între volumul esantionului, lungimea dorita a intervalului

de încredere 2E , nivelul de încredere de (1 − α) · 100% si abatereamedie σ:

— daca 2E descreste, volumul esantionului creste pentru nivelul deîncredere si σ fixati (se observa din secventa de comenzi de mai sus),

— daca σ creste, n creste pentru 2E , nivelul de încredere de (1 − α)·100% fixati,

Page 263: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 263/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 261

<< Statistics‘ContinuousDistributions‘z1 = Quantile[NormalDistribution[0, 1], 1-0.025]1.95996ER = 0.5;σ = 10;IntegerPart[((σ z1)/ER)^2] + 11537σ = 10.99IntegerPart[((σ z1)/ER)^2] + 11856

— daca nivelul de încredere creste, n creste pentru 2E si σ fixati.Nivelul de încredere 0.9 << Statistics‘ContinuousDistributions‘z1 = Quantile[NormalDistribution[0, 1], 1-0.05]1.64485IntegerPart[((σ z1)/ER)^2] + 11308Nivelul de încredere 0.95 z1 = Quantile[NormalDistribution[0, 1], 1-0.025]1.95996

IntegerPart[((σ z1)/ER)^2] + 11856Nivelul de incredere 0.99 z1 = Quantile[NormalDistribution[0, 1], 1-0.005]2.57583IntegerPart[((σ z1)/ER)^2] + 13206 ♦

Intervalele de încredere studiate pâna acum sunt bilaterale în sen-sul ca dadeau ca rezultat un interval închis. Daca exista o informatierelativa la valoarea medie de forma ca aceasta nu este limitata supe-

rior, atunci intervalul de încredere devine de forma µx − zα σ√ n

, ∞¶si este un interval de încredere unilateral.

În acest caz

P (Z > −z) = 1 − α ⇔ P

µm ∈

µx − z

σ√ n

, ∞¶¶

= 1 − α ⇔1 −Φ (−z) = 1 − α ⇔ Φ (−z) = α

Notam cu zα valoarea obtinuta din relatia Φ(−z) = α.

Page 264: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 264/364

262 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

O situatie similara are loc daca valoarea medie nu este limitata

inferior, intervalul de încredere fiindµ

−∞, x + zασ√

n

¶, iar valoarea

zα se obtine din relatia Φ(z) = 1 − α.

8.2 Intervale de încredere pentru medie

în cazul σ necunoscut

Presupunem ca populatia studiata are o distributie normala cu

media m si dispersia σ2 necunoscute. Facem o selectie de dimensiunen. Fie x1, x2, . . . , xn valorile variabilelor de selectie X 1, X 2, . . . , X n.

Putem calcula media de selectie x = 1n

nPi=1

xi si dispersia de selectie

modificata s2 = 1n−1

nPi=1

(xi − x)2.

Vrem sa calculam un interval de încredere pentru m. Daca disper-

sia este cunoscuta, stim ca Z =X − m

σ√ n

urmeaza o distributie normala.

Daca σ este necunoscut o procedura normala este de a înlocui σ cu

s. Statistica devine acum T =X

−m

s√ n . O întrebare logica care se

pune este urmatoarea: care este efectul înlocuirii lui σ cu s asupradistributiei statisticii T ? Daca n este suficient de mare, raspunsul laaceasta întrebare este: efectul este "destul de mic" si putem consi-dera ca urmeaza o distributie normala standard. În general n trebuiesa fie cel putin 40. Teorema limita centrala are loc pentru n ≥ 30,dar marirea esantionului recomandata este la cel putin 40, deoareceînlocuirea lui σ cu s în Z conduce la modificari suplimentare ale dis-tributiei.

În acest caz intervalul de încredere se construieste astfel:

Pasul 1. Se calculeaza x = 1n

nPi=1

xi si s2 = 1n−1

nPi=1

(xi − x).

Pasul 2. Se considera statistica Z =x − m

s√ n

.

Pasul 3. Pentru un nivel de încredere prescris (1 − α) · 100% sedetermina zα

2> 0 astfel încât Φ(−zα

2) = α

2.

Pasul 4. Se determina intervalul de încredere pentru m,·x − zα

2

s√ n

, x + zα2

s√ n

¸.

Page 265: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 265/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 263

Daca n este mic, cum se întâmpla în multe probleme din inginerie,trebuie folosita distributia Student pentru construirea intervalului deîncredere.

Testul Student

Presupunem ca populatia studiata are o distributie normala cumedia m si abaterea medie patratica σ necunoscute. Facem o selectiede dimensiune n, n mic. Vrem sa calculam un interval de încrederepentru m.

Teorema 8.1. Fie X 1, X 2, . . . , X n independente, care urmeaz a o dis-tribu tie normal a cu media m si dispersia σ2. Fie x1, x2, . . . , xn, x =

1n

nPi=1

xi si fie s =

r 1

n−1nPi=1

(xi − x)2, unde x reprezint a media de se-

lec tie, s reprezint a abaterea medie de selec tie. Statistica T =X − m

s√ n

urmeaz a o distribu tie Student cu n − 1 grade de libertate.

În tabelul din Anexa 2 pentru functia de repartitie a distributieiStudent pe prima linie sunt date valorile lui α iar pe coloana sunttrecute gradele de libertate. Astfel calculam

F (tα,n) = P (T ≤ tα,n) =

Z tα,n−∞

f (x)dx = 1 − α,

unde f (x) este densitatea de probabilitate a distributiei Student.Pentru valorile negative se foloseste faptul ca

F (−tα,n) = 1 − F (tα,n). (8.3)

Deoarece distributia Student este simetrica, avem t1−α,n = −tα,n,ceea ce înseamna ca în partea dreapta a lui tα,n, dar si în partea stânga

a lui t1−α,n, aria este α (figura 8.2).La fel obtinem aceste informatii folosind softul Mathematica.

Exemplul 8.2. Stiind ca T ∈ t (10), sa se calculeze

F (1.812) = P (T ≤ 1.812) ,

F (−1.812) = P (T ≤ −1.812) ,

F (t0.05,10) = P (T ≤ t0.05,10) = 0.95,

F (−t0.05,10) = P (T ≤ −t0.05,10) = 0.05.

Page 266: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 266/364

264 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

-3 t1−α,n -1 1 tα,n 3

0.1

0.2

0.3

0.4

α α

-3 t1−α,n -1 1 tα,n 3

0.1

0.2

0.3

0.4

Figura 8.2.

<< Statistics‘ContinuousDistributions‘CDF[StudentTDistribution[10], 1.812]0.949962CDF[StudentTDistribution[10], -1.812]0.0500376Deci F (1.812) = 0.949962. Observam ca F (

−1.812) = 1

−F (1.812).

Functia inversa functiei de repartitie, determinarea lui t când secunoaste probabilitatea, se face cu ajutorul comenzii Quantile.

Quantile[StudentTDistribution[10], 0.95]1.81246Quantile[StudentTDistribution[10], 0.05]−1.81246.In tabelul din Anexa 2 urmarim pe linia corespunzatoare celor

10 grade de libertate si cautam valoarea 1.812. Urcând pe coloanagasim α = 0.05. Pentru valoarea negativa tinem seama de simetriadensitatii de probabilitate folosim relatia (8.3). Pentru ultimele doua

valori cautam valoarea la intersectia liniei corespunzatoare celor 10grade de libertate cu coloana corespunzatoare lui α si obtinem valoareapozitiva.♦

Pentru orice α ∈ (0, 1) se poate determina pragul tα2,n−1 > 0 astfel

încât P (|T n−1| ≤ tα2 ,n−1) = 1 − α. Se alege tα

2 ,n−1 astfel încât ariile

colorate din figura 8.3. sa fie fiecareα

2.

Înlocuind T n−1 =

¡X − m

¢√ n

s, rezulta

Page 267: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 267/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 265

-3 −tαê2,n−1 -1 1 tαê2,n−1 3

0.1

0.2

0.3

0.4

αê2 αê2

-3 −tαê2,n−1 -1 1 tαê2,n−1 3

0.1

0.2

0.3

0.4

Figura 8.3.

P (−tα2,n−1 ≤

¡X − m

¢√ n

s≤ tα

2,n−1) = 1 − α ⇔

P

µm ∈

·x − s√

ntα2 ,n−1, x +

s√ n

tα2 ,n−1

¸¶= 1 − α.

Rezulta ca intervalul

·x−

s

√ ntα2,n−1, x +

s

√ ntα

2,n−1¸

este un interval de încredere pentru media m cu coeficientul de în-credere 100(1 − α)%.

Algoritmul testului Student (mai este cunoscut sub denumireade testul T)

Fie x1, x2, . . . , xn o selectie de variabile de selectie X 1, X 2, . . . , X ni.i.d. dintr-o populatie normala cu media m si dispersia σ2 necunos-cute.

Pasul 1. Se calculeaza x = 1n

n

Pk=1

xk si s = µ1

n−1n

Pk=1

(xk − x)2¶12

.

Pasul 2. Se considera statistica T =X − m

s√ n

.

Pasul 3. Pentru un coeficient de încredere prescris (1 − α) · 100%se determina din tabelul functiei de repartitie Student sau cu ajutorulsofturilor numarul tα

2,n−1 > 0 astfel încât P (|T | ≤ tα

2,n−1) = 1 − α.

Pasul 4. Se determina intervalul de încredere pentru m,·x − s√

ntα2 ,n−1, x +

s√ n

tα2 ,n−1

¸.

Page 268: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 268/364

266 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

În acest caz calculul intervalului de încredere se poate face cu aju-torul Mathematicii folosind comenzile:

— MeanCI[data] furnizeaza un interval de încredere pentru mediaesantionului numit data, bazat pe distributia Student.

— StudentTCI[mean, se, dof] furnizeaza un interval de încredere pen-tru medie, centrat în mean, un estimator nedeplasat al abaterii mediipatratice notat se si cu numarul gradelor de libertate dof, calculatcu ajutorul distributiei Student. Estimatorul nedeplasat se se de-termina cu ajutorul comenzii StandardErrorOfSampleMean[data], undedata reprezinta esantionul de date obtinut. Daca se cunoaste abaterea

medie patratica aceasta se poate preciza prin optiunea— KnownStandardDeviation->valoarea cunoscuta.

Exemplul 8.3. Consideram un esantion de 36 studenti care au obtinutpunctajele:64, 62, 76, 82, 66, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62, 58, 80, 79,84, 83, 62, 78, 84, 94, 88, 77, 58, 65, 53, 60, 49, 68, 74, 78, 98.

Sa se stabileasca intervale de 90%, 95% si 99% încredere pentrumedia punctajelor obtinute.

Rezolvare. Folosim testul Z.

Rezulta x = 73.7778, σ ' s = 11.6082.Statistica T este distribuita Student cu 35 grade de libertate (a seconsulta anexa 2 cu tabelul valorilor functiei de repartitie Student înfunctie de gradele de libertate).

Pentru 90% încredere (deci eroare sub 10%) avem t0.05 = 1.68957.Intervalul cerut are capetele 73.7778 ± 1.68957 · 11.6082√

36, adica

[70.509; 77.0466].Pentru 95% încredere (deci eroare sub 5%) avem t0.025 = 2.03011.

Intervalul cerut are capetele 73.7778 ± 2.03011 · 11.6082√ 36

, adica[69.8501; 77.7054]

Pentru 99% încredere (deci eroare sub 1%) avem t0.005 = 2.72381.Intervalul cerut are capetele 73.7778 ± 2.72381 · 11.6082√ 36

, adica[68.5081; 79.0475]

Calculam intervalele de încredere folosind algoritmul testului Stu-dent si apoi folosind comenzi specifice Mathematicii.

punc1 = 64, 62, 76, 82, 66, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86,62, 58, 80, 79, 84, 83, 62, 78, 84, 94, 88, 77, 58, 65, 53, 60, 49, 68, 74,78, 98;

n = Length[punc1]

Page 269: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 269/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 267

m = N[Mean[punc1]]3673.7778s = N[StandardDeviation[punc1]]11.6082<< Statistics‘ContinuousDistributions‘Nivelel de încredere 90%, α = 0.1z = Quantile[StudentTDistribution[n - 1], 1-0.05]1.68957imin = m - z s/Sqrt[n]

imax = m + z s/Sqrt[n]70.50977.0466Nivelel de încredere 95%, α = 0.05z1 = Quantile[StudentTDistribution[n - 1], 1-0.025]2.03011imin = m - z1 s/Sqrt[n]imax = m + z1 s/Sqrt[n]69.850177.7054

Nivelel de încredere 99%, α = 0.01z2 = Quantile[StudentTDistribution[n - 1], 1-0.005]2.72381imin = m - z2 s/Sqrt[n]imax = m + z2 s/Sqrt[n]68.508179.0475Calculul intervalelor de încredere cu comenzi din Mathematica.<< Statistics‘ConfidenceIntervals‘MeanCI[punc1]

69.8501, 77.7054se = N[StandardErrorOfSampleMean[punc1]]1.93469StudentTCI[m, se, n - 1]69.8501, 77.7054 ♦

Si în acest caz putem construi intervale de încredere de formaµx − tα,n−1

s√ n

, ∞¶

sauµ

−∞, x + tα,n−1s√ n

¶pentru intervale de în-

credere unilaterale.

Page 270: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 270/364

268 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

8.3 Intervale de încredere pentru disper-sie

Uneori este necesar calculul intervalului de încredere pentru dis-persia unei caracteristici studiate. Daca populatia este modelata de odistributie normala putem aplica intervalele descrise în continuare.

Teorema 8.2. Fie variabilele de selec tie X 1, X 2, . . . , X n i.i.d. (inde-pendente si identic distribuite) cu X ∈ N (m, σ), media m si dispersia σ2 necunoscute. Statistica

χ2n−1 =

(n − 1)s2

σ2

urmeaz a o distribu tie hi-p˘ atrat cu n − 1 grade de libertate.

Definim xα,n ca fiind punctul pentru care este satisf acuta inegali-tatea

P ¡

χ2 ≤ xα,n

¢=

xα,nZ −∞

f (t)dt = 1 − α, (8.4)

unde f (t) este densitatea de probabilitate a distributiei χ2

(n).Probabilitatea cautata este aria situata la stânga lui xα,n din figura8.4.

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

α

1−α

xα,n5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

Figura 8.4.

Pentru a ilustra modul de utilizare a tabelului de valori ale functieide repartitie hi-patrat observam ca pe prima coloana sunt trecutegradele de libertate iar pe linie sunt trecute valorile lui α. De exemplu,

Page 271: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 271/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 269

pentru n = 10 si α = 0.05 obtinem x0.05,10 = 18.31, iar x1−0.05,10 =3.94.

Cu Mathematica aceste informatii se obtin astfel, tinându-se seamade relatia (8.4):

<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[10], 0.05]3.9403Quantile[ChiSquareDistribution[10], 1 - 0.05]18.307.Deci P (χ2

≤x0.05,10) = 1

−0.05, P (χ2

≤x0.95,10) = 0.05, x0.05,10 =

18.31, iar x1−0.05,10 = 3.94. ♦

Pentru constructia intervalului de încredere pentru dispersie se

foloseste statistica χ2n−1 =

(n − 1)s2

σ2∈ χ2 (n − 1) . Pentru α ∈ (0, 1)

dat determinam x1(α) si x2(α) astfel încât

P ¡

x1(α) ≤ χ2n−1 ≤ x2(α)

¢= 1 − α. (8.5)

Numerele x1(α) si x2(α) nu sunt unic determinate si de obicei sealeg astfel încât x1(α) = x1−α/2,n−1 si P ¡χ2

n

−1

≤x1−α/2,n−1¢ =

α

2

, iar

x2(α) = xα/2,n−1 si P ¡

χ2n−1 ≥ xα/2,n−1

¢= α

2.

Semnificatia valorilor x1−α/2,n−1 si xα/2,n−1 poate fi vazuta în figu-ra 8.5.

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

αê2

x1−αê2,n−1

αê2

xαê2,n−15 10 15 20 25

0.02

0.04

0.06

0.08

0.1

Figura 8.5.

Înlocuind χ2n−1 =

(n − 1)s2

σ2în (8.5) si obtinem:

Page 272: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 272/364

270 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

P µ

x1−α/2,n−1 ≤ (n − 1)s2

σ2≤ xα/2,n−1

¶= 1 − α. (8.6)

Relatia (8.6) poate fi rearanjata astfel:

P

µ(n − 1)s2

xα/2,n−1≤ σ2 ≤ (n − 1)s2

x1−α/2,n−1

¶= 1 − α. (8.7)

Am obtinut astfel un interval de încredere pentru dispersie.

Algoritmul de determinare a intervalului de încredere pen-

tru dispersieFie x1, x2, . . . , xn o selectie de valori pentru variabilele de selectie

X 1, X 2, . . . , X n i.i.d. dintr-o populatie normala cu media m si dispersiaσ2 necunoscute.

Pasul 1. Se calculeaza x =1

n

nPk=1

xk si s =

µ1

n − 1

nPk=1

(xk − x)2¶ 1

2

.

Pasul 2. Se alege statistica χ2n−1 =

(n − 1)s2

σ2despre care se stie ca

urmeaza o distributie χ2 cu n − 1 grade de libertate.Pasul 3. Pentru un nivel de încredere prescris (1 − α) · 100% se de-

termina, din tabelul valorilor functiei de repartitie χ2 cu n−

1 grade delibertate sau cu ajutorul softurilor Matlab sau Mathematica, numerelex1−α/2,n−1 si xα/2,n−1 astfel încât

P ¡

χ2n−1 ≤ x1−α/2,n−1

¢=

α

2si P

¡χ2n−1 ≤ xα/2,n−1

¢= 1 − α

2.

Pasul 4. Se determina intervalul·

(n − 1)s2

xα/2,n−1,

(n − 1)s2

x1−α/2,n−1

¸si rezulta

intervalul de încredere pentru σ2.

Observatia 8.1. Este posibil sa determinam intervale nemarginite

inferior sau superior pentru dispersie cu un anumit nivel de încredere

(1−α) 100%. Acestea sunt³−∞,

(n−1)s2

x1−α,n−1

´, respectiv

³(n−1)s2

xα,n−1, ∞

´.

Exemplul 8.4. Reluam Exemplul 8.1. Dorim sa construim intervalede încredere pentru dispersie.

Rezolvare. Avem n = 83. Calculam s = 11.3517. Consideram sta-

tistica χ282 =

(n − 1)s2

σ2=

82s2

σ2.

Page 273: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 273/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 271

Pentru nivelul de încredere de 90% avem x0.95,83 = 62.1323 six0.05,83 = 104.139. Intervalul de încredere pentru dispersie este[101.468, 170.068].

Pentru nivelul de încredere de 95% avem x0.975,83 = 58.8446 six0.025,83 = 108.937. Intervalul de încredere pentru dispersie este[96.998, 179.57].

Pentru nivelul de încredere de 99% avem x0.995,83 = 52.7674 six0.005,83 = 118.726. Intervalul de încredere pentru dispersie este[89.0006, 200.251].

Intervalele de încredere pentru dispersie pot fi calculate cu co-

manda din Mathematica VarianceCI[data], din pachetul Statistics‘Con-fidenceIntervals‘. Calculul intervalului de încredere se face pe bazaalgoritmului prezentat mai sus. Implicit nivelul de încredere este con-siderat 95%. În alte situatii el trebuie precizat cu optiunea Confi-denceLevel ->1-α.

punc = 64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81;

n = Length[punc]83s = N[StandardDeviation[punc]]11.1271<< Statistics‘ContinuousDistributions‘Nivelel de încredere 95% x1 = Quantile[ChiSquareDistribution[n - 1], 0.05/2]58.8446x2 = Quantile[ChiSquareDistribution[n - 1], 1 - 0.05/2]108.937

imin = (n - 1)s^2/x2imax = (n - 1)s^2/x193.1976172.534<< Statistics‘ConfidenceIntervals‘VarianceCI[punc]93.1976, 172.534Nivelel de încredere 90% x1 = Quantile[ChiSquareDistribution[n - 1], 0.1/2]

Page 274: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 274/364

272 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

62.1323x2 = Quantile[ChiSquareDistribution[n - 1], 1 - 0.1/2]104.139imin = (n - 1)s^2/x2imax = (n - 1)s^2/x197.492163.405VarianceCI[punc, ConfidenceLevel -> .9]97.492, 163.405Nivelel de încredere 99%

x1 = Quantile[ChiSquareDistribution[n - 1], 0.01/2]52.7674x2 = Quantile[ChiSquareDistribution[n - 1], 1 - 0.01/2]118.726imin = (n - 1)s^2/x285.5136imax = (n - 1)s^2/x1192.405VarianceCI[punc, ConfidenceLevel -> .99]85.5136, 192.405 ♦

Exemplul 8.5. Media erorilor de masurare a lungimilor unor baghetemetalice este de 3 mm. Presupunem ca aceste erori respecta legeanormala cu media 3 mm si dispersia necunoscuta. Se face o selectiede volum 6: -1, 4, 4, 1,3,1. Se cere un interval de estimatie pentrudispersie cu nivel de încredere de 90%.

Rezolvare. Avem n = 6, m = 3. Calculam

s2 =1

3 ¡(−1 − 3)2 + (4 − 3)2 + (4 − 3)2 + (1 − 3)2 +

+(3 − 3)2 + (1 − 3)2¢ =26

3 = 8.6667

Consideram statistica χ25 =

(n − 1)s2

σ2=

5s2

σ2.

Pentru nivelul de încredere de 90% avem x0.95,5 = 1.14548 six0.05,5 = 11.0705.

Intervalul de încredere pentru dispersie este [2.34858; 22.698].mas = -1, 4, 4, 1, 3, 1;n = Length[mas]

Page 275: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 275/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 273

6sp = 1/3 ((-1 - 3)^2 + (4 - 3)^2 + (4 - 3)^2 + (1 - 3)^2)263

<< Statistics‘ContinuousDistributions‘Nivelel de incredere 90% x1 = Quantile[ChiSquareDistribution[n - 1], 0.1/2]1.14548x2 = Quantile[ChiSquareDistribution[n - 1], 1 - 0.1/2]11.0705imin = (n - 1)sp/x2

2.34858imax = (n - 1)sp/x122.698<< Statistics‘ConfidenceIntervals‘ChiSquareCI[sp, n - 1, ConfidenceLevel -> .9]2.34858, 22.698Se observa ca intervalul este destul de mare, deci precizia pentru

dispersie este mica, chiar daca apare cu probabilitate mare.

8.4 Intervale de încredere pentru propor-

tii

Pentru o populatie a carei membrii pot fi clasificati în functie deo anumita caracteristica în doua categorii: fie p probabilitatea dea apartine unei categorii, numit succes si 1 − p probabilitatea de aapartine celeilalte categorii, numita esec. Parametrul p poata denu-mirea de proportia populatiei si ipotezele asupra lui p se fac numarând

succesele, X =n

Pi=1

X i (≤ n), unde

X i : µ 0 11 − p p

¶ .

Atunci P =X

nun estimator punctual al lui p. Reamintim ca n

si p sunt parametrii unei distributii binomiale. Mai mult, statistica P

urmeaza o distributie normala cu media p si dispersiap(1 − p)

ndaca

p nu este aproape de 0 sau 1 si daca n este relativ mare.Aceasta înseamna ca pentru a folosi aceasta aproximare este nece-

sar ca np ≥ 5, n(1 − p) ≥ 5.

Page 276: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 276/364

274 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Teorema 8.3. Dac a n este astfel înc at np ≥ 5, n(1 − p) ≥ 5, atunci

Z =X − npp np(1 − p)

=P − pq p(1− p)

n

urmeaz a aproximativ o distribu tie normal a standard.

Pentru a construi un interval de încredere pentru p, observam ca

P

¡−zα

2≤ Z ≤ zα

2

¢= 1 − α

sauP µ

− zα2

≤ P − pq p(1− p)

n

≤ zα2

¶= 1 − α,

unde zα2

> 0 astfel încât Φ(−zα2

) =α

2.

Aceasta relatie poate fi rearanjata astfel:

P

µP − zα

2

r p(1 − p)

n≤ p ≤ P + zα

2

r p(1 − p)

n

¶= 1 − α.

Cantitatea r p(1

− p)

n se numeste eroarea standard a estimatoru-lui punctual P . Deoarece marginile intervalului contin p care estenecunoscut, o solutie satisf acatoare este înlocuirea sa cu P . Astfelobtinem

P

µP − zα

2

q P (1−P )

n≤ p ≤ P + zα

2

q P (1−P )

n

¶' 1 − α.

Aceasta conduce la determinarea unui interval de încredere cunivelul de încredere de (1 − α)100% si acesta este

·P − zα2q P (1−P )n , P + zα

2q P (1−P )n ¸ .

Exemplul 8.6. Se presupune ca la 85 de autoturisme de o anumitamarca se studiaza arborele cotit dupa un anumit timp de functionare.Se constata ca la 10 automobile acesta prezenta defecte ce impuneaînlocuirea lui. Sa se determine un estimator punctual al numaruluice reprezinta ce proportie dintre automobilele de acest tip prezintaaceasta deficienta. Sa se interpreteze acest rezultat si sa se estimeze ceproportie dintre automobilele de acest tip prezinta aceasta deficienta.

Page 277: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 277/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 275

Rezolvare. Pentru fiecare autoturism studiat, se obtine rezultatul caarborele cotit este defect sau nu. Putem aplica modelul Bernoulli siestimatorul de verosimilitate maxima va fi:

P =10

85= 0.117655.

Eroarea standard a estimatorului punctual este

q P (1−P )

n=

r 1085(1− 10

85)85

= 0.034946.

Nu este foarte clar cum interpretam aceasta valoare de 0.034946.Este aceasta estimare foarte exacta, exacta sau nu?

Construim un interval de încredere cu un nivel de încredere de 95%bazat pe valoarea observata 0.117655.

P − zα2

q P (1−P )

n≤ p ≤ P + zα

2

q P (1−P )

n,

0.1176 − 1.96q

0.1176·0.8885

≤ p ≤ 0.117 6 + 1.96q

0.1176·0.8885

,

0.04915 ≤ p ≤ 0.186141.

Concluzia: în 95% din cazuri probabilitatea ca automobilul sa pre-zinte defectul studiat este cuprinsa în intervalul [0.0491534, 0.186141].

pe = N[10/85]n = 85;0.117647n pe ≥ 5 && n(1 - pe) ≥ 5True<< Statistics‘ContinuousDistributions‘Nivelul de încredere 90% z1 = Quantile[NormalDistribution[0, 1], 1-0.05]

1.64485linf = pe - z1 Sqrt[p(1 - p)/n]lsup = pe + z1 Sqrt[p(1 - p)/n]0.06016540.175129În 90% din cazuri probabilitatea ca automobilul sa prezinte defec-

tul studiat este cuprinsa în intervalul [0.0601654, 0.175129].Nivelul de încredere 95% z2 = Quantile[NormalDistribution[0, 1], 1-0.025]

Page 278: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 278/364

276 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

1.95996linf = pe - z2 Sqrt[p(1 - p)/n]lsup = pe + z2 Sqrt[p(1 - p)/n]0.04915340.186141În 95% din cazuri probabilitatea ca automobilul sa prezinte defec-

tul studiat este cuprinsa în intervalul [0.0491534, 0.186141]. ♦

8.4.1 Alegerea dimensiunii esantionului

Deoarece P este un estimator punctual al lui p, putem definieroarea de estimare a lui p prin P de forma E = | p − P |. Observamca suntem aproximativ (1 − α)100% siguri ca aceasta eroare este mai

mica decât zα2

q P (1−P )

n. În exemplul anterior suntem 95% siguri ca

P = 1085

= 0.117655 difera de valoarea exacta a lui p cu mai putin de

1.95996

s 1085

(1 − 1085

)

85= 0.069084.

În situatiile în care dimensiunea esantionului poate fi aleas˘

a, putemlua n astfel încât sa fim aproximativ (1 − α)100% siguri ca eroareaeste mai mica decât o valoare specificata E . Daca consideram E =

zα2

q P (1−P )

nsi rezolvam ecuatia în raport cu n obtinem ca dimensiune

a esantionului

n =

·³zα2

E

´2P (1 − P )

¸+ 1. (8.8)

O estimare a lui p este necesara. Pentru aceasta se poate lua unesantion preliminar, se calculeaza P si apoi folosind relatia (8.8) putemdetermina câte observatii mai trebuie f acute pentru a obtine pentru p

o estimare satisf acatoare.O alta solutie este de a tine seama ca p(1 − p) ≤ 1

4si atunci

n =

·1

4

³zα2

E

´2¸+ 1. (8.9)

Exemplul 8.7. Reluam Exemplul 8.6. Cât de mare trebuie luat esan-tionul astfel încât sa fim 95% siguri ca eroarea pe care o facem cândfolosim P ca estimator a lui p sa fie mai mica decât 0.05?

Page 279: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 279/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 277

Rezolvare. Folosind P = 1085 gasim

n =

·³zα2

E

´2ˆ p(1 − ˆ p)

¸+ 1 =

h¡1.960.05

¢2 1085

¡1 − 10

85

¢i+ 1 = 160.

Daca vrem sa fim cel putin 95% siguri ca eroarea pe care o facemcând folosim P ca estimator a lui p sa fie mai mica decât 0.05 putemfolosi formula (8.9)

n = ·1

4 ³zα2

E ´2

¸ + 1 = h14 ¡1.960.05¢2i+ 1 = 385.

Observam ca daca avem o informatie privind valoarea lui p, chiardintr-un esantion preliminar, obtinem o dimensiune mai mica a esan-tionului mentinând precizia estimarii si nivelul de încredere. ♦

Este posibil sa determinam intervale deschise nemarginite infe-rior sau superior pentru proportia p cu un anumit nivel de încredere(1−α) 100%. Acestea sunt

³− ∞, P + zαq P (1−P )n ´, ³P

−zαq P (1−P )n

,

∞´.

8.5 Predictia

În unele situatii suntem interesati în a prevedea urmatoarele valoriale variabilei de selectie. Vom vedea cum se determina un interval depredictie cu (1−α)100% nivel de încredere pentru urmatoarea valoarea unei variabile de selectie care urmeaza o distributie normala.

Fie x1, x2, . . . , xn o selectie de valori pentru variabile de selectieX 1, X 2, . . . , X n i.i.d. dintr-o populatie normala cu media m si dispersia

σ2

. Dorim sa prevedem valoarea variabilei de selectie X n+1 la o singuraobservatie viitoare.Un punct de predictie este x. Eroarea de predictie este X n+1 − x.

Media erorii de predictie este M [X n+1 − x] = m − m = 0, iar dis-persia este D [X n+1 − x] = σ2 + σ2

n= σ2

¡1 + 1

n

¢, deoarece X n+1 este

independenta de media x.

Predictia X n+1−x este normal distribuita si atunci Z =X n+1 − X

σq

1 + 1nare o distributie normala standard.

Page 280: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 280/364

278 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Daca înlocuim σ prin s obtinem T = X n+1 − x

sq

1 + 1n

care are o dis-

tributie Student cu n−1 grade de libertate. Obtinem astfel intervalelede predictie cu (1 − α)100% nivel de încredere

P

Ã− tα

2 ,n−1 ≤ X n+1 − x

σq

1 + 1n

≤ tα2 ,n−1

!= 1 − α ⇒

"x − zα2 σr 1 +

1

n ≤ X n+1 ≤ x + zα2 σr 1 +

1

n#

si respectiv"x − tα

2 ,n−1s

r 1 +

1

n≤ X n+1 ≤ x + tα

2 ,n−1s

r 1 +

1

n

#.

Exemplul 8.8. Se studiaza o caracteristica pe n = 22 unitati statis-tice si se obtin valorile: 19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9,7.9, 17.6, 13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9, 15.8, 11.4, 15.4, 11.4.

Sa se determine intervalul de predictie pentru cea de a 23-a valoaresi intervalul de încredere pentru media valorilor obtinute, nivelul deîncredere fiind de 95%, iar caracteristica urmeaza o repartitie normala.

Rezolvare. Calculam si obtinem x = 13.71 si s = 3.55. Intervalul deîncredere pentru medie esteh

x − s√ n

tα2,n−1, x + s√

ntα2,n−1

i=

=h

13.7136 − 3.55358√ 22

· 2.07961, 13.7136 + 3.55358√ 22

· 2.07961i

=

= [12.1381, 15.2892] .

Intervalul de predictie cu 95% încredere este·x − tα

2,n−1s

q 1 + 1

n , x + tα2,n−1s

q 1 + 1

n

¸=

=

·13.713 − 2.079 · 3.553

q 1 + 1

22, 13.713 + 2.079 · 3.553

q 1 + 1

22

¸=

= [6.48601; 20.9413] .

Page 281: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 281/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 279

Rezulta ca 6.48601 ≤ X 23 ≤ 20.9413.

Prezentam secventa de comenzi Mathematica care rezolva prob-lema.

dat = 19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9, 7.9, 17.6,13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9, 15.8, 11.4, 15.4, 11.4;

n = Length[dat]m = N[Mean[dat]]2213.7136

s = StandardDeviation[dat]3.55358<< Statistics‘ContinuousDistributions‘z = Quantile[StudentTDistribution[n - 1], 1-0.025]2.07961pmin = m - z s/Sqrt[n]pmax = m + z s/Sqrt[n]6.4860120.9413<< Statistics‘ConfidenceIntervals‘MeanCI[dat]12.1381, 15.2892 ♦

Remarcam ca intervalul de predictie este considerabil mai lungdecât cel de încredere. Lungimea intervalului de încredere, pentrun → ∞, tinde la zero pe când lungimea intervalului de predictie tindela 2tα

2 ,n−1s.

8.6 Intervale de toleranta pentru carac-

teristici ce urmeaza o distributie nor-

mala

Definitia 8.2. Intervalul de toleran t a este un interval statistic în care,cu un nivel de încredere dat, caracteristica studiata a unei populatiiia valori cu o probabilitate de acoperire specificata.

Capetele intervalului de toleranta se numesc limite de toleran t a .În cazul intervalului de toleranta se cunoaste distributia pe care ourmeaza caracteristica si, eventual, se cunosc parametrii distributiei

Page 282: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 282/364

280 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

si se determina intervalul cu o probabilitate de acoperire si cu unanumit nivel de încredere. Difera de intervalul de încredere deoareceacesta din urma furnizeaza limite pentru un anumit parametru al po-pulatiei, necunoscut, de ex. medie, dispersie numai cu un anumit nivelde încredere.

În inginerie se specifica, de obicei, limitele de toleranta, de ac-ceptibilitate ale caracteristicii unui produs si nu reflecta întotdeaunavaloarea obtinuta prin masuratori.

Exemplul 8.9. Studiem o categorie de procesoare. Din istoriculstudiului procesoarelor de acest tip se stie ca frecventa procesoarelorurmeaza o distributie normala cu media m = 600 megahertzi si aba-terea medie patratica σ = 30 megahertzi. Sa se determine un intervalde toleranta pentru frecventa procesoarelor cu un nivel de încrederede 95% si cu o probabilitate de acoperire de 95%.

Daca media si dispersia sunt cunoscute, intervalul de tolerantase defineste de forma

£m − zα

2σ, m + zα

2σ¤, în functie de nivelul de

încredere 100(1 − α) %. Probabilitatea de acoperire este 1 − α.În exemplul dat, pentru un nivel de încredere de 95% avem inter-

valul [550.65; 649.35].

m − zα2 σ = 600 − 1.96 · 30 = 541.2m + zα

2σ = 600 + 1.96 · 30 = 658.8

Ele reprezinta valorile acceptate pentru frecventa procesoarelor.Daca m si σ nu sunt cunoscuti, putem folosi x si s pentru a calcula

intervalul de toleranta,£

x − zα2

s, x + zα2

s¤.

Este de asteptat ca în acest caz, datorita introducerii lui x si s,probabilitatea de acoperire sa fie mai mica decât 1 − α cu un nivelde încredere de (1 − α) · 100% Solutia este de a înlocui pe zα

2cu o

valoare care sa asigure un nivel de încredere de (1 − α) · 100%.Un interval de toleranta care sa aiba probabilitatea de acoperire

p pentru o caracteristica care urmeaza o distributie normala, cu unnivel de încredere de (1 − α) · 100% este [x − ks,x + ks], unde k esteun factor de toleranta.

Un exemplu de calcul al factorului de toleranta este dat de Howe,W. G. (1969).

Formula factorului de toleranta data de Howe este

k =

s (n − 1)(1 + 1

n)z2

(1+α)/2

χ1− p,n−1

Page 283: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 283/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 281

Algoritmul de calcul al factorului de toleranta, în functie de pro-portia p si de probabilitatea γ , este:

1. Se determina z(1+ p)/2 astfel încât daca Z urmeaza o distributienormala, P

¡Z ≤ z(1+ p)/2

¢= (1 + p)/2;

2. Se determina χα,n−1 astfel ca daca χ urmeaza o distributie hi-patrat cu n − 1 grade de libertate, P

¡χ ≤ χα,n−1

¢= α;

3. Se înlocuiesc în formula lui k.Reluam exemplul cu procesoarele. Dorim sa determinam un in-

terval de toleranta a frecventei procesorelor astfel ca probabilitatea deacoperire sa fie de 90% cu un nivel de încredere de 99%. Au fost anali-zate 43 de procesoare si s-a obtinut ca media frecventei este m = 584megahertzi si devierea standard s = 32 megahertzi.

n = 43;

p = 0.9;

alpha= 0.01;

p1 = (1 + p)/2

0.95<< Statistics‘ContinuousDistributions‘

z = Quantile[NormalDistribution[0, 1], p1]

1.64485x = Quantile[ChiSquareDistribution[42], alpha]

23.6501k = Sqrt[(n - 1)(1 + 1/n)z^2/x]

2.21732Intervalul de toleranta este [513.05, 654.95]. 90% din procesoare

vor avea frecventa cuprinsa în acest interval cu un nivel de încrederede 99%. ♦

8.7 Intervale de încredere pentru carac-teristicile a doua populatii care ur-

meaza o distributie normala

Pâna acum au fost prezentate moduri de constructie ale intervalelorde încredere pentru un parametru corespunzator unei singure popu-latii. Vom extinde în continuare aceste rezultate în cazul a doua po-pulatii independente care urmeaza distributii normale.

Page 284: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 284/364

282 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Presupunem ca avem o populatie care urmeaza o distributie nor-mala cu media m1 si dispersia σ2

1, iar cea de a doua populatie urmeazao distributie normala cu media m2 si dispersia σ2

2. Intervalele vorfi construite pe baza a doua esantioane de volum n1 respectiv n2.Fie x11, x12, . . . , x1n1 o selectie de valori pentru variabile de selectieX 11, X 12, . . . , X 1n1 i.i.d. din prima populatie distribuita normal si x21,x22, . . . , x2n2 o selectie de valori pentru variabile de selectie X 21, X 22,. . . , X 2n2 i.i.r. din a doua populatie distribuita normal.

8.7.1 Intervale de încredere pentru diferenta me-diilor a doua populatii ale caror dispersiisunt cunoscute

Construim intervale de încredere, cu nivelul de încredere (1 − α) ··100%, pentru diferenta mediilor a doua populatii care urmeaza o dis-tributie normala si ale caror dispersii sunt cunoscute.

Facem urmatoarele ipoteze:1. Se considera doua populatii independente care urmeaza o dis-

tributie normala cu dispersiile cunoscute;2. Se considera x11, x12, . . . , x1n1 o selectie de n1 valori pentru

variabile de selectie X 11, X 12, . . . , X 1n1 i.i.d. din prima populatie;3. Se considera x21, x22, . . . , x2n2 o selectie de n2 valori pentru

variabile de selectie X 21, X 22, . . . , X 2n2 i.i.d. din a doua populatie.Un estimator logic pentru diferenta mediilor, m1−m2 este diferenta

dintre mediile statistice ale celor doua esantioane, X 1 − X 2, unde

X 1 = 1n1

n1Pi=1

X 1i si X 2 = 1n2

n2Pi=1

X 2i. Folosind proprietatile mediei si

dispersiei obtinem ca

M

£X 1 − X 2

¤= M

£X 1

¤− M

£X 2

¤= m1 − m2,

D £X 1 − X 2¤ = D £X 1¤ + D £X 2¤ =σ2

1n1+

σ2

2n2.

Tinând seama de presupunerile f acute si de rezultatele anterioareputem afirma

Propozitia 8.1. Statistica

Z =X 1 − X 2 − (m1 − m2)r

σ21

n1+

σ22

n2

(8.10)

Page 285: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 285/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 283

urmeaz a o distribu tie normal a standard.

Observatia 8.2. Daca sunt îndeplinite conditiile Teoremei limita cen-trala pentru cele doua populatii, atunci rezultatul Propozitiei 8.1 sepastreaza.

Tinând seama de rezultatul Propozitiei 8.1 putem scrie

P ¡−zα/2 ≤ Z ≤ zα/2

¢= 1 − α ⇔

P ³ −zα/2

X1−X2−(m1−m2)

s σ21n1 +σ22n2

≤zα/2´ = 1

−α

⇔P ³

X 1−X 2−zα/2r

σ21n1

+σ22n2≤m1−m2≤X 1−X 2+zα/2

r σ21n1

+σ22n2

´= 1 − α.

Daca x1 = 1n1

n1Pi=1

x1i si x2 = 1n2

n2Pi=1

x2i atunci un interval de în-

credere pentru m1 − m2, cu un nivel de încredere (1 − α) %, estex1 − x2 − zα/2

s σ21

n1+

σ22

n2, x1 − x2 + zα/2

s σ21

n1+

σ22

n2

. (8.11)

Exercitiul 8.1. Fie variabilele de selectie X 11, X 12, . . . , X 1n1 i.i.d.care urmeaza o legea normala N (m1, σ1) si reprezinta încasarile în miilei ale unui lant de magazine din orasul A si variabile de selectie X 21,X 22, . . . , X 2n2 i.i.r. care urmeaza o legea normala N (m2, σ2) si re-prezinta încasarile în mii lei ale unui alt lant de magazine din orasulB. Presupunem ca cele doua selectii sunt independente. S-au efectuatdoua sondaje, respectiv pentru X 1 si X 2 si s-au obtinut urmatoareledate: pentru X 1 : 226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5 sipentru X 2 : 221.5, 230.2, 223.4, 224.3, 230.8, 223.8. Cu un nivel deîncredere de respectiv 0.90%, 0.95%, 0.99% vrem sa construim intervalede încredere pentru diferenta mediilor, m1−m2 daca σ1 = 2.5, σ2 = 3,cunoscute.

Rezolvare. Rezolvam problema cu Mathematica folosind expresia(8.11) pentru intervalul de încredere.

data1 = 226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5;data2 = 221.5, 230.2, 223.4, 224.3, 230.8, 223.8;n1 = Length[data1]n2 = Length[data2]

Page 286: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 286/364

284 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

76s1 = 2.5;s2 = 3;x1 = Mean[data1]224.314x2 = Mean[data2]225.667<< Statistics‘ContinuousDistributions‘alpha = 0.1;

z = Quantile[NormalDistribution[0, 1], 1-alpha/2]1.64485x1 - x2 - z Sqrt[s1^2/n1 + s2^2/n2]-3.89678x1 - x2 + z Sqrt[s1^2/n1 + s2^2/n2]1.19202Intervalul de încredere pentru diferenta mediilor încasarilor cu un

nivel de încredere de 90% este [−3.89678, 1.19202].Acelasi rezultat se poate obsine folosind comenzi specifice softului

Mathematica. În pachetul Statistics‘ConfidenceIntervals‘ comanda Me-

anDiff erenceCI[data1, data2], KnownVariance -> var1, var2] furnizeazaun interval de încredere bazat pe distributia normala si prezentat prinrelatia 8.11. Daca nu punem optiunea ConfidenceLevel ->1 − α, im-plicit nivelul de încredere este considerat 95%.

<< Statistics‘ConfidenceIntervals‘MeanDiff erenceCI[data1, data2, KnownVariance -> 6.25, 9, Confi-

denceLevel -> 0.9]-3.89678, 1.19202MeanDiff erenceCI[data1, data2, KnownVariance -> 6.25, 9]-4.38422, 1.67946

MeanDiff

erenceCI[data1, data2, KnownVariance -> 6.25, 9, Confi

-denceLevel -> 0.99]-5.3369, 2.63213 ♦

Observatia 8.3. Si în acest caz putem construi intervale de încrederede formaµ

x1−x2−zα/2

q σ21n1

+σ22n2

, ∞¶

sauµ−∞,x1−x2+zα/2

q σ21n1

+σ22n2

¶pentru diferenta mediilor.

Page 287: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 287/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 285

Alegerea dimensiunii esantionului

Daca dispersiile sunt cunoscute si dimensiunile esantioanelor suntegale, n1 = n2 = n, putem determina dimensiunea esantionului astfelîncât eroarea pe care o facem înlocuind m1 − m2 cu x1 − x2 sa fie maimica decât E cu un nivel de încredere (1 − α) 100%. Deoarece

|m1 − m2 − (x1 − x2)| ≤ zα/2

r σ21

n+

σ22

n≤ E

rezulta

n ≥ ³zα/2E

´2q σ21 + σ2

2, n ∈ N.

În Exercitiul 8.1 vrem sa alegem doua esantioane de aceeasi di-mensiune astfel încât, daca înlocuim m1 − m2 cu x1 − x2 eroarea safie mai mica decât 0.01 cu un nivel de încredere de 95%.

<< Statistics‘ContinuousDistributions‘α = 0.05;Er = 0.1;sigma1 = 2.5;sigma2 = 3;z = Quantile[NormalDistribution[0, 1], 1-α/2]1.95996n = IntegerPart[(z/Er)^2 Sqrt[sigma1^2 + sigma2^2]] + 11501 ♦

8.7.2 Intervale de încredere pentru diferenta me-diilor a doua populatii ale caror dispersiisunt necunoscute

Extindem rezultatele anterioare pentru cazul în care cele doua po-pulatii urmeaza o distributie normala si dispersiile sunt necunoscute.Daca volumele esantioanelor n1 si n2 depasesc valoarea de 40, rezul-tatul anterior poate fi utilizat. Daca esantioanele sunt mai mici atunciconstructia intervalului de încredere se bazeaza pe distributia Student.

Construim intervalul de încredere cu nivelul de încredere egal cu100 (1 − α) %, pentru diferenta mediilor a doua populatii ale carordispersii sunt necunoscute.

Doua situatii diferite trebuie tratate:

Page 288: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 288/364

286 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

1. Cazul în care dispersiile sunt necunoscute, dar egale σ21 =

σ22 = σ2,

2. Cazul în care dispersiile sunt necunoscute si diferite.

Cazul 1. σ21 = σ2

2 = σ2

Se considera x11, x12, . . . , x1n1 o selectie de n1 valori pentru vari-abile de selectie X 11, X 12, . . . , X 1n1 i.i.d. din prima populatie si x21,x22, . . . , x2n2 o selectie de n2 valori pentru variabile de selectie X 21,X 22, . . . , X 2n2 i.i.d. din a doua populatie. Fie mediile de selectie

X 1 =1

n1

n1

Pi=1

X 1i si X 2 =1

n2

n2

Pi=1

X 2i si dispersiile de selectie S 21 =

1

n1 − 1

n1Pi=1

¡X 1i − X 1

¢2si S 22 =

1

n2 − 1

n1Pi=1

¡X 2i − X 2

¢2.

Observam ca M £

X 1 − X 2¤

= M £

X 1¤ − M

£X 2¤

= m1 − m2,

deci X 1 − X 2 este un estimator nedeplasat pentru diferenta mediilor.Dispersia lui X 1 − X 2 este

X 1 − X 2¤

= D£

X 1¤

+ D£

X 2¤

=σ2

n1+

σ2

n2= σ2

µ1

n1+

1

n2

¶.

Combinam cele doua dispersii de selectie S 21 si S 22 pentru a formaun estimator al lui σ2. Acest estimator, notat S 2 p , se defineste astfel:

S 2 p =(n1 − 1) S 21 + (n2 − 1) S 22

n1 + n2 − 2.

Obsevam ca S 2 p poate fi scris astfel

S 2 p =n1 − 1

n1 + n2 − 2S 21 +

n2 − 1

n1 + n2 − 2S 22 = λS 21 + (1 − λ) S 22 ,

unde 0 < λ ≤ 1. S 2 p este o combinatie liniara de cele doua dipersiide selectie în care λ depinde doar de dimensiunea esantioanelor, n1 sin2. Daca n1 = n2 = n atunci S 2 p este media aritmetica a celor doua

dispersii de selectie.Stim ca Z =

X 1 − X 2 − (m1 − m2)

σq

1n1

+ 1n2

urmeaza o distributie normala

standard. Înlocuind σ cu S p obtinem urmatorul rezultat:

Propozitia 8.2. Statistica

T =X 1 − X 2 − (m1 − m2)

S pq

1n1

+ 1n2

Page 289: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 289/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 287

urmeaz a o distribu tie Student cu n1 + n2 − 2 grade de libertate.

Atunci

P ¡−tα/2,n1+n2−2 ≤ T ≤ tα/2,n1+n2−2

¢= 1 − α ⇔

P

−tα/2,n1+n2−2 ≤ X 1 − X 2 − (m1 − m2)

S pq

1n1

+ 1n2

≤ tα/2,

= 1 − α ⇔

P µX 1 − X 2 − tα/2,n1+n2−2S pr 1

n1+

1

n2≤ m1 − m2 ≤

≤ X 1 − X 2 + tα/2,n1+n2−2S p

r 1

n1+

1

n2

¶= 1 − α.

Daca x1 = 1n1

n1Pi=1

x1i si x2 = 1n2

n2Pi=1

x2i si s21 = 1n1−1

n1Pi=1

(x1i − x1)2

si s22 = 1n2−1

n1Pi=1

(x2i − x2)2 atunci un interval de încredere pentru

m1 − m2, cu un nivel de încredere de 100(1 − α) % este

hx1

−x2

−tα/2,n1+n2−2s pq 1n1 + 1

n2, x1

−x2 + tα/2,n1+n2−2s pq 1n1 + 1

n2i .

MeanDiff erenceCI[data1, data2, EqualVariances -> True] furnizeazaun interval de încredere bazat pe distributia Student în cazul în caredispersiile sunt egale.

Exercitiul 8.2. Reluam Exercitiul 8.1 si presupunem ca dispersiilesunt egale, dar necunoscute. Determinam un interval de încredere cu95% nivel de încredere folosind expresia data a intervalului si folosindcomenzi specifice softului.

Rezolvare.

data1 = 226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5;data2 = 221.5, 230.2, 223.4, 224.3, 230.8, 223.8;n1 = Length[data1]n2 = Length[data2]78x1 = Mean[data1]224.314x2 = Mean[data2]

Page 290: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 290/364

288 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

225.667s1 = Variance[data1]17.7648s2 = Variance[data2]14.9507sp = (n1 - 1)/(n1 + n2 - 2) s1 + (n2 - 1)/(n1 + n2 - 2) s216.4856<< Statistics‘ContinuousDistributions‘t = Quantile[StudentTDistribution[n1 + n2 - 2], 1-0.025]2.20099x1 - x2 - t Sqrt[sp] Sqrt[1/n1 + 1/n2]-6.32422x1 - x2 + t Sqrt[sp] Sqrt[1/n1 + 1/n2]3.61946<< Statistics‘ConfidenceIntervals‘MeanDiff erenceCI[data1, data2, EqualVariances -> True]-6.32422, 3.61946 ♦

Cazul 2 . σ21 6= σ2

2

În unele situatii nu putem presupune ca dispersiile necunoscute

sunt egale. Si în acest caz putem gasi un interval de încredere pentrudiferenta mediilor, cu un nivel de încredere de 100(1 − α)% folosindfaptul ca

T ∗ =X 1 − X 2 − (m1 − m2)q

S 21n1

+S 22n2

urmeaza aproximativ o distributie Student cu ν grade de libertate,unde

ν = ³s21n1

+s22n2

´2

µ s2

1n1¶2

n1−1 +µ s2

2n2¶2

n2−1

.

Daca ν nu este întreg, se rotunjeste prin lipsa la cel mai apropiatîntreg.

Intervalul de încredere, în acest caz, estex1 − x2 − tα/2,ν

s S 21n1

+S 22n2

, x1 − x2 + tα/2,ν

s S 21n1

+S 22n2

.

Page 291: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 291/364

Page 292: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 292/364

290 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

D [X ] =2v2(u + v − 2)

u (v − 2)2 (v − 4), pentru v > 4.

Graficul densitatii de probabilitate pentru u = v = 5 este dat înfigura 8.6.

1512.5107.552.50

0.625

0.5

0.375

0.25

0.125

0

x

y

x

y

Figura 8.6.

Graficul F-distributiei este foarte asemanator cu graficul distribu-tiei hi-patrat. Cei doi parametrii asigura o flexibilitate a formei.

Valorile functiei de repartitie a F-distributiei pot fi calculate cu aju-torul tabelului din Anexa 4. Fie f α,u,v punctul în care vrem sa calculamvaloarea functiei de repartitie cu u grade de libertate la numarator siv grade de libertate la numitor. Atunci

F u,v (f α,u,v) =

Z ∞f α,u,v

f (x)dx = α.

Exemplul 8.10. Pentru u = 5 si v = 10 sa se calculeze f α,u,v = 3.33.

În tabel la intersectia liniei v = 10 si coloanei u = 5 se gaseste, întabelul corespunzator lui α = 0.05 valoarea 3.33.

F 5,10 (3.33) = 0.95.

Tabelul contine probabilitatile pentru valorile lui α egale cu 0.25,0.1, 0.05, 0.025, 0.01.

Page 293: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 293/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 291

Valorile functiei de repartitie a F-distributiei cu u grade de liber-tate la numarator si v grade de libertate la numitor se pot obtine cuajutorul comenziilor din Mathematica.

Se încarca pachetul Statistics‘ContinuousDistributions‘ si se folosesteCDF[FRatioDistribution[u,v],x].

<< Statistics‘ContinuousDistributions‘CDF[FRatioDistribution[5, 10], 3.33]0.950169Operatia inversa se realizeaza cu ajutorul comenzii Quantile. Se

stie probabilitatea si se cere sa se determine f α,u,v,

Quantile[FRatioDistribution[5, 10], 0.950169]3.33001 ♦

Intervalul de încredere

P ¡

f α/2,n2−1,n1−1 ≤ T ≤ f 1−α/2,n2−1,n1−1¢

= 1 − α ⇔P

µf α/2,n2−1,n1−1 ≤ S 22/σ2

2

S 21/σ21

≤ f 1−α/2,n2−1,n1−1

¶= 1 − α ⇔

P

µS 21S 22

f α/2,n2−1,n1−1 ≤ σ21

σ22

≤ S 21S 22

f 1−α/2,n2−1,n1−1

¶= 1 − α.

·S

2

1S 22

f α/2,n2−1,n1−1, S

2

1S 22

f 1−α/2,n2−1,n1−1¸ . (8.12)

Determinarea valorilor f α,n1,n2 se realizeaza în Mathematica cu aju-torul comenzii Quantile[FRatioDistribution[ n1, n2], α].

Determinarea intervalului de încredere cu ajutorul Mathematiciise face folosind comanda FRatioCI[rap, n1, n2, ConfidenceLevel ->1 − α], comanda care se utilizeaza deschizând pachetul << Statis-tics‘ConfidenceIntervals‘.

Exercitiul 8.3. Într-un atelier se polizeaza o anumita suprafata me-talica. Doua procedee de polizare sunt folosite si ambele procedee

produc portiuni neregulate. Coordonatorul vrea sa aplice acel pro-cedeu care realizeaza cea mai mica variatie a portiunilor neregulate.A fost ales un esantion de n1 = 11 portiuni de suprafata polizate cuprimul procedeu si a rezultat o dispersie de selectie S 21 = 26.01, decio deviere standard de S 1 = 5.1 microinches si un esantion de n2 = 16portiuni de suprafata polizate cu al doilea procedeu si a rezultat odispersie de selectie S 22 = 22.09, deci o deviere standard de S 2 = 4.7microinches. Sa se determine un interval de încredere pentru raportuldispersiilor cu un nivel de încredere de 90%.

Page 294: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 294/364

292 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Rezolvare.<< Statistics‘ConfidenceIntervals‘rap = (5.1/4.7)^2;n1 = 16;n2 = 11;FRatioCI[rap, n2 - 1, n1 - 1, ConfidenceLevel -> 0.9]0.462888, 3.34988

Intervalul de încredere pentru raportul dispersiilor este [0.462888,3.34988]. Regasim acelasi interval de încredere folosind formula (8.12).

<< Statistics‘ContinuousDistributions‘z1 = Quantile[FRatioDistribution[15, 10], 0.05]0.393125z2 = Quantile[FRatioDistribution[15, 10], 0.95]2.84502z1 rap0.462888z2 rap3.34988Intervalul de încredere pentru raportul abaterilor standardSqrt[z1 rap]

0.680358Sqrt[z2 rap]1.83027 ♦

8.7.4 Intervale de încredere pentru diferenta pro-portiilor a doua populatii

Presupunem ca avem doua esantioane de dimensiuni n1 si respectivn2 extrase din doua populatii X 1 si X 2 reprezentând numarul de obser-vatii care apartin unei clase care se studiaza. Mai mult, presupunem

aproximarea distributiei binomiale cu distributia normala este apli-cabila (populatia sa aiba macar 10 elemente), astfel încât estimatoriiproportiilor P 1 = X 1/n1 si P 2 = X 2/n2 urmeaza o distributie normala.

Propozitia 8.5. Statistica

Z =P 1 − P 2 − ( p1 − p2)q

p1(1− p1)n1

+ p2(1− p2)n2

este distribuit a aproximativ normal standard.

Page 295: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 295/364

CAPITOLUL 8. INTERVALE DE ÎNCREDERE 293

Determinam intervalul de încredere

P ¡−zα/2 ≤ Z ≤ zα/2

¢= 1 − α ⇔

P

Ã− zα/2 ≤ P 1 − P 2 − ( p1 − p2)q

p1(1− p1)n1

+ p2(1− p2)n2

≤ zα/2

!= 1 − α

Daca ˆ p1 si ˆ p2 sunt proportiile obtinute din observatiile f acute asupracelor doua esantioane, atunci

−zα/2 ≤ ˆ p1 − ˆ p2 − ( p1 − p2)q p1(1−ˆ p1)

n1+ ˆ p2(1−ˆ p2)

n2

≤ zα/2 ⇔

ˆ p1 − ˆ p2 − zα/2

s p1(1 − ˆ p1)

n1+

ˆ p2(1 − ˆ p2)

n2≤ p1 − p2 ≤

≤ ˆ p1 − ˆ p2 + zα/2

s p1(1 − ˆ p1)

n1+

ˆ p2(1 − ˆ p2)

n2.

Exercitiul 8.4. Un cercetaror este interesat daca persoanele care auf acut psihologia sunt capabile sa rezolve o problema care implica oanumita judecata. Cercetatorul este interesat în a estima diferentadintre proportiile persoanelor din cele doua populatii care pot rezolvaproblema. Prima populatie are 100 membrii din care 65 au rezolvatproblema, iar a doua populatie are 110 din care doar 45 au rezolvatproblema. Sa se construiasca un interval de încredere pentru diferentaproportiilor cu un nivel de încredere de 99%.

Rezolvare.<< Statistics‘ContinuousDistributions‘p1 = 65/100;

p2 = 45/110;n1 = 100;n2 = 110;z = Quantile[NormalDistribution[0, 1], 1-0.005]2.57583p1 - p2 - z Sqrt[p1(1 - p1)/n1 + p2(1 - p2)/n2]0.0686441p1 - p2 + z Sqrt[p1(1 - p1)/n1 + p2(1 - p2)/n2]0.413174

Page 296: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 296/364

294 CAPITOLUL 8. INTERVALE DE ÎNCREDERE

Intervalul de încredere este [0.0686441, 0.413174]. Acest intervalnu include 0, este pozitiv, ceea ce înseamna ca în prima populatieavem o mai multi cercetatori care pot rezolva problema. ♦

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. Constructia intervalelor de încredere pentru media unei popu-latii care urmeaza o distributie normala, folosind distributiile normalesi Student.

2. Constructia intervalelor de încredere pentru dispersia unei popu-latii care urmeaza o distributie normala.

3. Constructia intervalelor de încredere pentru proportia unei po-pulatii.

4. Modul de comparare a caracteristicilor a doua populatii: in-tervale de încredere pentru diferenta mediilor, intervale de încrederepentru raportul dispersiilor, pentru diferenta proportiilor.

Page 297: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 297/364

Capitolul 9

Testarea ipotezelor statistice

În continuare vom face ipoteze asupra parametrilor unor populatii,stiind distributia pe care o urmeaza. Vom folosi rezultatele obtinutela estimarea prin intervale de încredere a unor parametri remarcabiliai unor distributii cunoscute.

Fie o colectivitate cercetatata din punct de vedere al caracteristiciiX . Legea de probabilitate este f (x, θ) si poate fi functia de frecventa,în cazul discret, respectiv densitatea de probabilitate, în cazul con-

tinuu.

9.1 Teste parametrice

Definitia 9.1. Se numeste ipotez a statistic a orice presupunere relativla parametrii distributiei uneia sau mai multor populatii statistice,daca distributia este cunoscuta, sau presupuneri legate de distributiade probabilitate a populatiei statistice. Ipotezele pot fi acceptate saunu cu anumite probabilitati de corectitudine a deciziei.

Testul statistic poat fi referitor la parametrii de care depinde legeade probabilitate a caracteristicii X . În acest caz testul se numesteparametric . În caz contrar se obtine un test neparametric .

Acceptarea unei ipoteze nu înseamna ca este adevarata ci ca nuexista motive de respingere. Adevarul sau falsitatea ipotezei nu sepoate stabili niciodata cu exactitate pâna nu se examineaza întreagapopulatie. Acest lucru este imposibil în cele mai multe situatii prac-tice. De aceea procedura de testare a ipotezei statistice se face cu oanumita probabilitate de a trage o concluzie gresita.

295

Page 298: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 298/364

296 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Exemplul 9.1. Sa presupunem ca în timp ce urmarim o emisiunela TV apare pe ecran o reclama în care se afirma ca firma X vindeun nou tip de baterii electrice functionând în medie 100 de ore f araîntrerupere. Un consumator sceptic doreste sa testeze aceasta afir-matie care se refera la durata de viata a bateriilor produse de firmaX . Pentru aceasta, statistica recomanda sa se considere un esantionaleator din bateriile produse de acea firma, sa fie lasate sa functionezesi sa se înregistreze timpii scursi pâna la descarcarea lor. Sa pre-supunem ca s-au considerat 26 de baterii si a rezultat un timp mediude functionare x = 98.2 de ore. Daca ar fi rezultat x

≥100, atunci nu

se putea reprosa nimic firmei X ; dar pentru x = 98.2 se pune prob-lema avertizarii consumatorilor. Unii se pot întreba daca esantionula fost reprezentativ, altii decid ca totul este Ok (ce înseamna 98.2,dar 100?). Cât de mult se poate coborî pentu a decide ca reclama nueste minciunoasa? Astfel de întrebari se pun în legatura cu testareaoricarei ipoteze statistice.

În testarea ipotezelor se începe cu o afirmatie numita ipoteza nulasi notata H 0, despre care nu se stie daca este adevarata sau falsa, iaresantionul este ales pentru a valida aceasta ipoteza. În cazul bateriilorelectrice ipoteza nula este

H 0 : m = 100

(deci firma X spune adevarul). Notamcu H 1 o ipoteza alternativa caresa sugereze si conditiile în care ipoteza H 0 este respinsa; de exemplu:

H 1 : m < 100

Nu întotdeauna ipoteza H 1 reprezinta negatia logica obisnuita aipotezei H 0. De regula, aceasta a doua ipoteza se alege în directiadeciziei de respingere a ipotezei H 0; nu se ia aici H 1 : m > 100 care nu

ar fi o ipoteza de respingere ci de satisfactie pentru calitatea bateriilor.Valorile parametrilor specificati prin ipoteza nula sunt determinati

prin mai multe cai:— pot rezulta dintr-o experienta trecuta, din experiente realizate

acum,— pot fi obtinute din teorie sau modele privitoare la procesele în

studiu.Obiectivul testului este, de obicei, de a stabili daca aceste valori

s-au schimbat. Alta situatie apare când valorile parametrilor rezulta

Page 299: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 299/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 297

din consideratii exterioare sau din obligatii contractuale. Atunci obiec-tivul testarii ipotezelor este de a confirma aceste valori.

9.1.1 Legatura dintre testarea ipotezei statisticerelativ la un parametru si intervalul de în-credere al parametrului

Fie parametrul θ si [u, v] intervalul de încredere pentru acest para-metru cu nivelul de încredere 100(1

−α)%. Astfel pentru ipoteza bi-

lateralaH 0 : θ = θ0,

H 1 : θ 6= θ0,

vom respinge ipoteza H 0 daca si numai daca θ0 /∈ [u, v], [u, v] in-tervalul de încredere cu nivelul de încredere 100(1 − α)%. Regiunea critic a pentru testul bilateral (contine valorile pentru care ipoteza H 0se respinge) este în afara intervalului de încredere.

Pentru ipoteza unilateralaH 0 : θ = θ0,

H 1 : θ < θ0,

vom respinge ipoteza H 0 daca si numai daca θ0 < u. Multimea (−∞, u)se numeste regiune critic a pentru testul unilateral propus, [u, ∞) fiindintervalul de încredere unilateral pentru parametrul θ.

Pentru ipoteza unilateralaH 0 : θ = θ0,

H 1 : θ > θ0,

vom respinge ipoteza H 0 daca si numai daca θ0 > v. Multimea (v, ∞)se numeste regiune critic a pentru testul unilateral propus, (−∞, v]fiind intervalul de încredere unilateral pentru parametrul θ.

Etapele procedurii de testare a ipotezelor:Pasul 1. Pentru problema studiata se identifica parametrul careintereseaza a fi testat.

Pasul 2. Se formuleaza ipoteza nula H 0.

Pasul 3. Se formuleaza ipoteza alternativa H 1.

Pasul 4. Se alege pragul de semnificatie α.

Pasul 5. Se face selectia, daca testul verifica o ipoteza pentru dateconfirmate din experiente realizate. Se determina testul statistic core-spunzator.

Page 300: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 300/364

298 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Pasul 6. Se stabileste regiunea critica corespunzatoare testului pro-pus.

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea.

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu.

Exemplul 9.2. Folosim un test unilateral pentru medie cu dispersienecunoscuta. Aplicam pasii testului problemei din Exemplul 9.1.

Pasul 1. Pentru problema studiata se identifica parametrii care in-tereseaza: timpul mediu de functionare a bateriilor. Notam cu m

parametrul care ia ca valori acest timp mediu.Pasul 2. Se formuleaza ipoteza nula

H 0 : m = 100

Pasul 3. Se formuleaza ipoteza alternativa

H 1 : m < 100

Pasul 4. Se alege pragul de semnificatie α = 0.05.Pasul 5. Se face selectia si se determina testul statistic corespun-

zator. Se considera un esantion n = 26 de baterii, sunt puse sa

functioneze si se noteaza timpul de functionare a bateriilor. S-a obtinutmedia x = 98.2 si s = 10 ore. Deoarece dispersia nu este cunoscuta sivolumul esantionului este mic folosim testul Student. Pentru aceastautilizam statistica (conform rezultatelor de la intervale de încredere)

T =X − m

s√ n

∈ t(n − 1).

Pasul 6. Testul este unilateral. Se determina tα,n−1 astfel încâtP (T < −tα,n−1) = α, P (T < −t0.05,25) = 0.05 rezulta t0.05,25 =1.70814. Regiunea critica pentru T este (

−∞,

−1.70814).

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea.

Stim ca x = 98.2 si s = 10 ore, rezulta cas√ n

=10√

26= 1.9612.

Calculam T =X − m

s√ n

=98.2 − 100

10√ 26

= −0.91782.

Aceasta înseamna ca X < 100 − 10√ 26

1.70814 = 96.65, regiunea

critica pentru m este (−∞, 96.65).

Page 301: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 301/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 299

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu. DeoareceT = −0.91782 > −1.70814 = −t0.05,25, rezulta ca în acest caz nuavem motive sa respingem ipoteza H 0, deci ipoteza H 0 se accepta(figura 9.1).

-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

αê2

−tαê2,n−1-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

Figura 9.1.

Regiunea colorata este regiunea critica pentru testul unilateral

H 0 : m = m0, H 1 : m < 100

Observatia 9.1. Daca am fi aplicat Testul Z atunci : Φ(z0.05) =0.95 ⇒ z0.05 = 1.64485 si regiunea critica este (−∞, −1.64485) . Deoa-rece Z = −0.91782 > −1.64485, rezulta ca nu avem motive sa res-pingem ipoteza H 0.

Daca datele din esantion ar fi dat x = 94.5, folosind testul Studentrezulta

T =X − m

s√ n

=94.5 − 100

10√ 26

= −2.8045 < −1.70814 = t0.05,25

si respingem ipoteza H 0.Daca am fi aplicat testul Z am obtine T = −2.8045 < −1.64485,

rezulta ca, la fel ca mai sus, respingem ipoteza H 0.Daca schimbam pragul de semnificatie α = 0.01, atunci daca apli-

cam testul Student t0.01,25 = 2.48511 si pentru x = 98.2, T = −0.91782> −2.48511. Rezulta ca nu avem motive sa respingem ipoteza H 0.

Pragul de semnificatie este dat de piata, lupta pentru calitate,concurenta în promovarea produselor. ♦

Page 302: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 302/364

300 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Aceasta procedura de decidere ne poate conduce la doua concluziigresite: eroare de tip I si eroare de tip II. Deoarece deciziile sunt bazatepe rezultate aleatoare, probabilitatile pot fi asociate acestor erori.

Eroarea de tip I consta în respingerea ipotezei H 0 desi ea esteadevarata (se respinge pe nedrept ipoteza nula). Probabilitatea de aface o eroare de tip I se numeste risc de speta întâi (risc al furnizorului)si este data de nivelul α de încredere,

α = P (se respinge H 0, desi H 0 este adevarat) .

Pentru exemplul nostru înseamna ca eroarea de tip I poate aparecând pentru esantionul studiat, media timpului de functionare a ba-teriilor a fost x = 94.5, fapt care ne conduce la respingerea ipotezei,desi în realitate timpul de functionare este corect.

Calculam

P (x < 94.5 | m = 100) = P

Ãx − 100

10√ 26

<94.5 − 100

10√ 26

!=

= P (T < −2.8045) = F 25(−2.804 5) = 0.0048 ≈ 0.005,

unde F 25(−2.804 5) reprezinta valoarea functiei de repartitie Studentcu 25 de grade de libertate. Aceasta înseamna ca 0.5% din esantioanevor conduce la respingerea ipotezei nule când media reala de viata abateriilor este de 100 ore.

Observatia 9.2. Putem reduce α prin largirea regiunii de acceptare.De exemplu, daca regiunea critica ar fi (−∞, 94.5) atunci

α = P (x < 94.5 | m = 100) = P

Ãx − 100

10√ 26

<94.5 − 100

10√ 26

!=

= P (T < −3.8243) = F 25(−3.8243) = 0.000388446

Se poate reduce α si prin cresterea dimensiunii esantionului. Dacafacem o selectie de volum n = 36 si am obtinut acelasi s = 10, atunci

α = P (x < 96.65 | m = 100) = P

Ãx − 100

10√ 36

<94.5 − 100

10√ 36

!=

= P (T < −3.3) = F 25(−3.3) = 0.00111.

Page 303: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 303/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 301

Eroarea de tip II înseamna admiterea unei ipoteze false, adica nuse respinge ipoteza H 0 desi ea este falsa. Probabilitatea acestei erorise numeste risc de speta a doua (risc al beneficiarului) si este notatacu β .

În exemplul nostru se poate produce o eroare de tip II daca esan-tionul pentru care am obtinut x = 98.2 ne conduce la acceptareaipotezei H 0, desi ea este falsa. β = P (nu resping H 0, desi H 0 estefals).

Presupunem ca în realitate m = 95.

β = P (x > 98.2 | m = 95) = P Ãx − 95

10√ 26

> 98.2 − 9510√ 26

!=

= P (T > 1.6317) = 1 − F 25(1.631 7) = 0.05763

Astfel, în testarea orcarei ipoteze statistice pot apare patru situatii:

Decizia H 0 adevarata H 0 este falsanu avem motive derespingere a lui H 0 p = 1 − α

eroare de tip II p = β

respingem H 0eroare de tip I

p = α p = 1 − β

Orice regula de decizie este cuplul de numere (α, β ).Dintre doua reguli de decizie cu (α1, β 1) si (α2, β 2) astfel încat

α1 ≤ α2, β 1 ≤ β 2, vom elimina pe a doua. Spunem ca regula dedecizie (α1, β 1) domina regula (α2, β 2). Exista si cazuri în care celedoua reguli nu se pot compara.

9.1.2 Testarea mediei unei distributii normale

Vrem sa testam ipotezaH 0 : m = m0

H 1 : m 6= m0

unde m0 este constanta data.Selectia X 1, X 2, . . . , X n s-a facut dintr-o populatie distribuita nor-

mal cu media necunoscuta si abaterea medie patratica σ cunoscuta.Deoarece X este distribuita normal cu media m0 si devierea standard

σ√ n

, si daca ipoteza nula este adevarata, putem construi o regiune

Page 304: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 304/364

302 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

critica pe baza datelor din esantion. Se utilizeaza statistica (conform

rezultatelor de la intervale de încredere) Z 0 =X − m0

σ√ n

∈ N (0, 1).

P (|Z 0| ≤ z) = 1 − α ⇔1 − α = P

µm ∈

·x − z

σ√ n

, x + zσ√

n

¸¶= Φ (z) −Φ (−z) =

= 1 − 2Φ(−z) ⇒ 1 − α = 1 − 2Φ(−z).

Notam cu zα2

valoarea pozitiva a lui z obtinuta din relatiaΦ(

−z) =

α

2

.

Daca pentru selectia f acuta valoarea calculata Z 0 = x−m0σ√ n

/∈£−zα2

, zα2

¤ipoteza H 0 este respinsa. Regiunea

¡−∞, −zα2

¢∪¡zα2

, ∞¢este regiunea

critica sau regiunea de respingere a ipotezei H 0.

-4 -3 −zαê2 -1 1 zαê2 3 4

0.1

0.2

0.3

0.4

αê2 αê2

-4 -3 −zαê2 -1 1 zαê2 3 4

0.1

0.2

0.3

0.4

Figura 9.2.

Regiunea critica pentru testul bilateral H 0 : m = m0, H 1 : m 6= m0

este prezentata în Figura 9.2 iar aria fiecarei zone colorate esteα

2.

Daca Z 0 = x − m0σ√ n

∈ £−zα2 , zα

2

¤ nu avem motive sa respingem

ipoteza H 0.Daca dispersia este necunoscuta se foloseste testul statistic

T =X − m0

s√ n

∈ t (n − 1), care urmeaza, în acest caz, o distributie

Student cu n − 1 grade de libertate.Regiunea critica pentru testul unilateral

H 0 : m = m0, H 1 : m > m0 este

Page 305: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 305/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 303

-4 -3 -2 -1 1 zα 3 4

0.1

0.2

0.3

0.4

α

-4 -3 -2 -1 1 zα 3 4

0.1

0.2

0.3

0.4

Figura 9.3.

IpotezaH 0

StatisticaIpoteza

alternativaH 1

Regiunea criti-ca pentru res-

pingerea lui H 0

A)Z 0 =

X − m0σ√ n

∈ N (0, 1)

m < m0 Z 0 < −zα

m = m0 (σ cunoscut)n ≥ 30 m > m0 Z 0 > zα

m 6= m0 |Z 0| > zα2

B)T =

X − m0s√ n

∈ t (n − 1)

m < m0 T < −tα,n−1

m = m0(σ necunoscut)

n < 30m > m0 T n−1 > tα,n−1

m 6= m0 |T n−1| > tα2 ,n−1

9.1.3 P -valoarea în teste statistice

Definitia 9.2. P -valoarea unui test statistic este cel mai mic prag desemnificatie care poate conduce la respingerea ipotezei nule pentru oselectie data.

Softul Mathematica, la testarea statistica, calculeaza P -valoarea,probabilitatea de respingere a ipotezei nule.

P -valoarea la un test bilateral, care urmeaza o distributie normala,

Page 306: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 306/364

304 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

este

1 − P ¡−zα

2< Z 0 < zα

2

¢= 1 −Φ ¡zα

2

¢+Φ

¡−zα2

¢= 2

¡1 −Φ ¡zα

2

¢¢.

Pentru teste unilaterale P -valoarea este:P (Z 0 < −zα) = Φ(zα), daca H 0 : m = m0, H 1 : m < m0;P (zα < Z 0) = 1 −Φ(zα), daca H 0 : m = m0, H 1 : m > m0.

Urmatoarele doua tabele, conform [1], dau informatii asupra res-pingerii sau sustinerii ipotezei H 0 în functie de P -valoare.

P -valoarea Informatii asuprarespingerii ipotezei H 0 p > 0.10 slabe

0.05 < p ≤ 0.1 moderate0.01 < p ≤ 0.05 puternice

p ≤ 0.01 foarte puterniceTabelul 9.1.

P -valoareaInformatii asuprasustinerii ipotezei H 0

p < 0.2 nu sunt

0.2 ≤ p < 0.5 slabe0.5 ≤ p < 0.75 moderate0.5 ≤ p < 0.75 puternice

Tabelul 9.2.

P -valoarea p furnizeaza informatia: ipoteza nula va fi respinsa pen-tru orice α > p. În ce masura vom fi multumuti de rezultat vom trageconcluziile din tabelele de mai sus.

Definitia 9.3. Puterea unui test se defineste ca fiind probabilitatea

de a respinge ipoteza nula H 0 când ipoteza H 1 este adevarata (proba-bilitatea respingerii unei ipoteze false). Puterea testului este 1 − β .

Puterea testului folosita pentru compararea testelor statistice.

Exemplul 9.3. Reluam Exemplul 8.1 din capitolul 8. Stiind ca aba-terea medie patratica punctajelor la acest examen este de 10.99, sase verifice ipoteza ca media punctajelor este 77 de puncte fata dealternativa ca media punctajelor este diferita de 77 cu un coeficientde încredere de 90%, 95% si 99%. Care este P -valoarea?

Page 307: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 307/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 305

Rezolvare. Aplicam un test bilateral pentru medie cu dispersiacunoscuta.

Prezentam exemplul rezolvat cu secvente intercalate de programMathematica

punc = 64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81;

n = Length[punc]

m = N[Mean[punc]]8375.0602Pasul 1 . Parametrul care trebuie testat este media punctajelor m.Pasul 2. Se fixeaza ipoteza nula H 0 : m = 77Pasul 3. Se fixeaza ipoteza alternativa H 1 : m 6= 77Pasul 4. Nivelul de semnificatie este considerat pe rând α = 0.05,

0.1, 0.01.Pasul 5. Se face selectia. Se stabileste statistica folosita

Z 0

=X

−m0

σ√ n ∈N (0, 1)

Pasul 6. Testul este bilateral. Se determina regiunea critica, pentruα = 0.05, se calculeaza z0.025 din relatia P

¡−zα2

< Z 0 < −zα2

¢= 1−α,

z0.025 = 1.95996.Nivelul de incredere 95%<< Statistics‘ContinuousDistributions‘z = Quantile[NormalDistribution[0, 1], 1-0.05]1.95996Ipoteza H 0 este respinsa daca Z 0 > 1.95996 sau Z 0 < −1.95996.

Retinem ca acest rezultat este legat de alegerea de la Pasul 4 a lui α

si furnizeaza regiunea critica pentru Z 0. Regiunea critica pentru Z 0este (−∞, −1.95996) ∪ (1.95996, ∞).

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea.

Z0 = (m - 77)/(10.99/Sqrt[n])-1.60801Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu. Deoarece

Z 0 nu este în regiunea critica, rezulta ca nu sunt motive sa respingemipoteza nula.

Page 308: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 308/364

306 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Pentru nivelul de încredere de 90%z1 = Quantile[NormalDistribution[0, 1], 1-0.05]1.64485Ipoteza H 0 este respinsa daca Z 0 > 1.64485 sau Z 0 < −1.64485.

Nici în acest caz nu avem motive sa respingem ipoteza nula.Pentru nivelul de încredere de 99%z2 = Quantile[NormalDistribution[0, 1], 1-0.005]2.57583Ipoteza H 0 este respinsa daca Z 0 > 2.57583 sau Z 0 < −2.57583.

Nici în acest caz nu avem motive sa respingem ipoteza nula.

Se pot folosi testele din pachetul << Statistics‘HypothesisTests‘ .Pentru medie este testul MeanTest. Utilizarea lui în aceasta problemase face astfel:

<< Statistics‘HypothesisTests‘Pval = MeanTest[punc, 77, KnownVariance -> 10.66^2, TwoSided

-> True]Rezultatul acestei comenzi esteTwoSidedPValue -> 0.107833Valoarea furnizata de MeanTest este P -valoarea testului bilateral

(optiunea TwoSided -> True) calculata pentru datele punc cu media

testata 77 si cu dispersia cunoscuta data prin optiunea KnownVariance-> 10.66^2.

P -valoarea 0.107833 furnizeaza informatia ca ipoteza nula va fi res-pinsa pentru orice α > 0.107833, dar nu va fi respinsa pentru α = 0.05sau α = 0.1 sau α = 0.005. Pentru α = 0.2, de exemplu, ipoteza nulava fi respinsa. Într-adevar,

z4 = Quantile[NormalDistribution[0, 1], 1-0.2/2]1.28155Ipoteza H 0 este respinsa daca Z 0 > 1.28155 sau Z 0 < −1.28155.

Dar Z 0 = −1.60801 < −1.28155, deci în acest caz ipoteza nula este

respinsa.Optiunea FullReport ofera urmatoarele informatii: media esantionu-lui, valoarea testului statistic, P -valoarea si concluzia.

MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,FullReport -> True]

FullReport->Mean TestStat Distribution75.0602 -1.6080 NormalDistribution

, TwoSided-

PValue -> 0.107832Informatiile furnizate de test sunt:

Page 309: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 309/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 307

— media de selectie m a esantionului: 75.0602,— valoarea testului statistic: −1.6080,— folosirea testului Z , specificat prin faptul ca distributia utilizata

este normala,— P-valoarea testului bilateral, 0.107832.Daca nu se specifica nivelul de semnificatie (SignificanceLevel) se

considera implicit 0.05.Daca adugam optiunea SignificanceLevel atunci prin executarea

comenzii MeanTest este furnizata si informatia daca ipoteza nula esteadmisa sau respinsa.

MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,FullReport -> True, SignificanceLevel -> .05]

FullReport->Mean TestStat Distribution75.0602 -1.6080 NormalDistribution

, TwoSided-

PValue -> 0.107832, Fail to reject null hypothesis at significance level ->0.05

Aplicam testul pentru nivele de încredere de 90% si 99%.MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,

FullReport -> True, SignificanceLevel -> .1]

FullReport->Mean TestStat Distribution

75.0602 -1.6080 NormalDistribution

, TwoSided-

PValue -> 0.107832, Fail to reject null hypothesis at significance level ->0.1

MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,FullReport ->

True, SignificanceLevel -> .01]

FullReport->Mean TestStat Distribution75.0602 -1.6080 NormalDistribution

, TwoSided-

PValue -> 0.107832, Fail to reject null hypothesis at significance level ->0.01.

MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,

FullReport ->True, SignificanceLevel ->0.2]

FullReport->Mean TestStat Distribution75.0602 -1.6080 NormalDistribution

, TwoSided-

PValue -> 0.107832, Reject null hypothesis at significance level -> 0.2.

Exemplul 9.4. La un control al calit a tii produselor fabricate de c atre o fabric a s-au obtinut urm atoarele date privind greutatea în grame a unui anumit produs: 998, 989, 1004, 1015, 991, 987, 995, 1006,

Page 310: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 310/364

308 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

987, 983, 996, 997, 1003, 990, 996, 992, 997, 1016, 990, 981. S a se verifice ipoteza c a greutatea produselor corespunde standardului de calitate care este 1000 g. S a se calculeze intervalul de încredere pentru greutatea produselor.

Rezolvare. Se va efectua mai întâi testul bilateral pentru medie cudispersie necunoscuta.

Pasul 1 . Parametrul care trebuie testat este media greutatii m.Pasul 2. Se fixeaza ipoteza nula

H 0 : m = 1000 (greutatea produselor corespunde normei);

Pasul 3. Se fixeaza ipoteza alternativaH 1 : m 6= 1000 (greutatea produselor nu corespunde normei,sînt necesare ajustari ale procesului de productie).

Pasul 4. Nivelul de seminficatie este considerat pe rând α = 0.05si α = 0.01.

Pasul 5. Se face selectia. Se stabileste statistica folosita (conformrezultatelor de la intervale de încredere)

T =X − m0

s√ n

∈ t (n − 1) ,

care are repartitie Student cu n − 1 grade de libertate. Avem x =1

n

nPi=1

xi este media greutatilor produselor din lotul dat, s este abaterea

medie patratica de selectie, s =

r 1

n − 1

nPi=1

(xi − x)2.

Pasul 6. Se determina regiunea critica si valoarea critica tα2,n−1 > 0

astfel încât P (|T | ≤ tα2,n−1) = 1−α. Se vor considera cazurile α = 0.05

si α = 0.01.Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic si

se calculeaza valoarea.

Pasul 8. Se stabileste dac˘

a ipoteza H 0 se accept˘

a sau nu. Dac˘

a|T | ≤ tα/2, atunci nu avem motive sa respingem ipoteza H 0, iar daca|T | > tα/2, atunci ipoteza H 0 se respinge si se accepta ipoteza H 1.

Urmatorul program Matlab va efectua calculele necesare si va de-termina ce ipoteza trebuie acceptata:

% Test bilateral privind media repartitiei normale,

% dispersie necunoscuta.

% ipoteza nula H0: m=1000

% ipoteza alternativa H1: m~=1000

Page 311: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 311/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 309

clc;

clear;

format compact;

x=[998, 989, 1004, 1015, 991, 987, 995, 1006, 987,...

983, 996, 997, 1003, 990, 996, 992, 997, 1016,...

990, 981]

n=length(x)

alfa=0.05

m=1000

ms=sum(x)/n

s=sqrt(1/(n-1)*sum((x-ms).^2))

t=(ms-m)*sqrt(n)/s

ta=tinv(1-alfa/2,n-1)

if abs(t)<=ta

disp(’Ipoteza H0 se accepta’)

else

disp(’Ipoteza H0 se respinge’)

end;

int_incr=[ms-ta*s/sqrt(n) ms+ta*s/sqrt(n)]

t=-5:0.1:5;

ft=tpdf(t,n-1);plot(t,ft,’m’);

xlabel(’t’); ylabel(’densitatea de repartitie Student’);

patch([t(t<=-ta),-ta],[ft(t<=-ta),0],’b’);

patch([t(t>=ta),ta],[ft(t>=ta),0],’b’);

Rulând programul, obtinem:

x = 995, 65; s = 9, 4494; t = −2, 0587; tα/2 = 2, 093.

Prin urmare |t| < tα/2 si, deci, ipoteza nula H 0 se accepta pentrunivelul de semnificatie α = 0, 05. Intervalul de incredere·

x − tα/2s√ n

, x + tα/2s√ n

¸

pentru x (greutatea produsului) este [991, 23; 1000, 1]. Programulafiseaza, de asemenea, graficul densitatii de repartitie Student (figura9.2). Zona hasurata indica valorile lui t pentru care ipoteza nula esterespinsa.

Page 312: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 312/364

310 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

-5 -4 -3 -2 -1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

t

d e n s i t a t e a d e r e p a r t i t i e S t u d e n t

Figura 9.4.

Luând α = 0.01, obtinem tα/2 = 2.8609 si deci ipoteza nula seconfirma iar. Intervalul de încredere este [989.6; 1001.7].

Rezolvarea cu Mathematica:

greut = 998, 989, 1004, 1015, 991, 987, 995, 1006, 987, 983, 996,997, 1003, 990, 996, 992, 997, 1016, 990, 981;

n = Length[greut]20m = N[Mean[greut]]995.65sigma = Sqrt[N[Variance[greut]]]9.44945<< Statistics‘HypothesisTests‘

MeanTest[greut, 1000, TwoSided -> True, SignificanceLevel -> 0.01,

FullReport -> True]

FullReport->Mean TestStat Distribution995.65 -2.05872 StudentTDistribution[19]

,

TwoSidedPValue -> 0.0534983, Fail to reject null hypothesis at signifi-cance level -> 0.01

MeanTest[greut, 1000, TwoSided -> True, SignificanceLevel -> 0.05,

FullReport -> True]

FullReport->Mean TestStat Distribution995.65 -2.05872 StudentTDistribution[19]

,

Page 313: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 313/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 311

TwoSidedPValue -> 0.0534983, Fail to reject null hypothesis at signifi-cance level -> 0.05.

<< Statistics‘ConfidenceIntervals‘MeanCI[greut][991.228, 1000.07]

Exemplul 9.5. Printr-un sondaj, pentru un e santion de volum n =20, s-a constatat c a durata medie de func tionare în ore a unui anumit tip de acumulatoare pîn a la urm atoarea înc arcare este 148 ore. S a se veri fi ce ipoteza c a durata de func tionare este 150 ore, ipoteza alterna-

tiv a fi ind un timp de func tionare mai mic de 150 ore, la un nivel de semni fi ca tie de 0.05, stiind c a dispersia duratei de func tionare este 35.

Rezolvare. Se va efectua un test unilateral pentru medie cu dispersiecunoscuta.

Pasul 1 . Parametrul care trebuie testat este media timpilor defunctionare a unui anumit tip de acumulator, m.

Pasul 2. Se fixeaza ipoteza nulaH 0 : m = 150

Pasul 3. Se fixeaza ipoteza alternativaH 1 : m < 150

Pasul 4. Nivelul de semnificatie este α = 0.05.Pasul 5. Se face selectia. Se stabieste statistica folosita

Z =

¡X − m

¢√ n

σ∈ N (0, 1) .

Pasul 6. Se determina regiunea critica si valoarea critica zα pentrunivelul de semnificatie α dat, din conditia P (z < −zα) = α, adicaΦ (zα) = 1 − α.

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea.

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu. Dacaz ≥ −zα atunci nu avem motive sa respingem ipoteza H 0, în cazcontrar se respinge H 0. Programul urmator va efectua acest test.

% Test unilateral privind media repartitiei normale,

% dispersie cunoscuta

% ipoteza nula H0: media m=150

% ipoteza alternativa H1: m<150

clc;

Page 314: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 314/364

Page 315: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 315/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 313

m = 148;n = 20;<< Statistics‘ContinuousDistributions‘z1 = Quantile[NormalDistribution[0, 1], 0.05]−1.64485Z = N[(148 - 150)/(Sqrt[35]/Sqrt[20])]−1.51186Deoarece Z = −1.51186 > z1 = −1.64485 rezulta ca nu avem

motive sa respingem ipoteza nula.

9.1.4 Test asupra dispersiei unei populatii distri-buite normal

Sa presupunem o selectie X 1, X 2, . . . , X n dintr-o populatie repar-tizata normal cu media m si dispersia σ2.

Pentru a testa ipotezaH 0 : σ2 = σ2

0

H 1 : σ2 6= σ20

se foloseste statistica χ20 =

(n − 1)s2

σ20

∈ χ2 (n − 1).

Se calculeaza χ20. Pentru α ∈ (0, 1) dat, se determina χ21−α/2,n−1,

χ2α/2,n−1 astfel încât

P

µ(n − 1)s2

σ2≤ χ2

1−α/2,n−1

¶=

α

2si P

µ(n − 1)s2

σ2≥ χ2

α/2,n−1

¶=

α

2.

De aici rezulta ca nu avem motive sa acceptam ipoteza H 0 dacaχ20 > χ2

α/2,n−1 sau χ20 < χ2

1−α/2,n−1. Regiunea critica în cazule testuluibilateral este prezentata în figura 9.6.

Aceeasi statistica este folosita pentru testul

H 0 : σ2 = σ20;H 1 : σ2 > σ2

0.Nu avem motive sa acceptam ipoteza H 0 daca χ2

0 > χ2α,n−1 (figura

9.7).Pentru testul

H 0 : σ2 = σ20;

H 1 : σ2 < σ20

se foloseste aceeasi statistica. Nu avem motive sa acceptam ipotezaH 0 daca χ2

0 < χ21−α,n−1. Regiunea critica este prezentata în figura 9.8.

Page 316: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 316/364

314 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

αê2

χ1−αê2,n−12

αê2

χαê2,n−125 10 15 20 25

0.02

0.04

0.06

0.08

0.1

Figura 9.6.

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

α

χαê2,n−125 10 15 20 25

0.02

0.04

0.06

0.08

0.1

Figura 9.7.

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

α

χ1−αê2,n−12 5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

Figura 9.8.

Page 317: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 317/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 315

Exemplul 9.6. O sectie de vopsitorie utilizeaza o mare cantitate detitan (ca pigment alb). Conform standardelor, se masoara tonul de alba acestui pigment utilizând o scala 0−30, unde nivelul 30 înseamna albperfect. Recent sectia si-a schimbat furnizorul si noul furnizor afirmaca dioxidul de titan livrat are nivelul mediu 25, cu o dispersie de 0.4.Cei din sectia de vopsitorie se îndoiesc de aceasta mica dispersie siplanifica un experiment pe 10 esantioane, cerând testarea ipotezei lanivel de dispersie, cu nivelul de semnificatie α = 0.05.

Rezolvare.

Pasul 1 . Parametru care trebuie testat este dispersia, σ2

.Pasul 2. Se fixeaza ipoteza nulaH 0 : σ2 = 0.4.

Pasul 3. Se fixeaza ipoteza alternativaH 1 : σ2 6= 0.4.

Pasul 4. Nivelul de semnificatie este α = 0.05.Pasul 5. Se face selectia. Presupunem ca în cele 10 esantioane,

tonul de alb masurat este: 24, 25, 27, 25, 26, 26, 24, 25, 26, 25 deci

X = 25.3, s2 = 0.9.

dat = 24, 25, 27, 25, 26, 26, 24, 25, 26, 25;n = Length[dat]10N[Mean[dat]]25.3N[Variance[dat]]0.9Pasul 6. Statistica folosita este

χ

2

0 =

(n

−1)s2

σ20 ∈ χ

2

(n − 1) .

Se stabileste regiunea critica. Se determina χ20.975,9 si χ2

0.025,9:

P ¡

χ20 ≤ χ2

0.975,9

¢= 0.025 ⇒ χ2

0.975,9 = 2.70039 si

P ¡

χ20 ≤ χ2

0.025,9

¢= 0.975 ⇒ χ2

0.025,9 = 19.0228.

alpha = 0.05;<< Statistics‘ContinuousDistributions‘

Page 318: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 318/364

316 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Quantile[ChiSquareDistribution[9], alpha/2]2.70039Quantile[ChiSquareDistribution[9], 1-alpha/2]19.0228imin = (n - 1)s^2/x2imax = (n - 1)s^2/x10.4258062.99957Fiind un test bilateral, H 0 se respinge daca χ2 > χ2

α/2,n−1 sauχ2 < χ2

1−α/2,n

−1.

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea. Atunci

χ20 =

(n − 1)s2

σ2=

9 · 0.9

0.4= 20.25.

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu.Deoarece χ2

0 = 20.25 > χ20.975,9 = 19.0228, se respinge H 0.

Comanda din Mathematica pentru testarea dispersiei este Vari-anceTest din pachetul Statistics‘HypothesisTests.

<< Statistics‘HypothesisTests‘

VarianceTest[dat, 0.4, SignificanceLevel -> .05, TwoSided -> True,FullReport -> True]

FullReport->Variance TestStat Distribution0.9 20.25 ChiSquareDistribution[9]

,

TwoSidedPValue -> 0.0328614, Reject null hypothesis at significancelevel->0.05

Observam ca intervalul de încredere de 99.5% pentru dispersie este"(n − 1)s2

χ21−α/2,n−1

,(n − 1)s2

χ2α/2,n−1

#=

·9 · 0.9

19.0228,

9 · 0.9

2.70039

¸= [0.4258; 2.9996] ,

iar 0.4 nu intr˘

a în acest interval.♦

Ipot. H 0 Testul statisticIpot.

altern.H 1

Regiunea criticapentru respingerea

lui H 0σ2< σ2

0 χ20 < χ2

1−α,n−1

σ2= σ20 χ2

0 =(n − 1)s2

σ20

σ2> σ20 χ2

0 > χ2α,n−1

σ26= σ20

χ20 < χ2

1−α/2,n−1 sau

χ20 > χ2

α/2,n−1

Page 319: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 319/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 317

9.1.5 Test asupra proportiei unei populatii

În probleme de inginerie apar v. a. care urmeaza o distribuitiebinomiala. De exemplu, studiem ce procent de aparate defecte suntproduse de o anumita fabrica. Este logic sa modelam acest proces cuo distributie binomiala cu parametrul p care reprezinta probabilitateaca un aparat sa nu fie acceptat. Multe decizii din inginerie se bazeazape teste asupra parametrului p.

Se considera ipotezele asupra lui p:H 0 : p = p0,

H 1 : p 6= p0.Se considera, de obicei, un test bazat pe aproximarea repartitieibinomiale cu o repartitie normala. Testul furnizeaza rezultate accep-tabile atât timp cât p nu este aproape de 0 sau 1 si daca volumulselectiei este relativ mare. Fie X numarul observatiilor dintr-un esan-tion de dimensiune n care apartin clasei careia îi este asociata pro-babilitatea p. Atunci, daca ipoteza H 0 : p = p0 este adevarata, avemX ∈ N [np0, np0(1 − p0)], aproximativ. Pentru acest test este folositastatistica (conform rezultatelor de la intervale de încredere)

Z 0 =X − np0p np0(1 − p0) ∈

N [0, 1] .

Ipoteza H 0 va fi respinsa daca Z 0 < −zα2

sau Z 0 > zα2

. Observamca distributia normala standard este cea utilizata în acest test.

Ipot. H 0 Testul statisticIpot. altern.

H 1

Regiunea criticapentru respingerea

lui H 0 p < p0 Z 0 < −zα

2

p = p0 Z 0=X − np0

p np0(1

− p0)

p > p0 Z 0 > zα2

p 6= p0 Z 0 > zα2 sau Z 0 < −zα

2

Exemplul 9.7. O firma produce aparate de comanda utilizate în in-dustria automobilistica. Utilizatorul impune conditia ca procentul deaparate defecte sa nu depaseasca 5%. Producatorul considera ca acestprocent este mai mic. Se utilizeaza un test statistic în care se con-sidera pragul de semnificatie α = 0.05, se alege un esantion de 200de aparate si se constata ca 4 dintre ele au defect. Poate demonstraproducatorul ca are dreptate?

Page 320: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 320/364

318 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Rezolvare. Prezentam pasii în testarea ipotezei statistice.Pasul 1. Parametrul testat este procentul de aparate defecte p.Pasul 2. Se formuleaza ipoteza nula H 0 : p = 0.05.Pasul 3. Se formuleaza ipoteza alternativa H 1 : p < 0.05.Pasul 4. α = 0.05.Pasul 5 . Se efectueaza selectia esantionului de volum n = 200 si se

stabileste ca procentul de aparate defecte în esantion este ˆ p = 4200

=0.02.

Pasul 6. Se considera statistica Z 0 =ˆ p − p0

q p0(1− p0)n

.

Se stabileste regiunea critica. Φ(−z0.05)= 0.05⇒−z0.05 = −1.64485.Rezulta regiunea critica (−∞, −1.64485).

Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic sise calculeaza valoarea.

Se calculeaza Z 0 =0.02 − 0.05q

0.05(1−0.05)200

= −1.9467.

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu.Z 0 = −1.9467 < −1.64485, ipoteza H 0 se respinge. Deci produca-

torul are dreptate.α=0.05;

n=200;

pe=N[4/200];

p0=0.05;

Z = (pe - p0)/Sqrt[p0 (1 - p0)/n]

-1.94666

<< Statistics‘ContinuousDistributions‘

Quantile[NormalDistribution[0, 1], 0.05]

-1.64485

Determin am eroarea de tip II Se poate obtine o aproximare a erorii de tip II, β -eroare pentru

testul anterior. Presupunem ca p este valoarea exacta a proportiei.Eroarea de tip II pentru ipoteza alternativa H 1 : p 6= p0 este

β = Φ

p0 − p + zα

2

q p0(1− p0)

nq p(1− p)

n

−Φ

p0 − p − zα

2

q p0(1− p0)

nq p(1− p)

n

.

Page 321: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 321/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 319

Daca H 1 : p < p0

β = 1 −Φ p0 − p − zα

2

q p0(1− p0)

nq p(1− p)

n

.

Daca H 1 : p > p0

β = Φ

p0 − p + zα

2

q p0(1− p0)

n

q p(1− p)n

.

Acesasta ecuatie poate fi folosita pentru a aproxima dimensiuneaesantionului n daca dorim sa aplicam un test cu nivelul de încredere1 − α si riscul specificat β .

În cazul testului bilateral

n =

"zα2

p p0(1 − p0) + zβ

2

p p(1 − p)

p − p0

#2.

Pentru testul unilateral

n =

"zαp

p0(1 − p0) + zβp

p(1 − p)

p − p0

#2.

În cazul Exemplului 9.7 eroarea de tip II este, daca consideram cavaloarea corecta a lui p = 0.03,

β = 1 −Φµ

0.05−0.03−1.64485q

0.05(1−0.05)200q

0.03(1−0.03)200

¶=

= 1 −Φ (−0.44343) = 1 − 0.328727 = 0.67127.

Eroarea de tip II este aproximativ 0.7, destul de mare iar putereatestului este 0.3, o putere mica.

Daca s-ar dori o eroare de tip II de 0.1, valoarea corecta ar fi p = 0.3cu α = 0.05, dimensiunea esantionului ar trebui sa fie cel putin

n =

·1.645

√ 0.05(1−0.05)+1.28155

√ 0.03(1−0.03)

0.03−0.05

¸2' 832.

Page 322: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 322/364

320 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

9.1.6 Test asupra diferentei mediilor a doua ca-racteristici distribuite normal

Aceste teste vor folosi statisticele studiate în capitolul Intervalede încredere pentru caracteristicile a doua populatii care urmeaza odistributie normala, în functie de cele doua cazuri, dispersia cunos-cuta sau necunoscuta. Statisticile folosite sunt cele prezentate la con-structia intervalelor de încredere pentru diferenta mediilor a doua pop-ulatii care urmeaza o distributie normala cu dispersiile cunoscute, re-spectiv necunoscute.

Urmeaza un exemplu de aplicare a testului privind egalitatea medi-ilor a doua esantioane, dispersie necunoscuta.

Exemplul 9.8. Notele înregistrate de studen tii a dou a grupe la un test sunt

I: 7, 5, 4, 8, 10, 9, 3, 8, 6, 5; II: 9, 7, 10, 10, 8, 4, 5, 4, 6, 9.S a se testeze dac a cunostin tele studen tilor celor dou a grupe difer a

semnificativ sau nu, stiind distrubu tia caractetistica studiat a urmeaz a o distribu tie normal a.

Rezolvare. Se va efectua un test Student pentru verificarea egalitatii

mediilor a doua esantioane, dispersiile populatiilor fiind necunoscute.Pasul 1. Se testeaza egalitatea mediilor notelor obtinute de stu-dentii a doua grupe, m1 si m2.

Pasul 2. Se formuleaza ipoteza nula H 0 : m1 = m2.Pasul 3. Se formuleaza ipoteza alternativa H 1 : m1 6= m2.Pasul 4. Consideram nivelul de semnificatie α = 0.05.Pasul 5 . Se efectueaza selectia, se calculeaza mediile celor doua

esantioane, dispersiile de selectie.Pasul 6. Se considera statistica

T =

m1

−m2r (n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2

r 1n1

+ 1n2

∈ t(n1 + n2 − 2).

unde s21 si s22 sînt dispersiile de selectie ale celor doua esantioane, iar n1

si n2 sînt volumele esantioanelor. Variabila aleatoare t are repartitieStudent cu n1 + n2 − 2 grade de libertate.

Se stabileste regiunea critica.Pasul 7. Se fac calculele necesare, se înlocuiesc în testul statistic si

se calculeaza valoarea critica.

Page 323: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 323/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 321

Pasul 8. Se stabileste daca ipoteza H 0 se accepta sau nu.Ipoteza nula H 0 se va accepta daca |T | ≤ tα/2, unde tα/2 se de-

termina din conditia P ¡

|T | ≤ tα/2¢

= 1 − α si va fi respinsa daca|T | > tα/2. Urmatorul program Matlab va verifica ipoteza egalitatiicelor doua medii:

% testare bilaterala a diferentei mediilor a doua esan-

tioane

% ipoteza nula: m1=m2

% ipoteza alternativa: m1~=m2

clc;

clear;

format compact;

x1=[7 5 4 8 10 9 3 8 6 5]

x2=[9 7 10 10 8 4 5 4 6 9]

alfa=0.05

n1=length(x1);

n2=length(x2);

ms1=sum(x1)/n1

ms2=sum(x2)/n2

s1=sqrt(1/(n1-1)*sum((x1-ms1).^2))

s2=sqrt(1/(n2-1)*sum((x2-ms2).^2))s=sqrt(((n1-1)*s1^2+(n2-1)*s2^2)/(n1+n2-2))

T=(ms1-ms2)/s/sqrt(1/n1+1/n2)

ta=tinv(1-alfa/2,n1+n2-2)

if abs(t)<=ta

disp(’Ipoteza H0 se accepta’)

else

disp(’Ipoteza H0 se respinge’)

end;

Rulând programul, obtinem

x1 = 6.5; s21 = 2.27; x2 = 7.2;

s22 = 2.35; T = −0.677; tα/2 = 2.1.

Cum |T | < tα/2, rezulta ca nu avem motive sa respingem ipoteza nulaH 0, adica la nivelul de semnificatie dat cunostintele studentilor celordoua grupe nu difera semnificativ.

Secventa de comenzi Mathematica care rezolva exemplul dat.not1 = 7, 5, 4, 8, 10, 9, 3, 8, 6, 5;

Page 324: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 324/364

322 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

nott2 = 9, 7, 10, 10, 8, 4, 5, 4, 6, 9;<< Statistics‘HypothesisTests‘MeanDiff erenceTest[not1, nott2, 0, EqualVariances -> False, FullRe-

port -> True, TwoSided -> True, SignificanceLevel -> 0.05]

FullReport->MeanDiff TestStat Distribution-0.7 -0.677419 StudentTDistribution[18]

,

TwoSidedPValue ->0.506763, Fail to reject null hypothesis at significancelevel -> 0.05.

Concluzia: nu avem motive sa respingem ipoteza nula H 0, adica lanivelul de semnificatie dat cunostintele studentilor celor doua grupe

nu difera semnificativ.Exemplul 9.9. Un producator este interesat în reducerea timpuluide uscare a unei vopsele. În acest caz se stie ca timpul de uscareurmeaza o distributie normala. Sunt testate doua formule: formula1 este cea standard, formula 2 contine un ingredient în vopsea carereduce timpul de uscare. Din experienta se stie ca timpul de uscareurmeaza o repartitie normala cu abaterea standard de 8 minute si ca eanu este afectata de adaugarea ingredientului. 10 produse sunt vopsiteutilizând formula 1 si 10 utilizând formula 2. Alegerea produselorpentru vopsire se face aleator. Se obtin datele

x1 = 120, 132, 111, 121, 119, 123, 120, 120, 119, 125x2 = 110, 111, 120, 113, 112, 103, 121, 115, 102, 113.Ce concluzie se poate trage despre cele doua formule folosind α =

0.05?

Se va efectua un test normal pentru verificarea egalitatii mediilora doua esantioane, dispersiile populatiilor fiind cunoscute si egale..

Ipoteza nula: H 0 : m1 = m2 (media timpilor de uscare nu diferasemnificativ, este aproape zero)

Ipoteza alternativa: H 1 : m1 > m2 media timpului de uscare aformulei 1 este mai mare decit a formulei 2.

x1 = 120, 132, 111, 121, 119, 123, 120, 120, 119, 125;x2 = 110, 111, 120, 113, 112, 103, 121, 115, 102, 113;<< Statistics‘HypothesisTests‘MeanDiff erenceTest[x1, x2, 0, KnownVariance -> 64, 64, FullRe-

port -> True, SignificanceLevel -> .05]

FullReport->MeanDiff TestStat Distribution9. 2.51558 NormalDistribution

,

OneSidedPValue -> 0.00594189, Reject null hypothesis at significancelevel -> 0.05.

Page 325: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 325/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 323

Nu sunt motive sa se accepte ipoteza nula, deci timpul de uscareprin a doua formula este mai mic decât cel prin prima formula.

9.1.7 Test asupra raportului dispersiilor a douapopulatii

Vom aplica test asupra raportului dispersiilor a doua populatiicare urmeaza o distributie normala si ale caror medii si dispersii suntnecunoscute.

Reluam exercitiul 8.3 din Capitolul 8.

Exemplul 9.10. Într-un atelier se polizeaza o anumita suprafata me-talica. Doua procedee de polizare sunt folosite si ambele procedeeproduc portiuni neregulate. Coordonatorul vrea sa aplice acel pro-cedeu care realizeaza cea mai mica variatie a portiunilor neregulate.A fost ales un esantion de n1 = 11 portiuni de suprafata polizate cuprimul procedeu si s-au obtinut rezultatele

22.0, 13.1, 22.7, 12.9, 12.05, 12.5, 12.55, 20.1, 24.7, 22.7, 14.5.A rezultat o dispersie de selectie S 21 = 26.0992, deci o deviere

standard de S 1 = 5.10874 microinches si un esantion de n2 = 16

portiuni de suprafat˘

a polizate cu al doilea procedeu si s-au obtinutrezultatele22.0, 13.2, 13.1, 22.1, 12.9, 12.4, 12.05, 12.1, 12.9, 14.55, 23.1,

23.3, 26.5, 24.158, 13.4, 14.5, 14.5, 19.7, 15.6, 12.6, 16.8, 15A rezultat o dispersie de selectie S 22 = 22.0243, deci o deviere

standard de S 2 = 4.69301 microinches. Dorim sa verificam ipoteza cadispersiile celor doua procedee sunt egale cu un nivel de încredere de90%.

Rezolvare.Ipoteza nula: ipoteza nula H 0 : σ1 = σ2.

Ipoteza alternativa: H 1 : σ1 6= σ2.x11 = 22.0, 13.1, 22.7, 12.9, 12.05, 12.5, 12.55, 20.1, 24.7, 22.7,

14.5;n1 = Length[x11]11Variance[x11]26.0992StandardDeviation[x11]5.10874

Page 326: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 326/364

324 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

x12 = 22.0, 13.2, 13.1, 22.1, 12.9, 12.4, 12.05, 12.1, 12.9, 14.55,23.1, 23.3, 26.5,

24.158, 13.4, 14.5, 14.5, 19.7, 15.6, 12.6, 16.8, 15;Variance[x12]22.0243StandardDeviation[x12]4.69301<< Statistics‘HypothesisTests‘VarianceRatioTest[x11, x12, 1, TwoSided -> True, FullReport ->True, SignificanceLevel -> .05]

FullReport-> Ratio TestStat Distribution1.18502 1.18502 FRatioDistribution[10, 15]

,

TwoSidedPValue -> 0.742545, Fail to reject null hypothesis at signifi-cance

level -> 0.05.Concluzia: nu avem motive sa respingem ipoteza nula.

9.1.8 Test asupra diferentei proportiilor a douapopulatii

Presupunem ca avem doua esantioane de dimensiuni n1 si respectivn2 extrase din doua populatii X 1 si X 2 reprezentând numarul de obser-vatii care apartin unei clase care se studiaza. Mai mult, presupunemaproximarea distributiei binomiale cu distributia normala este apli-cabila (populatia sa aiba macar 10 elemente), astfel încât estimatoriiproportiilor P 1 = X 1/n1 si P 2 = X 2/n2 urmeaza o distributie normala.Suntem interesati în a testa ipotezele

H 0 : p1 = p2,H 1 : p1 6= p2.

Statistica folosita este

Z = P 1 − P 2 − ( p1 − p2)q p1(1− p1)

n1+ p2(1− p2)

n2

.

Ea urmeaza o distributie aproximativ standard normala. Dacaipoteza nula este adevarata, folosind faptul ca p1 = p2 = p, atunci

Z =P 1 − P 2r

p (1 − p)³

1n1

+ 1n2

´ ∈ N [0, 1] .

Page 327: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 327/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 325

Estimatorul parametrului p este P = X 1 + X 2n1 + n2

.

Statistica folosita pentru testul având ipoteza H 0 : p1 = p2 va fi

Z 0 =P 1 − P 2r

P ³

1 − P ³

1n1

+ 1n2

´ .

Ipoteza alternativa Regiunea criticaH 1 : p1 6= p2

¡−∞, −zα

2 ¢∪¡

zα2

, ∞¢H 1 : p1 > p2 (zα, ∞)H 1 : p1 < p2 (−∞, −zα)

Exemplul 9.11. Un cercetaror este interesat daca persoanele care auf acut psihologia sunt capabile sa rezolve o problema care implica oanumita judecata. Cercetatorul este interesat în a estima diferentadintre proportiile persoanelor din cele doua populatii care pot rezolvaproblema. Prima populatie are 100 membrii din care 65 au rezolvatproblema, iar a doua populatie are 110 din care doar 45 au rezolvatproblema. Sa se analizeze ipotezele:

a) cele doua proportii sunt egale,

b) prima proportie este mai mare decât a doua.Rezolvare. a) 1. Parametrii care intereseaza sunt p1 si p2.

2. Ipoteza nula H 0 : p1 = p2,3. Ipoteza alternativa H 1 : p1 6= p2.4. Alegem α = 0.05

5. Testul statistic utilizat Z 0 =ˆ p1 − ˆ p2r

p (1 − p)³

1n1

+ 1n2

´ , unde ˆ p1 =

0.65, ˆ p2 = 45110

= 0.409 09, n1 = 100, n2 = 110 si

ˆ p = X 1n1

+ X 2n2

= 65 + 45100 + 110

= 0.523 81.

6. Regiunea critica: deoarece z0.025 = 1.96 rezulta ca ipoteza nulaeste respinsa daca Z 0 ∈ (−∞, −1.96) ∪ (1.96, ∞) .

7: Z 0 =0.65 − 0.409 09q

0.52381(1 − 0.52381)¡

1100

+ 1110

¢ = 3.4911.

8. Concluzia: deoarece Z 0 = 3.4911 > 1.96, rezulta ca ipoteza nulaeste respinsa, deci proportiile nu sunt egale.

Page 328: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 328/364

326 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

b) 1. Parametrii care intereseaza sunt p1 si p2.2. Ipoteza nula H 0 : p1 = p2,3. Ipoteza alternativa H 1 : p1 > p2.4. Alegem α = 0.05

5. Testul statistic utilizat Z 0 =ˆ p1 − ˆ p2r

p (1 − p)³

1n1

+ 1n2

´ , unde ˆ p1 =

0.65, ˆ p2 = 45110

= 0.409 09, n1 = 100, n2 = 110 si

ˆ p =X 1

n1

+X 2

n2

=65 + 45

100 + 110

= 0.523 81.

6. Regiunea critica: deoarece z0.05 = 1.65, rezulta ca ipoteza nulaeste respinsa daca Z 0 ∈ (1.65, ∞).

7: Z 0 =0.65 − 0.409 09q

0.52381(1 − 0.52381)¡

1100

+ 1110

¢ = 3.4911

8. Concluzia: deoarece Z 0 = 3.4911 > 1.65 rezulta ca ipoteza nulaeste respinsa, deci proportiile nu sunt egale iar prima proportie estemai mare decât a doua.

9.2 Testul lui Pearson (χ2

)Este folosit ca indicator al concordantei unei repartitii empirice cu

una teoretica. Este unul din cele mai importante teste statistice.Se considera o selectie de volum n, x0

1, x02, . . . , x0

n.Ipoteza H 0: selectia f acuta provine dintr-o populatie cu functia

de repartitie F complet specificata (de exemplu normala standard).Ipoteza alternativa H 1: selectia nu provine din populatia definita de F .

Se considera o selectie de volum n, x01, x0

2, . . . , x0n. Datele se îm-

part în r clase, x1 < x2 < · · · < xr. Obtinem intervalele [x1, x2) ,[x2, x3) , . . . , [xr,

∞) . Fie f j numarul de observatii din intervalul j si

p j probabilitatea teoretica ca v. a. din care provine selectia sa ia valoriîn intervalul j, daca admitem ipoteza H 0. Atunci frecventa teoreticaeste np j.

Statistica utilizata în testarea acestei ipoteze este:

χ2 =rX

j=1

(f j − np j)2

np j(9.1)

care urmeaza legea χ2 cu r − 1.

Page 329: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 329/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 327

9.2.1 Algoritmul testului lui Pearson

Pasul 1. Alegerea lui r: Mann si Wald au propus formula

r = 4

µ2(n − 1)2

C 2

¶ 15

unde C este cuantila de ordin α al repartitiei N (0, 1).Pasul 2. Selectia de volum n se împarte în r intervale. Se calculeaza

f k numarul de observatii în intervalul k iar pk probabilitatea teoreticaca v. a. în studiu sa ia valori în intervalul k în ipoteza ca H 0 este

adevarata. Pentru aceasta se estimeaza media (sau alti parametrii) sise genereaza acelasi numar de date repartizate conform legii teoreticealese. Pentru o buna aplicare a testului trebuie ca npk ≥ 5 pentruk = 1, r.

Pasul 3. Se calculeaza

χ2 =rX

j=1

(f j − np j)2

np j.

Pasul 4. Se stabileste nivelul de semnificatie 1 − α, se calculeazaχ2α,r−1.

Ipoteza H 0 se respinge daca χ2 > χ2α,r−1.

Daca χ2 < χ2α,r−1 nu avem motive sa respingem ipoteza H 0.

Observatia 9.3. În practica se poate da o expresie mai usor de retinutpentru (9.1) si anume

χ2 =X (O − E )2

E ,

unde O sunt datele observate si E cele estimate (pentru care trebuiedecisa buna potrivire).

Observatia 9.4. Daca se estimeaza un numar de s parametri, atunciχ2 urmeaza o repartitie χ2 cu r − s − 1 grade de libertate.

Exemplul 9.12. La o ora de vârf s-au sondat canalele de televiz-iune TVR1, PROTV, TVR2, Antena 1, Realitatea, care au avut la 23martie audientele 34%, 8%, 12%, 34%, 12% respectiv. La un sondajprintre 500 telespectatori dupa 6 luni s-au constatat rezultatele urma-toare: 159 spectatori pentru TVR1, 49, 62, 161, 69 pentru celelalte.Apare o diferenta semnificativa?

Page 330: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 330/364

328 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Rezolvare. În acest exemplu avem r = 5, X = audienta, n = 500, p1 = 0.34, p2 = 0.08, p3 = 0.12, p4 = 0.34, p5 = 0.12.

Numarul estimat de telespectatori la 23 martie este respectiv

np1 = 500 · 0.34 = 170, np2 = 500 · 0.08 = 40, np3 = 500 · 0.12 = 60,

np4 = 500 · 0.34 = 170, np5 = 500 · 0.12 = 60.

Calculam

χ2 = (159−170)2170

+ (49−40)240

+ (62−60)260

+ (161−170)2170

+ (69−60)260

= 4.6299.

Datele pot fi organizate conform urmatorului tabel

Grupa 1 2 3 4 5f k 159 49 62 161 69 pk 0.34 0.08 0.12 0.34 0.12npk 170 40 60 170 60

f k − npk −11 9 2 −9 9

(f k − npk)2 121 81 4 81 81

(f k − npk)2

npk

0.71176 2.025 6.6667 × 10−2 0.47647 1.35

Alegem α = 0.1, r − 1 = 4, atunci χ20.1(4) = 7.779. Deoarece χ2 <

χ20.1(4) (4.6299 < 7.7794) rezulta ca nu avem argumente suficiente

pentru a respinge ipoteza H 0.Daca luam α = 0.5 atunci χ2

0.5(4) = 3.36 si H 0 se respinge cu oeroare de 50%.

Secventa de program Mathematica care realizeaza aceasta testareeste data mai jos:

Potrivire cu repartitia binomial˘

aExemplul 9.13. O reclama a fost difuzata în mass-media. Dintr-unesalon de 800 de persoane au fost 434 care nu au auzit (vazut) reclama;329 au auzit o data; 35 de doua ori si 2 de 3 ori (nimeni mai mult detrei ori). Ne propunem sa verificam la nivel de semnificatie 95% dacanumarul de dati când o persoana a aflat de acea reclama urmeaza orepartitie binomiala cu parametru p = 0.2.

Rezolvare. Pasii care trebuie urmati în testarea ipotezei statistice

Page 331: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 331/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 329

Pasul 1. Variabila care intereseaza: X numara de câte ori o per-soana a auzit reclama.

Pasul 2. H 0 : variabila X urmeaza o distributie binomiala.Pasul 3. H 1 : variabila X nu urmeaza o distributie binomiala.Pasul 4. α = 0.05.Pasul 5. Testul statistic este

χ2 =rX

k=1

(f k − npk)2

npk

Pasul 6. Ipoteza H 0 este respins˘

a dac˘

a χ2

> χ2

0.05(3) = 7.81473.Regiunea critica este (7.81473, ∞).Pasul 7. Calculele: r = 4, k = 1, 2, 3, 4 si aceste valori sunt luate

de X cu probabilitatile pk = C k−13 pk−1(1 − p)4−k, deci

p1 = C 03(0.2)0(0.8)3 = 0.512, p2 = C 13(0.2)1(0.8)2 = 3 · 0.128 = 0.384,

p3 = 3 · (0.2)2 (0.8)1 = 0.096, p4 = (0.2)3 (0.8)0 = 0.008

n = 800,

Grupa 0 1 2 3f k 434 329 35 2 pk 0.512 0.384 0.096 0.008npk 409.6 307.2 76.8 6.4

f k − npk 24.4 21.8 −41.8 −4.4

(f k − npk)2 595.36 475.24 1747.2 19.36

(f k − npk)2

npk7.8641 × 10−2 1.547 22.75 3.025

χ2 = 28.776, χ20.95(3) = 7.81473.

Pasul 8. 28.776 > 7.81473 rezulta ca respingem H 0, deci dateleobservate nu urmeaza o lege binomiala cu parametru p = 0.2.

Secventa de program Mathematica care realizeaza aceasta testareeste data mai jos:

p = 0.2;n = 800;r = 4;p0 = (1 - p)^30.512

Page 332: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 332/364

330 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

p1 = 3 p (1 - p)^2

0.384p2 = 3 p^2 (1 - p)

0.096p3 = p^3

0.008CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -

35)^2/(n p2) + (n p3 - 2)^2/(n p3)

28.776

<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[r - 1], 0.95]

7.81473În ipoteza ca variabila studiata ar urma, totusi, o repartitie bino-

miala, estimam parametrul p cu metoda verosimilitatii maxime. Con-struim functia de verosimilitate maxima dupa modelul Exemplului 7.9

p1 = C 03 p0(1− p)3, p2 = C 13 p

1(1− p)2, p3 = C 23 p2(1− p)1, p4 = C 33 p

3,

L(x1, x2, x3, x4; p) = px11 px22 px33 px44L(434, 329, 35, 2; p) = (1 − p)3·4343 p329(1 − p)2·3293 p2·35(1 − p)35P 3·2 =

= 9 p405(1 − p)1995,ln L(434, 329, 35, 2; p) = ln 9 + 405 ln p + 1995 ln(1 − p),

∂ ln L(434, 329, 35, 2; θ)

∂p=

405

p− 1995

1 − p,

405

p− 1995

1 − p= 0, p =

27

160= 0.16875.

Secventa Mathematica:dr[s_] := (1 - s)^(3 434) 3 s^329 (1 - s)^(2 329) 3 s^70 (1 - s)^35

s^6

d1 = Simplify[dr[s]]

9(1 − s)1995s405

dd = Factor[D[Log[d1], s]]15(−27+160s)

(−1+s)sSolve[dd == 0, s]©©

s− > 27160

ªªN[%]

s− > 0.16875

Page 333: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 333/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 331

Cu acest p determinat, testul χ2 da ca valoare χ2 = 19.3074 faptcare ne conduce la aceeasi concluzie ca datele observate nu urmeaza olege binomiala.

p0 = (1 - s)^3; p1 = 3 s (1 - s)^2;p2 = 3 s^2 (1 - s); p3 = s^3;CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -

35)^2/(n p2) + (n p3 - 2)^2/(n p3)19.3074Observam din programul realizat cu Mathematica ca daca luam

p = 0.168, χ2 = 19.4136, deci χ2 începe sa creasca.

s = 0.168;p0 = (1 - s)^3; p1 = 3 s (1 - s)^2;p2 = 3 s^2 (1 - s); p3 = s^3;CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -

35)^2/(n p2) + (n p3 - 2)^2/(n p3)19.4138

Potrivire cu repartitia Poisson

Exemplul 9.14. Vrem sa stabilim daca numarul defectiunilor unui

circuit al unei imprimante urmeaz˘

a o repartitie Poisson. Se studiaz˘

acomportatea acestui circuit pe un numar de 60 de imprimante si suntconsemnate numarul defectiunilor care au aparut.

Nr. defectiunilor Frecventa0 321 152 9

≥3 4

Media distributiei Poisson presupuse este necunoscuta si trebuie

estimata din datele esantionului. Estimarea mediei numarului de-fectelor circuitului o facem printr-un estimator punctual al mediei,x = 32·0+15·1+9·2+4·3

60= 0.75. Din distributia Poisson cu parametrul

λ = 0.75 putem calcula probabilitatile teoretice pi, i = 1, 2, 3, 4,

p1 = P (X = 0) =e−0.75(0.75)0

0!= 0.472367

p2 = P (X = 1) =e−0.75(0.75)1

1!= 0.354275

Page 334: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 334/364

332 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

p3 = P (X = 2) =e−0.75(0.75)2

2!= 0.132 853

p4 = P (X ≥ 3) = 1 − ( p1 + p2 + p3) = 0.0405054

Secventa cu Mathematican = 60;media = (0 32 + 1 15 + 2 9 + 3 4)/6034

λ= N[%]0.75

p1 = Exp[-λ]0.472 367p2 = Exp[-λ] λ0.354 275p3 = Exp[-λ] (λ)^2/20.132 853p4 = 1 - (p1 + p2 + p3)0.0405054

Aplicam testul.Pasul 1. Variabila care intereseaza: X numarul de defecte care

apar la un circuit.Pasul 2. H 0 : variabila X urmeaza o distributie Poisson.Pasul 3. H 1 : variabila X nu urmeaza o distributie Poisson.Pasul 4. α = 0.05Pasul 5. Testul statistic este

χ2 =rX

k=1

(f k − npk)2

npk

Pasul 6. Determinam regiunea critica. χ2 urmeaza o distributie hi-patrat cu 2 grade de libertate. Sunt patru grade, ar trebui sa urmeze o

distributie cu 3 grade de libertate dar, deoarece s-a estimat parametruldistributiei Poisson, numarul gradelor de libertate se considera cu ounitate mai mic, conform Observatiei 9.4.

Frecventele observatef1 = 32;f2 = 15;f3 = 9;f4 = 4;Determinam regiunea critica

Page 335: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 335/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 333

<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[2], 0.95]5.99146Ipoteza H 0 este respinsa daca χ2 > χ2

0.05(2) = 5.99146. Regiuneacritica este (5.99146, ∞).

Pasul 7. Calculele:CHI = (n p1 - f1)^2/(n p1) + (n p2 - f2)^2/(n p2) + (n p3 - f3)^2/(n

p3) + (n p4 - f4)^2/(n p4)3.46021Pasul 8. χ2 = 3.46021 < χ2

0.05(2) = 5.99146. Nu avem motive sa

respingem ipoteza nula.

Potrivire cu repartitia uniforma

Exemplul 9.15. Un comerciant vrea sa vada daca un anumit produsse vinde la fel (uniform) în 5 dintre magazinele sale. Prin experimentconstata ca într-o saptamâna s-au realizat vânzari în mii RON de43, 29, 52, 34, 48. Este aceasta informatie suficienta pentru a consideraca exista mari diferente între cele 5 magazine?

Pasul 1. Variabila care intereseaza: X veniturile realizate prin

vânzari în 5 magazine, în decursul unei saptamâni.Pasul 2. Ipoteza H 0: variabila X urmeaza o distributie uniforma.

Probabilitatea de a cumpara de la unul din cele cinci magazine esteaceeasi p1 = p2 = · · · = p5 = 0.2, cu alte cuvinte vânzarile suntaceleasi.

Observatia 9.5. În cazul unei repartitii uniforme a vânzarilor pe cele5 magazine, ele ar trebui sa vânda fiecare în valoare de 206 · 0.2 =41.2 mii RON. Acestea sunt datele estimate daca ipoteza H 0 ar fiadevarata. Datele date în enunt sunt cele observate.

Pasul 3. Ipoteza H 1: variabila X nu urmeaza o distributie uni-forma.Pasul 4. α = 0.1Pasul 5. Testul statistic este

χ2 =rX

k=1

(f k − npk)2

npk.

Pasul 6. Determinam regiunea critica. χ2 urmeaza o distributiehi-patrat cu 4 grade de libertate.

Page 336: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 336/364

334 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

p1 = 0.2; p2 = 0.2; p3 = 0.2; p4 = 0.2; p5 = 0.2;f1 = 43; f2 = 29; f3 = 52; f4 = 34; f5 = 48;n = f1 + f2 + f3 + f4 + f5206<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[4], 0.9]7.77944Regiunea critica este (7.77944, ∞).Deoarece am estimat probabilitatile teoretice p1 = p2 = · · · = p5 =

0.2 care depind de volumul selectiei (numarul magazinelor cercetate)

specialistii recomanda sa se considere ca au ramas 5 − 1 − 1 = 3 gradede libertate. În acest caz

<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[3], 0.9]6.25139Regiunea critica este (6.25139, ∞).Pasul 7. Calculele:CHI = (n p1 - f1)^2/(n p1) + (n p2 - f2)^2/(n p2) + (n p3 - f3)^2/(n

p3) + (n p4 - f4)^2/(n p4) + (n p5 - f5)^2/(n p5)8.90291

Pasul 8. Pentru r = 5 la un nivel de semnificatie de 10% χ20.05(4) =7.77944 > 8.902 91, deci nu avem motive sa respingem ipoteza H 0. Lafel si pentru cazul a trei grade de libertate.

Observam ca daca consideram α = 0.05, atunci<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[4], 0.95]9.48773Quantile[ChiSquareDistribution[3], 0.95]7.81473În acest caz avem, conform celor doua situatii, regiunile critice:

(9.48773, ∞) si respectiv (7.81473, ∞).Observam ca între cele doua situatii interpretarile sunt diferite siatunci concluzia se trage în functie de conjunctura. Pentru r = 5 laun nivel de semnificatie de 5% χ2

0.05(4) = 9.48773 > 8.902 91, deci nuavem motive sa respingem ipoteza H 0. În cazul în care se considera5 − 1 − 1 = 3 grade de libertate, χ2

0.05(3) = 7.81473 < 8.9029 si înacest caz putem zice ca sunt diferente mari între magazine.

Daca se considera α = 0.01 atunci<< Statistics‘ContinuousDistributions‘

Page 337: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 337/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 335

Quantile[ChiSquareDistribution[4], 0.9]7.77944Quantile[ChiSquareDistribution[3], 0.9]6.25139În acest caz putem zice ca sunt diferente mari între magazine.

Potrivire cu repartitia normala

Exemplul 9.16. Presupunem ca timpul mediu de asamblare (în mi-nute) pentru un esantion de 300 de aparate electronice a fost m = 84,

cu abaterea medie patratica σ = 3. S-a observat ca aceste 300 deaparate au fost repartizate astfel: pentru 15 aparate au fost necesaresub 78 de minute, pentru 39 între 78-81 minute, pentru 96 între 81-84minute, pentru 87 între 84-87, pentru 48 aparate între 87-90 minutesi pentru 15 aparate peste 90 minute. Sa se testeze la nivel de sem-nificatie de 1% daca datele anterioare sunt repartizate normal.

Pasul 1. Variabila care intereseaza: X timpul mediu de asamblarea unor aparate electronice.

Pasul 2. H 0 : variabila X urmeaza o distributie normala.Pasul 3. H

1: variabila X nu urmeaza o distributie normala.

Pasul 4. α = 0.1Pasul 5. Testul statistic este

χ2 =rX

k=1

(f k − npk)2

npk.

Pasul 6. Determinam regiunea critica. Datele sunt împartite în 6grupe. S-a estimat media, m = 84 si abaterea medie patratica, σ = 3.Testul statistic urmeaza o distributie χ2

0.01(3).m = 84;

σ= 3;f1 = 15;f2 = 39;f3 = 96;f4 = 87;f5 = 48;f6 = 15;n = f1 + f2 + f3 + f4 + f5 + f6300

Page 338: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 338/364

336 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

<< Statistics‘ContinuousDistributions‘

Quantile[ChiSquareDistribution[3], 0.99]11.3449Regiunea critica este: (11.3449, ∞).Pasul 7. Calculele:Avem r = 6 grupe; daca X = timpul de asam-

blare si daca X ∈ N (84, 9), atunci

p1 = P (X < 78) = Φ

µ78 − 84

3

¶= Φ (−2) = 1 −Φ(2) =

= 1−

0.97725 = 0.02275

p2 = P (78 ≤ X < 81) = Φ

µ81 − 84

3

¶−Φ

µ78 − 84

3

¶=

= Φ (−1) −Φ (−2) = 0.977 25 − 0.84134 = 0.135 91

p3 = P (81 ≤ X < 84) = Φ

µ84 − 84

3

¶−Φ

µ81 − 84

3

¶=

= Φ (0) −Φ (−1) = 0.84134 − 0.5 = 0.341 34

p4 = P (84 ≤ X < 87) = Φ

µ87 − 84

3

¶−Φ

µ84 − 84

3

¶=

= Φ (1) −Φ (0) = 0.841 34 − 0.5 = 0.34134

p5 = P (87 ≤ X < 90) = Φ

µ90 − 84

3

¶−Φ

µ87 − 84

3

¶=

= Φ (2) −Φ (1) = 0.977 25 − 0.84134 = 0.135 91

p6 = P (90 ≤ X ) = 1 −Φµ

90 − 84

3

¶= 1 −Φ (2) =

= 1 − 0.97725 = 0.02275

n = 300

Acest calcul se realizeaz˘

a prin secventap1 = N[CDF[NormalDistribution[0, 1], (78 - 84)/3]]0.0227501p2 = N[CDF[NormalDistribution[0, 1], (81 - 84)/3]] - N[CDF[

NormalDistribution[0, 1], (78 - 84)/3]]0.135905p3 = N[CDF[NormalDistribution[0, 1], (84 - 84)/3]] - N[CDF[

NormalDistribution[0, 1], (81 - 84)/3]]0.341345

Page 339: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 339/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 337

p4 = N[CDF[NormalDistribution[0, 1], (87 - 84)/3]] - N[CDF[NormalDistribution[0, 1], (84 - 84)/3]]

0.341345p5 = N[CDF[NormalDistribution[0, 1], (90 - 84)/3]] - N[CDF[

NormalDistribution[0, 1], (87 - 84)/3]]0.135905p6 = 1 - N[CDF[NormalDistribution[0, 1], (90 - 84)/3]]0.0227501Calculam valoarea statisticiiCHI = (n p1 - f1)^2/(n p1) + (n p2 - f2)^2/(n p2) + (n p3 - f3)^2/(n

p3) + (n p4 - f4)^2/(n p4) + (n p5 - f5)^2/(n p5) + (n p6 - f6)^2/(np6)

23.6597χ2 = 23.6597Pasul 8. χ2 = 23.6597 > χ2

0.01(3) = 11.3449 rezulta ca respingemipoteza H 0.

Potrivire cu repartitia exponentiala

În general nu avem o densitate de probabilitate pentru X , ci numaiun model statistic pe care îl alegem din modelele cunoscute. Consi-deram un esantion (X 1, X 2, . . . , X k) ∈ Multinomial [n, p1, p2, . . . , pk].În mod natural ne punem problema sa gasim un estimator de verosimi-litate maxima în acest caz. Functia de verosimilitate maxima se ia deforma:

L(x1, x2, . . . , xk; p1, p2, . . . , pk) = ( p1)x1 ( p2)x2 · · · ( pk)xk .

Exemplul 9.17. Presupunem ca este testata durata de functionarea unui tip de becuri (masurata în ore) pentru un esantion de 30 debecuri. S-a observat ca durata de functionare a 9 becuri este sub 1000

de ore, a 12 becuri între 1000 si 2000 de ore, a 8 becuri între 2000si 3000 de ore, iar a unui bec peste 3000 de ore. Sa se testeze lanivel de semnificatie de 0.1% daca datele prezentate sunt repartizateexponential.

Avem nevoie de o estimare a parametrului v. a. X care ia ca valoridurata de functionare (masurata în sute de ore) a becurilor, presupusaexponentiala X ∈ Exponential [θ]. Reamintim ca pentru repartitia

exponentiala F (x) =

½0 daca x ≤ 0

1 − e−θx daca x > 0.

Page 340: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 340/364

338 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Datele se împart în patru grupe, (0, 1], (1, 2], (2, 3], (3, ∞).

p1 = P (0 ≤ X < 1) = F (1) − F (0) = 1 − e−θ,

p2 = P (1 ≤ X < 2) = F (2) − F (1) = e−θ − e−2θ,

p3 = P (2 ≤ X < 3) = F (3) − F (2) = e−2θ − e−3θ,

p4 = P (3 ≤ X ) = 1 − F (3) = e−3θ.

Pentru a calcula probabilitatile trebuie estimat parametrul θ. Folo-sim estimatorul de verosimilitate maxima. Functia de verosimilitate

maxima este

L(x1, . . . , xn; θ) =¡

1 − e−θ¢9 ¡

e−θ − e−2θ¢12 ¡

e−2θ − e−3θ¢8 ¡

e−θ¢1

.

ln L(x1, . . . , xn; θ) = ln¡

1−e−θ¢9¡

e−θ−e−2θ¢12¡

e−2θ−e−3θ¢8¡

e−3θ¢1

=

= 9ln(1 − e−θ) + 12 ln(e−θ − e−2θ) + 8 ln(e−2θ − e−3θ) − 3θ,

∂ ln L(x1, x2, . . . , xn; θ)

∂θ=

= 9e−θ

1−e−θ + 12e−θ−e−2θ¡2e−2θ−e−θ¢+ 8e−2θ−e−3θ

¡3e−3θ−2e−2θ¢−3 =

=9e−θ

1 − e−θ+

12

1 − e−θ¡

2e−θ − 1¢

+8

1 − e−θ¡

3e−θ − 2¢− 3 =

=1

e−θ − 1

¡31 − 60e−θ

¢,

1

e−θ − 1

¡31 − 60e−θ

¢= 0 ⇒ θ = 0.66036,

∂ ln L(x1, x2, . . . , xn; θ)

∂θ= 0 ⇒ θ = 0.660 36,

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2 =

= −57e−θ

1 − e−θ− 9

e2(−θ)

(1 − e−θ)2− 12

e−θ

(1 − e−θ)2¡

2e−θ − 1¢−

− 8e−θ

(1 − e−θ)2¡

3e−θ − 2¢

= −29e−θ

(1 − e−θ)2< 0,

Page 341: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 341/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 339

∂ 2 ln L(x1, x2, . . . , xn; θ)

∂θ2

¯θ=0.66036

=

= − 57e−0.66036

1−e−0.66036− 9e2(−0.66036)

(1−e−0.66036)2− 12e−0.66036

(1−e−0.66036)2¡

2e−0.66036−1¢−

− 8e−0.66036

(1 − e−0.66036)2¡

3e−0.66036 − 2¢

= −64.137.

θ = 0.66036 este estimator de verosimilitate maxima.

Secventa prin mathematica care realizeaza acest calcul este:ff [p_] := (1 - Exp[-p])^9 (Exp[-p] - Exp[-2 p])^12 (Exp[-2 p] - Exp[-3

p])^8 Exp[-3 p]

der = Factor[D[Log[ff [p]], p]]−60+31ep

−1+epN[Solve[der == 0, p]]

p->0.660357

D[der, p] /. p -> 0.6603573577369545

−64.1379

Aplicam testul.Pasul 1. Variabila care intereseaza: X durata de functionare ma-

surata în sute de orea a unui tip de becuri.Pasul 2. H 0 : variabila X urmeaza o distributie exponentiala.Pasul 3. H 1 : variabila X nu urmeaza o distributie exponentiala.Pasul 4. α = 0.001

Pasul 5. Testul statistic este

χ2 =r

Xk=1

(f k − npk)2

npk.

Pasul 6. Determinam regiunea critica.<< Statistics‘ContinuousDistributions‘

Quantile[ChiSquareDistribution[2], 0.999]

13.8155

Regiunea critica este (13.8155, ∞).Pasul 7. Calculele:

Page 342: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 342/364

340 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

Probabilitatile teoretice sunt

p1 = 1 − e−0.660 36 = 0.483 33,

p2 = e−0.660 36 − e−2·0.66036 = 0.24972,

p3 = e−2·0.660 36 − e−3·0.66036 = 0.12902,

p4 = e−3·0.660 36 = 0.13792,

χ2 = 2.086 2 + 2.713 2 + 4.405 5 + 2.379 3 = 11.584

χ20.999(2) = 13.8155

p1 = 1 - Exp[-p]0.483 33p2 = Exp[- p] - Exp[-2 p]0.24972p3 = Exp[-2 p] - Exp[-3 p]0.12902p4 = Exp[-3 p]0.137 92f1 = 9;f2 = 12;

f3 = 8;f4 = 1;n = 30;CHI = (n p1 - f1)^2/(n p1) + (n p2 - f2)^2/(n p2) + (n p3 - f3)^2/(n

p3) + (n p4 - f4)^2/(n p4)11.5837χ2 < χ2

0.001(2), rezulta ca nu avem motive sa respingem ipoteza H 0.

9.3 Teste de independenta în tabele de

contingent˘aTabelele de contingenta sunt construite în scopul studierii relatiei

dintre doua sau mai multe variabile de clasificare.De multe ori n elemente ale unei selectii pot fi clasificate conform

unor criterii diferite. Este interesant sa stim daca criteriile de clasi-ficare sunt statistic independente. Presupunem ca prima metoda declasificare conduce la r clase, iar a doua metoda la s clase. Notam cuoij frecventele relative observate pentru nivelul i din prima clasificare

Page 343: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 343/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 341

si nivelul j din a doua clasificare. Datele vor apare, în general, într-untabel de forma:

1 2 . . . s

1 o11 o12 · · · o1ssP

j=1

o1 j

2 o21 o22 · · · o2ssP

j=1

o2 j

......

......

...

r or1 or2 · · · orssP

j=1orj

sPi=1

oi1sP

i=1

oi2 · · ·sP

i=1

ois

Un astfel de tabel se numese tabel de contingen t a .Suntem interesati sa testam daca metodele folosite pentru clasifi-

carea datelor pe linii si coloane sunt independente. Daca respingemaceasta ipoteza înseamna ca exista unele interactiuni între cele douacriterii de clasificare.

Urmatorul test este valabil pentru n mare. Fie pij probabilitateaca un element luat la întâmplare sa apartina celulei ij, stiind ca celedoua calsificari sunt independente. Atunci pij = uiv j unde ui esteprobabilitatea ca elementul selectat sa apartina liniei i si v j proba-bilitatea ca elementul selectat sa apartina coloanei j. În conditii deindependenta, estimatorii lui ui si v j sunt:

ui =1

n

sX j=1

oij, v j =1

n

rXi=1

oij.

Atunci frecventele asteptate a fi pentru fiecare celula sunt:

E ij = nuiv j =1

n

sX j=1

oij

rXi=1

oij.

Pentru n mare, statistica

χ20 =

rXi=1

sX j=1

(oij − E ij)2

E ij

Page 344: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 344/364

342 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

urmeaza distributia χ2 cu (r − 1)(s − 1) grade de libertate. Ipotezade independenta este respinsa daca valoarea statisticii χ2

0 depasestevaloarea χ2

α,(r−1)(s−1).Cu ajutorul testului χ2 este posibil sa se verifice ipoteza conform

careia cele doua variabile de clasificare sunt independente.

9.3.1 Testul de independenta

Exemplul 9.18. O companie are de ales între trei planuri de pensiiprivate. Se pune problema daca preferintele pentru planurile de pensii

private sunt independente de forma de angajare cu α = 0.05. Estechestionat un esantion de 500 angajati iar rezultatele sunt prezentateîn urmatorul tabel:

1 2 3 Totalsalariati full time 160 140 40 340salariati part time 40 60 60 160Total 200 200 100 500

Etapele procedurii de testare a ipotezelor:Pasul 1. Variabilele de testat sunt preferintele pentru planurile de

de pensii private.Pasul 2. Ipoteza H 0 : preferintele sunt independente de forma deangajare.

Pasul 3. Ipoteza H 1 : preferintele nu sunt independente de formade angajare.

Pasul 4. α = 0.05.

Pasul 5. Statistica folosita este: χ20 =

rPi=1

sP j=1

(oij − E ij)2

E ij.

Pasul 6. r = 2, s = 3, numarul gradelor de libertate este (r − 1)(s − 1) = 2, χ2

0.05,2 = 5.99. Ipoteza va fi respinsa daca χ20 > χ2

0.05,2 =5.99. Regiunea critica este (5.99,

∞).

<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[2], 0.95]5.99146Pasul 7. Pe baza tabelului calculam

u1 =340

500= 0.68, u2 =

160

500= 0.32,

v1 =200

500= 0.4, v2 =

200

500= 0.4, v3 =

100

500= 0.2.

Page 345: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 345/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 343

n = 500;o11 = 160; o12 = 140; o13 = 40;o21 = 40; o22 = 60; o23 = 60;u1 = N[340/500]0.68u2 = N[160/500]0.32v1 = N[200/500]0.4v2 = N[200/500]0.4v3 = N[100/500]0.2Frecventele asteptate sunt

E 11 = nu1v1 = 500·0.68·0.4 = 136, E 12 = nu1v2 = 500·0.68·0.4 = 136,

E 13 = nu1v3 = 500·0.68·0.2 = 68, E 21 = nu2v1 = 500·0.32·0.4 = 64,

E 22 = nu2v2 = 500·0.32·0.4 = 64, E 23 = nu2v3 = 500·0.32·0.2 = 32.

E11 = n u1 v1136E12 = n u1 v2136E13 = n u1 v368E21 = n u2 v164E22 = n u2 v264

E23 = n u2 v332

χ20 =

rXi=1

sX j=1

(oij − E ij)2

E ij=

=(160 − 136)2

136+

(140 − 136)2

136+

(40 − 68)2

68+

(40 − 64)2

64+

+(60 − 64)2

64+

(60 − 32)2

32= 49.632.

Page 346: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 346/364

344 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

CHI = (o11 -E11)^2/E11 + (o12 - E12)^2/E12 + (o13 - E13)^2/E13+ (o21 - E21)^2/E21 + ( o22 - E22)^2/E22 + (o23 - E23)^2/E23

49.6324Pasul 8. Concluzii: deoarece χ2

0 = 49.632 > χ20.05,2 = 5.99 rezulta

ca nu avem motive sa acceptam ipoteza ca preferintele pentru diferiteplanuri de pensionare nu depind de forma de angajare.

9.3.2 Testarea omogeneitatii populatiilor

Mai multe populatii se numesc omogene daca ele sunt formate din

acelasi numar de subgrupe (straturi) cu acelasi procent din populatieîn fiecare subgrupa. Testul de omogeneitate poate fi vazut ca un testde independenta.

Exemplul 9.19. 300 de elevi din ultimele clase de liceu au fost ches-tionati asupra intentiilor lor de a-si continua studiile universitare întrei domenii de interes. Rezultatele sunt prezentate în urmatorul tabel:

inginerie stiinta arta Totalbaieti 37 41 44 122fete 35 72 71 178

Total 72 113 115 300Testati ipoteza ca populatiile sunt omogene (adica nu exista lega-

tura între faptul ca elevul este baiat sau fata si tipul de facultate) cuun nivel de încredere de 90%. Concluziile ar fi diferite daca nivelul deîncredere ar fi de 95%?

Etapele procedurii de testare a ipotezelor:Pasul 1. Testam daca cele doua populatii, formate din baieti si

respectiv fete, sunt omogene.Pasul 2. Ipoteza H 0 : preferintele sunt independente de faptul ca

elevul este baiat sau fata si tipul de facultate.Pasul 3. Ipoteza H 1 : preferintele nu sunt independente de faptulca elevul este baiat sau fata si tipul de facultate.

Pasul 4. α = 0.1.

Pasul 5. Statistica folosita este: χ20 =

rPi=1

sP j=1

(oij − E ij)2

E ijPasul 6. r = 2, s = 3, numarul gradelor de libertate este (r − 1)

(s − 1) = 2, χ20.1,2 = 4.60517. Ipoteza va fi respinsa daca χ2

0 > χ20.05,2 =

4.60517. Regiunea critica este (4.60517, ∞).

Page 347: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 347/364

CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 345

<< Statistics‘ContinuousDistributions‘

Quantile[ChiSquareDistribution[2], 0.9]4.60517Pasul 7. Pe baza tabelului calculamn = 300;o11 = 37; o12 = 41; o13 = 44;o21 = 35; o22 = 72; o23 = 71;

u1 = N[122/300]0.406667

u2 = N[178/300]0.593333v1 = N[72/300]0.24v2 = N[113/300]0.376667v3 = N[115/300]0.383333E11 = n u1 v128.28

E12 = n u1 v245.9533E13 = n u1 v346.7667E21 = n u2 v142.72E22 = n u2 v267.0467E23 = n u2 v368.2333

CHI = (o11 - E11)^2/E11 + (o12 - E12) 2/E12 + (o13 - E13) 2/E13+ (o21 - E21)^2/E21 + (o22 - E22)^2/E22 + (o23 - E23)^2/E23

4.60628Pasul 8. Concluzii: deoarece χ2

0 = 4.60628 > χ20.05,2 = 4.60517

rezulta ca nu avem motive sa acceptam ipoteza ca preferintele în ceeace priveste studiile viitoare sunt independente de faptul ca elevul estebaiat sau fata. Deci populatia nu este omogena. Procentul de baieticare intentioneaza sa urmeze anumite facultati este diferit de procentulde fete.

Page 348: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 348/364

346 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE

De exemplu, pentru inginerie, numarul datelor observate la baietieste 37, mai mare decât numarul asteptat, 29, dar pentru fete numaruldatelor observate este 35, mai mic decât cel asteptat care este de 43,daca ipoteza nula ar fi fost adevarata.

Daca nivelul de încredere este de 95%, atunci<< Statistics‘ContinuousDistributions‘Quantile[ChiSquareDistribution[2], 0.95]5.99146Regiunea critica este (5.99145, ∞) si deci nu avem argumente sa

respingem ipoteza nula, deci procentul de elevi care intentioneaza sa

urmeze o anumita facultate este acelasi în ambele situatii.

Dupa un studiu atent al acestui capitol trebuie retinute urma-toarele:

1. modul de luare a deciziilor în testele statistice,2. modul de folosire a testului asupra mediei unei populatii care

urmeaza o distributie normala, utilizarea testului Z sau a testului t,3. modul de folosire a testului asupra dispersiei unei populatii care

urmeaza o distributie normala,

4. modul de folosire a testului asupra proportiei populatii,5. utilizarea P -valorii,6. calculul puterii testului, a erorii de tip II,7. stabilirea unui volum al selectiei corespunzator,8. întelegerea legaturii între intervalele de încredere si testele sta-

tistice,9. utilizarea testului χ2.

Page 349: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 349/364

Bibliografie

[1] Martha L. Abell, James P. Braselton, John A. Rafter - Statisticswith Mathematica, Academic Press, San Diego, 1998

[2] Petru Blaga - Statistica...prin MATHLAB. Presa UniversitaraClujeana, Cluj-Napoca, 2002

[3] Teresa Bradley - Essential Statistics for Economics, Business andManagement, John Willey&Sons, Inc., 2007

[4] Adrian Corduneanu - Matematici speciale, vol. II, Institutul Po-litehnic Iasi, 1979

[5] Mariana Craiu - Statistica matematica, teorie si probleme, MA-TRIX ROM, Bucuresti, 1998

[6] Kai Lai Chung - Elementary Probability Theory with StichasticProcess, Springer Verlag, 1982

[7] Michael J. Evans, Jeff rey S. Rosenthal - Probability and Statis-tics, W. H. Freeman and Company, New York, 2004

[8] Teohari Ganciu, Cristina Tugurlan - Elemente de statistica sifi

abilitate, Editura "Gheorghe Asachi", 2002[9] John J. Kinney - Probability, Willey&Sons, Inc., 1997

[10] Douglas C. Montgomery, George C. Runger - Applied Statis-tics and Probability for Engineers, Fourth Edition, John Wil-ley&Sons, Inc., 2006

[11] Viorel Petrehus, Sever-Angel Popescu - Probabilitati si statistica,Bucuresti, 1997

347

Page 350: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 350/364

348 BIBLIOGRAFIE

[12] Ariadna Lucia Pletea, Liliana Popa - Teoria Probabilitatilor, Uni-versitatea Tehnica "Gheorghe Asachi" din Iasi, 1999

[13] Tatiana Stanasila - Metode statistice pentru ingineri, teoria, exer-citii, aplicatii, MATRIX ROM, Bucuresti, 1998

[14] P. Talpalaru, Gh. Sufaru Matematici speciale (Elemente de teo-ria probabilitatilor si statistica matematica) Institutul PolitehnicIasi, 1979

[15] P. Talpalaru, Liliana Popa, E. Popovici - Probleme de teoria prob-

abilitatilor si statistica matematica), Universitatea Tehnica "Ghe-orghe Asachi" din Iasi, 1995

Page 351: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 351/364

Anexe

Tabele statistice

349

Page 352: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 352/364

350

ANEXA 1. Functia de repartitie normala standard

Φ(x) = P (X ≤ x) =

Z x

−∞

1√ 2π

e−t2/2dt

Φ(−x) + Φ(x) = 1

-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

ΦHxL

-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.0 0.500000 0.503989 0.507978 0.511966 0.515953 0.519939 0.523922 0.527903 00.1 0.539828 0.543795 0.547758 0.551717 0.555670 0.559618 0.563559 0.567495 00.2 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 00.3 0.617911 0.621720 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 00.4 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 00.5 0.691462 0.694974 0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 00.6 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0.748571 00.7 0.758036 0.761148 0.764238 0.767305 0.770350 0.773373 0.776373 0.779350 00.8 0.788145 0.791030 0.793892 0.796731 0.799546 0.802337 0.805105 0.807850 00.9 0.815940 0.818589 0.821214 0.823814 0.826391 0.828944 0.831472 0.833977 01.0 0.841345 0.843752 0.846136 0.848495 0.850830 0.853141 0.855428 0.857690 01.1 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.879000 01.2 0.884930 0.886861 0.888768 0.890651 0.892512 0.894350 0.896165 0.897958 01.3 0.903200 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914657 01.4 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0

Page 353: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 353/364

ANEXE

ANEXA 1. Functia de repartitie normala standard Φ(x) (continuar

x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07

1.5 0.933193 0.934478 0.935745 0.936992 0.938220 0.939429 0.940620 0.941792 01.6 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 01.7 0.955435 0.956367 0.957284 0.958185 0.959070 0.959941 0.960796 0.961636 01.8 0.964070 0.964852 0.965620 0.966375 0.967116 0.967843 0.968557 0.969258 01.9 0.971283 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 02.0 0.977250 0.977784 0.978308 0.978822 0.979325 0.979818 0.980301 0.980774 02.1 0.982136 0.982571 0.982997 0.983414 0.983823 0.984222 0.984614 0.984997 02.2 0.986097 0.986447 0.986791 0.987126 0.987455 0.987776 0.988089 0.988396 02.3 0.989276 0.989556 0.989830 0.990097 0.990358 0.990613 0.990863 0.991106 02.4 0.991802 0.992024 0.992240 0.992451 0.992656 0.992857 0.993053 0.993244 0

2.5 0.993790 0.993963 0.994132 0.994297 0.994457 0.994614 0.994766 0.994915 02.6 0.995339 0.995473 0.995604 0.995731 0.995855 0.995975 0.996093 0.996207 02.7 0.996533 0.996636 0.996736 0.996833 0.996928 0.997020 0.997110 0.997197 02.8 0.997445 0.997523 0.997599 0.997673 0.997744 0.997814 0.997882 0.997948 02.9 0.998134 0.998193 0.998250 0.998305 0.998359 0.998411 0.998462 0.998511 03.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 03.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 03.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 03.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 03.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 03.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 03.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0

3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 03.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 03.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0

Page 354: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 354/364

352

ANEXA 2. Cuantilele tα,n ale distributiei Student

F (tα,n) = P (T ≤ tα,n) =

Z tα,n−∞

f (x)dx = 1− α, F (−tα,n) = α

-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

α

tα,n-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

n,α 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001

1 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.321 318.309 2 0.289 0.816 1.886 2.920 4.303 6.965 9.925 14.089 22.327 3 0.277 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.215 4 0.271 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 5 0.267 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6 0.265 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208 7 0.263 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785 8 0.262 0.706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 9 0.261 0.703 1.383 1.833 2.262 2.821 3.250 3.690 4.297

10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 11 0.260 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025 12 0.259 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930 13 0.259 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 14 0.258 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 15 0.258 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733

Page 355: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 355/364

ANEXE

ANEXA 2. Cuantilele tα,n ale distributiei Student (continuare)

n,α 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0

16 0.258 0.690 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.17 0.257 0.689 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.18 0.257 0.688 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.19 0.257 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.21 0.257 0.686 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.22 0.256 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.23 0.256 0.685 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.24 0.256 0.685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.25 0.256 0.684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.

26 0.256 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.27 0.256 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.28 0.256 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.29 0.256 0.683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.30 0.256 0.683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.35 0.255 0.682 1.306 1.690 2.030 2.438 2.724 2.996 3.340 3.40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.45 0.255 0.680 1.301 1.679 2.014 2.412 2.690 2.952 3.281 3.50 0.255 0.679 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.

100 0.254 0.677 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.150 0.254 0.676 1.287 1.655 1.976 2.352 2.609 2.849 3.146 3.

∞0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.

Page 356: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 356/364

354

ANEXA 3. Cuantilele χ2

α,nale distributiei Hi patrat

F ¡

χ2

α,n

¢= P

¡χ2 ≤ χ2

α,n

¢=

Z χ2α,n

−∞

f (t)dt = 1− α,

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

α

χα,n2

5 10 15 20 25

0.02

0.04

0.06

0.08

0.1

n,α 0.995 0.990 0.975 0.950 0.900 0.500 0.100 0.050 0.025 0.010

1 0.00+ 0.00+ 0.00+ 0.00+ 0.02 0.45 2.71 3.84 5.02 6.63 2 0.01 0.02 0.05 0.10 0.21 1.39 4.61 5.99 7.38 9.21 3 0.07 0.11 0.22 0.35 0.58 2.37 6.25 7.81 9.35 11.34 4 0.21 0.30 0.48 0.71 1.06 3.36 7.78 9.49 11.14 13.28 5 0.41 0.55 0.83 1.15 1.61 4.35 9.24 11.07 12.83 15.09 6 0.68 0.87 1.24 1.64 2.20 5.35 10.64 12.59 14.45 16.81 7 0.99 1.24 1.69 2.17 2.83 6.35 12.02 14.07 16.01 18.48 8 1.34 1.65 2.18 2.73 3.49 7.34 13.36 15.51 17.53 20.09 9 1.73 2.09 2.70 3.33 4.17 8.34 14.68 16.92 19.02 21.67

10 2.16 2.56 3.25 3.94 4.87 9.34 15.99 18.31 20.48 23.21 11 2.60 3.05 3.82 4.57 5.58 10.34 17.28 19.68 21.92 24.72 12 3.07 3.57 4.40 5.23 6.30 11.34 18.55 21.03 23.34 26.22

Page 357: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 357/364

ANEXE

ANEXA 3. Cuantilele χ2

α,nale distributiei Hi patrat (continuare)

n, α 0.995 0.990 0.975 0.950 0.900 0.500 0.100 0.050 0.025 0.010

13 3.57 4.11 5.01 5.89 7.04 12.34 19.81 22.36 24.74 27.6914 4.07 4.66 5.63 6.57 7.79 13.34 21.06 23.68 26.12 29.1415 4.60 5.23 6.26 7.26 8.55 14.34 22.31 25.00 27.49 30.5816 5.14 5.81 6.91 7.96 9.31 15.34 23.54 26.30 28.85 32.0017 5.70 6.41 7.56 8.67 10.09 16.34 24.77 27.59 30.19 33.4118 6.26 7.01 8.23 9.39 10.86 17.34 25.99 28.87 31.53 34.8119 6.84 7.63 8.91 10.12 11.65 18.34 27.20 30.14 32.85 36.1920 7.43 8.26 9.59 10.85 12.44 19.34 28.41 31.41 34.17 37.5721 8.03 8.90 10.28 11.59 13.24 20.34 29.62 32.67 35.48 38.9322 8.64 9.54 10.98 12.34 14.04 21.34 30.81 33.92 36.78 40.29

23 9.26 10.20 11.69 13.09 14.85 22.34 32.01 35.17 38.08 41.6424 9.89 10.86 12.40 13.85 15.66 23.34 33.20 36.42 39.36 42.9825 10.52 11.52 13.12 14.61 16.47 24.34 34.38 37.65 40.65 44.3126 11.16 12.20 13.84 15.38 17.29 25.34 35.56 38.89 41.92 45.6427 11.81 12.88 14.57 16.15 18.11 26.34 36.74 40.11 43.19 46.9628 12.46 13.56 15.31 16.93 18.94 27.34 37.92 41.34 44.46 48.2829 13.12 14.26 16.05 17.71 19.77 28.34 39.09 42.56 45.72 49.5930 13.79 14.95 16.79 18.49 20.60 29.34 40.26 43.77 46.98 50.8940 20.71 22.16 24.43 26.51 29.05 39.34 51.81 55.76 59.34 63.6950 27.99 29.71 32.36 34.76 37.69 49.33 63.17 67.50 71.42 76.1560 35.53 37.48 40.48 43.19 46.46 59.33 74.40 79.08 83.30 88.3870 43.28 45.44 48.76 51.74 55.33 69.33 85.53 90.53 95.02 100.43

80 51.17 53.54 57.15 60.39 64.28 79.33 96.58 101.88 106.63 112.3390 59.20 61.75 65.65 69.13 73.29 89.33 107.57 113.15 118.14 124.12

100 67.33 70.06 74.22 77.93 82.36 99.33 118.50 124.34 129.56 135.81

Page 358: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 358/364

356

ANEXA 4. Cuantilele f α,u,v ale repartitiei Fisher, F (f α,u,v) = R f α,u,v−∞

f (x)dx = 1−

v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 3

1 5.83 7.50 8.20 8.58 8.82 8.98 9.10 9.19 9.26 9.32 9.37 9.41 9.44 9.47 9.49 9.58 9.63 9.

2 2.57 3.00 3.15 3.23 3.28 3.31 3.34 3.35 3.37 3.38 3.39 3.39 3.40 3.41 3.41 3.43 3.44 3.4

3 2.02 2.28 2.36 2.39 2.41 2.42 2.43 2.44 2.44 2.44 2.45 2.45 2.45 2.45 2.46 2.46 2.46 2.4

4 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.0

5 1.69 1.85 1.88 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.88 1.88 1.

6 1.62 1.76 1.78 1.79 1.79 1.78 1.78 1.78 1.77 1.77 1.77 1.77 1.77 1.76 1.76 1.76 1.75 1.

7 1.57 1.70 1.72 1.72 1.71 1.71 1.70 1.70 1.69 1.69 1.69 1.68 1.68 1.68 1.68 1.67 1.67 1.

8 1.54 1.66 1.67 1.66 1.66 1.65 1.64 1.64 1.63 1.63 1.63 1.62 1.62 1.62 1.62 1.61 1.60 1.

9 1.51 1.62 1.63 1.63 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.58 1.58 1.57 1.57 1.56 1.55 1.

10 1.49 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.55 1.54 1.54 1.54 1.53 1.52 1.52 1.

11 1.47 1.58 1.58 1.57 1.56 1.55 1.54 1.53 1.53 1.52 1.52 1.51 1.51 1.51 1.50 1.49 1.49 1.4

12 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51 1.50 1.49 1.49 1.49 1.48 1.48 1.47 1.46 1.4

13 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49 1.48 1.47 1.47 1.47 1.46 1.46 1.45 1.44 1.4

14 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47 1.46 1.46 1.45 1.45 1.44 1.44 1.43 1.42 1.4

15 1.43 1.52 1.52 1.51 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.44 1.43 1.43 1.43 1.41 1.40 1.4

16 1.42 1.51 1.51 1.50 1.48 1.47 1.46 1.45 1.44 1.44 1.43 1.43 1.42 1.42 1.41 1.40 1.39 1.

17 1.42 1.51 1.50 1.49 1.47 1.46 1.45 1.44 1.43 1.43 1.42 1.41 1.41 1.41 1.40 1.39 1.38 1.

18 1.41 1.50 1.49 1.48 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40 1.40 1.40 1.39 1.38 1.37 1.

19 1.41 1.49 1.49 1.47 1.46 1.44 1.43 1.42 1.41 1.41 1.40 1.40 1.39 1.39 1.38 1.37 1.36 1.

20 1.40 1.49 1.48 1.47 1.45 1.44 1.43 1.42 1.41 1.40 1.39 1.39 1.38 1.38 1.37 1.36 1.35 1.

25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.36 1.35 1.35 1.34 1.33 1.31 1.

30 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.33 1.32 1.30 1.29 1.

40 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.31 1.30 1.30 1.28 1.26 1.

60 1.35 1.42 1.41 1.38 1.37 1.35 1.33 1.32 1.31 1.30 1.29 1.29 1.28 1.27 1.27 1.25 1.23 1.

120 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29 1.28 1.27 1.26 1.26 1.25 1.24 1.22 1.20 1.

∞ 1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27 1.25 1.25 1.24 1.23 1.22 1.22 1.19 1.17 1.

Page 359: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 359/364

ANEXE

ANEXA 4. Cuantilele f α,u,v ale repartitiei Fisher, α = 0.10 (continuar

v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25

1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 60.47 60.71 60.90 61.07 61.22 61.74 62.05

2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.42 9.44 9.45

3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.20 5.18 5.17

4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.87 3.84 3.83

5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.24 3.21 3.19

6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.87 2.84 2.81

7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.59 2.57

8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.46 2.42 2.40

9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.30 2.27

10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.24 2.20 2.17

11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.17 2.12 2.10

12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.06 2.03

13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.01 1.98

14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.01 1.96 1.93

15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.92 1.89

16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.94 1.89 1.86

17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.86 1.83

18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.89 1.84 1.80

19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.86 1.81 1.78

20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.79 1.76

25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.84 1.82 1.80 1.79 1.77 1.72 1.68

30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.72 1.67 1.63

40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.66 1.61 1.57

60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.68 1.66 1.64 1.62 1.60 1.54 1.50

120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.63 1.60 1.58 1.56 1.55 1.48 1.44

∞ 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 1.60 1.57 1.55 1.52 1.50 1.49 1.42 1.38

Page 360: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 360/364

358

ANEXA 4. Cuantilele f α,u,v ale repartitiei Fisher, α = 0.05 (continuar

v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25

1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 246.0 248.0 249.3

2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.45 19.46

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.66 8.63

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.80 5.77

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.56 4.52

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.87 3.83

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.44 3.40

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.15 3.11

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.94 2.89

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.77 2.73

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.65 2.60

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.54 2.50

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.46 2.41

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.39 2.34

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.33 2.28

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.28 2.23

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.23 2.18

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.19 2.14

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.16 2.11

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.12 2.07

25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.14 2.11 2.09 2.01 1.96

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.01 1.93 1.88

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.97 1.95 1.92 1.84 1.78

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.89 1.86 1.84 1.75 1.69

120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.87 1.83 1.80 1.78 1.75 1.66 1.60

∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.72 1.69 1.67 1.57 1.51

Page 361: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 361/364

Page 362: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 362/364

Page 363: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 363/364

Index de notiuni

Abatere medie patratica, 49, 98de selectie, 210

Amplitudine, 210Aranjamente, 19Asimetrie, 98

Câmp de evenimente, 6finit, 6

Câmp de probabilitate, 9Coeficient de corelatie, 55, 191

liniara, 217Coeficient de variatie, 210Combinari, 19Convergenta în probabilitate, 99Corelatie, 54, 190Covarianta, 54, 190, 213

Densitate de probabilitate, 96,178

conditionata, 180marginala, 179

Diagrama de împrastiere, 213Dispersie, 48, 98, 181

de selectie, 209marginala, 213

Dreapta de regresie, 214

Esantion, 197aleator, 198reprezentativ, 198

Ecuatii de verosimilitate, 233Eroare

de tip I, 298de tip II, 299

standard, 272Estimatie de verosimilitate ma-xima, 232

Estimator, 221absolut corect, 225corect, 225deplasat, 225nedeplasat, 225

Eveniment, 3cert, 4

compus, 4contrar, 4elementar, 4imposibil, 4sigur, 4

Evenimentecompatibile, 5incompatibile, 5independente, 11

Exces, 98Exemplul lui Bernstein, 12

Formulalui Bayes, 16lui Howe, 278lui Mann-Wald, 325lui Stirling, 64lui Sturges, 202probabilitatii totale, 15

Frecventa

361

Page 364: Carte SPD

7/28/2019 Carte SPD

http://slidepdf.com/reader/full/carte-spd 364/364

362 INDEX DE NO TIUNI

absoluta, 198cumulata crescator, 198

dubla, 212marginala, 212relativa, 198

cumulata crescator, 198Functia

caracteristica, 117de distributie cumulativa, 93de frecventa, 222, 223

de fiabilitate, 128de nesiguranta, 128de reliabilitate, 128de repartitie, 43, 93, 178

empirica, 198de verosimilitate maxima, 231,

235gama, 110generatoare, 59lui Heaviside, 44

scor, 232

Histograma, 199

Inegalitatea lui Cebâsev, 56, 99Interval de

încredere, 251toleranta, 277

Ipoteza statistica, 293

Legea

evenimentelor rare, 74numerelor mari, 100

Legi de probabilitate marginale,175

Masura de probabilitate, 8Matrice de repartitie, 42Mediana, 98, 209Medie, 47, 98, 180

de selectie, 208marginala, 213

Moda, 98, 202Model

probabilistic, 219statistic, 220

Modul, 209Moment

centrat, 48, 98initial, 48, 98

Nivel de încredere, 251

P-valoare, 301Pas de histograma, 202Permutari, 18Poligonul frecventelor, 207Populatie statistica, 197Principiul multiplicarii, 18Proba, 3Probabilitate, 8

conditionata, 10, 174marginala, 174

Proprietatea de pierdere a me-moriei, 107

Putere a testului, 302

Rata de defectare, 128Regiune critica, 295Regula celor trei sigma, 115Repartitia selectiei, 220

Repartitiebinomiala, 62binomiala cu exponent ne-

gativ, 66exponentiala, 105gama, 110geometrica, 69hi patrat, 121hipergeometrica, 71