Statistica matematica UTCB

115
2. STATISTICĂ MATEMATICĂ 2.1. Teoria selecţiei Definiţie 2.1.1. Numim colectivitate sau populaţie o mulţime C de elemente care este cercetată din punct de vedere a uneia sau mai multor caracteristici (proprietăţi), elementele colectivităţii fiind numite indivizi, iar numărul indivizilor unei colectivităţi se va numi volumul colectivităţii. Observaţie 2.1.2. 1) Problema esenţială a statisticii matematice este de a stabilii legea de probabilitate pe care o urmează caracteristica X. 2) Caracteristicile sunt de tip discret şi de tip continuu. Definiţie 2.1.3. Numim selecţie (sondaj) o subcolectivitate a colectivităţii cercetate C, iar numărul elementelor selecţiei poartă numele de volumul selecţiei (sondajului).

description

Mathematic Statistics

Transcript of Statistica matematica UTCB

2

142Elemente de teoria probabilitilor i statistic matematic

143Statistic matematic

2. STATISTIC MATEMATIC

2.1. Teoria selecieiDefiniie 2.1.1. Numim colectivitate sau populaie o mulime C de elemente care este cercetat din punct de vedere a uneia sau mai multor caracteristici (proprieti), elementele colectivitii fiind numite indivizi, iar numrul indivizilor unei colectiviti se va numi volumul colectivitii.Observaie 2.1.2.1) Problema esenial a statisticii matematice este de a stabilii legea de probabilitate pe care o urmeaz caracteristica X. 2) Caracteristicile sunt de tip discret i de tip continuu. Definiie 2.1.3. Numim selecie (sondaj) o subcolectivitate a colectivitii cercetate C, iar numrul elementelor seleciei poart numele de volumul seleciei (sondajului).Definiie 2.1.4. O selecie se numete repetat sau bernoullian dac dup examinarea individului acesta se reintroduce n colectivitate, n caz contrar selecia este nerepetat.Observaie 2.1.5. Dac volumul colectivitii C este mult mai mare dect volumul seleciei atunci selecia nerepetat poate fi considerat ca fiind selecie repetat. n continuare considerm numai selecii repetate.Definiie 2.1.6. Numim date de selecie relative la caracteristica X valorile obinute pentru indivizii care intr n selecie privind caracteristica X. Dac selecia este de volum n vom nota datele de selecie prin x1, x2,,xn.Definiie 2.1.7. Datele de selecie x1, x2,,xn sunt valorile unor variabile aleatoare, respectiv X1, X2,,Xn care se vor numi variabile de selecie.Observaie 2.1.8.1) Dac selecia este repetat atunci X1, X2,,Xn sunt independente i identic repartizate cu X (urmeaz aceeai lege de probabilitate ca X).

2) Dac datele de selecie x1, x2,,xn au valorile distincte x'1, x'2,,x'N atunci , unde fi = frecvena apariiei valorii x'i, se va numi distribuia empiric de selecie a lui X.

3) Dac X este de tip continuu se obinuiete s se fac o grupare a datelor de selecie n clase astfel: , , fi este frecvena datelor de selecie din intervalul , n = volumul seleciei.Aceast grupare se face chiar i pentru cazul cnd X este de tip discret.

Definiie 2.1.9. Dac avem funcia numim funcie de selecie sau statistic, variabila aleatoare iar valoarea numeric o numim valoarea funciei de selecie.

Definiie 2.1.10. Numim medie de selecie funcia de selecie definit prin iar valoarea numeric o numim valoarea mediei de selecie.Observaie 2.1.11.

1) Dac X urmeaz legea normal atunci media de selecie urmeaz legea normal .Demonstraie:

Avem ca variabile de selecie X1, X2, ..., Xn urmeaz i ele legea normal . Funcia caracteristic a variabilei Xk este de forma

i obinem

adic urmeaz legea normal .

2) Dac X urmeaz legea normal atunci statistica urmeaz legea normal N(0,1).Demonstraie:

Statistica

Conform observaiei 1, dac se consider caracteristica X care urmeaz legea normal , atunci media de selecie urmeaz legea normal.

adic Z urmeaz legea N(0,1).

3) Dac X1, X2 independente urmeaz legea normal atunci statistica

urmeaz legea normal N(0,1).Demonstraie:

Funciile caracteristice ale mediilor de selecie i sunt respectiv i i fiind independente rezult unde , iar

Avem succesiv

adic Z urmeaz legea N(0,1).

Definiie 2.1.12. Numim moment de selecie de ordin k funcia de selecie , iar valoarea numeric o numim valoarea momentului de selecie de ordin k.

Definiie 2.1.13. Numim moment centrat de selecie de ordin k funcia de selecie iar o numim valoarea momentului centrat de selecie de ordin k.Observaie 2.1.14.

1) Dac X urmeaz legea normal atunci:

statistica urmeaz legea Student cu n-1 grade de libertate.

statistica urmeaz legea cu n-1 grade de libertate

2) Funcia de selecie se numete dispersia de selecie; atunci statisticile din observaia anterioar devin: i .

3) Momentul centrat de selecie de ordin k, pentru n mare, urmeaz legea normal

Definiie 2.1.15. Numim funcie de repartiie de selecie funcia de selecie definit prin , unde este numrul valorilor variabilelor de selecie mai mici dect x.

Teorema lui Glivenko 2.1.16. Dac se consider caracteristica X ce are funcia de repartiie teoretic F i fie funcia de repartiie de selecie , atunci P(.

Teorema lui Kolmogorov 2.1.16. Fie caracteristica X de tip continuu, care are funcia de repartiie teoretic F i fie funcia de repartiie de selecie , iar , atunci

Observaie 2.1.17. Funcia K(x) se numete funcia lui Kolmogorov i are valorile tabelate.Exemplul 2.1.18. Se consider un eantion de 20 de clieni, care intr ntr-un magazin alimentar, pentru a cerceta frecvena X cu care clienii fac apel la serviciile magazinului de-a lungul unei sptmni i respectiv pentru cercetarea cheltuielilor lunare Y n mii lei ale clienilor, pentru procurarea de bunuri alimentare. S-au obinut urmtoarele date de selecie pentru X i respectiv Y.X: 1,2,1,4,3,2,5,6,1,2,3,2,3,4,6,2,4,3,1,2;Y: 9,90,101,88,85,77,102,100,86,97,76,121,113,110,96,9,2,108,112,103,109.Se cere:a) distribuiile empirice de selecie pentru fiecare din caracteristicile X i Y;b) mediile de selecie, momentele centrate de selecie de ordinul al doilea i dispersiile de selecie pentru caracteristicile X i Y;c) funciile de repartiie de selecie pentru X i Y.Rezolvare:a) Se observ c datele de selecie pentru caracteristica X au N = 6 valori distincte, deci distribuia empiric de selecie pentru X este:

X: . Pentru caracteristica Y toate datele de selecie sunt distincte. Vom face o grupare a datelor de selecie corespunztoare caracteristicii Y. Anume, prima clas cuprinde valorile datelor de selecie n intervalul [70,80), a doua clas cuprinde valorile din intervalul [80,90) etc. Dup efectuarea acestei grupri, distribuia empiric de selecie a lui Y devine:

Y: .b) Mediile de selecie pentru cele dou caracteristici sunt:

Valorile momentelor centrate de selecie de ordinul doi pentru cele dou caracteristici sunt respectiv:

Valorile dispersiilor de selecie se calculeaz imediat, dac se cunosc momentele centrate de selecie de ordinul doi.

.

.

Astfel, se poate obine i respectiv .c) Funciile de repartiie de selecie pentru cele dou caracteristici sunt respectiv:

2.2. Teoria estimaiei

Se consider caracteristica X care urmeaz legea de probabilitate dat prin funcia de probabilitate f(x;), parametru necunoscut, unde f este funcia densitate de probabilitate dac X este de tip continuu, respectiv funcia de frecven dac este de tip discret.

Teoria estimaiei are ca scop evaluarea parametrilor de care depinde legea de probabilitate a lui X, folosind datele de selecie i bazndu-ne pe rezultatele teoretice relative la variabilele de selecie .

Definiie 2.2.1. Se numete funcie de estimaie (punctual) sau estimator al parametrului funcia de selecie (statistica) cu ajutorul creia se trag concluzii relative la .

Definiie 2.2.2. Spunem c funcia de estimaie este estimator consistent dac , adic

, iar valoarea numeric se numete estimaie consistent pentru .

Definiie 2.2.3. Spunem c funcia de estimaie este estimator absolut corect pentru dac i cnd n, iar valoarea numeric se numete estimaie absolut corect pentru .

Definiie 2.2.4. Spunem c funcia de estimaie este estimator corect pentru dac i , iar valoarea numeric se numete estimaie corect pentru .

Definiie 2.2.5. Se numete distorsiunea (deplasarea) estimatorului diferena M(, iar dac distorsiunea este nul, estimatorul se numete nedeplasat.

Propoziie 2.2.6. Dac este un estimator absolut corect pentru , atunci estimatorul este consistent.Demonstraie:

Din ipotez avem c i folosind inegalitatea lui Cebev pentru * obinem , pentru orice > 0.

Deoarece din inegalitatea lui Cebev se obine , pentru orice > 0, deci * este un estimator consistent pentru parametrul .Observaie 2.2.7.

1) Se arat c momentul de selecie de ordin k este estimator absolut corect pentru momentul teoretic Demonstraie: ntr-adevr

,respectiv

,

cnd n se obine c este estimator absolut corect pentru .

2) Momentul centrat de selecie de ordin doi este estimator corect pentru momentul centrat teoretic de ordin doi , adic pentru dispersia teoretic;Demonstraie:Avem succesiv

cndn , respectiv

cnd n i rezult c este un estimator corect pentru .

3) Dispersia de selecie este estimator absolut corect pentru dispersia teoretic .Demonstraie:

Folosind relaia se obine

, respectiv

, cnd n i deci este un estimator absolut corect pentru dispersia teoretic.

Definiie 2.2.8. Numim cantitate de informaie relativ la parametrul expresia:

I(.

Observaie 2.2.9. Se arat c estimatorul absolut corect al lui verific inegalitatea Rao-Cramer .

Definiie 2.2.10. Estimatorul absolut corect pentru parametrul se numete eficient dac , iar raportul se numete eficiena estimatorului .

Aplicaie 2.2.11. S se arate c media de selecie constituie un estimator absolut corect i eficient al parametrului din repartiia Poisson.Rezolvare:

innd seama c variabila aleatoare X are repartiia Poisson cu avem:

cnd n i deci media de selecie este un estimator absolut corect al lui .Pentru determinarea cantitii de informaie avem:

,

iar

Rezult cantitatea de informaie

ntruct egalitatea este verificat rezult c este un estimator eficient al lui .Exemplul 2.2.12. La un control de calitate se verific diametrul pieselor prelucrate de un strung. Pentru a se realiza acest control s-a efectuat o selecie de 18 piese i s-a obinut c diametrul X al pieselor are urmtoarele dimensiuni (n cm):Diametru3,98 3,99 4,00 4,01 4,02

Nr. Piese4 3 5 3 3

S se determine:a) o estimaie absolut corect pentru diametrul mediu al pieselor realizate;b) o estimaie corect i una absolut corect pentru dispersia diametrelor fa de diametrul mediu.Rezolvare: a) Distribuia empiric de selecie a caracteristicii X este:

X: .

Diametrul mediu este media teoretic M(X)=m. Dar se cunoate c un estimator absolut corect pentru media teoretic m este media de selecie

Prin urmare, valoarea mediei de selecie este o estimaie absolut corect pentru media teoretic m. Se obine:

= 3,9989.

b) Deoarece un estimator corect al dispersiei teoretice este momentul centrat de selecie de ordinul doi , rezult c o estimaie corect pentru dispersia teoretic este valoarea momentului centrat de selecie de ordinul doi, adic:

.O estimaie absolut corect pentru dispersia teoretic este:

.

Exemplul 2.2.13. Fie caracteristica X ce urmeaz legea normal N(m,), unde meste cunoscut, iar este necunoscut. Se consider o selecie repetat de volum n. S se arate c funcia de selecie V= este o funcie de estimaie absolut corect pentru parametrul .Rezolvare:

Artm c M(V)= i . Avem

. Deoarece X urmeaz legea normal N(m,), avem c

dac s-a fcut schimbarea de variabil

.

Prin urmare, avem M(V) = , deci prima condiie este satisfcut.Pentru verificarea celei de-a doua condiii, scriem succesiv:

Metoda verosimilitii maxime 2.2.14.

Considerm caracteristica X supus cercetrii ca avnd funcia de probabilitate f(x; . Variabilele de selecie sunt independente i identic repartizate, rezult c vectorul aleator () va avea funcia de probabilitate

i care se numete funcie de verosimilitate.

Spunem c estimatorii sunt de verosimilitate maxim pentru dac realizeaz maximul funciei de verosimilitate.

Determinarea estimatorilor de verosimilitate maxim se va face rezolvnd sistemul , care de regul se nlocuiete cu numit sistem de verosimilitate maxim.Observaie 2.2.15.1) Se arat c un estimator eficient este un estimator de verosimilitate maxim.

2) Un estimator de verosimilitate maxim este estimator consistent, iar pentru valori mari ale lui n este o variabil aleatoare ce urmeaz legea normal N(, unde este parametrul estimat.

Exemplul 2.2.16. S se determine estimatorii de verosimilitate maxim pentru valoarea medie i abaterea standard dac se consider caracteristica X, care urmeaz legea normal N(m,).Rezolvare:

M(X) = m i , f(x; m,. Pentru a scrie sistemul de verosimilitate maxim avem:

ln f(x; m,) = - ln , de unde

, iar .Se obine:

.

sau: .Exemplul 2.2.17. Se consider caracteristica X ce urmeaz legea binomial, adic are distribuia teoretic:

X, unde P(m,k) = cu parametrul

p necunoscut. Folosind o selecie de volum n, se cere:

a) estimatorul de verosimilitate maxim pentru p;

b) s se arate c estimatorul este un estimator absolut corect pentru parametrul p;

c) s se arate c estimatorul este un estimator eficient pentru parametrul p.Rezolvare:a) Funcia de probabilitate pentru caracteristica X este

f(x; p) = . Pentru a scrie ecuaia de verosimilitate maxim , avem c

ln f(x; p) = ln , de unde

. Aadar ecuaia verosimilitii maxime este:

, adic , unde .

Ecuaia verosimilitii maxime se mai scrie , de unde se obine estimatorul de verosimilitate maxim pentru parametrul p.Pentru aceasta avem, n primul rnd, c:

, iar apoi pentru dispersie se poate scrie succesiv: .

Prin urmare, s-a obinut M() = p i , deci estimatorul este estimator absolut corect pentru parametrul p.c) Cantitatea de informaie relativ la parametrul p se poate calcula dup cum urmeaz:

.

Pe de alt parte, am vzut c deci estimatorul este estimator eficient pentru parametrul p.Metoda momentelor 2.2.18.Fie caracteristica X care are funcia de probabilitate

f(x; ). Aceast metod de estimare a parametrilor const n determinarea parametrilor , i = din condiiile c momentele iniiale teoretice ale lui X au ca estimatori absolut coreci momentele de selecie de ordin corespondent. Astfel se obine sistemul de ecuaii , k = din care se obin estimaii pentru parametrii .

Exemplul 2.2.19. Se consider caracteristica X, care urmeaz legea gamma de parametrii a>b>0 necunoscui. Vom estima aceti parametri, folosind metoda momentelor, pe baza datelor de selecie.Funcia densitate de probabilitate a caracteristicii X este:

, unde este funcia lui Euler de

spea a doua, adic .

n cazul de fa este vorba de doi parametri, deci sistemul de ecuaii este format din dou ecuaii, anume i .

Vom calcula momentul teoretic iniial de ordin k:

Rezult sistemul:

care are soluia , care reprezint estimatorii pentru parametrii a i b.Metoda intervalelor de ncredere 2.2.20.

Fie caracteristica X care are funcia de probabilitate f(x;, unde este parametrul necunoscut. Metoda const n determinarea a dou funcii de selecie astfel nct P() = 1-, unde nu depinde de i poart numele de probabilitate de risc, iar 1- se numete probabilitate de ncredere. Intervalul aleator (poart numele de interval de ncredere pentru parametrul .

De regul, pentru a construi un interval de ncredere pentru parametrul se caut determinarea unei statistici a crei lege de probabilitate s fie cunoscut i s nu depind de . Se determin apoi un interval numeric ( astfel nct P() = 1-. Din se exprim inegalitatea i de aici intervalul aleator ( este determinat. Intervalul este cu att mai bun cu ct are lungimea mai mic i cu ct 1- este mai mare.

Aplicaii 2.2.21.1. Interval de ncredere pentru valoarea medie teoretic dac dispersia teoretic este cunoscut.

Se consider caracteristica X care urmeaz legea normal N(m,) cu m necunoscut i cunoscut. Vom determina un interval de ncredere pentru m cu o probabilitate de ncredere 1- dat i cunoscnd datele de selecie , respectiv variabilele de selecie corespunztoare.

Considerm statistica , unde , care urmeaz legea normal N(0,1) ce nu depinde de parametrul necunoscut m. Deci putem determina intervalul ( astfel nct P(= 1- adic , este funcia lui Laplace i care are valorile tabelate. Intervalul are lungime minim cnd este simetric fa de origine adic . Rezult c i folosind tabelele de valori pentru funcia Laplace gsim .

Am obinut P( adic

P(= 1-. Deci intervalul de ncredere pentru media teoretic m este (, unde i

, iar .

Observaie 2.2.22. Cnd X nu urmeaz legea normal, dar volumul seleciei este mare (n>30) i se cunoate atunci statistica = , unde m=M(X) necunoscut, este aproximativ repartizat normal N(0,1). Deci se poate considera pentru m acelai interval de ncredere obinut mai sus.2. Interval de ncredere pentru valoarea medie teoretic dac dispersia teoretic este necunoscut.

Fie caracteristica X ce urmeaz legea normal N(m, cu m=M(X) parametru necunoscut i necunoscut. Considerm statistica , unde i care urmeaz legea Student cu n-1 grade de libertate. Determinm intervalul () cu P(= 1-, adic , unde este funcia de repartiie a legii Student cu n grade de libertate i care are valorile tabelate, iar . Deci se determin astfel nct , apoi putem scrie sau

. Adic, intervalul de ncredere pentru m este unde i .3. Intervalul de ncredere pentru diferena mediilor a dou populaii

Fie dou populaii i la care se analizeaz aceeai caracteristic i care pentru este ce urmeaz legea normal N(, iar pentru este ce urmeaz legea normal N. Vom determina un interval de ncredere pentru diferena mediilor cu probabilitatea de ncredere 1- folosind datele de selecie relativ la caracteristica , respectiv relativ la caracteristica .

a) Presupunem abaterile standard (cunoscute. Statistica , unde urmeaz legea normal N(0,1). Se determin intervalul ( astfel nct P(= 1- la fel ca n aplicaia 1.

Deci: sau

adic intervalul de ncredere pentru este (A,B) unde

A = ( i B = .

b) Presupunem abaterile standard necunoscute. Considerm statistica , unde i sunt mediile de selecie definite anterior, iar i dispersiile de selecie i , care urmeaz legea Student cu n = grade de libertate. La fel ca n aplicaia 2. se determin intervalul astfel nct adic .

Rezult intervalul de ncredere (A,B) pentru unde

A = i cu

.4. Intervalul de ncredere pentru dispersia teoretic

Fie caracteristica X ce urmeaz legea normal N(m,). Considerm statistica unde , iar , ce urmeaz legea cu n-1 grade de libertate. Pentru probabilitatea de ncredere 1- se poate determina intervalul (, astfel nct

.

se determin din relaia i

se determin din relaia , unde este funcia de repartiie a legii cu n grade de libertate care are valorile tabelate.

Deci sau

, adic s-a obinut intervalul de ncredere ( pentru , unde i , iar intervalul de ncredere pentru abaterea standard este .

Exemplul 2.2.23. Relativ la populaia se cerceteaz caracteristica X privind media teoretic M(X) = m. tiind c dispersia teoretic a caracteristicii X este , s se stabileasc un interval de ncredere pentru media teoretic m cu probabilitatea de ncredere 1- = 0,95, utiliznd distribuia empiric de selecie:

X: .Rezolvare: Folosind aplicaia 1., intervalul de ncredere pentru media teoretic

m este , unde i ; se determin astfel nct , folosind tabelele cu valorile funciei Laplace, .

Rezult , , adic .Exemplul 2.2.24. Pentru recepionarea unei mrfi ambalat n cutii, se efectueaz un control, prin sondaj, privind greutatea X a unei cutii. Pentru 22 cutii cntrite s-a obinut distribuia empiric de selecie, relativ la caracteristica X:

.

Folosind probabilitatea de ncredere 0,98, s se determine un interval de ncredere pentru valoarea medie a greutii cutiilor, presupunnd c X urmeaz legea normal .Rezolvare:

Deoarece abaterea standard este necunoscut, conform aplicaiei 2. intervalul de ncredere pentru m este (m1,m2) unde i . Pentru n-1=21 i din tabelul cu valorile funciei de repartiie a legii Student se determin .Folosind distribuia empiric de selecie se obine:

iar

Obinem: ; adic .

Exemplul 2.2.25. Masa de carne ambalat n produse de 1000 grame de mainile M1 i M2 este o caracteristic X1, ce urmeaz legea normal i respectiv o caracteristic X2 ce urmeaz legea normal . Cntrind 100 de pachete din cele produse de maina M1 s-a obinut valoarea medie de seleciegrame,iar din cntrirea a 150 pachete de la maina M2 s-a obinut grame.

Folosind probabilitatea de ncredere 0,98, s se determine intervalul de ncredere pentru diferena m1-m2 , dac se tie c abaterile standard sunt i .Rezolvare: Conform aplicaiei 3. a) intervalul de ncredere pentru m1-m2 este (A,B) unde

i iar

se determin a.. .

Folosind tabelul cu valorile funciei lui Laplace obinem .

Deci :

Exemplul 2.2.26. Fie caracteristica X1 ce urmeaz legea normal N(m,) i care reprezint vnzrile n milioane lei pe sptmn la magazinele alimentare n oraul A i X2 vnzrile n milioane lei la magazinele alimentare din oraul B i care urmeaz legea normal N(m2,). S-au efectuat dou sondaje, respectiv pentru X1 i X2 i s-au obinut urmtoarele date de selecie:X1: 226,5;224,1;218,6;220,1;228,8;229,6;222,5.X2: 221,5;230,2;223,4;224,3;230,8;223,8.

Cu probabilitatea de ncredere 0,95 s se construiasc un interval de ncredere pentru diferena m1-m2, dac este necunoscut.Rezolvare:

Conform aplicaiei 3. b) intervalul de ncredere pentru m1-m2 este (A,B) unde i dac iar se determin a.. .

Pentru i n=1 obinem .Calculm:

Exemplul 2.2.27. Fie caracteristica X ce reprezint timpul de producere a unei reacii chimice, msurat n secunde. Dac X urmeaz legea normal i avnd o selecie repetat de volum n=11, cu datele de selecie: 4,21;4,03;3,99;4,05;3,89;3,98;4,01;3,92;4,23;3,85;4,20. S se determine intervalul de ncredere pentru dispersia i pentru abaterea standard , cu probabilitatea de ncredere 0,95.Rezolvare:

Conform aplicaiei 4. intervalul de ncredere pentru este unde i iar i se determin folosind tabelele de valori pentru funcia de repartiie a legii cu n-1 grade de libertate.

Avem: i

Rezult: i

i .

2.3. Verificarea ipotezelor statisticeDefiniie 2.3.1. Numim ipotez statistic o presupunere relativ la o caracteristic X a unei populaii C, fie privind legea de probabilitate a lui X, fie privind parametrii de care depinde aceast lege.Metoda prin care o ipotez statistic ce trebuie verificat se accept sau se respinge, poart numele de test (criteriu) statistic.Observaie 2.3.2.1) Dac testul statistic se refer la parametrii de care depinde legea de probabilitate a lui X spunem c avem un test parametric.

2) Dac testul statistic se refer la natura legii de probabilitate atunci spunem c avem un test de concordan . Considernd caracteristica X cu legea de probabilitate parametru necunoscut, ipoteza principal ce se face asupra lui o numim ipotez nul i o notm , iar orice alt ipotez ce se face relativ la parametrul o numim ipotez admisibil i o notm .Observaie 2.3.3.

1) n continuare, relativ la parametrul , vom considera doar dou ipoteze: ipoteza nul , i o ipotez alternativ .

2) Verificarea ipotezei nule n ipoteza alternativ pentru o probabilitate de risc se face determinnd o regiune U numit regiune critic a.. P(X1,X2,,Xn) U. Din modul cum construim aceast regiune critic U obinem diferite teste de verificare a ipotezei statistice H0.

3) Probabilitatea de risc se mai numete i nivel de semnificaie a testului.

Definiie 2.3.4. Numim eroare de genul I respingerea unei ipoteze adevrate, iar probabilitatea de producere a acestei erori este U i poart numele de riscul furnizorului.Definiie 2.3.5. Numim eroare de genul II admiterea unei ipoteze false, iar probabilitatea de producere a acestei erori este

U i poart numele de riscul beneficiarului.

Definiie 2.3.6. Se numete puterea testului probabilitatea de respingere a unei ipoteze false, adic U unde sau .Observaie 2.3.7. Nu exist o metod general de construire a regiunii critice U, care ne duce la testul de verificare a ipotezei nule H0, dar se cunosc clase de probleme pentru care s-au construit astfel de regiuni critice i corespunztor lor avem teste de verificare a ipotezelor statistice.Testul Z 2.3.8.

Fie caracteristica X ce urmeaz legea normal cu necunoscut i cunoscut. Vrem s verificm ipoteza nul H0:m=m0 n

ipoteza alternativ cu probabilitatea de risc i datele de selecie x1, x2, xn.

Considerm statistica ce urmeaz legea

normal N(0,1). Deci pentru dat putem determina intervalul

a.. .

Se definete regiunea critic U prin:

U.

Astfel am obinut:

Folosind regiunea critic U vom respinge ipoteza nul H0 dac (x1, x2,,xn) U adic i o admitem dac U adic .Observaie 2.3.9. 1) Deoarece regiunea critic U corespunde complementarei

intervalului de ncredere pentru statistica Z n continuare nu vom pune n eviden de fiecare dat regiunea critic U ci numai intervalul de ncredere pentru statistica utilizat.2) Testul Z se poate folosi i pentru o caracteristic X ce nu urmeaz legea normal atunci cnd volumul seleciei este mare (n>30).

3) Deoarece ipoteza alternativ este testul Z se numete testul Z bilateral. Dac se consider H1:m30 i este cunoscut, folosim testul Z pentru verificarea ipotezei nule H0:m=16 cu alternativa

Pentru =0,01 folosind testul se determin a.. . Se obine z0,995=2,58, care ne d intervalul numeric pentru statistica . Calculm

.

Deoarece z = - 0,422 ipoteza se accept.Testul T(Student) 2.3.11.

Fie caracteristica X ce urmeaz legea normal N(m,) cu i necunoscui. Relativ la media teoretic m=M(X) facem ipoteza nul H0:m=m0 cu ipoteza alternativ ; probabilitatea de risc fiind iar variabilele de selecie x1,x2,,xn.

Pentru verificarea ipotezei nule considerm statistica ce urmeaz legea Student cu n-1 grade de libertate. Deci se determin intervalul numeric a.. , iar complementara acestui interval ne definete regiunea critic U. Etapele aplicrii testului T:

1) Se consider

2) Se determin a..

3) Se calculeaz

4) Dac ipoteza m=m0 este admis, altfel este respins.

Observaie 2.3.12. Deoarece ipoteza alternativ H1:este testul T prezentat se numete testul T bilateral, exist i teste unilaterale.Exemplul 2.3.13. Caracteristica X reprezint gradul de ocupare zilnic a unei uniti hoteliere (n procente). S se verifice, cu nivelul de semnificaie =0,05, ipoteza c media de ocupare zilnic a hotelului este dat prin m=80%, dac dintr-o selecie efectuat n 15 zile ale anului s-au obinut urmtoarele date de selecie (n procente): 60,85,90,75,84,78,92,56,77,82,65,79,83,65,76.Rezolvare:

Putem considera c X urmeaz legea normal cu m i necunoscui. Ipoteza nul ce se face este H0:m=80, cu alternativa .

Deoarece este necunoscut, folosind testul T, cu =0,05 i tabelele

de valori se determin a.. . Se obine t14;0,975 =2,145. Prin urmare intervalul numeric pentru statistica este (-2,145;2,145).

Calculm

ntruct -1,291, ipoteza ca media de ocupare zilnic a unitii hoteliere este de 80% se accept.Teste pentru compararea a dou medii 2.3.14.

Fie dou populaii C2 i C2 cercetate din punct de vedere al aceleiai caracteristici anume X1 pentru C1 care urmeaz legea normal i C2 care urmeaz , C1 i C2 fiind independente.

Vrem s verificm ipoteza nul H0:m1=m2 n ipoteza alternativ cu probabilitatea de risc i seleciile de volum n1 i n2 din cele dou populaii.

a) Testul Z (dac sunt cunoscute)

Considerm statistica care urmeaz legea normal N(0,1).

Pentru dat se determin intervalul numeric,astfel nct

.Etapele aplicrii testului:

1) Se consider

2) Se determin a..

3) Se calculeaz

4) Dac ipoteza este admis, altfel este respins.

b) Testul T (dac necunoscute)

Considerm statistica care urmeaz legea Student cu grade de libertate.

Pentru statistica T se determin intervalul numeric a.. Etapele aplicrii testului:

1) Se consider .

2) Se determin a..

3) Se calculeaz

4) Dac atunci ipoteza este admis, altfel este respins.

c) Testul T (dac necunoscute)

Considerm statistica care urmeaz legea Student cu n grade de libertate, n este dat de

.

Pentru statistica T se determin intervalul numeric a.. .Etapele aplicrii testului:

1) Se consider

2) Se determin a.. unde

;

3) Se calculeaz

4) Dac atunci ipoteza este admis, altfel este respinsExemplul 2.3.15. La o unitate de mbuteliere a laptelui exist dou maini care efectueaz aceast operaie n sticle de 1l. Pentru a cerceta reglajul de mbuteliere la cele dou maini s-au efectuat dou selecii relative la sticlele mbuteliate n cele dou maini i s-au obinut datele de selecie:

990 995 1000 1005 1010

985 990 995 1000 1005 1010

7 9 11 8 5

5 5 6 7 6 4

Folosind nivelul de semnificaie , s se verifice dac mediile de umplere a sticlelor de ctre cele dou maini sunt aceleai, n cazul n care abaterile standard sunt ml i ml.Rezolvare: Caracteristicile X1 i X2 ce reprezint cantitatea de lapte (n ml) coninut de o sticl mbuteliat de prima main, se consider ca urmnd legile de probabilitate normale N(m1, 6) i N(m2; 7,5).

Verificarea ipotezei nule N0:m1=m2 cu alternativa , se va face cu testul Z.

Folosind nivelul de semnificaie se determin din tabele valoarea a.. . Se obine , care ne d intervalul (-2,58; 2,58) pentru statistica

.

Calculm:

Deoarece , rezult c mediile de umplere a sticlelor nu difer semnificativ pentru cele dou maini.Exemplul 2.3.16. Se cerceteaz dou loturi de ulei pentru automobile, din punct de vedere al vscozitii, obinndu-se datele de selecie:

10,27 10,28 10,29 10,30 10,32

10,26 10,27 10,29 10,30 10,31

3 2 1 1 1

3 2 1 1 1

Analizele fcndu-se cu acelai aparat, se consider c abaterile standard sunt aceleai. Considernd nivelul de semnificaie ; s se verifice dac mediile de vscozitate pentru cele dou laturi nu difer semnificativ.Rezolvare:

Caracteristicile X1 i X2, ce reprezint vscozitile pentru cele dou loturi de ulei, se consider c urmeaz fiecare legea normal, respectiv i , cu abaterea standard necunoscut.

Verificarea ipotezei nule cu alternativa , se va face cu testul T, deoarece abaterea standard este necunoscut. Folosind nivelul de semnificaie , se determin folosind tabelele, valoarea , a.. , unde n=n1+n2-2. Adic se obine intervalul pentru statistica care urmeaz legea Student cu n grade de libertate.Calculm:

Deoarece , rezult c vscozitile medii ale celor dou loturi de ulei nu difer semnificativ.

Testul privind dispersia 2.3.17.

Fie caracteristica X ce urmeaz legea normal N(m,) cu parametri i necunoscui. Vrem s verificm ipoteza nul n raport cu ipoteza alternativ cunoscnd probabilitatea de risc i o selecie de volum n.

Considerm caracteristica care urmeaz legea cu n-1 grade de libertate, i se determin pentru aceasta intervalul numeric Etapele aplicrii testului:

1) Se consider .

2) Se determin i

.

3) Se calculeaz

4) Dac atunci ipoteza este admis, altfel este respins.

Exemplul 2.3.18. Se efectueaz o selecie repetat de volum n=12 relativ la caracteristica X ce urmeaz legea normal , obinndu-se distribuia empiric de selecie

.

S se verifice, cu nivelul de semnificaie , ipoteza nul , cu alternativa Rezolvare:

Se utilizeaz testul . La nivelul de semnificaie ; se determin intervalul , pentru statistica , care urmeaz legea cu n-1 grade de libertate; folosind tabelele de valori din i

Deci, intervalul pentru statistica este (3,82;21,9).

Calculm

;

Deoarece , ipoteza nul fcut relativ la dispersia teoretic este acceptat.Testul F (Sndcor - Fischer) 2.3.19.

Fie dou populaii C1 i C2 referitor la care ne intereseaz caracteristicile: X1 ce urmeaz i X2 ce urmeaz . Cu probabilitatea de risc vrem s verificm ipoteza nul n raport cu ipoteza alternativ , considernd cte o selecie din fiecare populaie, respectiv de volum n1 i n2.

Statistica urmeaz legea Sndcor - Fischer cu i grade de libertate, iar intervalul numeric pentru aceast statistic se determin a.. . Extremitile intervalului se determin din relaiile i , dac este funcia de repartiie a legii "Fs" i are valorile tabelate.

Are loc relaia i de aceea tabelele pentru sunt ntocmite numai pentru valori mari ale lui i pentru F>1. Dac F