L1 Teste Statistice

17
Lucrarea 1 – Prelucrarea statistică a datelor experimentale LUCRAREA 1 PRELUCRAREA STATISTICĂ A DATELOR EXPERIMENTALE 1. Obiectivele lucrării Însuşirea unor noţiuni referitoare la: principalele tipuri de prelucrări statistice efectuate asupra eşantioanelor de valori provenite din măsurări experimentale sau din operaţii de achiziţie de date, domeniil de aplicabilitate ale respectivelor prelucrări, algoritmii şi modurile de lucru corespunzătoare. Aplicarea testelor statistice prezentate în lucrare asupra unui eşantion de date experimentale şi enunţarea concluziilor corespunzătoare. 2. Noţiuni teoretice În situaţiile în care se urmăreşte determinarea valorii unei variabile dintr-un anumit proces, atunci când se doreşte eliminarea sau reducerea efectelor datorate diverselor tipuri de erori, valorile experimentale obţinute sunt supuse unor teste ce evaluează influenţele induse de către factorii generatori de erori de măsurare. Principalele categorii de teste statistice aplicabile unui eşantion de valori experimentale sunt dedicate identificării şi eventual eliminării unor influenţe datorate celor trei tipuri de erori ce pot conduce la diferenţe între valorile măsurate şi cele reale ale variabilei ce se doreşte a fi determinată: erori aberante (grosolane), cauzate de funcţionarea defectuoasă a sistemului de măsurare sau provenite din nerespectarea de către operatorul uman a metodologiei adecvate de măsurare; erori sistematice, cauzate în general de configurarea (reglarea) incorectă a sistemului de măsurare sau de influenţa unor factori exteriori de valoare constantă; erori aleatoare, prezente în majoritatea activităţilor de măsurare, datorate caracterului stochastic al oricărui proces natural, inclusiv al procesului studiat şi al celui în urma căruia se obţin valorile experimentale. 4

description

o serie de teste statistice pentru constructii

Transcript of L1 Teste Statistice

LUCRAREA 1

Modelare i simulare ndrumar de laborator

Lucrarea 1 Prelucrarea statistic a datelor experimentale

Lucrarea 1Prelucrarea statistic a datelor experimentale

1. Obiectivele lucrriinsuirea unor noiuni referitoare la: principalele tipuri de prelucrri statistice efectuate asupra eantioanelor de valori provenite din msurri experimentale sau din operaii de achiziie de date, domeniil de aplicabilitate ale respectivelor prelucrri, algoritmii i modurile de lucru corespunztoare.Aplicarea testelor statistice prezentate n lucrare asupra unui eantion de date experimentale i enunarea concluziilor corespunztoare.2. Noiuni teoreticen situaiile n care se urmrete determinarea valorii unei variabile dintr-un anumit proces, atunci cnd se dorete eliminarea sau reducerea efectelor datorate diverselor tipuri de erori, valorile experimentale obinute sunt supuse unor teste ce evalueaz influenele induse de ctre factorii generatori de erori de msurare.Principalele categorii de teste statistice aplicabile unui eantion de valori experimentale sunt dedicate identificrii i eventual eliminrii unor influene datorate celor trei tipuri de erori ce pot conduce la diferene ntre valorile msurate i cele reale ale variabilei ce se dorete a fi determinat:erori aberante (grosolane), cauzate de funcionarea defectuoas a sistemului de msurare sau provenite din nerespectarea de ctre operatorul uman a metodologiei adecvate de msurare;erori sistematice, cauzate n general de configurarea (reglarea) incorect a sistemului de msurare sau de influena unor factori exteriori de valoare constant;erori aleatoare, prezente n majoritatea activitilor de msurare, datorate caracterului stochastic al oricrui proces natural, inclusiv al procesului studiat i al celui n urma cruia se obin valorile experimentale.n continuare vor fi prezentate o serie de teste pentru identificarea celor trei tipuri de erori enumerate mai sus. Dac identificarea valorilor experimentale afectate de erori aberante poate fi urmat de eliminarea valorilor respective din eantionul de date experimentale, prezena erorilor sistematice nu poate fi perceput dect prin influena sa asupra ntregului eantion de valori experimentale. Reducerea efectelor induse de ctre erorile sistematice nu poate fi realizat dect prin compararea rezultatelor prelucrrii mai multor eantioane de valori experimentale. Deoarece erorile aleatoare apar n majoritatea eantioanelor de valori experimentale (excepie fcnd unele determinri precise ale unor variabile de natur discret), testele statistice nu urmresc n acest caz dect evidenierea gradului n care aceste erori au afectat eantionul respectiv, indicnd dac densitatea de probabilitate a acestuia mai coincide ca form general cu aceea a variabilei reale ce a fost msurat.2.1. Eliminarea datelor afectate de erori aberante

Fiind dat un ir de valori experimentale , se consider c valoarea xi este afectat de erori aberante dac este verificat condiia (criteriul Chauvenet)

(1.1)

unde i reprezint media aritmetic, respectiv abaterea standard a irului de valori experimentale, iar mrimea z se alege din tabelul 1.1 n funcie de numrul n de valori din ir (cunoscut i ca dimensiunea irului sau volumul eantionului).Tabelul 1.1nznznz

51,64142,1027 292,37

61,73152,1230 332,41

71,80162,1434 382,46

81,87172,1739 452,51

91,91182,2046 552,58

101,96192,2356 712,65

112,0020 212,2672 1002,75

122,0422 232,29101 1662,88

132,0724 - 262,33167 - 5003,09

Din motive evidente, este suficient ca verificarea relaiei (1.1) s fie efectuat doar pentru valorile extreme (minim i maxim) din cadrul eantionului.Valoarea abaterii standard a irului de valori experimentale este determinat n acest caz cu expresia

(1.2)

Valoarea z din tabelul 1.1 poate fi determinat i cu ajutorul relaiei

(1.3)

unde

(1.4)

Dac, n urma aplicrii testului, rezult c una dintre valorile testate este afectat de erori aberante, valoarea respectiv este eliminat din cadrul eantionului, se recalculeaz valorile mediei i abaterii standard pentru valorile rmase i se reia verificarea condiiei (1.1), algoritmul aplicndu-se pn cnd condiia respectiv nu mai este verificat pentru nici una dintre cele dou valori extreme ale eantionului.2.2. Verificarea caracterului aleatorUnul dintre testele cele mai utilizate pentru verificarea caracterului aleator al unui eantion de valori experimentale este testul Young, descris prin algoritmul de mai jos.

Pasul 1: Fiind dat un ir de valori experimentale , se calculeaz mrimea

(1.5)

i mrimea

(1.6)

Pasul 2: Se compar mrimea M cu valorile VCI (valoare critic inferioar) i VCS (valoare critic superioar), alese din tabelul 1.2, i se consider c irul de valori experimentale are un caracter aleator, cu probabilitatea , dac este ndeplinit condiia

VCI < M < VCS(1.7)

Tabelul 1.2VCIVCS

n = 0,95 = 0,99 = 0,95 = 0,99

40,780,533,223,47

50,820,543,183,46

60,890,563,113,44

70,940,613,063,39

80,980,663,023,34

91,020,712,983,29

101,060,752,943,25

111,100,792,903,21

121,130,832,873,17

151,210,922,793,08

201,301,042,702,96

251,371,132,632,87

Se poate observa c testul nu poate fi aplicat dect pentru eantioane coninnd cel mult 25 de valori experimentale.Parametrul din tabelul 1.2 are semnificaia unui coeficient de ncredere i poate fi ales orientativ, n funcie de volumul eantionului, din tabelul 1.3.Tabelul 1.3n56789101214

0,9600,9700,9760,9800,9830,9850,9880,990

n161820253050100150

0,9910,9920,9930,9940,9950,9960,9970,9973

Dac volumul eantionului se afl ntre dou valori din tabelul 1.3, este indicat s se aleag valoarea corespunztoare unui volum mai mic al eantionului.Alegerea coeficientului de ncredere din tabelul 1.3 poate fi nlocuit de determinarea acestuia cu ajutorul relaiei

(1.8)

Dac valoarea aleas sau calculat a coeficientului de ncredere se afl ntre valorile disponibile n tabelul 1.2, este indicat s se aleag valoarea disponibil inferioar.Alegerea valorilor VCI i VCS din tabelul 1.2 poate fi nlocuit cu determinarea acestora cu ajutorul relaiilor

(1.9)

(1.10)

2.3. Verificarea normalitiiIpoteza c valorile experimentale din cadrul unui eantion sunt repartizate dup o lege de distribuie normal (Gauss) poate fi testat, ntr-o prim aproximare, prin verificarea urmtoarelor criterii:histograma eantionului de valori experimentale s aib un singur vrf (punct de maxim);diferena dintre media teoretic a eantionului i valoarea median a acestuia s fie nul, unde valoarea median poate fi determinat cu relaia

(1.11)

unde indicii superiori, ntre paranteze rotunde, semnific poziia n cadrul irului ordonat cresctor;diferena dintre media teoretic a eantionului i modulul acestuia s fie nul (condiie echivalent cu cea anterioar), unde modulul poate fi determinat cu relaia

(1.12)

s fie satisfcut urmtoarea condiie referitoare la coeficientul de boltire :

(1.13)

unde reprezint momentul centrat de ordinul 4, determinat cu relaia

(1.14)

iar abaterea standard este determinat de aceast dat din relaia

(1.15)

s fie satisfcut urmtoarea condiie (echivalent cu cea anterioar) referitoare la valoarea excesului E al eantionului de valori experimentale:

(1.16)

Dac verificarea criteriilor prezentate mai sus nu conduce la rezultate elocvente, pentru verificarea ipotezei referitoare la distribuia normal a valorilor din eantionul experimental se poate apela la unul din testele Massey sau , alegerea unuia sau altuia dintre cele dou teste fcndu-se n funcie de valoarea volumului eantionului de date experimentale.2.3.1. Testul Massey

Testul poate fi aplicat pentru valori ale volumului eantionului n intervalul i const din urmtorii pai:

Pasul 1: Se calculeaz valorile

(1.17)

Pasul 2: Se determin valorile

(1.18)

unde

(1.19)

Pasul 3: Se calculeaz frecvenele relative cumulate

(1.20)

unde reprezint numrul de valori y mai mici sau egale cu valoarea .

Pasul 4: Se determin valorile

(1.21)

i se alege valoarea .

Pasul 5: Se compar valoarea cu valoarea aleas din tabelul 1.4 (n funcie de volumul eantionului i de un coeficient de ncredere ales conform celor prezentate anterior) i se consider c eantionul de valori experimentale are o distribuie normal (Gauss) dac este ndeplinit condiia

(1.22)

Tabelul 1.4

n

n

n

80,1400,163160,1250,144240,1100,126

90,1340,158170,1240,142250,1090,124

100,1300,156180,1220,138260,1080,121

110,1290,155190,1200,136270,1070,120

120,1280,154200,1170,133280,1050,118

130,1280,153210,1150,131290,1040,116

140,1280,151220,1130,129300,1020,114

150,1270,148230,1120,128310,0990,111

Valorile din tabelul 1.4 pot fi aproximate prin calcul utiliznd expresiile

(1.23)

2.3.2. Testul Testul poate fi aplicat pentru eantioane de cel puin 50 de valori experimentale i const din urmtorii pai:

Pasul 1: Fiind dat un ir de valori experimentale , se ordoneaz irul cresctor i se mparte n k clase, unde

(1.24)

i

(1.25)

Pasul 2: Se comaseaz clasele extreme, dac este cazul, astfel nct fiecare clas s aib cel puin cte 5 valori, i se consider numrul de grade de libertate al irului de date

= numrul de noi clase (comasate) - 1(1.26)

Pasul 3: Se calculeaz pentru fiecare clas valoarea

(1.27)

unde reprezint limita superioar a clasei i (la ultima clas se consider x(+1) = ).

Pasul 4: Se calculeaz valorile

(1.28)

unde

(1.29)

unde

(1.30)

(1.31)

Pasul 5: Se calculeaz valoarea

(1.32)

unde reprezint numrul de valori din clasa i.

Pasul 6: Se compar 2 cu din tabelul 1.5, n funcie de coeficientul de ncredere i se consider c repartiia este normal dac

(1.33)

Tabelul 1.5

0,800,900,950,980,990,9950,9980,999

45,997,789,4911,6713,314,916,918,5

57,299,2411,113,3915,116,718,920,5

68,5610,612,615,0316,818,520,722,5

79,8012,014,116,618,520,322,624,3

811,013,415,518,220,122,024,326,1

912,214,716,919,721,723,626,127,9

1013,416,018,321,223,225,227,729,6

1114,617,319,722,624,726,829,431,3

1215,818,521,024,126,228,331,032,9

1317,019,822,425,527,729,832,534,5

1418,221,123,726,929,131,334,036,1

1519,322,325,028,330,632,835,637,7

1620,523,526,329,632,034,337,139,3

1721,624,827,631,033,435,738,640,8

1822,826,028,932,334,837,240,142,3

1923,927,230,133,736,238,641,643,8

2025,028,431,435,037,640,043,145,3

Valorile din tabelul 1.5 pot fi determinate prin calcul utiliznd relaia

(1.34)

unde parametrii a, b, c i d depind de coeficientul de ncredere conform celor prezentate n tabelul 1.6.Tabelul 1.6abcd

0,800,464181,48892-0,0320880,0015968

0,901,41721,72353-0,0392250,0014982

0,952,496611,93494-0,0540080,0022594

0,984,258742,00109-0,0407960,0011185

0,995,22672,24028-0,0643540,0023769

0,9956,434042,33645-0,0658930,0023355

0,9988,329692,31312-0,0452750,0007687

0,9999,301272,57235-0,0796160,003011

Parametrii a, b, c i d pot fi de asemenea exprimai n funcie de coeficientul de ncredere utiliznd relaiile de mai jos, funciile de regresie respective oferind ns coeficieni de corelaie relativ deprtai de unitate.

(1.35)

(1.36)

(1.37)

(1.38)

3. Exemplu de calcul (1)Pe parcursul realizrii unui model de simulare a funcionrii unui sistem de producie, se urmrete determinarea funciei de repartiie a numrului de piese prelucrate de ctre o main unealt pe parcursul unei zile de lucru.Pentru aceasta, pe parcursul a ase sptmni, se nregistreaz cantitile prelucrate de ctre respectiva main unealt, obinndu-se rezultatele din tabelul 1.7.

Se cere:a. S se verifice existena n eantionul de date a valorilor afectate de erori aberante;b. S se verifice caracterul aleator al eantionului de date;c. S se verifice faptul c eantionul de date urmeaz o lege de distribuie normal.

Tabelul 1.7SptLMaMiJVSptLMaMiJV

I3239333840IV3941333337

II3241413941V3840413335

III3333333437VI4040323832

3.1. Eliminarea datelor afectate de erori aberantePasul 1: Se calculeaz media aritmetic a celor n = 30 valori (6 sptmni x 5 zile / sptmn) din tabelul 1.7:

(1.39)

Pasul 2: Se calculeaz, utiliznd expresia (1.2), abaterea standard a celor 30 de valori:

(1.40)

Pasul 3: Se alege din tabelul 1.1 valoarea z = 2,41 (pentru n = 30).

n mod evident, dintre datele aparinnd unui eantion experimental, cele suspecte de a fi afectate de erori aberante sunt valorile extreme ale irului datelor ordonate cresctor sau descresctor. Ordonnd cresctor cele n = 30 de valori ale eantionului studiat, se va efectua verificarea influenei erorilor aberante pentru valoarea minim x(1) = 32 i pentru valoarea maxim x(30) = 41, unde indicii dintre paranteze reprezint poziia n cadrul irului ordonat. Rezult, aplicnd relaia (1.1):

(1.41)

i

(1.42)

concluzia fiind aceea c nici una dintre valorile extreme nu este afectat de erori aberante.

Dac n urma aplicrii testului ar fi rezultat c o valoare este afectat de erori aberante, aceasta ar fi trebuit exclus din eantionul experimental, iar testul ar fi trebuit aplicat din nou valorilor rmase, recalculnd parametrii , i z.3.2. Verificarea caracterului aleatorPasul 1: Folosind relaia (1.5), se calculeaz valoarea

(1.43)

i folosind relaia (1.6) se calculeaz mrimea

(1.44)

Pasul 2: Din tabelul 1.2 se aleg valorile VCI = 1,13 i VCS = 2,87, corespunztoare unui coeficient de ncredere = 0,99 i unui volum al eantinului experimental n = 25.Valoarea coeficientului de ncredere a fost aleas astfel nct s fie ct mai apropiat de valoarea recomandat n tabelul 1.3. Limitele VCI i VCS au fost alese corespunztor valorii n = 25 deoarece n tabelul 1.2 nu exist valori disponibile pentru un volum al eantionului n = 30. O extrapolare a valorilor din tabelul 1.2 ar putea fi permis n acest caz, observnd tendinele asimptotice ale funciilor (1.9) i (1.10) care descriu variaia limitelor VCI i VCS, cantitile cu care acestea se modific la o variaie unitar a volumului eantionului i poziia n care valoarea M se ncadreaz ntre cele dou limite.Deoarece este ndeplinit condiia (1.7), se trage concluzia c eantionul de date experimentale are un caracter aleator.3.3. Verificarea normalitiiDup cum se poate observa n continuare, criteriile prezentate la nceputul subcapitolului 2.3 nu ofer rezultate pozitive privind caracterul normal al distribuiei valorilor din eantionul experimental. Astfel:histograma eantionului (figura 1.1) are o form diferit de curba Gauss;

valoarea median, determinat cu relaia (1.11) este Me = 37,5, diferit de media aritmetic a eantionului = 36,6;

calculnd, cu ajutorul relaiei (1.14), momentul centrat de ordinul 4 ( = 184,622), se determin din relaia (1.13) valoarea coeficientului de boltire = 1,347, acesta fiind mult deprtat de valoarea 3.

n consecin, innd seama de valoarea volumului eantionului experimental, se decide aplicarea testului Massey pentru verificarea caracterului normal al distribuiei.Valorile rezultate din aplicarea pailor 1, ..., 4 ai testului (relaiile (1.17), ..., (1.21)) sunt prezentate n tabelul 1.8.Valoarea dmax = 0,233 este mai mare dect valoarea dcritic = 0,102 aleas din tabelul 1.4 (pentru n = 30 i = 0,95).Condiia (1.22) nefiind ndeplinit, Figura 1.1: Histograma eantionului de valori experimentale din Tabelul 1.7

testul Massey confirm presupunerea anterioar: cu probabilitatea 0,95 se poate estima c eantionul studiat nu are o distribuie normal.Tabelul 1.8xiyitiiniFidi

32-1,3221,785-0,45340,1330,086

32-1,3221,785-0,45340,1330,086

33-1,0341,525-0,366110,3670,233

390,6900,8130,255210,7000,055

380,4020,8820,156180,6000,056

400,9770,7550,336250,8330,002

390,6900,8130,255210,7000,055

411,2640,7040,397301,0000,103

33-1,0341,525-0,366110,3670,233

411,2640,7040,397301,0000,103

400,9770,7550,336250,8330,002

Tabelul 1.8 (continuare)xiyitiiniFidi

400,9770,7550,336250,8330,002

33-1,0341,525-0,366110,3670,233

411,2640,7040,397301,0000,103

33-1,0341,525-0,366110,3670,233

33-1,0341,525-0,366110,3670,233

411,2640,7040,397301,0000,103

32-1,3221,785-0,45340,1330,086

380,4020,8820,156180,6000,056

390,6900,8130,255210,7000,055

34-0,7471,331-0,277120,4000,177

33-1,0341,525-0,366110,3670,233

33-1,0341,525-0,366110,3670,233

380,4020,8820,156180,6000,056

400,9770,7550,336250,8330,002

411,2640,7040,397301,0000,103

370,1150,9630,046150,5000,046

370,1150,9630,046150,5000,046

35-0,4601,181-0,178130,4330,111

32-1,3221,785-0,45340,1330,086

4. Exemplu de calcul (2)

Fiind dat eantionul de 60 de valori experimentale din tabelul 1.9, se va exemplifica n continuare aplicarea asupra acestuia a testului pentru verificarea normalitii.

Tabelul 1.98265824204918407211

5360982613182799529

38491485577290465941

60411567243853422278

3932326328191151570

37269951591126954889

Pasul 1: Utiliznd relaia (1.24) se determin numrul de clase k = 7, iar conform recomandrii (1.25) se alege k = 10.Valorile extreme (minim i maxim) ale eantionului fiind xmin = 1 i xmax = 99, se determin limea unei clase

(1.45)

Limitele inferioar i superioar ale fiecrei clase, precum i numrul de valori experimentale din eantion din fiecare clas, sunt prezentate n tabelul 1.10.

Tabelul 1.10Clasa12345678910

Limita inferioar- 10,820,630,440,25059,869,679,489,2

Limita superioar10,820,630,440,25059,869,679,489,2

Numrul de valori31087765446

Pasul 2: Deoarece prima clas nu conine cel puin cinci valori, se comaseaz primele dou clase, obinndu-se situaia din tabelul 1.11.Tabelul 1.11Clasa123456789

Limita inferioar- 20,630,440,25059,869,679,489,2

Limita superioar20,630,440,25059,869,679,489,2

Numrul de valori1387765446

Conform relaiei (1.26), se consider numrul de grade de libertate = 8.

Paii 3 i 4: Determinnd valorile mediei aritmetice i abaterii standard ale irului de date experimentale ( i ), se calculeaz, conform relaiilor (1.27), ..., (1.31), valorile prezentate n tabelul 1.12.Tabelul 1.12Clasa123456789

xi20,630,440,25059,869,679,489,2

ti-0,939-0,584-0,2280,1280,4830,8391,1941,55

ai1,4541,2411,0820,9590,8620,7820,7160,660

(ti)-0,337-0,222-0,090,0510,1850,2990,3840,4390,5

pi0,1630,1150,1320,1410,1350,1140,0850,0560,061

Pentru calculul valorii p0 s-a considerat (t0) = (- ) = -0,5.

Pasul 5: Utiliznd relaia (1.32), se determin valoarea 2 = 0,315.

Pasul 6: Alegnd din tabelul 1.3 un coeficient de ncredere recomandat = 0,996, se alege din tabelul 1.5 (pentru = 0,995 i = 8) valoarea = 22.Deoarece condiia (1.33) nu este satisfcut, se trage concluzia c eantionul de valori experimentale din tabelul 1.9 nu are o funcie de repartiie normal (Gauss).5. Enunul problemeiPentru unul dintre eantioanele de valori experimentale din Anexa 1, s se studieze:existena unor valori afectate de erori aberante;caracterul aleator al eantionului de date;ncadrarea valorilor din eantion ntr-o distribuie normal (Gauss).

4

5