Seminar 2 (Parametri Statistici)

17
I. Parametri statistici şi reprezentãri grafice Statistica este o ştiinţã care are nenumãrate utilizãri în domenii foarte diferite: sociologie, medicinã, biologie, finanţe, agriculturã, industrie, administraţie, politicã etc. Parametrii statistici au marele avantaj prezintã sintetic o multitudine de caracteristici, permit comparaţii între cazuri greu de comparat altfel, permit identificarea unor factori de influenţã a fenomenelor etc. Ex. 1 Considarãm un lot având n = 200 piese a fost împãrţit în douã subloturi avand n1 = n2 = 100 piese care au fost prelucrate separat în douã locuri de muncã. Abaterile efective [μm] ale pieselor din cele douã subloturi au fost mãsurate şi trecute în douã tabele patrate ( 10 x 10 ). Tabelul 1 Tabelul2 1 1 2 1 2 1 2 1 2 3 2 1 2 2 1 2 2 1 7 1 5 1 6 1 5 1 4 1 2 2 1 3 2 2 3 4 3 1 1 1 2 2 3 4 3 2 2 1 3 2 2 2 1 2 2 2 2 1 3 1 7 1 7 1 6 1 5 1 4 2 3 3 4 2 4 2 3 1 8 1 1 2 4 2 1 2 4 2 2 2 3 2 4 2 3 2 3 1 5 2 1 1 9 1 8 1 6 1 5 1 7 4 3 2 6 2 1 1 9 1 4 1 2 3 2 3 2 2 2 1 2 2 3 1 4 3 2 1 8 2 2 2 1 2 1 1 7 1 6 1 8 1 2 3 1 1 7 3 2 1

Transcript of Seminar 2 (Parametri Statistici)

Page 1: Seminar 2 (Parametri Statistici)

I. Parametri statistici şi reprezentãri grafice

Statistica este o ştiinţã care are nenumãrate utilizãri în domenii foarte diferite:

sociologie, medicinã, biologie, finanţe, agriculturã, industrie, administraţie, politicã etc. Parametrii

statistici au marele avantaj cã prezintã sintetic o multitudine de caracteristici, permit

comparaţii între cazuri greu de comparat altfel, permit identificarea unor factori de influenţã

a fenomenelor etc.

Ex. 1

Considarãm cã un lot având n = 200 piese a fost împãrţit în douã subloturi avand n1 = n2 =

100 piese care au fost prelucrate separat în douã locuri de muncã. Abaterile efective [μm] ale

pieselor din cele douã subloturi au fost mãsurate şi trecute în douã tabele patrate ( 10 x 10 ).

Tabelul 1 Tabelul2

11 21 21 21 23 21 22 12 21 7 15 16 15 14 12 21 32 23 43 11

12 23 43 22 13 22 21 22 22 13 17 17 16 15 14 23 34 24 23 18

11 24 21 24 22 23 24 23 23 15 21 19 18 16 15 17 43 26 21 19

14 12 32 32 22 12 23 14 32 18 22 21 21 17 16 18 12 31 17 32

15 14 32 31 13 15 32 16 31 26 21 23 21 18 19 17 17 21 19 22

16 16 22 19 15 16 31 17 25 27 24 16 19 19 18 19 18 23 17 15

11 17 11 18 17 17 25 19 26 31 25 14 16 21 17 15 26 11 21 14

21 18 14 23 19 18 25 18 27 32 32 12 13 22 21 21 23 18 23 13

14 24 15 21 18 19 26 32 27 21 19 11 8 23 23 23 15 7 22 16

21 19 21 23 21 21 23 21 29 25 18 11 15 16 16 22 21 23 19 17

Privind aceste tabele cu valori numerice comparaţia este foarte dificilã şi neconcludentã. Dar dacã

se calculeazã şi se comparã anumiţi parametri statistici atunci comparaţia devine simplã si

sigurã, de exemplu:

- valorile medii aratã dimensiunile de reglaj ale maşinilor ;

- dispersiile şi abaterile medii pãtratice aratã caracteristicile de precizie ale maşinilor unelte etc.

1

Page 2: Seminar 2 (Parametri Statistici)

Utilizarea parametrilor statistici trebuie sã fie raţionalã deoarece pot sã aparã chiar şi situaţii în

care compararea unui singur parametru este neconcludentã. De exemplu: PIB-ul pe cap de locuitor,

consumul mediu al anumitor produse etc. în anumite state din lumea a III-a şi din Europa sunt

sensibil egale. Deci utilizarea unui singur parametru statistic poate denatura analizele.

Ex. 2

Considerãm studiul unei mãrimi fizice z = z ( x, y ) la care variabila “x” este mai

dificil de modificat şi de mãsurat iar variabila “y” se poate modifica şi mãsura foarte uşor

[1].

Variabila “x” va primi 4 valori succesive şi pentru fiecare dintre acestea variabila “y”

va primi 11 valori. S-au obţinut astfel urnãtoarele patru tabele de date:

Dacã se calculeazã valorile medii şi abaterile medii pãtratice pentru variabilele “y” şi

“z” se constatã, în mod surprinzãtor, cã toate cele 4 cazuri conduc la parametri statistici

identici:

- pentru y => y med = 9 - pentru z => z med = 7.5

σ y = 3.16 σ z = 1.94

Tabelul 3 Tabelul 4

x y z x y z

1

4 4.26

3

4 3.15 5.68 5 4.746 7.24 6 6.167 4.82 7 7.268 6.95 8 8.149 8.61 9 8.7710 8,04 10 9.1411 8.33 11 9.2612 10.84 12 9.1313 7.85 13 8.7414 9.96 14 8.1

Tabelul 5 Tabelul 6

2

Page 3: Seminar 2 (Parametri Statistici)

x y z x y z

5

4 5.39

1

8 6.585 5.73 8 5.766 6.08 8 7.717 6.42 8 8.848 6.77 8 8.479 7.11 8 7.0410 7.46 8 5.2511 7.81 8 5.5612 8.15 8 7.9113 12.74 8 6.8914 8.84 19 12.5

Nu trebuie trasã însã concluzia pripitã cã în cele 4 cazuri funcţia z are un comportament identic sau

asemãnãtor ci trebuie trasate graficele z = z (x, y) sau z = z ( y ) pentru a se încerca explicarea

situaţiei.

1. Pentru x = 1 (Tab. 3) sistemul are un comportament foarte instabil. Rezultatul

mãsurãtorilor formeazã un “nor” de date (Fig. 1).

Curba de regresie cea mai adecvatã este o dreaptã z = 2.9 + 0.51 y dar coeficientul de

corelaţie este relativ scãzut. Împrãştierea (dispersia) datelor în jurul dreptei de regresie este foarte

mare

Fig. 1

2. Pentru x = 3 (Tab. 4) sistemul studiat pare cã are un comportament foarte stabil. Rezultatele

mãsurãtorilor urmeazã foarte corect o parabolã ( Fig. 2 ) a cãrei ecuaţie de regresie este: z = -6 +

3

Page 4: Seminar 2 (Parametri Statistici)

2.78 y – 0.127 y2 . Coeficientul de coprelaţie este foarte bun (apropiat de unitate) iar dispersia

rezultatelor mãsurate în jurul curbei de regresie este foarte micã.

Fig. 2

3. Pentru x = 5 (Tab. 5) sistemul are, în continuare, un comportament stabil. Rezultatele

mãsurãtorilor aratã însã cã parabola a degenerat într-o dreaptã (fig. 3 ) a cãrei ecuaţie de regresie s-ar

putea determina în douã variante. Pentru setul (13, 12.74) existã suspiciunea cã ar putea reprezenta

o eroare grosolanã.

Fig. 33.a. Pentru întreg setul de date se obţine ecuaţia dreptei de regresie z = 3 + 0.5 y

4

Page 5: Seminar 2 (Parametri Statistici)

Se observã cã ecuaţia este foarte apropiatã de cea corespunzãtoare cazului 1 iar coeficientul

de corelaţie este destul de scãzut..

3.b. Dacã se eliminã valoarea z(13) = 12.74 (deoarece se poate demonstra cã este o eroare

grosolanã) se va identifica o nouã dreaptã de regresie z = 4 + 0.34 y care va conduce la

un coeficient de corelaţie foarte bun.

Obs. Comparând numai cazurile 1 şi 3 se ubservã cã:

- valorile medii şi abaterile medii pãtratice sunt identice;

- curbele de modelare sunt foarte asemãnãtoare;

- comportarea sistemului este foarte diferitã în aceste cazuri.

4. Pentru cã în cazul x = 1 sistemul a demonstrat instabilitate, a fost realizat un nou experiment

cu un nou set de date (Tab. 6), menţinând 10 valori identice ale parametrului y (y 1 = y2 = . ..= y10 =

8) şi o ultimã valoare distinctã y11 = 19 (Tabelul 6).

Deşi din punct de vedere fizic acest experiment nu are nimic în comun cu primele trei se

observã cã parametrii statistici sint identici:

- pentru y => y med = 9 - pentru z => z med = 7.5

σ y = 3.16 σ z = 1.94

Fig. 4Concluzii:- utilitatea parametrilor statistici este certã deoarece analiza acestora poate oferi informaţii foarte

importante;

5

Page 6: Seminar 2 (Parametri Statistici)

- folosirea parametrilor statistici trebuie însã fãcutã cu discernãmânt pentru cã sunt situaţii în care utilizarea lor poate conduce la concluzii greşite.

II. Corelaţii şi reprezentãri grafice

Corelaţia dintre anumite seturi de date exprimã gradul de dependenţã dintre acestea.

Existã mai multe metode folosite pentru a se studia corelaţia dintre anumite mãrimi fizice:

A) Metoda seriilor paralele

Metoda cere sã se ordoneze datele în ordinea crescãtoare a variabilei independente şi

apoi sã se estimeze existenţa sau inexistenţa unei corelaţii.

De exemplu, privind datele din cele patru tabele de mai sus se poate afirma cã datele din

Tab. 3 şi Tab. 5 aratã existenţa unei corelaţii între mãrimile “y” şi “z”. Aceastã concluzie poate

fi desprinsã şi din analiza graficelor din Fig. 1 şi Fig. 3 care ne sugereazã cã între vectorii y şi z

corelaţia este de fapt o dependenţã liniarã.

Analizând însã datele din Tab. 6 sau privind graficul din fig.4 se poate afirma cã acestea

sunt absolut necorelate.

B) Metode analitice bazate pe coaficienţi de corelaţie

Existã mai mulţi coeficienţi utilizaţi pentru estimarea gradului de corelaţie a datelor,

dintre aceştia cel mai cunoscut fiind coeficientul de corelaţie Pearson:

R y / x =

În mod practic existã urmãtoarele recomandãri pentru aprecierea corelaţiei:

R y / x ( 0 … 0.2) => legãtura este inexistentã sau nesemnificativã;

R y / x ( 0.2 … 0.5) => legãtura este slabã;

R y / x ( 0.5 … 0.75) => legãtura este de intensitate medie;

R y / x ( 0.75 … 0.95) => legãtura este puternicã;

R y / x ( 0.95 … 1) => legãtura este foarte puternicã, deterministã.

6

Page 7: Seminar 2 (Parametri Statistici)

Rezolvare MATLAB

Considerând seturile de date din Tab. 1, Tab. 2, Tab. 3 şi Tab. 4 se pot construi 4 perechi de

vectori:

y1 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z1 = [ 4.26 5.68 7.24 4.82 6.95 8.81 8.04 8.33 10.84 7.58 9.96 ]

y2 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z2 = [3.10 4.74 6.13 7.26 8.14 8.77 9.14 9.26 9.13 8.74 8.10 ]

y3 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z3 = [ 5.39 5.73 6.08 6.42 6.77 7.11 7.46 7.81 8.15 12.74 8.84 ]

y4 = [ 8 8 8 8 8 8 8 8 8 8 19 ] z4 = [ 5.25 5.56 5.76 6.58 6.89 7.04 7.71 7.91 8.47 8.84 12.50 ]

R1 = corrcoef(y1,z1)=> R1 = 0.8164

R2 = corrcoef(y2,z2)=> R1 = 0.8136

R3 = corrcoef(y3,z3)=> R3 = 0.8163

R4 = corrcoef(y4,z4)=> R4 = 0.8165

Analizând aceste valori se poate trage concluzia ca cele 4 seturi de date sunt

caracterizate printr-o legãturã puternicã, concluzie care este doar parţial adevãratã.

Concluzii

Pentru analiza datelor experimentale utilizarea unui singur coeficient statistic sau a mai

multor coeficienţi statistici nu trebuie sã ţinã locul unei analize complete a mãrimilor

studiate.

Repreprezentãrile grafice trebuie sã fie realizate utilizând eventual mai multe tipuri de scãri

(liniare, lugaritmice, exponenţiale etc.).

Trebuie identificate funcţiile de regresie.

Dacã se cunoaşte tipul dependenţei fizice se cautã un singur tip de funcţie dar, dacã nu se

cunoaşte tipul dependenţei, trebuie cãutate mai multe tipuri de funcţii de regresie.

Comparaţia între funcţiile de regresie trebuie sã se facã în funcţie de mãrimea abaterilor

dintre datele modelate şi cele mãsurate.

Dacã anumite experimentãri se pot repeta, în cazul corelaţiilor slabe, este bine sã se repete cu

modificarea anumitor condiţii care ar putea contribui la scãderea corelaţiei.

7

Page 8: Seminar 2 (Parametri Statistici)

Ex. 4

Fig. 3 a), b)

În acest exemplu (Fig. 3) se prezintã un montaj la care, între locul unde se aflã situatã o

construcţie matalicã pe care sunt montaţi traductorii şi locul unde sunt instalate aparatele de mãsurã

este o distanţã mare [3].

La montajul din Fig. 3a cablurile de legãturã vor fi parcurse de semnalele de mãsurã,

semnale caracterizate prin curenţi şi tensiuni scãzute. La preamplificator va ajunge un

semnal contaminat cu “zgomot de fond”. Raportul semnal/zgomot va fi destul de slab iar

datele mãsurate vor fi puternic perturbate.

La montajul din Fig. 3b , montarea preamplificatorului în apropierea traductorilor face ca

prin cablurile de legaturã sã circule semnale amplificate, ceea ce face ca influenţa

“zgomotului de fond” sã scadã foarte mult. Raportul semnal/zgomot va fi foarte mare, datele

mãsurate vor avea o mai bunã acurateţe iar împrãştierea lor va fi mult mai redusã.

8

Page 9: Seminar 2 (Parametri Statistici)

III. Mãsurarea semnalelor şi parametrii statistici

Parametrii statistici nu se determinã numai în urma calculelor fãcute asupra unor seturi de

date ci se pot întâlni şi în cazul unor mãsurãtori fãcute cu anumite aparate.

În tehnicã sunt multe situaţii în care se mãsoarã anumite mãrmi fizice considerate

staţionare sau cvasistaţionare.

Simplificator, o anumitã mãrime fizicã poate fi consideratã staţionarã dacã nu suferã

variaţii în funcţie de timp ( = 0 ) şi cvasistaţionarã dacã variatiile sunt mai mici decât o

anumitã limitã impusã.

Exemplul clasic de mãrimi staţionare poate fi reprezentat de constantele fizice

universale: acceleraţia gravitaţionalã, constantele atomice, caracteristicile materialelor (E, υ, ρ) etc.

Mãrimi cvasistaţionare sunt majoritatea celorlalte marimi fizice care ar trebui sã fie

constante dar cãrora li se admit anumite abateri limitã: temperatura şi alţi parametri de mediu

din laboratoarele metrologice, tensiunea şi ferecvenţa curentului electric din reţelele publice etc.

Majoritare sunt însã cazurile în care mãrimile studiate sunt variabile în funcţie de timp

( ≠ 0 ): eforturile unitare în cazul solicitãrilor variabile, carateristicile zgomotului aleator,

caracteristicile vibraţiilor seismice etc. Pentru mãsurarea caracteristicilor acestor mãrimi se pot

folosi aparate analogice, aparate digitale, aparate hibride sau lanţuri de aparate.

Pentru o funcţie de tipul f(t) = , de regulã, prezintã interes major cel puţin

una sau mai multe dintre urmãtoarele mãrimi principale:

- valoarea maximã f max,± = max ± [f (t)];

- valoarea medie absolutã f med = ;

- valoarea medie = ;

- valoare medie pãtraticã f RMS = (root mean square)

9

Page 10: Seminar 2 (Parametri Statistici)

Obs.1 Pentru cazul foarte des întâlnit în tehnicã al funcţiilor sinusoidale de tipul:

x(t) = Xmax sin (2πf t)

se pot determina relaţiile:

- valoarea medie absolutã x med = 0.637 X max

- valoarea medie = 0

- valoare medie pãtraticã x RMS = 0.707 X max

Obs.2 Dacã se considerã cazul tensiunii de la reţeaua de distribuţie casnicã aceasta are ecuaţia:

u(t) = Umax sin( 2 π f t) = 311 sin ( 100 π t) şi rezultã

u med = 0.637 X max = 0.637 ∙311 = 198 V

= 0 V

u RMS = 0.707 X max = 0.707 ∙311 = 220 V

Obs.3 Majoritatea voltmetrelor sau avometrelor, la mãsurarea tensiunilor alternative sau a

curenţilor alternativi afişeazã valoarea medie pãtraticã (RMS) a semnalului.

Obs.4 Majoritatea voltmetrelor sau avometrelor, la mãsurarea tensiunilor continue sau a intensitãţii

curentului alternativ afişeazã valoarea efectivã (constantã) a semnalului.

Obs.5 Ohmetrele, avometrele şi megohmetrele se folosesc pentru mãsurarea rezistenţei

conductoarelor, mãsurarea rezistenţei prizelor de pãmãnt, mãsurarea rezistenţei de izolaţie

etc. şi afişeazã valorile efective ale rezistenţelor ohmice.

Obs.6 Majoritatea aparatelor pentru mãsurarea vibraţiilor pot indica valoarea medie, valoarea

medie pãtraticã (RMS) şi valoarea maximã (pozitivã şi negativã) a caracteristicii mãsurate.

Obs.7 Un caz particular îl reprezintã aparatele destinate pentru mãsurarea şocurilor (sau a

impulsurilor scurte), aparate care afişeazã de regula valorile de vârf.

Obs.8 Rugozimetrele electronice calculeazã şi afişeazã o serie de parametri statistici ai rugozitãţii

suprafeţelor mãsurate în sistemul liniei medii, pe direcţie transversalã sau longitudinalã:

- înãlţimea medie aritmeticã a microneregularitãţilor Ra =

10

Page 11: Seminar 2 (Parametri Statistici)

- abaterea medie pãtraticã a profilului R RMS = Rq =

- pasul mediu al microneregularitãţilor S m = etc.

Obs.9 Un caz cu totul deosebit este reprezentat de experimentãrile la care, pentru mãsurarea datelor

experimentale se folosesc osciloscoape şi/sau oscilografe. Toate aceste ãparate sunt foarte

utile deoarece prezintã grafic modul de variaţie al funcţiei studiate f(t) = .

Au însã dezavantajul cã trebuie sã fie “etalonate” cu ajutorul altor aparate specializate pentru

mãsurarea respectivelor mãrimi fizice (mai sus amintite).

Etalonarea se realizeazã simplu fãcând corespondenţa dintre valoarea maximã din

reprezentarea graficã şi valoarea maximã mãsuratã f max,± = max ± [f (t)];

Valorile medii mãsurate sau calculate (valoarea medie f med şi valoare medie pãtraticã f

RMS ) nu pot fi folosite pentru etalonare deoarece nu pot fi identificate pe

reprezentãrile grafice oferite de osciloscoape sau oscilografe).

BIBLIOGRAFIE

[1] – “Graphs in Statistical Analysis” – F. J. Ascombe - în “American Statistician” – nr.

27, pag 17-21, 1973

[2] – “Prelucrarea matematicã a datelor experimentale”- L.Z. Rumşinski – Editura

Tehnicã, Bucureşti, 1974

[3] – “Mechanical Vibration and Shock Measurement” – J. T. Broch – Editura Brüel & Kjær ,

Næerum, Denmark, 1984

11