Seminar 2 (Parametri Statistici)
-
Upload
engineer86 -
Category
Documents
-
view
8 -
download
2
Transcript of Seminar 2 (Parametri Statistici)
I. Parametri statistici şi reprezentãri grafice
Statistica este o ştiinţã care are nenumãrate utilizãri în domenii foarte diferite:
sociologie, medicinã, biologie, finanţe, agriculturã, industrie, administraţie, politicã etc. Parametrii
statistici au marele avantaj cã prezintã sintetic o multitudine de caracteristici, permit
comparaţii între cazuri greu de comparat altfel, permit identificarea unor factori de influenţã
a fenomenelor etc.
Ex. 1
Considarãm cã un lot având n = 200 piese a fost împãrţit în douã subloturi avand n1 = n2 =
100 piese care au fost prelucrate separat în douã locuri de muncã. Abaterile efective [μm] ale
pieselor din cele douã subloturi au fost mãsurate şi trecute în douã tabele patrate ( 10 x 10 ).
Tabelul 1 Tabelul2
11 21 21 21 23 21 22 12 21 7 15 16 15 14 12 21 32 23 43 11
12 23 43 22 13 22 21 22 22 13 17 17 16 15 14 23 34 24 23 18
11 24 21 24 22 23 24 23 23 15 21 19 18 16 15 17 43 26 21 19
14 12 32 32 22 12 23 14 32 18 22 21 21 17 16 18 12 31 17 32
15 14 32 31 13 15 32 16 31 26 21 23 21 18 19 17 17 21 19 22
16 16 22 19 15 16 31 17 25 27 24 16 19 19 18 19 18 23 17 15
11 17 11 18 17 17 25 19 26 31 25 14 16 21 17 15 26 11 21 14
21 18 14 23 19 18 25 18 27 32 32 12 13 22 21 21 23 18 23 13
14 24 15 21 18 19 26 32 27 21 19 11 8 23 23 23 15 7 22 16
21 19 21 23 21 21 23 21 29 25 18 11 15 16 16 22 21 23 19 17
Privind aceste tabele cu valori numerice comparaţia este foarte dificilã şi neconcludentã. Dar dacã
se calculeazã şi se comparã anumiţi parametri statistici atunci comparaţia devine simplã si
sigurã, de exemplu:
- valorile medii aratã dimensiunile de reglaj ale maşinilor ;
- dispersiile şi abaterile medii pãtratice aratã caracteristicile de precizie ale maşinilor unelte etc.
1
Utilizarea parametrilor statistici trebuie sã fie raţionalã deoarece pot sã aparã chiar şi situaţii în
care compararea unui singur parametru este neconcludentã. De exemplu: PIB-ul pe cap de locuitor,
consumul mediu al anumitor produse etc. în anumite state din lumea a III-a şi din Europa sunt
sensibil egale. Deci utilizarea unui singur parametru statistic poate denatura analizele.
Ex. 2
Considerãm studiul unei mãrimi fizice z = z ( x, y ) la care variabila “x” este mai
dificil de modificat şi de mãsurat iar variabila “y” se poate modifica şi mãsura foarte uşor
[1].
Variabila “x” va primi 4 valori succesive şi pentru fiecare dintre acestea variabila “y”
va primi 11 valori. S-au obţinut astfel urnãtoarele patru tabele de date:
Dacã se calculeazã valorile medii şi abaterile medii pãtratice pentru variabilele “y” şi
“z” se constatã, în mod surprinzãtor, cã toate cele 4 cazuri conduc la parametri statistici
identici:
- pentru y => y med = 9 - pentru z => z med = 7.5
σ y = 3.16 σ z = 1.94
Tabelul 3 Tabelul 4
x y z x y z
1
4 4.26
3
4 3.15 5.68 5 4.746 7.24 6 6.167 4.82 7 7.268 6.95 8 8.149 8.61 9 8.7710 8,04 10 9.1411 8.33 11 9.2612 10.84 12 9.1313 7.85 13 8.7414 9.96 14 8.1
Tabelul 5 Tabelul 6
2
x y z x y z
5
4 5.39
1
8 6.585 5.73 8 5.766 6.08 8 7.717 6.42 8 8.848 6.77 8 8.479 7.11 8 7.0410 7.46 8 5.2511 7.81 8 5.5612 8.15 8 7.9113 12.74 8 6.8914 8.84 19 12.5
Nu trebuie trasã însã concluzia pripitã cã în cele 4 cazuri funcţia z are un comportament identic sau
asemãnãtor ci trebuie trasate graficele z = z (x, y) sau z = z ( y ) pentru a se încerca explicarea
situaţiei.
1. Pentru x = 1 (Tab. 3) sistemul are un comportament foarte instabil. Rezultatul
mãsurãtorilor formeazã un “nor” de date (Fig. 1).
Curba de regresie cea mai adecvatã este o dreaptã z = 2.9 + 0.51 y dar coeficientul de
corelaţie este relativ scãzut. Împrãştierea (dispersia) datelor în jurul dreptei de regresie este foarte
mare
Fig. 1
2. Pentru x = 3 (Tab. 4) sistemul studiat pare cã are un comportament foarte stabil. Rezultatele
mãsurãtorilor urmeazã foarte corect o parabolã ( Fig. 2 ) a cãrei ecuaţie de regresie este: z = -6 +
3
2.78 y – 0.127 y2 . Coeficientul de coprelaţie este foarte bun (apropiat de unitate) iar dispersia
rezultatelor mãsurate în jurul curbei de regresie este foarte micã.
Fig. 2
3. Pentru x = 5 (Tab. 5) sistemul are, în continuare, un comportament stabil. Rezultatele
mãsurãtorilor aratã însã cã parabola a degenerat într-o dreaptã (fig. 3 ) a cãrei ecuaţie de regresie s-ar
putea determina în douã variante. Pentru setul (13, 12.74) existã suspiciunea cã ar putea reprezenta
o eroare grosolanã.
Fig. 33.a. Pentru întreg setul de date se obţine ecuaţia dreptei de regresie z = 3 + 0.5 y
4
Se observã cã ecuaţia este foarte apropiatã de cea corespunzãtoare cazului 1 iar coeficientul
de corelaţie este destul de scãzut..
3.b. Dacã se eliminã valoarea z(13) = 12.74 (deoarece se poate demonstra cã este o eroare
grosolanã) se va identifica o nouã dreaptã de regresie z = 4 + 0.34 y care va conduce la
un coeficient de corelaţie foarte bun.
Obs. Comparând numai cazurile 1 şi 3 se ubservã cã:
- valorile medii şi abaterile medii pãtratice sunt identice;
- curbele de modelare sunt foarte asemãnãtoare;
- comportarea sistemului este foarte diferitã în aceste cazuri.
4. Pentru cã în cazul x = 1 sistemul a demonstrat instabilitate, a fost realizat un nou experiment
cu un nou set de date (Tab. 6), menţinând 10 valori identice ale parametrului y (y 1 = y2 = . ..= y10 =
8) şi o ultimã valoare distinctã y11 = 19 (Tabelul 6).
Deşi din punct de vedere fizic acest experiment nu are nimic în comun cu primele trei se
observã cã parametrii statistici sint identici:
- pentru y => y med = 9 - pentru z => z med = 7.5
σ y = 3.16 σ z = 1.94
Fig. 4Concluzii:- utilitatea parametrilor statistici este certã deoarece analiza acestora poate oferi informaţii foarte
importante;
5
- folosirea parametrilor statistici trebuie însã fãcutã cu discernãmânt pentru cã sunt situaţii în care utilizarea lor poate conduce la concluzii greşite.
II. Corelaţii şi reprezentãri grafice
Corelaţia dintre anumite seturi de date exprimã gradul de dependenţã dintre acestea.
Existã mai multe metode folosite pentru a se studia corelaţia dintre anumite mãrimi fizice:
A) Metoda seriilor paralele
Metoda cere sã se ordoneze datele în ordinea crescãtoare a variabilei independente şi
apoi sã se estimeze existenţa sau inexistenţa unei corelaţii.
De exemplu, privind datele din cele patru tabele de mai sus se poate afirma cã datele din
Tab. 3 şi Tab. 5 aratã existenţa unei corelaţii între mãrimile “y” şi “z”. Aceastã concluzie poate
fi desprinsã şi din analiza graficelor din Fig. 1 şi Fig. 3 care ne sugereazã cã între vectorii y şi z
corelaţia este de fapt o dependenţã liniarã.
Analizând însã datele din Tab. 6 sau privind graficul din fig.4 se poate afirma cã acestea
sunt absolut necorelate.
B) Metode analitice bazate pe coaficienţi de corelaţie
Existã mai mulţi coeficienţi utilizaţi pentru estimarea gradului de corelaţie a datelor,
dintre aceştia cel mai cunoscut fiind coeficientul de corelaţie Pearson:
R y / x =
În mod practic existã urmãtoarele recomandãri pentru aprecierea corelaţiei:
R y / x ( 0 … 0.2) => legãtura este inexistentã sau nesemnificativã;
R y / x ( 0.2 … 0.5) => legãtura este slabã;
R y / x ( 0.5 … 0.75) => legãtura este de intensitate medie;
R y / x ( 0.75 … 0.95) => legãtura este puternicã;
R y / x ( 0.95 … 1) => legãtura este foarte puternicã, deterministã.
6
Rezolvare MATLAB
Considerând seturile de date din Tab. 1, Tab. 2, Tab. 3 şi Tab. 4 se pot construi 4 perechi de
vectori:
y1 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z1 = [ 4.26 5.68 7.24 4.82 6.95 8.81 8.04 8.33 10.84 7.58 9.96 ]
y2 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z2 = [3.10 4.74 6.13 7.26 8.14 8.77 9.14 9.26 9.13 8.74 8.10 ]
y3 = [ 4 5 6 7 8 9 10 11 12 13 14 ] z3 = [ 5.39 5.73 6.08 6.42 6.77 7.11 7.46 7.81 8.15 12.74 8.84 ]
y4 = [ 8 8 8 8 8 8 8 8 8 8 19 ] z4 = [ 5.25 5.56 5.76 6.58 6.89 7.04 7.71 7.91 8.47 8.84 12.50 ]
R1 = corrcoef(y1,z1)=> R1 = 0.8164
R2 = corrcoef(y2,z2)=> R1 = 0.8136
R3 = corrcoef(y3,z3)=> R3 = 0.8163
R4 = corrcoef(y4,z4)=> R4 = 0.8165
Analizând aceste valori se poate trage concluzia ca cele 4 seturi de date sunt
caracterizate printr-o legãturã puternicã, concluzie care este doar parţial adevãratã.
Concluzii
Pentru analiza datelor experimentale utilizarea unui singur coeficient statistic sau a mai
multor coeficienţi statistici nu trebuie sã ţinã locul unei analize complete a mãrimilor
studiate.
Repreprezentãrile grafice trebuie sã fie realizate utilizând eventual mai multe tipuri de scãri
(liniare, lugaritmice, exponenţiale etc.).
Trebuie identificate funcţiile de regresie.
Dacã se cunoaşte tipul dependenţei fizice se cautã un singur tip de funcţie dar, dacã nu se
cunoaşte tipul dependenţei, trebuie cãutate mai multe tipuri de funcţii de regresie.
Comparaţia între funcţiile de regresie trebuie sã se facã în funcţie de mãrimea abaterilor
dintre datele modelate şi cele mãsurate.
Dacã anumite experimentãri se pot repeta, în cazul corelaţiilor slabe, este bine sã se repete cu
modificarea anumitor condiţii care ar putea contribui la scãderea corelaţiei.
7
Ex. 4
Fig. 3 a), b)
În acest exemplu (Fig. 3) se prezintã un montaj la care, între locul unde se aflã situatã o
construcţie matalicã pe care sunt montaţi traductorii şi locul unde sunt instalate aparatele de mãsurã
este o distanţã mare [3].
La montajul din Fig. 3a cablurile de legãturã vor fi parcurse de semnalele de mãsurã,
semnale caracterizate prin curenţi şi tensiuni scãzute. La preamplificator va ajunge un
semnal contaminat cu “zgomot de fond”. Raportul semnal/zgomot va fi destul de slab iar
datele mãsurate vor fi puternic perturbate.
La montajul din Fig. 3b , montarea preamplificatorului în apropierea traductorilor face ca
prin cablurile de legaturã sã circule semnale amplificate, ceea ce face ca influenţa
“zgomotului de fond” sã scadã foarte mult. Raportul semnal/zgomot va fi foarte mare, datele
mãsurate vor avea o mai bunã acurateţe iar împrãştierea lor va fi mult mai redusã.
8
III. Mãsurarea semnalelor şi parametrii statistici
Parametrii statistici nu se determinã numai în urma calculelor fãcute asupra unor seturi de
date ci se pot întâlni şi în cazul unor mãsurãtori fãcute cu anumite aparate.
În tehnicã sunt multe situaţii în care se mãsoarã anumite mãrmi fizice considerate
staţionare sau cvasistaţionare.
Simplificator, o anumitã mãrime fizicã poate fi consideratã staţionarã dacã nu suferã
variaţii în funcţie de timp ( = 0 ) şi cvasistaţionarã dacã variatiile sunt mai mici decât o
anumitã limitã impusã.
Exemplul clasic de mãrimi staţionare poate fi reprezentat de constantele fizice
universale: acceleraţia gravitaţionalã, constantele atomice, caracteristicile materialelor (E, υ, ρ) etc.
Mãrimi cvasistaţionare sunt majoritatea celorlalte marimi fizice care ar trebui sã fie
constante dar cãrora li se admit anumite abateri limitã: temperatura şi alţi parametri de mediu
din laboratoarele metrologice, tensiunea şi ferecvenţa curentului electric din reţelele publice etc.
Majoritare sunt însã cazurile în care mãrimile studiate sunt variabile în funcţie de timp
( ≠ 0 ): eforturile unitare în cazul solicitãrilor variabile, carateristicile zgomotului aleator,
caracteristicile vibraţiilor seismice etc. Pentru mãsurarea caracteristicilor acestor mãrimi se pot
folosi aparate analogice, aparate digitale, aparate hibride sau lanţuri de aparate.
Pentru o funcţie de tipul f(t) = , de regulã, prezintã interes major cel puţin
una sau mai multe dintre urmãtoarele mãrimi principale:
- valoarea maximã f max,± = max ± [f (t)];
- valoarea medie absolutã f med = ;
- valoarea medie = ;
- valoare medie pãtraticã f RMS = (root mean square)
9
Obs.1 Pentru cazul foarte des întâlnit în tehnicã al funcţiilor sinusoidale de tipul:
x(t) = Xmax sin (2πf t)
se pot determina relaţiile:
- valoarea medie absolutã x med = 0.637 X max
- valoarea medie = 0
- valoare medie pãtraticã x RMS = 0.707 X max
Obs.2 Dacã se considerã cazul tensiunii de la reţeaua de distribuţie casnicã aceasta are ecuaţia:
u(t) = Umax sin( 2 π f t) = 311 sin ( 100 π t) şi rezultã
u med = 0.637 X max = 0.637 ∙311 = 198 V
= 0 V
u RMS = 0.707 X max = 0.707 ∙311 = 220 V
Obs.3 Majoritatea voltmetrelor sau avometrelor, la mãsurarea tensiunilor alternative sau a
curenţilor alternativi afişeazã valoarea medie pãtraticã (RMS) a semnalului.
Obs.4 Majoritatea voltmetrelor sau avometrelor, la mãsurarea tensiunilor continue sau a intensitãţii
curentului alternativ afişeazã valoarea efectivã (constantã) a semnalului.
Obs.5 Ohmetrele, avometrele şi megohmetrele se folosesc pentru mãsurarea rezistenţei
conductoarelor, mãsurarea rezistenţei prizelor de pãmãnt, mãsurarea rezistenţei de izolaţie
etc. şi afişeazã valorile efective ale rezistenţelor ohmice.
Obs.6 Majoritatea aparatelor pentru mãsurarea vibraţiilor pot indica valoarea medie, valoarea
medie pãtraticã (RMS) şi valoarea maximã (pozitivã şi negativã) a caracteristicii mãsurate.
Obs.7 Un caz particular îl reprezintã aparatele destinate pentru mãsurarea şocurilor (sau a
impulsurilor scurte), aparate care afişeazã de regula valorile de vârf.
Obs.8 Rugozimetrele electronice calculeazã şi afişeazã o serie de parametri statistici ai rugozitãţii
suprafeţelor mãsurate în sistemul liniei medii, pe direcţie transversalã sau longitudinalã:
- înãlţimea medie aritmeticã a microneregularitãţilor Ra =
10
- abaterea medie pãtraticã a profilului R RMS = Rq =
- pasul mediu al microneregularitãţilor S m = etc.
Obs.9 Un caz cu totul deosebit este reprezentat de experimentãrile la care, pentru mãsurarea datelor
experimentale se folosesc osciloscoape şi/sau oscilografe. Toate aceste ãparate sunt foarte
utile deoarece prezintã grafic modul de variaţie al funcţiei studiate f(t) = .
Au însã dezavantajul cã trebuie sã fie “etalonate” cu ajutorul altor aparate specializate pentru
mãsurarea respectivelor mãrimi fizice (mai sus amintite).
Etalonarea se realizeazã simplu fãcând corespondenţa dintre valoarea maximã din
reprezentarea graficã şi valoarea maximã mãsuratã f max,± = max ± [f (t)];
Valorile medii mãsurate sau calculate (valoarea medie f med şi valoare medie pãtraticã f
RMS ) nu pot fi folosite pentru etalonare deoarece nu pot fi identificate pe
reprezentãrile grafice oferite de osciloscoape sau oscilografe).
BIBLIOGRAFIE
[1] – “Graphs in Statistical Analysis” – F. J. Ascombe - în “American Statistician” – nr.
27, pag 17-21, 1973
[2] – “Prelucrarea matematicã a datelor experimentale”- L.Z. Rumşinski – Editura
Tehnicã, Bucureşti, 1974
[3] – “Mechanical Vibration and Shock Measurement” – J. T. Broch – Editura Brüel & Kjær ,
Næerum, Denmark, 1984
11