CURS_006_ET_STATISTICA.doc

16
CURS 6 ELEMENTE DE BAZĂ ALE STATISTICII TEHNICE Analiza experimentală a unei mărimi se face, în general, efectuându-se numeroase măsurători şi înregistrându-se rezultatele obţinute. De exemplu, curentul de mers în gol la o serie de transformatoare electrice, curentul absorbit de o serie de electromagneţi, tensiunea de ţinere la izolatoare etc. Mulţimea tuturor acestor elemente de acelaşi fel (transformatoare electrice, electromagneţi, izolatoare) se numeşte populaţie statistică sau colectivitate statistică. Elementele sau componentele populaţiei statistice se numesc indivizi sau unităţi statistice . În funcţie de numărul indivizilor populaţia statistică poate fi finită sau infinită. O populaţie poate fi omogenă (statistică ) dacă elementele componente sunt de acelaşi tip sau neomogenă la care elementele componente sunt de ti[uri diferite. Metodele statistice se aplică numai populaţiei omogene. Trăsătura comună a populaţiei statistice caracterizată prin valorile particulare corespunzătoare fiecărui individ se numeşte caracteristică şi se notează în general cu X. Caracteristica se mai numeşte şi variabilă şi poate fi: - cantitativă – exprimată numeric prin valorile măsurate; - atributivă sau calitativă exprimată prin aprecieri ca: bun sau defect, satisfăcător – nesatisfăcător etc. O populaţie poate avea una sau mai multe caracteristici. Dacă informaţiile referitoare la caracteristica populaţiei statistice sunt luate de la fiecare component se efectuează o cercetare completă (unitară) sau enumerare completă. În cazul în care informaţiile (măsurătorile) se referă numai la o parte din indivizii populaţiei se face o cercetare selectivă . Indivizii de la care se obţin informaţiile formează selecţia sau eşantionul. Valoarea numerică a caracteristicii cantitative referitoare la o unitate statistică se mai numeşte valoare

Transcript of CURS_006_ET_STATISTICA.doc

Page 1: CURS_006_ET_STATISTICA.doc

CURS 6

ELEMENTE DE BAZĂ ALE STATISTICII TEHNICE

Analiza experimentală a unei mărimi se face, în general, efectuându-se numeroase măsurători şi înregistrându-se rezultatele obţinute. De exemplu, curentul de mers în gol la o serie de transformatoare electrice, curentul absorbit de o serie de electromagneţi, tensiunea de ţinere la izolatoare etc.

Mulţimea tuturor acestor elemente de acelaşi fel (transformatoare electrice, electromagneţi, izolatoare) se numeşte populaţie statistică sau colectivitate statistică. Elementele sau componentele populaţiei statistice se numesc indivizi sau unităţi statistice.

În funcţie de numărul indivizilor populaţia statistică poate fi finită sau infinită. O populaţie poate fi omogenă (statistică) dacă elementele componente sunt de acelaşi tip sau neomogenă la care elementele componente sunt de ti[uri diferite. Metodele statistice se aplică numai populaţiei omogene.

Trăsătura comună a populaţiei statistice caracterizată prin valorile particulare corespunzătoare fiecărui individ se numeşte caracteristică şi se notează în general cu X.

Caracteristica se mai numeşte şi variabilă şi poate fi:- cantitativă – exprimată numeric prin valorile măsurate;- atributivă sau calitativă exprimată prin aprecieri ca: bun sau defect, satisfăcător – nesatisfăcător etc.

O populaţie poate avea una sau mai multe caracteristici. Dacă informaţiile referitoare la caracteristica populaţiei statistice sunt luate de la

fiecare component se efectuează o cercetare completă (unitară) sau enumerare completă. În cazul în care informaţiile (măsurătorile) se referă numai la o parte din indivizii populaţiei se face o cercetare selectivă. Indivizii de la care se obţin informaţiile formează selecţia sau eşantionul.

Valoarea numerică a caracteristicii cantitative referitoare la o unitate statistică se mai numeşte valoare observată. Totalitatea valorilor observate formează datele experimentale.

6.1. REPARTIŢII EMPIRICE

Tabele

Colectarea datelor referitoare la caracteristica unei populaţii statistice urmăreşte stabilirea valorii care poate caracteriza un individ al populaţiei sau are ca scop formarea unei concluzii din datele observate.

Statistica descriptivă reprezintă forma cea mai simplă de analiză a caracteristicii unei populaţii şi include colectarea de date, prezentarea lor sub formă de tabele, întocmirea unor reprezentări grafice şi stabilirea indicatorilor statistici. Acest lucru permite obţinerea unor date referitoare la populaţie.

Tabelele sunt alcătuite dintr-o reţea de linii orizontale şi verticale formând linii

Page 2: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

şi coloane în care sunt trecute valorile obţinute ale caracteristicii. Primul tabel care poate fi întocmit, conţinând valorile caracteristicii cercetate:

trecute în ordine întâmplătoare se numeşte tabelul datelor primare. Este clar că tabelul datelor primare se prezintă ca o masă dezordonată de valori.

Aceleaşi valori, aranjate în ordine crescătoare, astfel ca între două valori consecutive să existe relaţia formează tabelul datelor primare.

Frecvenţe şi intervale

Gruparea termenilor

Valorile unei caracteristici se pot prezenta tabelat şi sub formă mai restrânsă efectuând o grupare simplă sau pe intervale. Gruparea simplă, posibilă în anumite cazuri pentru caracteristicile discrete reprezintă un tabel conţinând valorile distincte şi numărul respectiv de apariţii. Adoptarea unui număr m de intervale disjuncte şi gruparea valorilor pe aceste intervale conduce, de asemenea, la întocmirea unui tabel cu clase (intervale) de grupare foarte frecvent utilizat. Numărul unităţilor (elementelor) cu aceeaşi valoare sau aparţinând aceluiaşi interval reprezintă frecvenţa absolută.

. Suma totală a frecvenţelor, egală cu numărul unităţilor cercetate este:

. (6.1)

Raportul dintre frecvenţa absolută şi numărul total de unităţi statistice se

numeşte frecvenţă relativă:

. (6.2)

Suma frecvenţelor relative este egală cu unitatea:

. (6.3)

Intervale de grupare

Mărimea intervalelor (claselor) de grupare se ia în general, egală, cu excepţia intervalelor extreme, pentru care uneori se pot adopta valori diferite. Numărul intervalelor de grupare se poate stabili cu relaţia lui H. A. Sturges:

. (6.4) unde n este numărul total al datelor de observaţie. Pentru n>100 H.B. Mann şi A. Wald

39

Page 3: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

dau relaţia:

. (6.5)

În general se constată că pentru n < 250 sunt suficiente 10 clase de grupare.

6.2. Indicatori statistici

Repartiţia empirică a frecvenţelor arată că pentru orice caracteristică a populaţiei se observă în general o tendinţă de variaţie cu două aspecte: de localizare în jurul aceloraşi valori, dar care prezintă împrăştieri diferite. Se constată, de asemenea, că repartiţie frecvenţelor poate fi simetrică sau asimetrică în raport cu poziţia de localizare. Graficele de frecvenţă prezintă aceste aspecte numai calitativ. O analiză care să permită o comparaţie a tendinţelor de localizare şi de variaţie (împrăştiere) se poate efectua numai cu ajutorul unor indicatori statistici determinaţi de valorile caracteristicilor respective. Există mai mulţi indicatori statistici care exprimă numeric fie localizarea, fie împrăştierea şi care pot fi determinaţi pe baza valorilor caracteristicii. Indicatorii statistici se pot clasifica astfel:1) indicatori de localizare (de poziţie);2) indicatori de variaţie (împrăştiere).

6.2.1. Indicatori de localizare (de poziţie)

Localizarea valorilor poate fi exprimată cu ajutorul unor indicatori care se deosebesc între ei atât ca valoare cât şi ca mod de calcul. Este interesant de subliniat că indicatorul de localizare este o valoare teoretică, putând în multe cazuri să nu existe practic printre valorile populaţiei, ea indicând valoarea spre care tinde să se grupeze datele reale. Indicatorul de bază al tendinţei de localizare este media care se notează în general cu M[X] şi care poate fi de mai multe feluri:

1. Media aritmetică Considerând valorile caracteristicii media aritmetică este dată de relaţia:

. (6.6)

Dacă valorile se repetă, respectiv cu frecvenţele absolute

media aritmetică este:

40

Page 4: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

. (6.7)

unde reprezintă volumul populaţiei statistice.

Media aritmetică mai poate fi exprimată şi cu relaţia:

. (6.8)

unde reprezintă frecvenţa relativă.

2. Media geometrică Considerând valorile caracteristicii media geometrică este:

. (6.9)

Pentru uşurinţa calculului se utilizează logaritmii:

. (6.10)

3. Media armonică Pentru valorile caracteristicii media armonică este:

. (6.11)

4. Media pătratică este:

. (6.12)

5. Mediana M e este valoarea caracteristicii care ocupă locul central în şirul ordonat de valori, împărţind caracteristica în două grupe egale ca număr. Dacă şirul conţine un număr impar de

41

Page 5: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

valori valoarea medianei este dată de valoarea unităţii statistice de rang , adică:

. (6.13)

În cazul unui număr par de valori mediana este egală cu media aritmetică a celor două valori centrale:

. (6.14)

Dacă valorile sunt grupate pe clase, intervalul care conţine elementul median se numeşte interval median sau clasă mediană. Mediana se determină mult mai uşor decât media aritmeticăşi nu necesită nici un fel de calcul. Din cauza uşurinţei de determinare mediana este frecvent folosită în industrie la controlul statistic al fabricaţiei. Mediana este preferată mediei fiind mai puţin afectată de valorile extreme mari sau mici. Mediana este mai stabilă la fluctuaţiile de selecţie decât media aritmetică.

6. Mod – M 0

Valoarea xi a caracteristicii corespunzătoare celei mai mari frecvenţe se numeşte mod. În cazul când repartiţia frecvenţelor este reprezentată de o curbă moda corespunde valorii maxime a caracteristicii. După cum repartiţia empirică are un maximum, două sau mai multe, se numeşte unimodală, bimodală sau polimodală.

În cazul valorilor grupate pe clase, intervalul căruia îi corespunde frecvenţa maximă se numeşte interval modal sau clasă modală.

&. Valoarea centrală

Ca indicator al localizării se utilizează şi media valorilor extreme ale caracteristicii:

. (6.15)

Valoarea centrală se poate referi şi la un interval de grupare k care reprezintă media valorilor limită (inferioară şi superioară) a intervalului:

. (6.16)

42

Page 6: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

6.2.2. Observaţii privind indicatorii de localizare

a. Pentru repartiţii unimodale simetrice abaterea medianei faţă de media aritmetică este egală cu o treime din abaterea modului faţă de media aritmetică (relaţia lui Yulle):

. (6.17)

b. Mediile aritmetică şi pătratică sunt influenţate de valorile mari ale seriei;c. Mediile (geometrică şi armonică) sunt influenţate de valorile mici şi reduc din influenţa valorilor mari;d. Între cei patru indicatori ai mediei există relaţia:

. (6.18)

e. Mediana nu este influenţată de valorile extreme;f. Dintre indicatorii de localizare cel mai important este media aritmetică.

6.3. Indicatorii de variaţie

Variaţia (împrăştierea) unei caracteristici poate fi redată de unul din următorii indicatori:

1. Dispersia caracteristicii, definită în raport cu valoarea medie este dată de relaţia:

.(6.19)

Ţinând seama de relaţia (6.2) relaţia (6.19) se scrie astfel:

. (6.20)

În cazul în care se estimează dispersia populaţiei cu ajutorul unei selecţii,

dispersia de selecţie se calculează cu ajutorul unui factor de corecţie şi se numeşte

dispersie corectată (notată ):

43

Page 7: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

. (6.21)

Abaterea medie pătratică

Un indicator cu semnificaţii directe pentru caracterizarea variaţiei se obţine din rădăcina pătrată a dispersiei şi se numeşte abatere medie pătratică, notată uneori :

. (6.22)

Considerând frecvenţele absolute sau relative relaţia (6.22) devine:

. (6.23)

Dezvoltând relaţia (6.24) se obţine:

. (6.24)

Înlocuind:

.(6.25)

relaţia (6.24) devine:

.(6.26)

În mod similar, după transformări, relaţia (6.23) se poate scrie astfel:

44

Page 8: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

. (6.27)

sau:

. (6.28)

În cazul în care abaterea medie pătratică se estimează cu ajutorul unei selecţii, conform (6.21) rezultă:

. (6.29)

Observaţie

Abaterea unei caracteristici poate fi considerată în raport cu orice constantă. În general, abaterea se ia în raport cu media aritmetică şi în acest caz se numeşte abatere standard.

3. Amplitudinea se notează cu W şi este un indicator statistic definit de diferenţa valorilor extreme:

. (6.30)

În mod similar se defineşte şi amplitudinea clasei, ω, sau a intervalului de grupare care reprezintă diferenţa dintre valorile extreme ale intervalului.

4. Intervalul intercuartilic I Q

Cuartilele sunt definite de trei valori Q1, Q2, Q3 care împart amplitudinea în patru intervale astfel încât frecvenţele relative ale intervalelor să fie egale între ele (fig. 6.1). Rezultă că 25 % din observaţii sunt inferioare cuartilei Q1, 25 % din observaţii sunt superioare cuartilei Q3, iar cuartila Q2 este egală cu mediana Me. Intervalul intercuartilic este definit ca diferenţă dintre prima şi ultima cuartilă:

. (6.31)

Cuartilele şi se mai numesc respectiv cuartila inferioară (mică), respectiv cuartila superioară (mare).

45

Page 9: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

5. Coeficientul de variaţie intercuartilică q este definit de raportul:

. (6.32)

`6. Coeficientul de variaţie C v reprezintă valoarea abaterii standard raportată la media aritmetică:

. (6.33)

`sau considerând abaterea standard corectată:

. (6.34)

Proprietăţi şi observaţii referitoare la indicatorii de variaţie

a. Suma algebrică a abaterilor faţă de media aritmetică este egală zero. Pentru demonstraţie se notează cu abaterea valorii de ordin k în raport cu media aritmetică:

. (6.35)

Media aritmetică a abaterilor este:

.(6.36)

`

Din relaţia (6.35) rezultă că , dacă rezultă că , întrucât este

nenul.b. Suma abaterilor pătratice are valoare minimă atunci când acestea sunt calculate în raport cu media aritmetică. Se consideră suma abaterilor medii pătratice în raport cu variabila arbitrară :

.

(6.37)

46

Page 10: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

Observaţii

1. Al doilea termen din relaţia (6.34) s-a obţinut prin scăderea şi apoi adunarea mediei

aritmetice :

2. Termenul se anulează întrucât este zero, conform

relaţiei (6.35).

Din relaţia (6.37) rezultă:

.(6.38)

este minimă atunci când ceea ce implică:

. (6.39)

Se obţine:

. (6.40)

c. Abaterile în raport cu o valoare constantă oarecare sunt utilizate uneori pentru simplificarea unor calcule. Astfel, valoarea medie a caracteristicii se obţine mai uşor dacă se calculează suma abaterilor adoptându-se astfel ordinul de mărime cel mai convenabil:

. (6.41)

de unde rezultă:

. (6.42)

d. Cei mai utilizaţi indicatori de variaţie sunt dispersia şi abaterea standard.

47

Page 11: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

Momente

Anumite particularităţi legate de forma (alura) repartiţiei nu pot fi redate de indicatorii statistici (de localizare sau variaţie). La fel ca în mecanica solidelor în statistica matematică şi teoria probabilităţilor şi în statistică se utilizează noţiunea de moment şi este extrem de importantă, pe baza sa putându-se stabili indicatori de bază (media şi dispersia) precum şi indicatori privind forma repartiţiei (simetria şi aplatizarea). Momentele se împart în două mari categorii: momente absolute (iniţiale de ordin k) la care valorile sunt considerate în raport cu originea (notate ) şi momente centrate de ordin k la care valorile sunt exprimate în raport cu o valoare arbitrară (notate ).

Moment absolut de ordin k (k>1)

Prin definiţie, momentul absolut (iniţial) de ordin k este dat de relaţia:

. (6.43)

unde sunt valorile observate ale caracteristicii X. Momentul absolut de ordin k poate fi exprimat şi cu ajutorul frecvenţelor absolute sau relative:

. (6.44)

Momentul absolut de ordinul 1 reprezintă media aritmetică:

. (6.45)

De asemenea, momentul absolut de ordin 2 este egal cu pătratul mediei pătratice (relaţia 6.12):

. (6.46)

Momente centrate de ordin k (k>1)

Prin definiţie, momentul centrat de ordin k în raport cu o origine arbitrară A este:

48

Page 12: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

. (6.47)

sau, în funcţie de frecvenţelor relative:

. (6.48)

Momentul centrat de ordin k în raport cu media aritmetică se notează cu şi este dat de expresia:

. (6.49)

sau:

. (6.50)

Momentul centrat de ordinul 2 este egal cu dispersia:

. (6.51)

Relaţii între momentele absolute şi momentele centrate

Între momentele absolute şi momente centrate se pot stabilei anumite relaţii. Pornind de la relaţia (6.49), momentul centrat de ordin 2 poate fi exprimat în funcţie de momentele iniţiale:

.

(6.52)

În mod similar momentul centrat de ordinul 3 este:

(6.53)

49

Page 13: CURS_006_ET_STATISTICA.doc

CONTROL STATISTIC ŞI FIABILITATE

.

50