ST - Lucrarea 2 - Tema de laborator.pdf

27
Repartiția în frecvență a datelor Reprezentarea și prelucrarea primară a șirurilor de date Tema de laborator Rev. 3.3 Lucrarea 2

Transcript of ST - Lucrarea 2 - Tema de laborator.pdf

Page 1: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecvență a datelor

Reprezentarea și prelucrarea

primară a șirurilor de date

Tema de laborator

Rev. 3.3

Lucrarea

2

Page 2: ST - Lucrarea 2 - Tema de laborator.pdf

2 Lucrarea 2

A. Cuprins

A. Cuprins ................................................................................................................ 2

B. Scopul lucrării ...................................................................................................... 3

C. Noțiuni de bază ................................................................................................... 3

1. Repartiții empirice/experimentale .................................................................. 4

1.1. Prezentarea tabelara a datelor................................................................ 4

1.2. Frecvențe şi intervale .............................................................................. 4

1.3. Diagramele repartiției .............................................................................. 5

1.4. Indicatorii statistici ................................................................................... 5

2. Utilizarea programului Excel pentru calculul indicatorilor ............................. 12

D. Desfășurarea lucrării: ........................................................................................ 16

1. Tema ........................................................................................................... 16

2. Prelucrarea rezultatelor ............................................................................... 16

2.1. Introducerea datelor .............................................................................. 16

2.2. Calculul indicatorilor de localizare ......................................................... 17

2.3. Calculul indicatorilor de împrăștiere ...................................................... 18

2.4. Calculul momentelor ............................................................................. 19

2.5. Calculul coeficienţilor de asimetrie și aplatizare .................................... 20

2.6. Trasarea tabelului frecvențelor.............................................................. 20

2.7. Trasarea histogramelor ......................................................................... 23

2.8. Calculul coeficientului de rebut ............................................................. 25

3. Prezentarea rezultatelor: ............................................................................. 27

E. Bibliografie: ........................................................................................................ 27

Page 3: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 3

B. Scopul lucrării Se urmărește realizarea următoarelor obiective:

- prezentarea repartițiilor empirice;

- prezentarea indicatorilor statistici;

- prezentarea noțiunilor generale legate de utilizarea formulelor și funcțiilor utilizând

software-ul Excel;

- prezentarea unei aplicaţii;

C. Noțiuni de bază Măsurarea oricărei mărimi se face cu erori, ceea ce necesita efectuarea de mai

multe ori a măsurării și prelucrarea ulterioara a rezultatelor, cu metodele statisticii

matematice, în vederea determinării cat mai apropiate de realitate a valorii măsurate.

O populație poate fi omogenă (statistica) dacă elementele componente sunt de

acelaşi tip (exemplu: un lot de contactoare cu aceleași date nominale, executate din

același material, etc.) sau neomogenă , la care elementele componente sunt de tipuri

diferite.

Metodele statistice se aplică numai populaţiilor omogene (statistice). În funcție de

numărul indivizilor statistici populaţia statistică poate fi finită sau infinită .

Trăsătura comuna a populației statistice, caracterizata prin valorile particulare

corespunzătoare fiecărui individ, se numește caracteristica și se notează cu litera

mare (A, D, X). Caracteristica poarta denumirea de variabila și poate fi:

- cantitativa: exprimata numeric prin valorile măsurate; aceasta putând fii la rândul

sau: discreta (daca capătă valori izolate, aparținând mulțimii numerelor întregi sau

raționale, spre exemplu: numărul pieselor defecte dintr-un lot) sau continua (daca

intr-un interval dat, capătă orice valoare reala pentru caracteristica);

- calitativa sau atributiva: exprimata prin aprecieri ca: bun sau defect, satisfăcător/

nesatisfăcător;

O populație statistică poate avea una sau mai multe caracteristici. Dacă informațiile

referitoare la caracteristica populației statistice sunt luate de la fiecare component, se

efectuează o cercetare completa (unitară) sau enumerare completă; în cazul când

informațiile se refera numai la o parte din indivizii populației, se face o cercetare

selectiva, indivizii de la care se obțin informațiile formând selecția sau eșantionul. Un

element al populației statistice se numește unitate statistica sau individ statistic.

Colectarea datelor referitoare la caracteristica unei populații statistice urmărește

stabilirea valorii care poate caracteriza un individ al populației sau are ca scop

formarea unor concluzii din datele observate.

Statistica descriptiva reprezintă forma cea mai simpla de analiza a caracteristicii

unei populații și include colectarea de date, prezentarea lor sub forma de tabele,

întocmirea unor reprezentări grafice și stabilirea indicatorilor statistici.

Page 4: ST - Lucrarea 2 - Tema de laborator.pdf

4 Lucrarea 2

1. Repartiții empirice/experimentale

1.1. Prezentarea tabelara a datelor

Tabelele trebuie în aşa fel întocmite încât să permită o interpretare directă şi uşoară

fără a mai necesita texte aplicative suplimentare (vezi Lucrarea 1, Introducerea în

programul Excel. Achiziții de date și reprezentări grafice).

Primul tabel care se întocmeşte este tabelul datelor primare în care sunt trecute în

ordinea măsurării caracteristicile cercetate.

Aceleaşi valori aranjate în ordine crescătoare astfel ca între două valori consecutive

să existe relaţia:

(𝑥𝑖 < 𝑥𝑖+1) (2.1)

formează tabelul valorilor ordonate, totalitatea valorilor unei caracteristici scrise într-

o anumită ordine (crescătoare sau descrescătoare) formând un șir statistic.

1.2. Frecvențe şi intervale

1.2.1 Gruparea termenilor

Valorile unei caracteristici se pot prezenta tabelat și sub forma mai restrânsa

efectuând o grupare simpla sau pe intervale.

Gruparea simplă, posibilă în anumite cazuri pentru caracteristicile discrete, reprezintă

un tabel conținând valorile distincte și numărul respectiv de apariții. Un astfel de tabel

poartă denumirea de tabel cu simplă intrare.

Adoptarea unui număr de intervale disjuncte (m) și gruparea valorilor pe aceste

intervale, conduc de asemenea, la întocmirea unui tabel cu clase (intervale) de

grupare frecvent utilizat. Numărul unităților (elementelor) cu aceeași valoare sau

aparținând aceluiași interval reprezintă frecvența absolută a1, a2, …am, suma totală a

frecvențelor fiind egală cu numărul unităților cercetate n, (și poartă denumirea de

volumul populației statistice) :

∑ 𝑎𝑖 = 𝑛

𝑚

𝑖=1

(2.2)

Raportul dintre frecvența absolută şi numărul total de unități statistice se numește

frecvența relativă; suma totală a frecvențelor relative fiind egală cu unitatea:

𝑓𝑖 =𝑎𝑖

𝑛; ∑ 𝑓𝑖 = 1

𝑚

𝑖=1

(2.3)

În multe cazuri este necesar să se cunoască numărul total de unități statistice până

la o anumită valoare a caracteristicii sau numărul de la o anumită valoare în sus.

Acest număr reprezintă frecventa cumulată, F; aceasta poate fii relativă sau

absolută, după cum se raportează sau nu la numărul total de elemente n, şi de

asemenea crescătoare (daca reprezintă suma frecvențelor pana la valoarea x

inclusiv) sau descrescătoare (dacă reprezintă suma frecvențelor de la valoarea x de

asemenea inclusiv).

Page 5: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 5

𝑨𝒄 = ∑ 𝒂𝒊

𝒏

𝒊=𝟏

; 𝑭𝒄 =𝑨𝒄

𝒏; 𝑨𝒅 = ∑ 𝒂𝒊

𝒏

𝒊=𝟏

; 𝑭𝒅 =𝑨𝒅

𝒏;

(2.4)

1.2.2 Intervale de grupare

Mărimea intervalelor (claselor) de grupare se ia, în general egală, cu excepția

intervalelor extreme, pentru care uneori se pot adopta valori diferite, existând relațiile:

1. Relaţia lui H. A. Sturges (cea mai des utilizata):

𝑚 = 1 + 3,322 ∗ lg 𝑛 (2.5)

unde n reprezintă numărul total al datelor de observaţie.

2. Relaţia lui H. B. Mann şi A. Wald pentru n>100:

𝑚 = 4 [1

4(𝑛 − 1)]

15

(2.6)

3. Prin adoptarea numărului întreg dat de relaţia:

𝒎 = √𝒏 (2.7)

În general s-a constatat că pentru n<250 este suficientă gruparea în zece clase.

Dacă u şi v sunt limitele intervalului de grupare intervalul se consideră totdeauna

semi-închis, fie u,v fie u,v.

1.3. Diagramele repartiției

Graficele cel mai frecvent folosite sunt: histogramele de repartiție a frecvențelor

(simple sau cumulate), diagramele cu bare, poligonul frecvențelor și diagramele

circulare, (vezi Lucrarea 1, Introducerea în programul Excel. Achiziții de date și

reprezentări grafice).

1.4. Indicatorii statistici

Din studiul unei histograme se poate observa că datele experimentale prezintă două

tendinţe:

- o tendința de localizare, când datele se concentrează în jurul unei anumite valori;

- o tendința de împrăştiere, când datele rezultate în urma măsurătorii se vor

încadra totdeauna într-un interval; (exista populații la care localizarea se face în

jurul aceleiași valori, dar care prezintă împrăștieri diferite).

Se constată de asemenea că repartiția frecvențelor poate fii simetrică sau asimetrică

în raport cu poziția de localizare.

Graficele de frecventa prezintă aceste aspecte numai calitativ, o analiza cantitativă

care să permită o comparație a două sau mai multe repartiții experimentale, a

tendințelor de localizare și de variaţie/ împrăștiere se poate efectua numai cu ajutorul

unor indicatori statistici determinați de valorile caracteristicilor respective.

Specific tendinţei datelor indicatorii statistici se clasifică în:

- indicatori de localizare;

- indicatori de împrăştiere.

Page 6: ST - Lucrarea 2 - Tema de laborator.pdf

6 Lucrarea 2

1.4.1 Indicatorii de localizare (de poziție)

Indicatorul de localizare este o valoare teoretică, care poate să nu existe practic

printre valorile măsurate, el indicând valoarea spre care tind să se grupeze datele

reale. Indicatorul de bază al tendinţei de localizare îl reprezintă media care poate fi

calculată în mai multe feluri.

1.4.1.1 Media aritmetică. Considerând valorile unei caracteristici x: x1, x2, ...,xn,

media aritmetică este dată de relaţia:

𝑀[𝑥] =∑ 𝑥𝑖

𝑛𝑖=1

𝑛

(2.9)

Media aritmetică se notează în general cu Mx, pentru loturi de fabricaţie, media

fiind notată cu μ iar pentru eşantioane cu 𝑥. Dacă x1, x2, ...,xn se repetă, respectiv cu

frecvențele absolute a1, a2, ...,an, atunci media aritmetică este:

𝑀[𝑥] =∑ 𝑎𝑖𝑥𝑖

𝑛𝑖=1

𝑛

(2.10)

1.4..1.2. Media geometrică. Cu valorile x1, x2, ...,xn, media geometrică este:

𝑀𝑔 = √𝑥1 ∗ 𝑥2 ∗. . .∗ 𝑥𝑛𝑛 = √∏ 𝑥𝑖

𝑛

𝑖=1

𝑛

(2.11)

1.4.1.3. Media armonică. Pentru valorile x1, x2, ...,xn, media armonică se obţine cu

relaţia:

𝑀𝑎 =𝑛

∑1𝑥𝑖

𝑛𝑖=1

(2.12)

1.4.1.4. Media pătratică. Pentru aceleaşi valori media pătratică este:

𝑀𝑝 = √∑ 𝑥𝑖

2𝑛𝑖=1

𝑛

(2.13)

1.4.1.5. Mediana. Valoarea caracteristicii care ocupă locul central în șirul ordonat de

valori, împărţind caracteristica în două grupe egale ca număr: Dacă șirul conţine un

număr impar de valori (n=2k+1) valoarea medianei este dată de valoarea unită ţii

statistice de rang (n+1)/2, adică :

𝑀𝑒 = 𝑋(

𝑛+12

) (2.14)

În cazul unui număr par de valori mediana este egală cu media aritmetică a celor

două valori centrale:

𝑀𝑒 =𝑥(𝑛/2) + 𝑥(𝑛 2+1⁄ )

2

(2.15)

Dacă valorile sunt grupate pe clase intervalul care conţine elementul median se

numește interval median sau clasă mediană . Mediana se determină mult mai uşor

decât media şi nu necesită nici un calcul. Din cauza uşurinţei de determinare

mediana este folosită frecvent în industrie la controlul statistic al fabricaţiei. Mediana

este preferată uneori mediei fiind mai puţin afectată de valorile extreme, fiind totodată

mult mai stabilă la fluctuaţiile de selecţie decât media aritmetică.

Page 7: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 7

1.4.1.6. Mod sau modală. Este valoarea caracteristicii corespunzătoare celei mai

mari frecvenţe. În cazul în care repartiţia frecvențelor este reprezentată de o curbă,

modala corespunde valorii maxime a caracteristicii. După cum repartiţia

experimentală are unul, două sau mai multe maxime, se numește unimodală,

bimodală, sau polimodală. Dacă valorile sunt grupate pe clase, intervalul care

conţine elementul median se numește interval median sau clasă mediană .

1.4.1.7. Valoarea centrală. Ca indicator al localizării se utilizează şi media

extremelor valorilor caracteristicii:

𝑋𝑐 =𝑋max + 𝑋min

2

(2.16)

Valoarea centrală se poate referi și la un interval de grupare de ordinul i care

reprezintă media valorilor limită (inferior și superior) ale intervalului:

𝑋𝑐𝑖 =𝑋𝑖

inf + 𝑥𝑖sup

2

(2.17)

Proprietăţi și observaţii referitoare la indicatorii statistici de localizare

- Pentru repartiţii unimodale simetrice, abaterea medianei faţă de media aritmetică

este egală cu o treime din abaterea modului faţă de media aritmetică:

|𝑥 − 𝑀𝑒| =|𝑥 − 𝑀𝑜|

3

(2.18)

- Mediile aritmetică și pătratică sunt influenţate de valorile mari ale seriei.

- Mediile geometrică și armonică sunt influenţate de valorile mici și reduc din

influenţa valorilor mari.

- Între cei patru indicatori ai mediei există relaţia:

𝑀𝑎 < 𝑀𝑔 < 𝑥 < 𝑀𝑝 (2.19)

- Mediana nu este influenţată de valorile extreme.

- Dintre indicatorii de localizare cel mai important este media aritmetică.

1.4..2 Indicatori de împrăştiere

Variația (împrăștierea) unei caracteristici poate fi redată cu ajutorul unuia din

următorii indicatori:

1.4.2.1 Dispersia: Notată în general cu Dx, expresia dispersiei este:

𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛

𝑖=1

𝑛

(2.20)

Pentru loturi de fabricaţie dispersia este notată cu σ2 iar pentru eşantioane cu s2.

Dacă x1, x2, ...,xn se repetă, respectiv cu frecvențele absolute a1, a2, ...,an, atunci

dispersia este:

𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑎𝑖

𝑛𝑖=1

𝑛= ∑(𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑓𝑖

𝑛

𝑖=1

(2.21)

În cazul estimării dispersiei populației cu ajutorul unei selecţii, dispersia de selecţie

se ajustează cu un factor de corecţie n/(n-1). În acest caz dispersia se numește

dispersie corectată:

Page 8: ST - Lucrarea 2 - Tema de laborator.pdf

8 Lucrarea 2

𝐷𝐶[𝑥] =𝑛

𝑛 − 1∗ 𝐷[𝑥] =

∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛𝑖=1

𝑛 − 1

(2.22)

1.4.2.2. Abaterea medie pătratică. Acest indicator se obține din rădăcina pătrată a

dispersiei și se notează cu σ pentru lot şi cu s pentru eşantion.

√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛

𝑖=1

𝑛= √

1

𝑛∗ ∑ 𝑥𝑖

2 − 𝑀[𝑥]2

𝑛

𝑖=1

(2.23)

Considerând frecvențele absolute sau relative expresiile abaterii medii pătratice

devin:

√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑎𝑖

𝑛𝑖=1

𝑛= √

∑ 𝑥𝑖2 ∗ 𝑎𝑖

𝑛𝑖=1

𝑛− 𝑀[𝑥]2

√𝐷[𝑥] = √∑(𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑓𝑖

𝑛

𝑖=1

= √∑ 𝑥𝑖2 ∗ 𝑓𝑖 − 𝑀[𝑥]2

𝑛

𝑖=1

(2.24)

În cazul în care abaterea medie pătratică se estimează cu ajutorul unei selecţii

rezultă :

𝑠 = √∑ (𝑥𝑖 − 𝑥−

)2𝑛

𝑖=1

𝑛 − 1

(2.25)

Abaterea unei caracteristici poate fi considerată în raport cu orice constantă . În

general abaterea se ia în raport cu media aritmetică și-n acest caz se numește

abatere standard.

1.4.2.3. Amplitudinea. Este un indicator statistic definit de diferenţa valorilor

extreme.

𝑊 = 𝑥max − 𝑥min (2.26)

În mod similar se poate defini și amplitudinea clasei, w, sau a intervalului de grupare,

care reprezintă diferenţa între valorile extreme ale intervalului.

1.4.2.4. Intervalul intercuartilic. Cuartilele sunt definite de trei valori Q1, Q2, Q3,

care împart amplitudinea în patru intervale astfel ca frecvenţele relative ale

intervalelor să fie egale între ele. Rezultă că 25 din numărul măsurătorilor sunt

inferioare cuartilei Q1, 25 din numărul observaţiilor sunt superioare cuartilei Q3, iar

cuartila Q2 este egală cu mediana Me. Intervalul intercuartilic este definit de diferenţa

dintre prima și ultima cuartilă :

𝐼𝑄 = 𝑄3 − 𝑄1 (2.27)

1.4.2.5. Coeficientul de variaţie intercuartilic. Este definit de raportul:

𝑞 =𝑄3 − 𝑄1

𝑄2=

𝑄3 − 𝑄1

𝑀𝑒

(2.28)

1.4.2.6 Coeficientul de variaţie. Reprezintă valoarea abaterii standard raportată la

media aritmetică.

𝐶𝑣 =𝐷[𝑥]

𝑀[𝑥] 𝑠𝑎𝑢 𝐶𝑣 =

𝑠

𝑥

(2.29)

Page 9: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 9

Acest coeficient poate fi exprimat şi în procente, relaţiile prezentate putând fi utilizate

și în cazul valorilor grupate pe clase.

Proprietăţi și observaţii referitoare la indicatorii de variaţie

- Suma algebrică a abaterilor faţă de media aritmetică este egală cu zero. Notând

abaterea valorii de ordinul i în raport cu media aritmetică :

ε𝑖 = 𝑥𝑖 − 𝑥 (2.30)

Media aritmetică a abaterilor este:

ε =1

𝑛∑ ε𝑖

𝑛

𝑖=1

=1

𝑛∑(𝑥𝑖 − 𝑥) =

1

𝑛∑ 𝑥𝑖 −

𝑛 ∗ 𝑥

𝑛

𝑛

𝑖=1

𝑛

𝑖=1

= 𝑥 − 𝑥 = 0 (2.31)

Dacă : 1

𝑛∑ ε𝑖

𝑛𝑖=1 = 0 rezultă de asemenea și: ∑ ε𝑖

𝑛𝑖=1 = 0

Deoarece suma erorilor măsurătorilor faţă de media aritmetică este zero, pentru

aprecierea erorii totale este necesar ca aceste abateri să fie ridicate la pătrat și apoi

însumate, cea ce ne conduce la formula dispersiei. În consecinţă dintre indicatorii de

împrăştiere dispersia şi abaterea standard reprezintă cei mai buni estimatori ai

dispersiei.

- Suma abaterilor pătratice are valoarea minimă atunci când sunt calculate în raport

cu media aritmetică. Considerând suma abaterilor pătratice în raport cu valoarea

arbitrară x0.

∑(𝒙𝒊 − 𝒙𝟎)𝟐 = ∑[(𝒙𝒊 − 𝒙) − (𝒙𝟎 − 𝒙)]𝟐

𝒏

𝒊=𝟏

𝒏

𝒊=𝟏

(2.32)

Dezvoltând termenul din partea dreaptă se obține:

∑[(𝑥𝑖 − 𝑥) − (𝑥0 − 𝑥)]2 = ∑(𝑥𝑖 − 𝑥)2

− 2 ∗ (𝑥0 − 𝑥) ∗ ∑(𝑥𝑖 − 𝑥) + ∑(𝑥0 − 𝑥)2

𝑛

𝑖=1

𝑛

𝑖=1

𝑛

𝑖=1

𝑛

𝑖=1

(2.33)

Conform celor arătate mai sus (suma algebrică a abaterilor față de media aritmetică,

vom obține:

∑(𝑥𝑖 − 𝑥0)2 = ∑(𝑥𝑖 − 𝑥)2

+ 𝑛 ∗ (𝑥0 − 𝑥)2

𝑛

𝑖=1

𝑛

𝑖=1

(2.34)

Rezultă :

∑(𝑥𝑖 − 𝑥0)2 > ∑(𝑥𝑖 − 𝑥)2

𝑛

𝑖=1

𝑛

𝑖=1

(2.35)

Deci suma abaterii pătratice este minimă dacă :

𝑥0 = 𝑥 (2.36)

- Abaterile în raport cu o constantă oarecare x0 sunt folosite uneori pentru

simplificarea unor calcule. Astfel valoarea medie a caracteristicii se obţine mai uşor

dacă se calculează suma abaterilor x’i =xi-x0 adoptându-se astfel ordinul de mărime

cel mai convenabil:

𝑥′ =1

𝑛∑ 𝑥′𝑖

𝑛

𝑖=1

=1

𝑛∑(𝑥𝑖 − 𝑥0

𝑛

𝑖=1

) =1

𝑛∑ 𝑥0

𝑛

𝑖=1

− 𝑥0 = 𝑥 − 𝑥0

(2.37)

de unde rezultă:

Page 10: ST - Lucrarea 2 - Tema de laborator.pdf

10 Lucrarea 2

𝑥 = 𝑥0 +1

𝑛∑ 𝑥′𝑖

𝑛

𝑖=1

= 𝑥0 − 𝑥′

(2.38)

Dispersia şi abaterea standard sunt cei mai utilizaţi indicatori de variaţie.

1.4.3. Momente

Pentru stabilirea formei (alura) funcţiei de repartiţie experimentale şi a unor

particularităţi a acesteia s-a introdus noţiunea de moment. Între aceștia şi indicatorii

de bază existând o strânsă legătură. Momentele se împart în două categorii:

- momente absolute de ordinul k la care valorile sunt considerate în raport cu

originea;

- momente centrate de ordinul k (la care valorile sunt exprimate în raport cu o

valoare arbitrară)

1.4.3.1 Moment absolut de ordinul k (k>1)

Prin definiţie momentul absolut de ordinul k (k>1), este dat de relaţia:

𝑚𝑘 =1

𝑛∑ 𝑥𝑖

𝑘

𝑛

𝑖=1

(2.39)

unde x1, x2,...,xn, sunt valorile mă surate, ale caracteristicii x. Momentul absolut de

ordinul k poate fi exprimat şi cu ajutorul frecvențelor absolute sau relative.

𝑚𝑘 =1

𝑛∑ 𝑥𝑖

𝑘 ∗ 𝑎𝑖

𝑛

𝑖=1

= ∑ 𝑥𝑖𝑘 ∗ 𝑓𝑖

𝑛

𝑖=1

(2.40)

Se observă că momentul absolut de ordinul 1 reprezintă media aritmetică :

𝑚1 =1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

= 𝑥−

(2.41)

De asemenea momentul absolut de ordinul 2 este egal cu pătratul mediei pătratice.

𝑚2 =1

𝑛∑ 𝑥𝑖

2

𝑛

𝑖=1

= 𝑀𝑝2

(2.42)

1.4.3.2 Momentul centrat de ordinul k (k>1)

Prin definiţie, momentul centrat de ordinul k (k>1), în raport cu o origine arbitrară

este:

𝑀𝑘δ =

1

𝑛∑(𝑥𝑖 − δ)𝑘

𝑛

𝑖=1

(2.43)

sau în funcţie de frecvenţă :

𝑀𝑘δ =

1

𝑛∑(𝑥𝑖 − δ)𝑘

𝑛

𝑖=1

∗ 𝑎𝑖 = ∑(𝑥𝑖 − δ)𝑘

𝑛

𝑖=1

∗ 𝑓𝑖

(2.44)

Momentul centrat de ordinul k în raport cu media aritmetică se notează cu Mk şi este

dat de expresia:

𝑀𝑘 =1

𝑛∑(𝑥𝑖 − 𝑥)𝑘

𝑛

𝑖=1

(2.45)

sau:

Page 11: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 11

𝑀𝑘 =1

𝑛∑(𝑥𝑖 − 𝑥)𝑘

𝑛

𝑖=1

∗ 𝑎𝑖 = ∑(𝑥𝑖 − 𝑥)𝑘

𝑛

𝑖=1

∗ 𝑓𝑖

(2.46)

Momentul centrat de ordinul 2 este egal cu dispersia:

𝑀2 =1

𝑛∑(𝑥𝑖 − 𝑥)2

𝑛

𝑖=1

= 𝐷[𝑥]

(2.47)

1.4.3.3 Relaţii intre momentele absolute şi momentele centrate

Intre momentele absolute şi cele centrate se pot scrie următoarele relaţii:

𝑀1 = 0

𝑀2 = 𝑚2 − 𝑚12 = 𝐷[𝑥]

𝑀3 = 𝑚3 − 3𝑚1𝑚2 + 2𝑚13

𝑀4 = 𝑚4 − 4𝑚1𝑚3 + 6𝑚1𝑚2 − 3𝑚1

(2.48)

1.4.3.4 Corecţia momentelor

În general gruparea valorilor pe clase conduce la anumite erori, deoarece în calculele

indicatorilor statistici frecvenţa este considerată corespunzătoare valorii centrale a

intervalului de grupare. Această consideraţie presupune o repartiţie uniformă a

datelor în interiorul clasei, lucru rar întâlnit. Corectarea valorilor din acest punct de

vedere este cunoscută sub numele de corecţia Sheppard. Media nu necesită nici o

corecţie deoarece:

𝑥 =1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

= δ +1

𝑛∑(𝑥𝑖

𝑛

𝑖=1

− δ)

(2.49)

Nici momentul absolut de ordinul 3 nu necesită corecţii.

În cazul momentelor absolute de ordinul 2 şi 4 se realizează corecțiile, conform

relaţiilor:

𝑚2 = 𝑚2 −1

12ϖ2

𝑚4 = 𝑚4 −1

2ϖ𝑚2 +

7

240ϖ4

(2.50)

unde reprezintă amplitudinea intervalului de grupare.

1.4.3.5 Indicatori pentru asimetrie şi aplatizare

Există diferite moduri prin care se poate aprecia asimetria unei repartiţii, cel mai

utilizat fiind coeficientul de asimetrie (2.51) și coeficientul de exces (2.52) (care se

referă la gradul de ascuțire/aplatizare a unei repartiții), indicatori obținuți cu ajutorul

momentelor, exprimați de relaţiile:

γ1 =𝑀3

𝑀23/2

=𝑀3

√𝐷[𝑥]3

(2.51)

γ2 =𝑀4

𝑀22 − 3 =

𝑀4

𝐷[𝑥]2− 3

(2.52)

Page 12: ST - Lucrarea 2 - Tema de laborator.pdf

12 Lucrarea 2

1>0 1=0 1<0

Repartiție asimetrică la

dreapta

Repartiție simetrica Repartiție asimetrică la

stânga

Fig.2.1: Indicarea tipului de asimetrie de către coeficientul de asimetrie; simetria repartiției

Excesul sau aplatizarea se exprimă având ca etalon de referință repartiţia normală la

care 2=0. Pentru 2<0 repartiţia este mai aplatizată decât cea normală iar pentru

2>0 repartiţia este mai ascuţită , (Fig. 2.2). Repartiţiile experimentale pot avea unul

sau mai multe maxime. Repartiţia cu un singur maxim se numește repartiţie

unimodală; dacă repartiţia are mai multe maxime repartiţia se numeşte repartiţie

polimodală, (Fig. 2.3).

2<0 2=0 2>0

Repartiție aplatizată Repartiție normală Repartiție ascuțită

Fig.2.2: Indicarea excesului sau a aplatizării repartiției de către coeficientul de asimetrie𝛾2

Se pot întâlni repartiţii la care în loc de un maxim să apară un minim, în acest caz

repartiţia numindu-se repartiţie antimodală, (Fig. 2.3). Un caz particular de repartiţie

antimodală îl reprezintă repartiţia uniformă la care frecvențele rămân constante.

Repartiție unimodală Repartiție bimodală Repartiție antimodală

Fig.2.3: Tipuri de repartiții

2. Utilizarea programului Excel pentru calculul indicatorilor

Pentru efectuarea calculelor necesare prelucrării datelor statistice puteți utiliza

formulele și funcțiile oferite de software-ul de specialitate Excel.

Formulele sunt folosite în foile de calcul pentru efectuarea calculelor cu cifrele

introduse (sau generate), putând fii efectuate operații de adunare, scădere, înmulțire,

împărțire etc., folosind valorile din diferite celule.

Page 13: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 13

Formulele sunt formate de regula din una sau mai multe adrese de celule sau valori

și un operator matematic cum ar fii: + (adunare), - (scădere), * (înmulțire),

/(împărțire), ș.a.m.d. Orice formula este formata din următoarele elemente:

1- Semnul = , ce arata ca ceea ce urmează este o formula;

2- Argumentul 1 (cum ar fii: A1),

3- Operatorul matematic;

4- Argumentul 2 (cum ar fii: B1), argumentele indicând adresele celulelor cu valorile

afectate de formula.

Când folosiți formulele pentru a efectua anumite calcule, Excel va recalcula automat

rezultatul la orice modificare a valorilor numerice care participă la respectivul calcul.

Formulele pot fi introduse în două moduri: tastând formula direct în celulă sau

indicând celulele cu care formula va opera. Astfel:

Operatorul Operatia

+

-

*

/

%

^

Adunare

Scadere

Inmultire

Impartire

Calcul procentual

Ridicare la putere

1

2 3

4

5

Fig.2.4: Introducerea unei formule prin tastare/ indicare; operatori matematici

La crearea formulelor este recomandată introducerea datelor necesare în foaia de

calcul, referirea celulelor respective în cadrul relaţiilor de definiție a formulelor

făcându-se ulterior; în acest mod la orice modificare a valorilor numerice din celule,

Excel va recalcula imediat rezultatul.

Observație: puteți să obțineți suma unui grup de celule şi selectând pur și simplu

celulele respective și citind rezultatul de pe bara de stare; puteți să aflați astfel și

media, valoarea minimă sau cea maximă, şi numărul celulelor dintr-un domeniu,

pentru aceasta executând clic cu butonul din dreapta pe bara de stare și selectați

opțiunea dorita din meniul de comenzi rapide care apare pe ecran.

În mod normal, Excel nu afișează în celulă formula propriu-zisa, ci rezultatul

calculului; puteți totuși să vedeți formula selectând celula şi citind-o pe bara cu

formule.

În cazul copierii formulelor (utilizând opțiunile Copy şi Paste, …), acestea sunt

adaptate pentru a corespunde poziției celulei în care va fi copiata (de exemplu: dacă

copiați formula =C2+C3 din celula C4 în celula D4, aceasta este adaptată pentru

coloana D, devenind =D2+D3). De asemenea, în cazul copierii unei formule dintr-o

pagina de calcul în alta, Excel adaptează referințele celulei din formule în funcție de

noua poziție în foaia de calcul.

Dacă doriți ca referințele sa nu fie modificate atunci când copiați formulele, veți lucra

cu referinţe absolute.

Page 14: ST - Lucrarea 2 - Tema de laborator.pdf

14 Lucrarea 2

Observație: O referință absolută este referința la o celula dintr-o formulă care nu se

schimbă atunci când formula este copiată în alta parte. O referință relativă este o

referință la o celulă care este adaptată atunci când este copiată.

Pentru a face ca o referință la o celulă dintr-o formulă să fie absolută, trebuie să-i

adăugați simbolul dolarului ($) înaintea literei și a numărului care reprezintă adresa

celulei (de exemplu: =$B$10). De asemenea utilizarea tastei F4 permite folosirea

coordonatelor absolute pentru indicarea celulei, şi anume:

1. Selectați celula în care va apare formula;

2. Tastați semnul = (egal) pentru a începe introducerea formulei;

3. Introduceți operatorul;

4. Executați clic asupra următoarei celule implicate în calcul;

5. Apăsați tasta F4 (Coordonate absolute);

6. Apăsați tasta Enter.

Funcțiile sunt formule complexe preformate, folosite pentru executarea unei serii de

operații cu un grup specificat de valori (de exemplu, pentru a calcula suma unei serii

de numere din celulele A1-H1, puteți folosii funcția =SUM(A1:H1) în loc să

introduceți formula =A1+B1+C1…+H1. Funcțiile pot folosi referinţe la domenii de

celule, denumiri de domenii sau valori numerice.

Orice funcție este formata din următoarele trei elemente:

1. Semnul = arata că ceea ce urmează este o funcție;

2. denumirea funcției (de exemplu: SUM), arată ce operaţie va fii efectuată;

3. argumentul (cum ar fii: (A1:H1)), indică adresele celulelor cu valorile afectate de

funcție; argumentul este adeseori un domeniu de celule, dar poate fi și mult mai

complex;

1

2 3

4

6

7

Fig.2.5: Introducerea unei funcții într-o celulă; însumarea conținutului unui rând/ coloană utilizând

comanda AutoSum (Însumare automată)

Astfel pentru introducerea unei funcții într-o celulă avem:

1. selectați celula în care doriți să introduceți formula;

2. tastați semnul = (egal) pentru a începe introducerea functiei;

3. introduceți numele funcției urmat de o paranteză deschisă (exemplu: funcția

AVERAGE - Media aritmetica);

Page 15: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 15

4. selectați grupul de celule folosite ca argument;

5. apăsați tasta Enter.

Dacă nu sunteți sigur de modul în care operează o anumita funcție, facilitatea

Function Wizard (Asistent pentru funcții) va poate ghida în procesul introducerii

acesteia, pașii parcurși (prezentați în figura 2.6) fiind:

1- executați dublu clic asupra celulei în care doriți să apăra funcția;

2- executați clic asupra butonului Function Wizard (Asistent pentru funcții), sau

alegeți opțiunile Insert, Function… (Introducere, Funcții..). ;

3- selectați categoria;

4- selectați funcția;

5- executați clic asupra butonului ok;

6- în căsuța de dialog care s-a deschis, introduceți argumentele functiei;

7- citiți informațiile referitoare la funcția aleasa;

8- executai clic asupra butonului ok;

9- apăsați tasta Enter pentru vizualizarea rezultatului.

1

2

3

4

6

7

8

Fig.2.6: Utilizarea facilitații Function Wizard (Asistent pentru funcții)

Când folosiți în comun cu alți utilizatori o foaie de calcul sau dacă datele utilizate de

către formulă se modifică periodic, aveți posibilitatea indicării naturii conținutului unei

celule prin intermediul unei note descriptiv-explicative, atașată fiecărei celule în

parte, pentru aceasta fiind necesari parcurgerea următorilor pași:

1. selectați celula căreia doriți sa-i atașați o nota explicativă;

2. executați clic dreapta și selectați opțiunea Insert Comment (Introducere,

Comentariu explicativ);

3. în căsuța de dialog care s-a deschis, introduceți textul notei explicative;

Afișarea notei explicative presupune poziționarea indicatorului mausului pe celulă

(apare textul din nota explicativă); Înlăturarea unei note se realizează prin selectarea

acesteia şi execuția clic asupra butonului Delete (Ștergere).

Page 16: ST - Lucrarea 2 - Tema de laborator.pdf

16 Lucrarea 2

D. Desfășurarea lucrării:

1. Tema

Să se genereze un șir de 60 de valori aşezate într-un tabel cu 12 coloane.

Generarea numerelor va fi aleatoare, datele vor fi normal repartizate, cu media egală

cu ziua de naștere și dispersia cuprinsă în intervalul 0,01-0,31 va fi de forma 0,XX,

unde XX reprezintă ziua nașterii.

Exemplu: Pentru un student/studentă născută în 22 ianuarie media va fi 22 și

dispersia 0,22.

Să se completeze un raport care să cuprindă:

1. datele primare;

2. indicatorii de localizare (mediile, modală, mediană, valoarea centrală;

3. indicatorii de împrăştiere (dispersia, abaterea medie pătratică, amplitudinea);

4. momentele absolute de ordinele 1, 2, 3;

5. momentele centrate de ordinele 1, 2, 3, 4;

6. coeficientul de aplatizare,

7. coeficientul de asimetrie.

8. tabelul frecvențelor (absolute, relative, crescătoare, descrescătoare

9. histograma

10. procentul de rebut pentru intervalul:

Media aritmetica ±95%*Amplitudinea/2

2. Prelucrarea rezultatelor

2.1. Introducerea datelor

Pe baza celor enunţate anterior se va introduce un șir de date, n= 60, utilizând

software-ul Excel, şi anume:

1. Selectaţi panoul Data și din secțiunea Analysis selectați Data Analysis

(Instrumente, Analiza datelor);

2. Selectaţi din caseta de dialog care s-a deschis opţiunea Random Number

Generation (Generare de Numere Aleatorii);

3. Executaţi clic asupra butonului OK;

4. În caseta de dialog care se deschide selectaţi:

Number of Variables (Numărul coloanelor generate): 12;

Number of Random Number (Numărul rândurilor generate): 5;

Distribution: Normal (Distribuţia, Normala):

Mean (Media):XX (unde XX este ziua nașterii);

Standard Deviation (Abaterea standard): 0,XX (unde XX este ziua

nașterii);

Output Range (Afişarea generării), selectând/introducând domeniul

(rândul/coloană) unde dorim sa fie afişat şirul de date generat;

5. Executaţi clic asupra butonului OK.

Page 17: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 17

2.2. Calculul indicatorilor de localizare

După generarea şirului de date se trece la calcularea indicatorilor de localizare

utilizând formulele (2.10), (2.11), (2.12), (2.13), (2.14), (2.15), (2.16).

Atenție: Valorile căsuțelor din formule sunt doar pentru exemplificare!

2.2.1. Media aritmetică:

𝑀[𝑥] =∑ 𝑥𝑖

𝑛𝑖=1

𝑛

Astfel, în Excel se va putea scrie: =AVERAGE(A1:L5) unde A1:L5 sunt adresele ce

conțin valorile generate.

2.2.2. Media geometrică.

Cu valorile x1, x2, ... xn, media geometrică este:

𝑴𝒈 = √𝒙𝟏 ∗ 𝒙𝟐 ∗. . .∗ 𝒙𝒏𝒏 = √∏ 𝒙𝒊

𝒏

𝒊=𝟏

𝒏

Astfel: =GEOMEAN(A1:L5) unde A1:L5 sunt adresele ce conțin valorile generate.

2.2.3. Media armonică

Pentru valorile x1, x2, ... xn, media armonică se obţine cu relaţia:

𝑀𝑎 =𝑛

∑1𝑥𝑖

𝑛𝑖=1

Utilizând Excel, avem: =HARMEAN(A1:L5) unde A1:L5 sunt adresele ce conțin

valorile generate.

2.2.4. Media pătratică.

Pentru aceleaşi valori x1, x2, ... xn, media pătratică este:

𝑀𝑝 = √∑ 𝑥𝑖

2𝑛𝑖=1

𝑛

Pentru calcularea funcţiilor mai complexe care necesită doi sau mai mulţi paşi pentru

rezolvarea lor, se va utiliza o foaie de calcul suplimentară. În aceasta datele sunt

aranjate în coloană. Pentru calculul mediei pătratice valorile sunt ridicate la pătrat și

însumate. Rezultatul final se obține: =SQRT(R64/60) unde R64 este valoarea căsuței

ce conține suma valorilor generate ridicate la pătrat.

Cu valorile calculate se verifica relația, (2.19) Ma<Mg<M[x]<Mp.

2.2.5. Mediana:

Datele vor fi trecute într-o foaie de calcul suplimentară într-o coloană în care vor fi

copiate unitate cu unitate. Se va face sortarea acestora. Deoarece numărul de valori

este par mediana va fi calculata aplicând formula:

Page 18: ST - Lucrarea 2 - Tema de laborator.pdf

18 Lucrarea 2

𝑀𝑒 =𝑥30 + 𝑥31

2

Astfel: =SUM(P33+P34)/2 unde P33 și P34 sunt valorile din mijlocul șirului valorilor

generate aranjate crescător.

Alternativ se poate folosi formula: =MEDIAN(A1:L5) unde A1:L5 sunt adresele ce

conțin valorile generate.

2.2.6. Modala.

Modala se determină după trasarea histogramei deoarece acolo se observă care

este intervalul cu frecvența maximă.

2.2.7. Valoarea centrala:

𝑋𝑐 =𝑋max + 𝑋min

2

Pentru determinarea valorii centrale, mai întâi trebuie să determinăm valoarea

minimă și maximă a şirului nostru. Astfel:

- valoarea maximă va fi =MAX(A1:L5)

- valoarea minimă va fi =MIN(A1:L5)

unde A1:L5 sunt adresele ce conțin valorile generate.

Utilizând funcţiile Excel pentru determinarea valorii centrale avem:

=SUM(MAX(A1:L5)+MIN(A1:L5))/2

unde A1:L5 sunt adresele ce conțin valorile generate.

Observaţie: Valoarea centrală se poate referi şi la un interval de grupare de ordin i

care reprezintă media valorilor limită (inferior şi superior) ale intervalului.

2.3. Calculul indicatorilor de împrăștiere

Calcului indicatorilor de împrăştiere se face cu ajutorul relaţiilor (2.20), (2.21), (2.23),

(2.24), (2.26);

2.3.1. Dispersia:

𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛

𝑖=1

𝑛

Pentru calculul in Excel al dispersiei se va folosi formula directa aflata in secţiunea

din program relativa funcţiilor: =VAR(A1:L5) unde A1:L5 sunt adresele ce conțin

valorile generate.

2.3.2. Abaterea standard(abaterea medie pătratică):

√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛

𝑖=1

𝑛= √

1

𝑛∗ ∑ 𝑥𝑖

2 − 𝑀[𝑥]2

𝑛

𝑖=1

În Excel: =STDEV(A1:L5) sau =SQRT(F11) unde A1:L5 sunt adresele ce conțin

valorile generate iar F11 valoarea ocupată de dispersie.

Page 19: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 19

2.3.3. Amplitudinea:

𝑊 = 𝑥max − 𝑥min

În cazul exemplului nostru va fi: =(P63-P4) unde P63 și P4 sunt valorile maximă

respectiv minimă.

2.4. Calculul momentelor

Calculul momentelor absolute și centrale utilizând formulele (2.39), (2.45).

2.4.1. Moment absolut de ordin 1

𝑚1 =1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

= 𝑥−

Formula de mai sus reprezintă formula generalizată a momentului în cazul nostru

momentul de ordin 1 fiind media aritmetică a şirului de date.

În Excel ea putând fi scrisă: =SUM(P4:P63)/60 unde P4-P63 sunt valorile generate

aleatoriu.

2.4.2. Moment absolut de ordin 2

Pentru determinarea momentului absolut de ordin 2 va fi nevoie să se utilizeze foaia

de calcul unde se utilizează coloana care-l cuprinde pe xi2

Astfel rezultatul obţinut va putea fi determinat cu ajutorul formulei:

=SUM(R4:R63)/60 unde R4-R63 sunt valorile generate aleatoriu ridicate la pătrat.

2.4.3. Moment absolut de ordin 3

Va rezulta cu ajutorul foi de calcul unde se utilizează coloana care-l cuprinde pe xi3 și

a formulei: =SUM(S4:S63)/60 unde S4-S63 sunt valorile generate aleatoriu ridicate la

cub.

2.4.4. Moment absolut de ordin 4

Va rezulta cu ajutorul foii de calcul unde se utilizează coloana care-l cuprinde pe xi3 și

a formulei: =SUM(T4:T63)/60 unde T4-T63 sunt valorile generate aleatoriu ridicate la

puterea a patra.

2.4.5. Moment centrat de ordin 1

𝑀𝑘 =1

𝑛∑(𝑥𝑖 − 𝑥)𝑘

𝑛

𝑖=1

Și pentru determinarea momentelor centrate de ordin 1, 2, 3, 4 se va apela la ajutorul

foii de calcul.

Astfel cu ajutorul programului Excel vom putea scrie: =SUM(U4:U63)/60 unde

U4:U63 sunt valorile diferențelor dintre fiecare valoare generată (xi) și media lor

aritmetică (�̅�=M[x]).

Page 20: ST - Lucrarea 2 - Tema de laborator.pdf

20 Lucrarea 2

2.4.6. Moment centrat de ordin 2

Acest moment va corespunde valorii dispersiei astfel se va putea verifica daca

calculul a fost efectuat corect: =SUM(V4:V63)/60 unde V4:V63 sunt valorile

diferențelor dintre fiecare valoare generată și media lor aritmetică calculate anterior

(U4:U63), ridicate la pătrat.

2.4.7. Moment centrat de ordin 3

Se calculează în Excel cu: =SUM(W4:W63)/60 unde W4:W63 sunt valorile

diferențelor dintre fiecare valoare generată și media lor aritmetică calculate anterior

(U4:U63), ridicate la cub.

2.4.8. Moment centrat de ordin 4

Se calculează în Excel cu: =SUM(X4:X63)/60 unde X4:X63 sunt valorile diferențelor

dintre fiecare valoare generată și media lor aritmetică calculate anterior (U4:U63),

ridicate la puterea a patra.

2.5. Calculul coeficienţilor de asimetrie și aplatizare

Calcului coeficienţilor de asimetrie si aplatizare utilizând formulele (2.51), (2.52);

2.5.1. Coeficientul de asimetrie

γ1 =𝑀3

𝑀23/2

=𝑀3

√𝐷[𝑥]3

În Excel: =L13/(POWER(L12,3/2)) unde L13 este valoarea lui M3 iar L12 este

valoarea lui M2.

2.5.2. Coeficientul de aplatizare

γ2 =𝑀4

𝑀22 − 3 =

𝑀4

𝐷[𝑥]2− 3

În Excel: =L14/(POWER(L12,2))-3 unde L14 este valoarea lui M4 iar L12 este

valoarea lui M2.

2.6. Trasarea tabelului frecvențelor

În continuare pe baza relaţiilor prezentate în lucrare vom putea determina:

2.6.1. Numărul de clase m

Se calculează utilizând formula (2.5);

𝑚𝑐𝑎𝑙𝑐 = 1 + 3,322 ∗ lg 𝑛

Utilizând funcţiile Excel, aceasta formula va fi scrisă în celula selectată sub forma:

=1+3.322*LOG10(60) obţinând valoarea: m=6.907;

Fiind necesar un număr întreg de clase, se adopta un număr de 7 clase, astfel ca:

m=7 este valoarea numărului de clase aproximat.

Page 21: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 21

2.6.2. Mărimea unui interval d

Se determina utilizând formula:

𝑑 =𝑊

𝑚=

𝑥max − 𝑥min

𝑚

Utilizând Excel, valoarea obţinuta este: =O9/O8 unde adresa O9 corespunde valorii

amplitudinii, iar O8 valorii numărului de clase aproximat; valoarea intervalului obţinut

va corespunde in continuare adresei O10.

2.6.3. Întocmirea tabelului datelor grupate

Reprezentând valorile intervalelor, astfel: [xmin: xmin+d); [xmin+d: xmin+2d);… (xmax];

Utilizând Excel, introducerea acestor valori poate fi realizata după cum este

prezentat în Figura 2.7.

Fig. 2.7. Determinarea intervalelor

2.6.4. Calcularea frecvențelor absolute (ai)

Se poate realiza în mai multe feluri printre care:

a. utilizând facilităţile de sortare ale software-ul Excel, si anume (Figura 2.8.):

1. selectaţi opţiunea Data, Filter, pentru şirul generat din foaia de calcul;

2. Din lista ce apare în dreptul capului de tabel (printr-un clic pe săgeată)

selectați Number Filters și Custom Filter;

3. În cele două câmpuri introducem condițiile de filtrare respectiv: pentru primul

interval, toate valorile mai mari sau egale cu minimul și mai mici strict ca

minim + valoarea intervalului;

4. După executarea unui clic pe butonul OK, Excel va păstra doar valorile care

respectă criteriile de filtrare; se numără valorile și se introduc în coloana ai în

dreptul intervalului folosit pentru filtrare;

5. Se repetă pașii până când se trece prin toate intervalele, având grijă ca la

ultimul interval să includem și valoarea maximă.

Page 22: ST - Lucrarea 2 - Tema de laborator.pdf

22 Lucrarea 2

Fig. 2.8: Opţiunea de filtrare a datelor; opţiunea client

b. Utilizând funcția countifs:

1. Funcția counifs numără o valoare din unul sau mai multe intervale dacă

este respectată una sau mai multe condiții. Astfel argumentele funcției sunt

intervalul de valori din care se numără și condiția. Spre exemplu:

=COUNTIFS($P$2:$P$61,">="&A22, interval_2, condiție_2) va număra

din intervalul marcat cu albastru doar valorile care respectă condiția

marcată cu verde (în exemplu: dacă valoarea fiecărui număr din intervalul

P2:P61 este mai mare sau egală cu valoarea din căsuța A22) ș.a.m.d. Mai

multe detalii despre folosirea funcției puteți obține din meniul Help;

2. În coloana ai se vor introduce formulele astfel:

=COUNTIFS($A$6:$J$15,">="&F22,$A$6:$J$15,"<"&G22)

Unde: intervalul roșu este cel care conține valorile generate, valoarea albastră este

capătul din stânga a intervalului considerat iar valoarea verde capătul din dreapta al

intervalului.

3. Formula se poate propaga pe întreaga coloană având grijă ca la final

condiția pentru capătul din dreapta să includă și valoarea maximă.

Verificarea rezultatelor se face cu formula (2.2.):

∑ 𝑎𝑖 = 𝑛

𝑚

𝑖=1

2.6.5. Calcularea frecvențelor relative (fi)

Se realizează utilizând formula (2.3)

𝑓𝑖 =𝑎𝑖

𝑛; ∑ 𝑓𝑖 = 1

𝑚

𝑖=1

Page 23: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 23

Astfel:

=C21/60; =C22/60 ….; ș.a.m.d pentru fiecare valoare f1, f2, ...f6; unde C21,

C22…sunt valorile frecvenței absolute.

Verificarea rezultatelor presupunând însumarea valorilor frecvențelor relative (vezi

formula (2.3)): =SUM(D21:D27) (deoarece valorile frecvențelor relative corespund

adreselor de la D21 la D27), valoarea obţinută fiind 1.00 (ceea ce este conform

formulei (2.3).

2.6.6. Calcularea frecvențelor cumulate (Ac, Ad, Fc, Fd)

Calculul şi prezentarea lor tabelară se va realiza utilizând rezultatele anterior

obţinute, şi anume valorile ai şi fi, şi au la baza relaţiile (2.4).

𝑨𝒄 = ∑ 𝒂𝒊

𝒊

𝒊=𝟏

; 𝑭𝒄 =𝑨𝒄

𝒏; 𝑨𝒅 = ∑ 𝒂𝒊

𝒋

𝒊=𝒏

; 𝑭𝒅 =𝑨𝒅

𝒏;

Astfel, utilizând funcţiile Excel, vom avea:

=C21; =SUM(C21:C22);… =SUM(C21:C27) pentru Ac;

=SUM(C21:C27); =SUM(C22:C27);… =C27 pentru Ad;

=E21/60; =E22/60; … =E27/60 pentru Fc;

=F21/60; =F22/60;… =F27/60 pentru Fd;

Unde C21:C27 sunt valorile frecvenței absolute (ai), E21:E27 valorile frecvenței

absolute crescătoare (Ac) și F21:F27 valorile frecvenței absolute descrescătoare (Ad).

Valorile obținute sunt similare celor din Tabelul 1.1.

Tab. 1.1. Valorile pentru frecvențele cumulate

Ac Fc Ad Fd

3.000 0.167 18.000 1.000

8.000 0.444 15.000 0.880

14.000 0.778 10.000 0.586

15.000 0.833 4.000 0.235

17.000 0.944 3.000 0.176

18.000 1.000 1.000 0.059

2.7. Trasarea histogramelor

Pentru trasarea graficelor se urmează următorii pași (Figurile 2.9 -2.11)

1. Selectaţi datele pe care doriţi sa le reprezentaţi grafic;

2. Executaţi clic asupra butonului Column (Coloane) din secțiunea Charts

(Grafice) a panoului Insert;

3. Selectaţi tipul de grafic dorit;

4. Adaptați graficul după dorințe atribuindu-i un format (din Layout) și

adăugând elementele dorite (titlu, etichete pentru axe, etc.);

Page 24: ST - Lucrarea 2 - Tema de laborator.pdf

24 Lucrarea 2

Fig. 2.9: Trasarea histogramei frecvențelor relative fi

Fig. 2.10. Trasarea histogramei frecvențelor relative crescătoare Fc

Fig. 2.11: Trasarea histogramei frecvențelor relative descrescătoare Fd

0.000

0.200

0.400

0.600

0.800

1.000

1.200

19.626 19.768 19.909 20.051 20.192 20.334 20.475

19.484 19.626 19.768 19.909 20.051 20.192 20.334

Val

oar

ea

fre

cve

nțe

i

Valoarea clasei

Reprezentarea frecvenței relative crescătoare

Page 25: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 25

2.8. Calculul coeficientului de rebut

Procentului de rebut pentru intervalul Media aritmetica ±95%*Amplitudinea/2

Pentru a determina coeficientul de rebut este necesar mai întâi determinarea

intervalului de semnificaţie. Pentru aceasta se calculează limitele acestui interval, ca

fiind M[x] ±95%*W/2. unde M[x] este media aritmetică iar W este amplitudinea.

Cu ajutorul funcţiilor Excel și relaţiei de mai sus se determina limitele, inferioară

(pentru formula cu minus) și superioară (pentru formula cu plus).

Coeficientul de rebut este reprezentat de suma ariilor din histogramă, aflate în afara

limitelor intervalului de semnificaţie. Aceste două arii vor fi notate în continuare cu

(A1) – pentru aria aflata în stânga limitei inferioare, Li, respectiv (A2) – pentru aria

aflată în dreapta limitei superioare Ls.

Pentru determinarea celor două arii este necesară analiza histogramei frecvențelor

relative, respectiv plasarea limitelor intervalului de semnificaţie, Fig.2.12.

Fig. 2.12: Plasarea limitelor intervalului de semnificaţie pe histograma frecvențelor relative

Aria (A1) este reprezentată de aria dreptunghiului aflat între limita inferioară a

primului interval reprezentat în histogramă (respectiv 21,48) si limita inferioară a

intervalului de semnificaţie (în cazul nostru 21,52 ce reiese din calcul) – Fig. 2.12.

Lungimea acestui dreptunghi este egală cu frecvența absolută a primului interval

reprezentat în histogramă, și anume ai=5. Lăţimea dreptunghiului este determinată

procentual din mărimea subintervalului – se consideră că mărimea primului

subinterval este 100% și se determină procentul reprezentat de lăţimea

dreptunghiului care ne interesează (de fapt segmentul aflat între limita inferioară a

intervalului și limită intervalului de semnificaţie).

Page 26: ST - Lucrarea 2 - Tema de laborator.pdf

26 Lucrarea 2

Fig. 2.13: Determinarea ariei (A1)

Aria (A2) se determina în mod similar, ca fiind aria dreptunghiului aflat între limita

superioară a intervalului de semnificaţie și limita superioară a ultimului interval

reprezentat în histogramă (Fig. 2.14).

Fig. 2.14: Determinarea ariei (A2)

După efectuarea tuturor calculelor, ariile (A1) și (A2) vor avea valorile (A1)=1,4,

respectiv (A2)=0,21.

Coeficientul de rebut este reprezentat de suma celor două arii, fiind în cazul de față

(A1)+(A2)=1,61%.

Page 27: ST - Lucrarea 2 - Tema de laborator.pdf

Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de

date 27

3. Prezentarea rezultatelor:

Rezultatele vor fi prezentate sub forma unui raport ce va cuprinde:

- reprezentarea datelor primare, şirul de date:

- reprezentarea tabelara a datelor grupate;

- reprezentarea tabelară a frecvențelor: frecvențele absolute ai, frecvențele

relative fi şi a frecvențelor cumulate crescătoare şi descrescătoare: Ac, Ad, Fc,

Fd.

- reprezentarea statistică pe grupe de clase, trasarea histogramelor repartiţiei

frecvențelor relative fi şi a frecvențelor cumulate Fc, Fd.

E. Bibliografie: [1] Bulgaru, M., Bolboaca, L., Ingineria calitatii.Mangementul calitatii, statistica şi

control,

nasurari in 3D, Alma Mater, Cluj-Napoca 2001, ISBN 973-85153-0-0.

[2] Cathy, K., Excel pentru Windows tm 95 in 503 imagini, Teora, Bucuresti, 1999,

ISBN

973-601-457-6

[3] Faithe, W., Microsoft Office 97 Professional 6in 1, Teora, Bucuresti, 1998, ISBN

973-

601-907-1

[4] Tanasescu I Controlul statistic al proceselor si produselor, Editura didactica si

pedagogica, Bucuresti, 1987.

[5] *** Colectie de standarde, Managementul şi asigurarea calitatii, Editura tehnica,

Bucuresti, 1996