ST - Lucrarea 2 - Tema de laborator.pdf
-
Upload
bacaoanu-veronica -
Category
Documents
-
view
58 -
download
4
Transcript of ST - Lucrarea 2 - Tema de laborator.pdf
Repartiția în frecvență a datelor
Reprezentarea și prelucrarea
primară a șirurilor de date
Tema de laborator
Rev. 3.3
Lucrarea
2
2 Lucrarea 2
A. Cuprins
A. Cuprins ................................................................................................................ 2
B. Scopul lucrării ...................................................................................................... 3
C. Noțiuni de bază ................................................................................................... 3
1. Repartiții empirice/experimentale .................................................................. 4
1.1. Prezentarea tabelara a datelor................................................................ 4
1.2. Frecvențe şi intervale .............................................................................. 4
1.3. Diagramele repartiției .............................................................................. 5
1.4. Indicatorii statistici ................................................................................... 5
2. Utilizarea programului Excel pentru calculul indicatorilor ............................. 12
D. Desfășurarea lucrării: ........................................................................................ 16
1. Tema ........................................................................................................... 16
2. Prelucrarea rezultatelor ............................................................................... 16
2.1. Introducerea datelor .............................................................................. 16
2.2. Calculul indicatorilor de localizare ......................................................... 17
2.3. Calculul indicatorilor de împrăștiere ...................................................... 18
2.4. Calculul momentelor ............................................................................. 19
2.5. Calculul coeficienţilor de asimetrie și aplatizare .................................... 20
2.6. Trasarea tabelului frecvențelor.............................................................. 20
2.7. Trasarea histogramelor ......................................................................... 23
2.8. Calculul coeficientului de rebut ............................................................. 25
3. Prezentarea rezultatelor: ............................................................................. 27
E. Bibliografie: ........................................................................................................ 27
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 3
B. Scopul lucrării Se urmărește realizarea următoarelor obiective:
- prezentarea repartițiilor empirice;
- prezentarea indicatorilor statistici;
- prezentarea noțiunilor generale legate de utilizarea formulelor și funcțiilor utilizând
software-ul Excel;
- prezentarea unei aplicaţii;
C. Noțiuni de bază Măsurarea oricărei mărimi se face cu erori, ceea ce necesita efectuarea de mai
multe ori a măsurării și prelucrarea ulterioara a rezultatelor, cu metodele statisticii
matematice, în vederea determinării cat mai apropiate de realitate a valorii măsurate.
O populație poate fi omogenă (statistica) dacă elementele componente sunt de
acelaşi tip (exemplu: un lot de contactoare cu aceleași date nominale, executate din
același material, etc.) sau neomogenă , la care elementele componente sunt de tipuri
diferite.
Metodele statistice se aplică numai populaţiilor omogene (statistice). În funcție de
numărul indivizilor statistici populaţia statistică poate fi finită sau infinită .
Trăsătura comuna a populației statistice, caracterizata prin valorile particulare
corespunzătoare fiecărui individ, se numește caracteristica și se notează cu litera
mare (A, D, X). Caracteristica poarta denumirea de variabila și poate fi:
- cantitativa: exprimata numeric prin valorile măsurate; aceasta putând fii la rândul
sau: discreta (daca capătă valori izolate, aparținând mulțimii numerelor întregi sau
raționale, spre exemplu: numărul pieselor defecte dintr-un lot) sau continua (daca
intr-un interval dat, capătă orice valoare reala pentru caracteristica);
- calitativa sau atributiva: exprimata prin aprecieri ca: bun sau defect, satisfăcător/
nesatisfăcător;
O populație statistică poate avea una sau mai multe caracteristici. Dacă informațiile
referitoare la caracteristica populației statistice sunt luate de la fiecare component, se
efectuează o cercetare completa (unitară) sau enumerare completă; în cazul când
informațiile se refera numai la o parte din indivizii populației, se face o cercetare
selectiva, indivizii de la care se obțin informațiile formând selecția sau eșantionul. Un
element al populației statistice se numește unitate statistica sau individ statistic.
Colectarea datelor referitoare la caracteristica unei populații statistice urmărește
stabilirea valorii care poate caracteriza un individ al populației sau are ca scop
formarea unor concluzii din datele observate.
Statistica descriptiva reprezintă forma cea mai simpla de analiza a caracteristicii
unei populații și include colectarea de date, prezentarea lor sub forma de tabele,
întocmirea unor reprezentări grafice și stabilirea indicatorilor statistici.
4 Lucrarea 2
1. Repartiții empirice/experimentale
1.1. Prezentarea tabelara a datelor
Tabelele trebuie în aşa fel întocmite încât să permită o interpretare directă şi uşoară
fără a mai necesita texte aplicative suplimentare (vezi Lucrarea 1, Introducerea în
programul Excel. Achiziții de date și reprezentări grafice).
Primul tabel care se întocmeşte este tabelul datelor primare în care sunt trecute în
ordinea măsurării caracteristicile cercetate.
Aceleaşi valori aranjate în ordine crescătoare astfel ca între două valori consecutive
să existe relaţia:
(𝑥𝑖 < 𝑥𝑖+1) (2.1)
formează tabelul valorilor ordonate, totalitatea valorilor unei caracteristici scrise într-
o anumită ordine (crescătoare sau descrescătoare) formând un șir statistic.
1.2. Frecvențe şi intervale
1.2.1 Gruparea termenilor
Valorile unei caracteristici se pot prezenta tabelat și sub forma mai restrânsa
efectuând o grupare simpla sau pe intervale.
Gruparea simplă, posibilă în anumite cazuri pentru caracteristicile discrete, reprezintă
un tabel conținând valorile distincte și numărul respectiv de apariții. Un astfel de tabel
poartă denumirea de tabel cu simplă intrare.
Adoptarea unui număr de intervale disjuncte (m) și gruparea valorilor pe aceste
intervale, conduc de asemenea, la întocmirea unui tabel cu clase (intervale) de
grupare frecvent utilizat. Numărul unităților (elementelor) cu aceeași valoare sau
aparținând aceluiași interval reprezintă frecvența absolută a1, a2, …am, suma totală a
frecvențelor fiind egală cu numărul unităților cercetate n, (și poartă denumirea de
volumul populației statistice) :
∑ 𝑎𝑖 = 𝑛
𝑚
𝑖=1
(2.2)
Raportul dintre frecvența absolută şi numărul total de unități statistice se numește
frecvența relativă; suma totală a frecvențelor relative fiind egală cu unitatea:
𝑓𝑖 =𝑎𝑖
𝑛; ∑ 𝑓𝑖 = 1
𝑚
𝑖=1
(2.3)
În multe cazuri este necesar să se cunoască numărul total de unități statistice până
la o anumită valoare a caracteristicii sau numărul de la o anumită valoare în sus.
Acest număr reprezintă frecventa cumulată, F; aceasta poate fii relativă sau
absolută, după cum se raportează sau nu la numărul total de elemente n, şi de
asemenea crescătoare (daca reprezintă suma frecvențelor pana la valoarea x
inclusiv) sau descrescătoare (dacă reprezintă suma frecvențelor de la valoarea x de
asemenea inclusiv).
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 5
𝑨𝒄 = ∑ 𝒂𝒊
𝒏
𝒊=𝟏
; 𝑭𝒄 =𝑨𝒄
𝒏; 𝑨𝒅 = ∑ 𝒂𝒊
𝒏
𝒊=𝟏
; 𝑭𝒅 =𝑨𝒅
𝒏;
(2.4)
1.2.2 Intervale de grupare
Mărimea intervalelor (claselor) de grupare se ia, în general egală, cu excepția
intervalelor extreme, pentru care uneori se pot adopta valori diferite, existând relațiile:
1. Relaţia lui H. A. Sturges (cea mai des utilizata):
𝑚 = 1 + 3,322 ∗ lg 𝑛 (2.5)
unde n reprezintă numărul total al datelor de observaţie.
2. Relaţia lui H. B. Mann şi A. Wald pentru n>100:
𝑚 = 4 [1
4(𝑛 − 1)]
15
(2.6)
3. Prin adoptarea numărului întreg dat de relaţia:
𝒎 = √𝒏 (2.7)
În general s-a constatat că pentru n<250 este suficientă gruparea în zece clase.
Dacă u şi v sunt limitele intervalului de grupare intervalul se consideră totdeauna
semi-închis, fie u,v fie u,v.
1.3. Diagramele repartiției
Graficele cel mai frecvent folosite sunt: histogramele de repartiție a frecvențelor
(simple sau cumulate), diagramele cu bare, poligonul frecvențelor și diagramele
circulare, (vezi Lucrarea 1, Introducerea în programul Excel. Achiziții de date și
reprezentări grafice).
1.4. Indicatorii statistici
Din studiul unei histograme se poate observa că datele experimentale prezintă două
tendinţe:
- o tendința de localizare, când datele se concentrează în jurul unei anumite valori;
- o tendința de împrăştiere, când datele rezultate în urma măsurătorii se vor
încadra totdeauna într-un interval; (exista populații la care localizarea se face în
jurul aceleiași valori, dar care prezintă împrăștieri diferite).
Se constată de asemenea că repartiția frecvențelor poate fii simetrică sau asimetrică
în raport cu poziția de localizare.
Graficele de frecventa prezintă aceste aspecte numai calitativ, o analiza cantitativă
care să permită o comparație a două sau mai multe repartiții experimentale, a
tendințelor de localizare și de variaţie/ împrăștiere se poate efectua numai cu ajutorul
unor indicatori statistici determinați de valorile caracteristicilor respective.
Specific tendinţei datelor indicatorii statistici se clasifică în:
- indicatori de localizare;
- indicatori de împrăştiere.
6 Lucrarea 2
1.4.1 Indicatorii de localizare (de poziție)
Indicatorul de localizare este o valoare teoretică, care poate să nu existe practic
printre valorile măsurate, el indicând valoarea spre care tind să se grupeze datele
reale. Indicatorul de bază al tendinţei de localizare îl reprezintă media care poate fi
calculată în mai multe feluri.
1.4.1.1 Media aritmetică. Considerând valorile unei caracteristici x: x1, x2, ...,xn,
media aritmetică este dată de relaţia:
𝑀[𝑥] =∑ 𝑥𝑖
𝑛𝑖=1
𝑛
(2.9)
Media aritmetică se notează în general cu Mx, pentru loturi de fabricaţie, media
fiind notată cu μ iar pentru eşantioane cu 𝑥. Dacă x1, x2, ...,xn se repetă, respectiv cu
frecvențele absolute a1, a2, ...,an, atunci media aritmetică este:
𝑀[𝑥] =∑ 𝑎𝑖𝑥𝑖
𝑛𝑖=1
𝑛
(2.10)
1.4..1.2. Media geometrică. Cu valorile x1, x2, ...,xn, media geometrică este:
𝑀𝑔 = √𝑥1 ∗ 𝑥2 ∗. . .∗ 𝑥𝑛𝑛 = √∏ 𝑥𝑖
𝑛
𝑖=1
𝑛
(2.11)
1.4.1.3. Media armonică. Pentru valorile x1, x2, ...,xn, media armonică se obţine cu
relaţia:
𝑀𝑎 =𝑛
∑1𝑥𝑖
𝑛𝑖=1
(2.12)
1.4.1.4. Media pătratică. Pentru aceleaşi valori media pătratică este:
𝑀𝑝 = √∑ 𝑥𝑖
2𝑛𝑖=1
𝑛
(2.13)
1.4.1.5. Mediana. Valoarea caracteristicii care ocupă locul central în șirul ordonat de
valori, împărţind caracteristica în două grupe egale ca număr: Dacă șirul conţine un
număr impar de valori (n=2k+1) valoarea medianei este dată de valoarea unită ţii
statistice de rang (n+1)/2, adică :
𝑀𝑒 = 𝑋(
𝑛+12
) (2.14)
În cazul unui număr par de valori mediana este egală cu media aritmetică a celor
două valori centrale:
𝑀𝑒 =𝑥(𝑛/2) + 𝑥(𝑛 2+1⁄ )
2
(2.15)
Dacă valorile sunt grupate pe clase intervalul care conţine elementul median se
numește interval median sau clasă mediană . Mediana se determină mult mai uşor
decât media şi nu necesită nici un calcul. Din cauza uşurinţei de determinare
mediana este folosită frecvent în industrie la controlul statistic al fabricaţiei. Mediana
este preferată uneori mediei fiind mai puţin afectată de valorile extreme, fiind totodată
mult mai stabilă la fluctuaţiile de selecţie decât media aritmetică.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 7
1.4.1.6. Mod sau modală. Este valoarea caracteristicii corespunzătoare celei mai
mari frecvenţe. În cazul în care repartiţia frecvențelor este reprezentată de o curbă,
modala corespunde valorii maxime a caracteristicii. După cum repartiţia
experimentală are unul, două sau mai multe maxime, se numește unimodală,
bimodală, sau polimodală. Dacă valorile sunt grupate pe clase, intervalul care
conţine elementul median se numește interval median sau clasă mediană .
1.4.1.7. Valoarea centrală. Ca indicator al localizării se utilizează şi media
extremelor valorilor caracteristicii:
𝑋𝑐 =𝑋max + 𝑋min
2
(2.16)
Valoarea centrală se poate referi și la un interval de grupare de ordinul i care
reprezintă media valorilor limită (inferior și superior) ale intervalului:
𝑋𝑐𝑖 =𝑋𝑖
inf + 𝑥𝑖sup
2
(2.17)
Proprietăţi și observaţii referitoare la indicatorii statistici de localizare
- Pentru repartiţii unimodale simetrice, abaterea medianei faţă de media aritmetică
este egală cu o treime din abaterea modului faţă de media aritmetică:
|𝑥 − 𝑀𝑒| =|𝑥 − 𝑀𝑜|
3
(2.18)
- Mediile aritmetică și pătratică sunt influenţate de valorile mari ale seriei.
- Mediile geometrică și armonică sunt influenţate de valorile mici și reduc din
influenţa valorilor mari.
- Între cei patru indicatori ai mediei există relaţia:
𝑀𝑎 < 𝑀𝑔 < 𝑥 < 𝑀𝑝 (2.19)
- Mediana nu este influenţată de valorile extreme.
- Dintre indicatorii de localizare cel mai important este media aritmetică.
1.4..2 Indicatori de împrăştiere
Variația (împrăștierea) unei caracteristici poate fi redată cu ajutorul unuia din
următorii indicatori:
1.4.2.1 Dispersia: Notată în general cu Dx, expresia dispersiei este:
𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛
𝑖=1
𝑛
(2.20)
Pentru loturi de fabricaţie dispersia este notată cu σ2 iar pentru eşantioane cu s2.
Dacă x1, x2, ...,xn se repetă, respectiv cu frecvențele absolute a1, a2, ...,an, atunci
dispersia este:
𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑎𝑖
𝑛𝑖=1
𝑛= ∑(𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑓𝑖
𝑛
𝑖=1
(2.21)
În cazul estimării dispersiei populației cu ajutorul unei selecţii, dispersia de selecţie
se ajustează cu un factor de corecţie n/(n-1). În acest caz dispersia se numește
dispersie corectată:
8 Lucrarea 2
𝐷𝐶[𝑥] =𝑛
𝑛 − 1∗ 𝐷[𝑥] =
∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛𝑖=1
𝑛 − 1
(2.22)
1.4.2.2. Abaterea medie pătratică. Acest indicator se obține din rădăcina pătrată a
dispersiei și se notează cu σ pentru lot şi cu s pentru eşantion.
√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛
𝑖=1
𝑛= √
1
𝑛∗ ∑ 𝑥𝑖
2 − 𝑀[𝑥]2
𝑛
𝑖=1
(2.23)
Considerând frecvențele absolute sau relative expresiile abaterii medii pătratice
devin:
√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑎𝑖
𝑛𝑖=1
𝑛= √
∑ 𝑥𝑖2 ∗ 𝑎𝑖
𝑛𝑖=1
𝑛− 𝑀[𝑥]2
√𝐷[𝑥] = √∑(𝑥𝑖 − 𝑀[𝑥])2 ∗ 𝑓𝑖
𝑛
𝑖=1
= √∑ 𝑥𝑖2 ∗ 𝑓𝑖 − 𝑀[𝑥]2
𝑛
𝑖=1
(2.24)
În cazul în care abaterea medie pătratică se estimează cu ajutorul unei selecţii
rezultă :
𝑠 = √∑ (𝑥𝑖 − 𝑥−
)2𝑛
𝑖=1
𝑛 − 1
(2.25)
Abaterea unei caracteristici poate fi considerată în raport cu orice constantă . În
general abaterea se ia în raport cu media aritmetică și-n acest caz se numește
abatere standard.
1.4.2.3. Amplitudinea. Este un indicator statistic definit de diferenţa valorilor
extreme.
𝑊 = 𝑥max − 𝑥min (2.26)
În mod similar se poate defini și amplitudinea clasei, w, sau a intervalului de grupare,
care reprezintă diferenţa între valorile extreme ale intervalului.
1.4.2.4. Intervalul intercuartilic. Cuartilele sunt definite de trei valori Q1, Q2, Q3,
care împart amplitudinea în patru intervale astfel ca frecvenţele relative ale
intervalelor să fie egale între ele. Rezultă că 25 din numărul măsurătorilor sunt
inferioare cuartilei Q1, 25 din numărul observaţiilor sunt superioare cuartilei Q3, iar
cuartila Q2 este egală cu mediana Me. Intervalul intercuartilic este definit de diferenţa
dintre prima și ultima cuartilă :
𝐼𝑄 = 𝑄3 − 𝑄1 (2.27)
1.4.2.5. Coeficientul de variaţie intercuartilic. Este definit de raportul:
𝑞 =𝑄3 − 𝑄1
𝑄2=
𝑄3 − 𝑄1
𝑀𝑒
(2.28)
1.4.2.6 Coeficientul de variaţie. Reprezintă valoarea abaterii standard raportată la
media aritmetică.
𝐶𝑣 =𝐷[𝑥]
𝑀[𝑥] 𝑠𝑎𝑢 𝐶𝑣 =
𝑠
𝑥
(2.29)
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 9
Acest coeficient poate fi exprimat şi în procente, relaţiile prezentate putând fi utilizate
și în cazul valorilor grupate pe clase.
Proprietăţi și observaţii referitoare la indicatorii de variaţie
- Suma algebrică a abaterilor faţă de media aritmetică este egală cu zero. Notând
abaterea valorii de ordinul i în raport cu media aritmetică :
ε𝑖 = 𝑥𝑖 − 𝑥 (2.30)
Media aritmetică a abaterilor este:
ε =1
𝑛∑ ε𝑖
𝑛
𝑖=1
=1
𝑛∑(𝑥𝑖 − 𝑥) =
1
𝑛∑ 𝑥𝑖 −
𝑛 ∗ 𝑥
𝑛
𝑛
𝑖=1
𝑛
𝑖=1
= 𝑥 − 𝑥 = 0 (2.31)
Dacă : 1
𝑛∑ ε𝑖
𝑛𝑖=1 = 0 rezultă de asemenea și: ∑ ε𝑖
𝑛𝑖=1 = 0
Deoarece suma erorilor măsurătorilor faţă de media aritmetică este zero, pentru
aprecierea erorii totale este necesar ca aceste abateri să fie ridicate la pătrat și apoi
însumate, cea ce ne conduce la formula dispersiei. În consecinţă dintre indicatorii de
împrăştiere dispersia şi abaterea standard reprezintă cei mai buni estimatori ai
dispersiei.
- Suma abaterilor pătratice are valoarea minimă atunci când sunt calculate în raport
cu media aritmetică. Considerând suma abaterilor pătratice în raport cu valoarea
arbitrară x0.
∑(𝒙𝒊 − 𝒙𝟎)𝟐 = ∑[(𝒙𝒊 − 𝒙) − (𝒙𝟎 − 𝒙)]𝟐
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
(2.32)
Dezvoltând termenul din partea dreaptă se obține:
∑[(𝑥𝑖 − 𝑥) − (𝑥0 − 𝑥)]2 = ∑(𝑥𝑖 − 𝑥)2
− 2 ∗ (𝑥0 − 𝑥) ∗ ∑(𝑥𝑖 − 𝑥) + ∑(𝑥0 − 𝑥)2
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
(2.33)
Conform celor arătate mai sus (suma algebrică a abaterilor față de media aritmetică,
vom obține:
∑(𝑥𝑖 − 𝑥0)2 = ∑(𝑥𝑖 − 𝑥)2
+ 𝑛 ∗ (𝑥0 − 𝑥)2
𝑛
𝑖=1
𝑛
𝑖=1
(2.34)
Rezultă :
∑(𝑥𝑖 − 𝑥0)2 > ∑(𝑥𝑖 − 𝑥)2
𝑛
𝑖=1
𝑛
𝑖=1
(2.35)
Deci suma abaterii pătratice este minimă dacă :
𝑥0 = 𝑥 (2.36)
- Abaterile în raport cu o constantă oarecare x0 sunt folosite uneori pentru
simplificarea unor calcule. Astfel valoarea medie a caracteristicii se obţine mai uşor
dacă se calculează suma abaterilor x’i =xi-x0 adoptându-se astfel ordinul de mărime
cel mai convenabil:
𝑥′ =1
𝑛∑ 𝑥′𝑖
𝑛
𝑖=1
=1
𝑛∑(𝑥𝑖 − 𝑥0
𝑛
𝑖=1
) =1
𝑛∑ 𝑥0
𝑛
𝑖=1
− 𝑥0 = 𝑥 − 𝑥0
(2.37)
de unde rezultă:
10 Lucrarea 2
𝑥 = 𝑥0 +1
𝑛∑ 𝑥′𝑖
𝑛
𝑖=1
= 𝑥0 − 𝑥′
(2.38)
Dispersia şi abaterea standard sunt cei mai utilizaţi indicatori de variaţie.
1.4.3. Momente
Pentru stabilirea formei (alura) funcţiei de repartiţie experimentale şi a unor
particularităţi a acesteia s-a introdus noţiunea de moment. Între aceștia şi indicatorii
de bază existând o strânsă legătură. Momentele se împart în două categorii:
- momente absolute de ordinul k la care valorile sunt considerate în raport cu
originea;
- momente centrate de ordinul k (la care valorile sunt exprimate în raport cu o
valoare arbitrară)
1.4.3.1 Moment absolut de ordinul k (k>1)
Prin definiţie momentul absolut de ordinul k (k>1), este dat de relaţia:
𝑚𝑘 =1
𝑛∑ 𝑥𝑖
𝑘
𝑛
𝑖=1
(2.39)
unde x1, x2,...,xn, sunt valorile mă surate, ale caracteristicii x. Momentul absolut de
ordinul k poate fi exprimat şi cu ajutorul frecvențelor absolute sau relative.
𝑚𝑘 =1
𝑛∑ 𝑥𝑖
𝑘 ∗ 𝑎𝑖
𝑛
𝑖=1
= ∑ 𝑥𝑖𝑘 ∗ 𝑓𝑖
𝑛
𝑖=1
(2.40)
Se observă că momentul absolut de ordinul 1 reprezintă media aritmetică :
𝑚1 =1
𝑛∑ 𝑥𝑖
𝑛
𝑖=1
= 𝑥−
(2.41)
De asemenea momentul absolut de ordinul 2 este egal cu pătratul mediei pătratice.
𝑚2 =1
𝑛∑ 𝑥𝑖
2
𝑛
𝑖=1
= 𝑀𝑝2
(2.42)
1.4.3.2 Momentul centrat de ordinul k (k>1)
Prin definiţie, momentul centrat de ordinul k (k>1), în raport cu o origine arbitrară
este:
𝑀𝑘δ =
1
𝑛∑(𝑥𝑖 − δ)𝑘
𝑛
𝑖=1
(2.43)
sau în funcţie de frecvenţă :
𝑀𝑘δ =
1
𝑛∑(𝑥𝑖 − δ)𝑘
𝑛
𝑖=1
∗ 𝑎𝑖 = ∑(𝑥𝑖 − δ)𝑘
𝑛
𝑖=1
∗ 𝑓𝑖
(2.44)
Momentul centrat de ordinul k în raport cu media aritmetică se notează cu Mk şi este
dat de expresia:
𝑀𝑘 =1
𝑛∑(𝑥𝑖 − 𝑥)𝑘
𝑛
𝑖=1
(2.45)
sau:
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 11
𝑀𝑘 =1
𝑛∑(𝑥𝑖 − 𝑥)𝑘
𝑛
𝑖=1
∗ 𝑎𝑖 = ∑(𝑥𝑖 − 𝑥)𝑘
𝑛
𝑖=1
∗ 𝑓𝑖
(2.46)
Momentul centrat de ordinul 2 este egal cu dispersia:
𝑀2 =1
𝑛∑(𝑥𝑖 − 𝑥)2
𝑛
𝑖=1
= 𝐷[𝑥]
(2.47)
1.4.3.3 Relaţii intre momentele absolute şi momentele centrate
Intre momentele absolute şi cele centrate se pot scrie următoarele relaţii:
𝑀1 = 0
𝑀2 = 𝑚2 − 𝑚12 = 𝐷[𝑥]
𝑀3 = 𝑚3 − 3𝑚1𝑚2 + 2𝑚13
𝑀4 = 𝑚4 − 4𝑚1𝑚3 + 6𝑚1𝑚2 − 3𝑚1
(2.48)
1.4.3.4 Corecţia momentelor
În general gruparea valorilor pe clase conduce la anumite erori, deoarece în calculele
indicatorilor statistici frecvenţa este considerată corespunzătoare valorii centrale a
intervalului de grupare. Această consideraţie presupune o repartiţie uniformă a
datelor în interiorul clasei, lucru rar întâlnit. Corectarea valorilor din acest punct de
vedere este cunoscută sub numele de corecţia Sheppard. Media nu necesită nici o
corecţie deoarece:
𝑥 =1
𝑛∑ 𝑥𝑖
𝑛
𝑖=1
= δ +1
𝑛∑(𝑥𝑖
𝑛
𝑖=1
− δ)
(2.49)
Nici momentul absolut de ordinul 3 nu necesită corecţii.
În cazul momentelor absolute de ordinul 2 şi 4 se realizează corecțiile, conform
relaţiilor:
𝑚2 = 𝑚2 −1
12ϖ2
𝑚4 = 𝑚4 −1
2ϖ𝑚2 +
7
240ϖ4
(2.50)
unde reprezintă amplitudinea intervalului de grupare.
1.4.3.5 Indicatori pentru asimetrie şi aplatizare
Există diferite moduri prin care se poate aprecia asimetria unei repartiţii, cel mai
utilizat fiind coeficientul de asimetrie (2.51) și coeficientul de exces (2.52) (care se
referă la gradul de ascuțire/aplatizare a unei repartiții), indicatori obținuți cu ajutorul
momentelor, exprimați de relaţiile:
γ1 =𝑀3
𝑀23/2
=𝑀3
√𝐷[𝑥]3
(2.51)
γ2 =𝑀4
𝑀22 − 3 =
𝑀4
𝐷[𝑥]2− 3
(2.52)
12 Lucrarea 2
1>0 1=0 1<0
Repartiție asimetrică la
dreapta
Repartiție simetrica Repartiție asimetrică la
stânga
Fig.2.1: Indicarea tipului de asimetrie de către coeficientul de asimetrie; simetria repartiției
Excesul sau aplatizarea se exprimă având ca etalon de referință repartiţia normală la
care 2=0. Pentru 2<0 repartiţia este mai aplatizată decât cea normală iar pentru
2>0 repartiţia este mai ascuţită , (Fig. 2.2). Repartiţiile experimentale pot avea unul
sau mai multe maxime. Repartiţia cu un singur maxim se numește repartiţie
unimodală; dacă repartiţia are mai multe maxime repartiţia se numeşte repartiţie
polimodală, (Fig. 2.3).
2<0 2=0 2>0
Repartiție aplatizată Repartiție normală Repartiție ascuțită
Fig.2.2: Indicarea excesului sau a aplatizării repartiției de către coeficientul de asimetrie𝛾2
Se pot întâlni repartiţii la care în loc de un maxim să apară un minim, în acest caz
repartiţia numindu-se repartiţie antimodală, (Fig. 2.3). Un caz particular de repartiţie
antimodală îl reprezintă repartiţia uniformă la care frecvențele rămân constante.
Repartiție unimodală Repartiție bimodală Repartiție antimodală
Fig.2.3: Tipuri de repartiții
2. Utilizarea programului Excel pentru calculul indicatorilor
Pentru efectuarea calculelor necesare prelucrării datelor statistice puteți utiliza
formulele și funcțiile oferite de software-ul de specialitate Excel.
Formulele sunt folosite în foile de calcul pentru efectuarea calculelor cu cifrele
introduse (sau generate), putând fii efectuate operații de adunare, scădere, înmulțire,
împărțire etc., folosind valorile din diferite celule.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 13
Formulele sunt formate de regula din una sau mai multe adrese de celule sau valori
și un operator matematic cum ar fii: + (adunare), - (scădere), * (înmulțire),
/(împărțire), ș.a.m.d. Orice formula este formata din următoarele elemente:
1- Semnul = , ce arata ca ceea ce urmează este o formula;
2- Argumentul 1 (cum ar fii: A1),
3- Operatorul matematic;
4- Argumentul 2 (cum ar fii: B1), argumentele indicând adresele celulelor cu valorile
afectate de formula.
Când folosiți formulele pentru a efectua anumite calcule, Excel va recalcula automat
rezultatul la orice modificare a valorilor numerice care participă la respectivul calcul.
Formulele pot fi introduse în două moduri: tastând formula direct în celulă sau
indicând celulele cu care formula va opera. Astfel:
Operatorul Operatia
+
-
*
/
%
^
Adunare
Scadere
Inmultire
Impartire
Calcul procentual
Ridicare la putere
1
2 3
4
5
Fig.2.4: Introducerea unei formule prin tastare/ indicare; operatori matematici
La crearea formulelor este recomandată introducerea datelor necesare în foaia de
calcul, referirea celulelor respective în cadrul relaţiilor de definiție a formulelor
făcându-se ulterior; în acest mod la orice modificare a valorilor numerice din celule,
Excel va recalcula imediat rezultatul.
Observație: puteți să obțineți suma unui grup de celule şi selectând pur și simplu
celulele respective și citind rezultatul de pe bara de stare; puteți să aflați astfel și
media, valoarea minimă sau cea maximă, şi numărul celulelor dintr-un domeniu,
pentru aceasta executând clic cu butonul din dreapta pe bara de stare și selectați
opțiunea dorita din meniul de comenzi rapide care apare pe ecran.
În mod normal, Excel nu afișează în celulă formula propriu-zisa, ci rezultatul
calculului; puteți totuși să vedeți formula selectând celula şi citind-o pe bara cu
formule.
În cazul copierii formulelor (utilizând opțiunile Copy şi Paste, …), acestea sunt
adaptate pentru a corespunde poziției celulei în care va fi copiata (de exemplu: dacă
copiați formula =C2+C3 din celula C4 în celula D4, aceasta este adaptată pentru
coloana D, devenind =D2+D3). De asemenea, în cazul copierii unei formule dintr-o
pagina de calcul în alta, Excel adaptează referințele celulei din formule în funcție de
noua poziție în foaia de calcul.
Dacă doriți ca referințele sa nu fie modificate atunci când copiați formulele, veți lucra
cu referinţe absolute.
14 Lucrarea 2
Observație: O referință absolută este referința la o celula dintr-o formulă care nu se
schimbă atunci când formula este copiată în alta parte. O referință relativă este o
referință la o celulă care este adaptată atunci când este copiată.
Pentru a face ca o referință la o celulă dintr-o formulă să fie absolută, trebuie să-i
adăugați simbolul dolarului ($) înaintea literei și a numărului care reprezintă adresa
celulei (de exemplu: =$B$10). De asemenea utilizarea tastei F4 permite folosirea
coordonatelor absolute pentru indicarea celulei, şi anume:
1. Selectați celula în care va apare formula;
2. Tastați semnul = (egal) pentru a începe introducerea formulei;
3. Introduceți operatorul;
4. Executați clic asupra următoarei celule implicate în calcul;
5. Apăsați tasta F4 (Coordonate absolute);
6. Apăsați tasta Enter.
Funcțiile sunt formule complexe preformate, folosite pentru executarea unei serii de
operații cu un grup specificat de valori (de exemplu, pentru a calcula suma unei serii
de numere din celulele A1-H1, puteți folosii funcția =SUM(A1:H1) în loc să
introduceți formula =A1+B1+C1…+H1. Funcțiile pot folosi referinţe la domenii de
celule, denumiri de domenii sau valori numerice.
Orice funcție este formata din următoarele trei elemente:
1. Semnul = arata că ceea ce urmează este o funcție;
2. denumirea funcției (de exemplu: SUM), arată ce operaţie va fii efectuată;
3. argumentul (cum ar fii: (A1:H1)), indică adresele celulelor cu valorile afectate de
funcție; argumentul este adeseori un domeniu de celule, dar poate fi și mult mai
complex;
1
2 3
4
6
7
Fig.2.5: Introducerea unei funcții într-o celulă; însumarea conținutului unui rând/ coloană utilizând
comanda AutoSum (Însumare automată)
Astfel pentru introducerea unei funcții într-o celulă avem:
1. selectați celula în care doriți să introduceți formula;
2. tastați semnul = (egal) pentru a începe introducerea functiei;
3. introduceți numele funcției urmat de o paranteză deschisă (exemplu: funcția
AVERAGE - Media aritmetica);
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 15
4. selectați grupul de celule folosite ca argument;
5. apăsați tasta Enter.
Dacă nu sunteți sigur de modul în care operează o anumita funcție, facilitatea
Function Wizard (Asistent pentru funcții) va poate ghida în procesul introducerii
acesteia, pașii parcurși (prezentați în figura 2.6) fiind:
1- executați dublu clic asupra celulei în care doriți să apăra funcția;
2- executați clic asupra butonului Function Wizard (Asistent pentru funcții), sau
alegeți opțiunile Insert, Function… (Introducere, Funcții..). ;
3- selectați categoria;
4- selectați funcția;
5- executați clic asupra butonului ok;
6- în căsuța de dialog care s-a deschis, introduceți argumentele functiei;
7- citiți informațiile referitoare la funcția aleasa;
8- executai clic asupra butonului ok;
9- apăsați tasta Enter pentru vizualizarea rezultatului.
1
2
3
4
6
7
8
Fig.2.6: Utilizarea facilitații Function Wizard (Asistent pentru funcții)
Când folosiți în comun cu alți utilizatori o foaie de calcul sau dacă datele utilizate de
către formulă se modifică periodic, aveți posibilitatea indicării naturii conținutului unei
celule prin intermediul unei note descriptiv-explicative, atașată fiecărei celule în
parte, pentru aceasta fiind necesari parcurgerea următorilor pași:
1. selectați celula căreia doriți sa-i atașați o nota explicativă;
2. executați clic dreapta și selectați opțiunea Insert Comment (Introducere,
Comentariu explicativ);
3. în căsuța de dialog care s-a deschis, introduceți textul notei explicative;
Afișarea notei explicative presupune poziționarea indicatorului mausului pe celulă
(apare textul din nota explicativă); Înlăturarea unei note se realizează prin selectarea
acesteia şi execuția clic asupra butonului Delete (Ștergere).
16 Lucrarea 2
D. Desfășurarea lucrării:
1. Tema
Să se genereze un șir de 60 de valori aşezate într-un tabel cu 12 coloane.
Generarea numerelor va fi aleatoare, datele vor fi normal repartizate, cu media egală
cu ziua de naștere și dispersia cuprinsă în intervalul 0,01-0,31 va fi de forma 0,XX,
unde XX reprezintă ziua nașterii.
Exemplu: Pentru un student/studentă născută în 22 ianuarie media va fi 22 și
dispersia 0,22.
Să se completeze un raport care să cuprindă:
1. datele primare;
2. indicatorii de localizare (mediile, modală, mediană, valoarea centrală;
3. indicatorii de împrăştiere (dispersia, abaterea medie pătratică, amplitudinea);
4. momentele absolute de ordinele 1, 2, 3;
5. momentele centrate de ordinele 1, 2, 3, 4;
6. coeficientul de aplatizare,
7. coeficientul de asimetrie.
8. tabelul frecvențelor (absolute, relative, crescătoare, descrescătoare
9. histograma
10. procentul de rebut pentru intervalul:
Media aritmetica ±95%*Amplitudinea/2
2. Prelucrarea rezultatelor
2.1. Introducerea datelor
Pe baza celor enunţate anterior se va introduce un șir de date, n= 60, utilizând
software-ul Excel, şi anume:
1. Selectaţi panoul Data și din secțiunea Analysis selectați Data Analysis
(Instrumente, Analiza datelor);
2. Selectaţi din caseta de dialog care s-a deschis opţiunea Random Number
Generation (Generare de Numere Aleatorii);
3. Executaţi clic asupra butonului OK;
4. În caseta de dialog care se deschide selectaţi:
Number of Variables (Numărul coloanelor generate): 12;
Number of Random Number (Numărul rândurilor generate): 5;
Distribution: Normal (Distribuţia, Normala):
Mean (Media):XX (unde XX este ziua nașterii);
Standard Deviation (Abaterea standard): 0,XX (unde XX este ziua
nașterii);
Output Range (Afişarea generării), selectând/introducând domeniul
(rândul/coloană) unde dorim sa fie afişat şirul de date generat;
5. Executaţi clic asupra butonului OK.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 17
2.2. Calculul indicatorilor de localizare
După generarea şirului de date se trece la calcularea indicatorilor de localizare
utilizând formulele (2.10), (2.11), (2.12), (2.13), (2.14), (2.15), (2.16).
Atenție: Valorile căsuțelor din formule sunt doar pentru exemplificare!
2.2.1. Media aritmetică:
𝑀[𝑥] =∑ 𝑥𝑖
𝑛𝑖=1
𝑛
Astfel, în Excel se va putea scrie: =AVERAGE(A1:L5) unde A1:L5 sunt adresele ce
conțin valorile generate.
2.2.2. Media geometrică.
Cu valorile x1, x2, ... xn, media geometrică este:
𝑴𝒈 = √𝒙𝟏 ∗ 𝒙𝟐 ∗. . .∗ 𝒙𝒏𝒏 = √∏ 𝒙𝒊
𝒏
𝒊=𝟏
𝒏
Astfel: =GEOMEAN(A1:L5) unde A1:L5 sunt adresele ce conțin valorile generate.
2.2.3. Media armonică
Pentru valorile x1, x2, ... xn, media armonică se obţine cu relaţia:
𝑀𝑎 =𝑛
∑1𝑥𝑖
𝑛𝑖=1
Utilizând Excel, avem: =HARMEAN(A1:L5) unde A1:L5 sunt adresele ce conțin
valorile generate.
2.2.4. Media pătratică.
Pentru aceleaşi valori x1, x2, ... xn, media pătratică este:
𝑀𝑝 = √∑ 𝑥𝑖
2𝑛𝑖=1
𝑛
Pentru calcularea funcţiilor mai complexe care necesită doi sau mai mulţi paşi pentru
rezolvarea lor, se va utiliza o foaie de calcul suplimentară. În aceasta datele sunt
aranjate în coloană. Pentru calculul mediei pătratice valorile sunt ridicate la pătrat și
însumate. Rezultatul final se obține: =SQRT(R64/60) unde R64 este valoarea căsuței
ce conține suma valorilor generate ridicate la pătrat.
Cu valorile calculate se verifica relația, (2.19) Ma<Mg<M[x]<Mp.
2.2.5. Mediana:
Datele vor fi trecute într-o foaie de calcul suplimentară într-o coloană în care vor fi
copiate unitate cu unitate. Se va face sortarea acestora. Deoarece numărul de valori
este par mediana va fi calculata aplicând formula:
18 Lucrarea 2
𝑀𝑒 =𝑥30 + 𝑥31
2
Astfel: =SUM(P33+P34)/2 unde P33 și P34 sunt valorile din mijlocul șirului valorilor
generate aranjate crescător.
Alternativ se poate folosi formula: =MEDIAN(A1:L5) unde A1:L5 sunt adresele ce
conțin valorile generate.
2.2.6. Modala.
Modala se determină după trasarea histogramei deoarece acolo se observă care
este intervalul cu frecvența maximă.
2.2.7. Valoarea centrala:
𝑋𝑐 =𝑋max + 𝑋min
2
Pentru determinarea valorii centrale, mai întâi trebuie să determinăm valoarea
minimă și maximă a şirului nostru. Astfel:
- valoarea maximă va fi =MAX(A1:L5)
- valoarea minimă va fi =MIN(A1:L5)
unde A1:L5 sunt adresele ce conțin valorile generate.
Utilizând funcţiile Excel pentru determinarea valorii centrale avem:
=SUM(MAX(A1:L5)+MIN(A1:L5))/2
unde A1:L5 sunt adresele ce conțin valorile generate.
Observaţie: Valoarea centrală se poate referi şi la un interval de grupare de ordin i
care reprezintă media valorilor limită (inferior şi superior) ale intervalului.
2.3. Calculul indicatorilor de împrăștiere
Calcului indicatorilor de împrăştiere se face cu ajutorul relaţiilor (2.20), (2.21), (2.23),
(2.24), (2.26);
2.3.1. Dispersia:
𝐷[𝑥] =∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛
𝑖=1
𝑛
Pentru calculul in Excel al dispersiei se va folosi formula directa aflata in secţiunea
din program relativa funcţiilor: =VAR(A1:L5) unde A1:L5 sunt adresele ce conțin
valorile generate.
2.3.2. Abaterea standard(abaterea medie pătratică):
√𝐷[𝑥] = √∑ (𝑥𝑖 − 𝑀[𝑥])2𝑛
𝑖=1
𝑛= √
1
𝑛∗ ∑ 𝑥𝑖
2 − 𝑀[𝑥]2
𝑛
𝑖=1
În Excel: =STDEV(A1:L5) sau =SQRT(F11) unde A1:L5 sunt adresele ce conțin
valorile generate iar F11 valoarea ocupată de dispersie.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 19
2.3.3. Amplitudinea:
𝑊 = 𝑥max − 𝑥min
În cazul exemplului nostru va fi: =(P63-P4) unde P63 și P4 sunt valorile maximă
respectiv minimă.
2.4. Calculul momentelor
Calculul momentelor absolute și centrale utilizând formulele (2.39), (2.45).
2.4.1. Moment absolut de ordin 1
𝑚1 =1
𝑛∑ 𝑥𝑖
𝑛
𝑖=1
= 𝑥−
Formula de mai sus reprezintă formula generalizată a momentului în cazul nostru
momentul de ordin 1 fiind media aritmetică a şirului de date.
În Excel ea putând fi scrisă: =SUM(P4:P63)/60 unde P4-P63 sunt valorile generate
aleatoriu.
2.4.2. Moment absolut de ordin 2
Pentru determinarea momentului absolut de ordin 2 va fi nevoie să se utilizeze foaia
de calcul unde se utilizează coloana care-l cuprinde pe xi2
Astfel rezultatul obţinut va putea fi determinat cu ajutorul formulei:
=SUM(R4:R63)/60 unde R4-R63 sunt valorile generate aleatoriu ridicate la pătrat.
2.4.3. Moment absolut de ordin 3
Va rezulta cu ajutorul foi de calcul unde se utilizează coloana care-l cuprinde pe xi3 și
a formulei: =SUM(S4:S63)/60 unde S4-S63 sunt valorile generate aleatoriu ridicate la
cub.
2.4.4. Moment absolut de ordin 4
Va rezulta cu ajutorul foii de calcul unde se utilizează coloana care-l cuprinde pe xi3 și
a formulei: =SUM(T4:T63)/60 unde T4-T63 sunt valorile generate aleatoriu ridicate la
puterea a patra.
2.4.5. Moment centrat de ordin 1
𝑀𝑘 =1
𝑛∑(𝑥𝑖 − 𝑥)𝑘
𝑛
𝑖=1
Și pentru determinarea momentelor centrate de ordin 1, 2, 3, 4 se va apela la ajutorul
foii de calcul.
Astfel cu ajutorul programului Excel vom putea scrie: =SUM(U4:U63)/60 unde
U4:U63 sunt valorile diferențelor dintre fiecare valoare generată (xi) și media lor
aritmetică (�̅�=M[x]).
20 Lucrarea 2
2.4.6. Moment centrat de ordin 2
Acest moment va corespunde valorii dispersiei astfel se va putea verifica daca
calculul a fost efectuat corect: =SUM(V4:V63)/60 unde V4:V63 sunt valorile
diferențelor dintre fiecare valoare generată și media lor aritmetică calculate anterior
(U4:U63), ridicate la pătrat.
2.4.7. Moment centrat de ordin 3
Se calculează în Excel cu: =SUM(W4:W63)/60 unde W4:W63 sunt valorile
diferențelor dintre fiecare valoare generată și media lor aritmetică calculate anterior
(U4:U63), ridicate la cub.
2.4.8. Moment centrat de ordin 4
Se calculează în Excel cu: =SUM(X4:X63)/60 unde X4:X63 sunt valorile diferențelor
dintre fiecare valoare generată și media lor aritmetică calculate anterior (U4:U63),
ridicate la puterea a patra.
2.5. Calculul coeficienţilor de asimetrie și aplatizare
Calcului coeficienţilor de asimetrie si aplatizare utilizând formulele (2.51), (2.52);
2.5.1. Coeficientul de asimetrie
γ1 =𝑀3
𝑀23/2
=𝑀3
√𝐷[𝑥]3
În Excel: =L13/(POWER(L12,3/2)) unde L13 este valoarea lui M3 iar L12 este
valoarea lui M2.
2.5.2. Coeficientul de aplatizare
γ2 =𝑀4
𝑀22 − 3 =
𝑀4
𝐷[𝑥]2− 3
În Excel: =L14/(POWER(L12,2))-3 unde L14 este valoarea lui M4 iar L12 este
valoarea lui M2.
2.6. Trasarea tabelului frecvențelor
În continuare pe baza relaţiilor prezentate în lucrare vom putea determina:
2.6.1. Numărul de clase m
Se calculează utilizând formula (2.5);
𝑚𝑐𝑎𝑙𝑐 = 1 + 3,322 ∗ lg 𝑛
Utilizând funcţiile Excel, aceasta formula va fi scrisă în celula selectată sub forma:
=1+3.322*LOG10(60) obţinând valoarea: m=6.907;
Fiind necesar un număr întreg de clase, se adopta un număr de 7 clase, astfel ca:
m=7 este valoarea numărului de clase aproximat.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 21
2.6.2. Mărimea unui interval d
Se determina utilizând formula:
𝑑 =𝑊
𝑚=
𝑥max − 𝑥min
𝑚
Utilizând Excel, valoarea obţinuta este: =O9/O8 unde adresa O9 corespunde valorii
amplitudinii, iar O8 valorii numărului de clase aproximat; valoarea intervalului obţinut
va corespunde in continuare adresei O10.
2.6.3. Întocmirea tabelului datelor grupate
Reprezentând valorile intervalelor, astfel: [xmin: xmin+d); [xmin+d: xmin+2d);… (xmax];
Utilizând Excel, introducerea acestor valori poate fi realizata după cum este
prezentat în Figura 2.7.
Fig. 2.7. Determinarea intervalelor
2.6.4. Calcularea frecvențelor absolute (ai)
Se poate realiza în mai multe feluri printre care:
a. utilizând facilităţile de sortare ale software-ul Excel, si anume (Figura 2.8.):
1. selectaţi opţiunea Data, Filter, pentru şirul generat din foaia de calcul;
2. Din lista ce apare în dreptul capului de tabel (printr-un clic pe săgeată)
selectați Number Filters și Custom Filter;
3. În cele două câmpuri introducem condițiile de filtrare respectiv: pentru primul
interval, toate valorile mai mari sau egale cu minimul și mai mici strict ca
minim + valoarea intervalului;
4. După executarea unui clic pe butonul OK, Excel va păstra doar valorile care
respectă criteriile de filtrare; se numără valorile și se introduc în coloana ai în
dreptul intervalului folosit pentru filtrare;
5. Se repetă pașii până când se trece prin toate intervalele, având grijă ca la
ultimul interval să includem și valoarea maximă.
22 Lucrarea 2
Fig. 2.8: Opţiunea de filtrare a datelor; opţiunea client
b. Utilizând funcția countifs:
1. Funcția counifs numără o valoare din unul sau mai multe intervale dacă
este respectată una sau mai multe condiții. Astfel argumentele funcției sunt
intervalul de valori din care se numără și condiția. Spre exemplu:
=COUNTIFS($P$2:$P$61,">="&A22, interval_2, condiție_2) va număra
din intervalul marcat cu albastru doar valorile care respectă condiția
marcată cu verde (în exemplu: dacă valoarea fiecărui număr din intervalul
P2:P61 este mai mare sau egală cu valoarea din căsuța A22) ș.a.m.d. Mai
multe detalii despre folosirea funcției puteți obține din meniul Help;
2. În coloana ai se vor introduce formulele astfel:
=COUNTIFS($A$6:$J$15,">="&F22,$A$6:$J$15,"<"&G22)
Unde: intervalul roșu este cel care conține valorile generate, valoarea albastră este
capătul din stânga a intervalului considerat iar valoarea verde capătul din dreapta al
intervalului.
3. Formula se poate propaga pe întreaga coloană având grijă ca la final
condiția pentru capătul din dreapta să includă și valoarea maximă.
Verificarea rezultatelor se face cu formula (2.2.):
∑ 𝑎𝑖 = 𝑛
𝑚
𝑖=1
2.6.5. Calcularea frecvențelor relative (fi)
Se realizează utilizând formula (2.3)
𝑓𝑖 =𝑎𝑖
𝑛; ∑ 𝑓𝑖 = 1
𝑚
𝑖=1
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 23
Astfel:
=C21/60; =C22/60 ….; ș.a.m.d pentru fiecare valoare f1, f2, ...f6; unde C21,
C22…sunt valorile frecvenței absolute.
Verificarea rezultatelor presupunând însumarea valorilor frecvențelor relative (vezi
formula (2.3)): =SUM(D21:D27) (deoarece valorile frecvențelor relative corespund
adreselor de la D21 la D27), valoarea obţinută fiind 1.00 (ceea ce este conform
formulei (2.3).
2.6.6. Calcularea frecvențelor cumulate (Ac, Ad, Fc, Fd)
Calculul şi prezentarea lor tabelară se va realiza utilizând rezultatele anterior
obţinute, şi anume valorile ai şi fi, şi au la baza relaţiile (2.4).
𝑨𝒄 = ∑ 𝒂𝒊
𝒊
𝒊=𝟏
; 𝑭𝒄 =𝑨𝒄
𝒏; 𝑨𝒅 = ∑ 𝒂𝒊
𝒋
𝒊=𝒏
; 𝑭𝒅 =𝑨𝒅
𝒏;
Astfel, utilizând funcţiile Excel, vom avea:
=C21; =SUM(C21:C22);… =SUM(C21:C27) pentru Ac;
=SUM(C21:C27); =SUM(C22:C27);… =C27 pentru Ad;
=E21/60; =E22/60; … =E27/60 pentru Fc;
=F21/60; =F22/60;… =F27/60 pentru Fd;
Unde C21:C27 sunt valorile frecvenței absolute (ai), E21:E27 valorile frecvenței
absolute crescătoare (Ac) și F21:F27 valorile frecvenței absolute descrescătoare (Ad).
Valorile obținute sunt similare celor din Tabelul 1.1.
Tab. 1.1. Valorile pentru frecvențele cumulate
Ac Fc Ad Fd
3.000 0.167 18.000 1.000
8.000 0.444 15.000 0.880
14.000 0.778 10.000 0.586
15.000 0.833 4.000 0.235
17.000 0.944 3.000 0.176
18.000 1.000 1.000 0.059
2.7. Trasarea histogramelor
Pentru trasarea graficelor se urmează următorii pași (Figurile 2.9 -2.11)
1. Selectaţi datele pe care doriţi sa le reprezentaţi grafic;
2. Executaţi clic asupra butonului Column (Coloane) din secțiunea Charts
(Grafice) a panoului Insert;
3. Selectaţi tipul de grafic dorit;
4. Adaptați graficul după dorințe atribuindu-i un format (din Layout) și
adăugând elementele dorite (titlu, etichete pentru axe, etc.);
24 Lucrarea 2
Fig. 2.9: Trasarea histogramei frecvențelor relative fi
Fig. 2.10. Trasarea histogramei frecvențelor relative crescătoare Fc
Fig. 2.11: Trasarea histogramei frecvențelor relative descrescătoare Fd
0.000
0.200
0.400
0.600
0.800
1.000
1.200
19.626 19.768 19.909 20.051 20.192 20.334 20.475
19.484 19.626 19.768 19.909 20.051 20.192 20.334
Val
oar
ea
fre
cve
nțe
i
Valoarea clasei
Reprezentarea frecvenței relative crescătoare
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 25
2.8. Calculul coeficientului de rebut
Procentului de rebut pentru intervalul Media aritmetica ±95%*Amplitudinea/2
Pentru a determina coeficientul de rebut este necesar mai întâi determinarea
intervalului de semnificaţie. Pentru aceasta se calculează limitele acestui interval, ca
fiind M[x] ±95%*W/2. unde M[x] este media aritmetică iar W este amplitudinea.
Cu ajutorul funcţiilor Excel și relaţiei de mai sus se determina limitele, inferioară
(pentru formula cu minus) și superioară (pentru formula cu plus).
Coeficientul de rebut este reprezentat de suma ariilor din histogramă, aflate în afara
limitelor intervalului de semnificaţie. Aceste două arii vor fi notate în continuare cu
(A1) – pentru aria aflata în stânga limitei inferioare, Li, respectiv (A2) – pentru aria
aflată în dreapta limitei superioare Ls.
Pentru determinarea celor două arii este necesară analiza histogramei frecvențelor
relative, respectiv plasarea limitelor intervalului de semnificaţie, Fig.2.12.
Fig. 2.12: Plasarea limitelor intervalului de semnificaţie pe histograma frecvențelor relative
Aria (A1) este reprezentată de aria dreptunghiului aflat între limita inferioară a
primului interval reprezentat în histogramă (respectiv 21,48) si limita inferioară a
intervalului de semnificaţie (în cazul nostru 21,52 ce reiese din calcul) – Fig. 2.12.
Lungimea acestui dreptunghi este egală cu frecvența absolută a primului interval
reprezentat în histogramă, și anume ai=5. Lăţimea dreptunghiului este determinată
procentual din mărimea subintervalului – se consideră că mărimea primului
subinterval este 100% și se determină procentul reprezentat de lăţimea
dreptunghiului care ne interesează (de fapt segmentul aflat între limita inferioară a
intervalului și limită intervalului de semnificaţie).
26 Lucrarea 2
Fig. 2.13: Determinarea ariei (A1)
Aria (A2) se determina în mod similar, ca fiind aria dreptunghiului aflat între limita
superioară a intervalului de semnificaţie și limita superioară a ultimului interval
reprezentat în histogramă (Fig. 2.14).
Fig. 2.14: Determinarea ariei (A2)
După efectuarea tuturor calculelor, ariile (A1) și (A2) vor avea valorile (A1)=1,4,
respectiv (A2)=0,21.
Coeficientul de rebut este reprezentat de suma celor două arii, fiind în cazul de față
(A1)+(A2)=1,61%.
Repartiția în frecventa a datelor. Reprezentarea și prelucrarea primara a șirurilor de
date 27
3. Prezentarea rezultatelor:
Rezultatele vor fi prezentate sub forma unui raport ce va cuprinde:
- reprezentarea datelor primare, şirul de date:
- reprezentarea tabelara a datelor grupate;
- reprezentarea tabelară a frecvențelor: frecvențele absolute ai, frecvențele
relative fi şi a frecvențelor cumulate crescătoare şi descrescătoare: Ac, Ad, Fc,
Fd.
- reprezentarea statistică pe grupe de clase, trasarea histogramelor repartiţiei
frecvențelor relative fi şi a frecvențelor cumulate Fc, Fd.
E. Bibliografie: [1] Bulgaru, M., Bolboaca, L., Ingineria calitatii.Mangementul calitatii, statistica şi
control,
nasurari in 3D, Alma Mater, Cluj-Napoca 2001, ISBN 973-85153-0-0.
[2] Cathy, K., Excel pentru Windows tm 95 in 503 imagini, Teora, Bucuresti, 1999,
ISBN
973-601-457-6
[3] Faithe, W., Microsoft Office 97 Professional 6in 1, Teora, Bucuresti, 1998, ISBN
973-
601-907-1
[4] Tanasescu I Controlul statistic al proceselor si produselor, Editura didactica si
pedagogica, Bucuresti, 1987.
[5] *** Colectie de standarde, Managementul şi asigurarea calitatii, Editura tehnica,
Bucuresti, 1996