cap2
-
Upload
ancuta-maria -
Category
Documents
-
view
138 -
download
3
Transcript of cap2
CAPITOLUL 2
CAPITOLUL 2
SISTEMATIZAREA ŞI PREZENTAREA DATELOR STATISTICE
Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea, astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.
Termeni cheie
cartodiagramă frecvenţă redusă cartogramă frecvenţă relativă clasificare funcţie de repartiţie corelogramă grafic statistic cronogramă grupare curbă cumulativă a frecvenţelor histogramă diagramă de structură poligon al frecvenţelor diagramă prin coloane serie cronologică distribuţie de probabilitate serie de distribuţie de frecvenţe distribuţie heterogradă serie statistică distribuţie homogradă serie teritorială distribuţie teoretică sistematizare frecvenţă absolută tabel statistic frecvenţă cumulată
STATISTICĂ ECONOMICĂ
Noţiuni teoretice
2.1. INTRODUCERE După ce datele statistice au fost colectate din surse de date publicate,
din observări totale sau din observări parţiale – ele trebuie organizate, în scopul de a avea o formă care să permită prelucrarea lor statistică diversă. Cum observarea parţială – în mod special eşantionarea probabilistă – salvează timp, resurse de muncă şi resurse băneşti, vom trata îndeosebi problema sistematizării datelor provenite din eşantioane. Cu toate acestea, trebuie să înţelegem că, indiferent dacă lucrăm cu date referitoare la colectivităţi parţiale ori la colectivităţi totale, atunci când seturile de date conţin în jur de 30 de observaţii sau peste acest număr (date de masă), cel mai bun mod de a le examina este să le sistematizăm şi apoi să le prezentăm în tabele şi grafice. Putem atunci, să extragem cele mai importante trăsături, prin analiza seriilor şi graficelor statistice.
2.2. GRUPAREA ŞI CLASIFICAREA DATELOR STATISTICE
După cum am văzut, în etapa de observare statistică se culeg date uni, bi sau multivariate, adică pentru fiecare unitate statistică se culeg date privitoare la o singură caracteristică sau la mai multe caracteristici considerate.
2.2.1. Principiile grupării/clasificării Sistematizarea datelor se realizează prin gruparea şi clasificarea
datelor statistice, adică prin împărţirea lor în grupe/clase omogene, după unul sau mai multe criterii de grupare/clasificare.
O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se asemene cât mai mult între ele din punctul de vedere al criteriului utilizat, adică dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici, date de prezenţa factorilor aleatori, întâmplători.
CAPITOLUL 2
Criteriul de grupare/clasificare reprezintă variabila (caracteristica) statistică în funcţie de care sistematizăm datele. După cum avem de-a face cu un singur criteriu sau mai multe criterii de grupare/clasificare, vom vorbi de grupări/clasificări simple sau combinate.
Dacă sistematizarea datelor se face după o variabilă nenumerică,
procesul se numeşte clasificare. Gruparea reprezintă sistematizarea datelor după o variabilă
(caracteristică) numerică. În funcţie de tipul acesteia, gruparea se poate face după o variabilă discretă sau continuă.
2.2.2. Gruparea pe intervale de variaţie Intervalul de variaţie reprezintă un şir de valori ale variabilei
studiate, delimitat de intervalele vecine prin limita inferioară şi limita superioară. Intervalele de variaţie pot fi de mărime egală sau neegală.
• Pentru gruparea pe intervale de variaţie se recomandă utilizarea
unui număr moderat de grupe. Deseori, un număr de 4 până la 10 grupe este arbitrar recomandat, dar felul datelor poate necesita un alt număr de grupe.
Pentru alegerea numărului de intervale de grupare (r) se poate utiliza şi relaţia lui Sturges (în ipoteza repartiţiei aproximativ normale a unităţilor după variabila studiată):
nlog322,31r 10+= (2.1.) unde n reprezintă numărul total de unităţi din colectivitate (volumul colec-tivităţii).
• Pentru sistematizarea datelor pe intervale de variaţie se recomandă utilizarea intervalelor de mărime egală, cu excepţia cazurilor în care analiza datelor, descoperirea unor tipuri calitative în colectivitate, necesită folosirea unor intervale de mărime neegală.
• Mărimea intervalului (h) se recomandă a se rotunji la o valoare convenabilă.
• Punctul de plecare în alcătuirea intervalelor de grupare se alege, convenabil, 0 sau un număr întreg puţin mai mic decât valoarea minimă din setul de date.
STATISTICĂ ECONOMICĂ
• Limitele intervalelor de grupare trebuie stabilite cu acurateţe, respectând precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt de această manieră).
• Limitele intervalelor de grupare se stabilesc exact, fără ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată fi încadrată într-o singură clasă.
Aşadar, pentru sistematizarea datelor pe intervale egale de grupare se
prezintă următorii paşi: 1. Se stabileşte amplitudinea variaţiei caracteristicii:
minmaxx xxA −= (2.2.) 2. Se stabileşte numărul de grupe, r, în care vor fi sistematizate
datele 3. Se calculează mărimea aproximativă a intervalelor de grupare:
rxx
rAh minmax −
=≈ (2.3.)
4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o valoare puţin mai mică):
xmin xmin+h xmin+h xmin+2h ..................................................... xmin + (r — 1)h xmin + r ⋅ h Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele prin
numărarea unităţilor care se încadrează în fiecare grupă. Dacă există grupe cu frecvenţă nulă, ori multe grupe cu o singură observaţie, poate fi necesară revizuirea mărimii intervalelor sau a numărului de intervale.
2.3. SERII STATISTICE
Rezultatul sistematizării datelor prin grupare/clasificare se constituie sub forma seriilor statistice.
DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor refe-
ritoare la manifestările unui fenomen colectiv sub forma a două şiruri de
CAPITOLUL 2 date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.
2.3.1. Serii de distribuţie de frecvenţe pentru o variabilă
atributivă A. Vom începe, acum, cu rezultatul sistematizării pe intervale de
grupare, pentru o variabilă numerică continuă, pentru care se obţine o serie de distribuţie (repartiţie) de frecvenţe pe intervale, sub forma (Tabelul 2.1).
Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup x2inf – x2sup
. xinf – xisup
.
. xrinf – xrsup
n1 n2 . ni . . nr
Total ∑=
=
r
1iinn
OBSERVAŢII: • dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4) unde ∆ este o unitate de discretizare • dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5) atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă; • mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , r,ii = (2.6) dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, r,ii = (2.7) sau
hi = xisup – x(i–1)sup, r,2i = (2.8) indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.
STATISTICĂ ECONOMICĂ • pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni unităţi dintr-o grupă au valoarea variabilei egală cu centrul de interval (xi).
2hxx i
infii += (2.9)
sau, dacă intervalele sunt cu variaţie continuă:
2supinf ii
ixx
x+
= (2.10)
Pe lângă frecvenţa absolută (ni) care indică numărul total de unităţi
statistice care au valoarea variabilei situată într-un interval (xiinf – xisup), se poate calcula şi frecvenţa relativă a grupei, care indică proporţia din nu-mărul total de unităţi, care se încadrează în grupă:
nn
n
nn ir
1ii
i*i =
∑=
=
(2.11)
unde n reprezintă volumul total al colectivităţii. Exprimată în procente, frecvenţa relativă a grupei i este:
100nn
100n
nn i
r
1ii
i%*i =
∑=
=
(2.12)
Dacă utilizăm frecvenţele relative, obţinem o serie de distribuţie (repartiţie) de frecvenţe relative (Tabelul 2.2)
Tabelul 2.2.
Serie de distribuţie de frecvenţe relative Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup x2inf – x2sup
.
.
. xi inf – xi sup
.
. xrinf – xrsup
*1n *2n
.
. *in
.
. *rn
Total ∑=
=
r
1i
*in00,1
CAPITOLUL 2
Frecvenţele absolute cumulate (Fci) reprezintă numărul unităţilor statistice care au valoarea variabilei mai mică (sau, eventual, egală) cu limita superioară a grupei (deci, au valoarea variabilei mai mare decât x1inf şi mai mică decât xisup).
∑==
i
1kkci nF (2.13)
Similar cu frecvenţele cumulate crescător, se pot calcula şi frecvenţe cumulate descrescător:
∑==
r
ikkdi nF (2.14)
∑==
r
ik
*k
*di nF (2.15)
EXEMPLUL 2.1 În urma sistematizării datelor cu privire la salariul
net încasat de o colectivitate de muncitori, s-a obţinut următoarea serie de repartiţie (Tabelul 2.3):
Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Salariul net (mii lei)
Număr de salariaţi
(ni)
Frecvenţe relative *
in
Frecvenţe absolute
cumulate (Fci)
Frecvenţe relative
cumulate ( *ciF )
1,4 – 1,6 1,6 – 1,8 1,8 – 2,0 2,0 – 2,2 2,2 – 2,4 2,4 – 2,6 2,6 – 2,8 2,8 – 3,0 3,0 – 3,2
5 8 4
17 8 3 2 2 1
0,10 0,16 0,08 0,34 0,16 0,06 0,04 0,04 0,02
5 13 17 34 42 45 47 49 50
0,10 0,26 0,34 0,68 0,84 0,90 0,94 0,98 1,00
Total 50 1,00 — — Dacă intervalele sunt neegale, pentru asigurarea comparabilităţii
datelor se pot calcula frecvenţe reduse la un interval etalon (standard). Frecvenţa redusă (corectată) a unui interval ( cor
in ) se calculează prin raportarea frecvenţei absolute la un factor de corecţie (l) ce reprezintă numărul intervalelor etalon ce încap într-un interval de grupare:
STATISTICĂ ECONOMICĂ
et
i
hh
l = (2.16)
ln
n icori = (2.17)
unde hi reprezintă mărimea intervalului i, r,1i = het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare). B. În cazul în care variabila de grupare este discretă şi gruparea se
efectuează pe variante, seria de distribuţie de frecvenţe este discretă sau pe variante.
EXEMPLUL 2.2: Un exemplu de distribuţie de frecvenţe după o va-
riabilă discretă este distribuţia divorţurilor din România în anul 2000 după numărul de copii minori rămaşi prin desfacerea căsătoriei (Tabelul 2.4), pentru care s-au calculat şi frecvenţele relative (col.2) şi frecvenţele cumu-late (col. 3 şi col. 4):
Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de copii minori
Număr de divorţuri
(ni)
Frecvenţe relative ( *
in ) Frecvenţe absolute cumulate
(Fci)
Frecvenţe relative
cumulate ( *
ciF ) 0 1 2 3 4 0 18.614 0,465 18.614 0,465 1 14.518 0,363 33.132 0,828 2 5.351 0,134 38.483 0,962 3 1.062 0,027 39.545 0,989 4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000 Total 39.985 1,000 — —
Seriile de distribuţie de frecvenţe alcătuite după o variabilă
cantitativă (numerică), adică cele descrise de paragrafele A şi B, poartă numele de distribuţii heterograde.
CAPITOLUL 2
C. O distincţie aparte trebuie făcută pentru seriile de distribuţie de frecvenţe alcătuite după o variabilă calitativă (nenumerică) ce poartă numele de distribuţii homograde.
EXEMPLUL 2.3: O distribuţie homogradă, după o variabilă nenume-
rică măsurată pe o scală nominală este distribuţia contractelor de asigurare pe viaţă în România, în anul 1999, pe principalele companii (vezi Tabelul 2.5, unde se prezintă ca o distribuţie de frecvenţe relative):
Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe principalele companii
Compania Procent din numărul total de contracte încheiate (%)
Nederlanden ASIROM S.A. SARA MERKUR UNITA AIG Life Garanta Omniasig METROPOL S.A. Interamerican ARDAF Altele
45,70 27,41 12,16 8,30 1,93 1,35 0,96 0,92 0,57 0,25 0,45
Total 100,0 D. Seriile statistice de distribuţie de frecvenţe bidimensionale
sunt cele formate prin considerarea concomitentă a două variabile (X şi Y). Forma unei astfel de serii de distribuţie bidimensională este (Tabelul 2.6)
STATISTICĂ ECONOMICĂ
Tabelul 2.6 Distribuţia de frecvenţe bidimensională
Intervale/variante pentru Y
Intervale/ Variante pentru X
y1 y2 ... yj ... ym Total
x1 x2 . . xi . . xr
n11 n12 ... n1j ... n1m n21 n22 ... n2j ... n2m . . . . . . . . . . . . . . . . . . . ni1 ni2 ... nij ... nim . . . . . . . . . . . . . . . . . . . . nr1 nr2 ... nrj .... nrm
n1. n2. ...
ni. ...
nr.
Total n.1 n.2 .... n.j ... n.m n.. În acest tabel trebuie să remarcăm că:
∑==
⋅
m
1jiji nn (2.18)
∑==
⋅
r
1iijj nn (2.19)
∑ ∑=∑=∑== ===
r
1i
m
1jij
m
1jj
r
1i.i n.nn..n (2.20)
O situaţie aparte o întâlnim în cazul variabilelor alternative, când
datele se pot prezenta într-un tabel de asociere de forma (Tabelul 2.7):
Tabelul 2.7 Tabel de asociere
Clasele lui Y Clasele lui X Y(y1) non Y(y2)
Total
X(x1) non X(x2)
n11 n21
n12 n22
n1. = n11 + n12 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22 2.3.2. Serii cronologice Seriile cronologice reprezintă seriile statistice ce se obţin prin
sistematizarea datelor după o variabilă de timp. O serie cronologică este
CAPITOLUL 2 alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp. Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade), seria cronologică se numeşte de flux (de intervale). O serie cronologică se notează:
.n1, t,yt
sau y ... y ... y yn ... t ... 2 1
tnt21=
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).
Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Anul Vânzările (mii exemplare)
ianuarie 2001 februarie 2001
martie 2001 aprilie 2001
mai 2001 iunie 2001 iulie 2001
august 2001 septembrie 2001 octombrie 2001 noiembrie 2001 decembrie 2001 ianuarie 2002 februarie 2001
104,0 103,8 104,5 99,2 124,0 127,8 108,7 110,0 116,7 123,8 148,0 133,0 139,0 143,0
2.3.3. Serii teritoriale Dacă variabila pentru care se sistematizează datele este o variabilă
de spaţiu (teritorială), adică elementul ce diferenţiază manifestările fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul este o serie teritorială (de spaţiu).
STATISTICĂ ECONOMICĂ
EXEMPLUL 2.5: Rata şomajului în anul 1997 pentru 11 ţări din Europa a fost (Tabelul 2.9):
Tabelul 2.9 Rata şomajului
Ţara Rata şomajului (%) Austria Belgia
Bulgaria Elveţia Franţa
Germania Italia
Olanda România Spania Ungaria
7,1 13,2 13,7 5,2 12,4 12,5 12,3 5,5 10,4 20,8 10,4
2.4. PREZENTAREA DATELOR ÎN TABELE STATISTICE Tabelul statistic constituie o modalitate de prezentare a datelor
statistice şi este format dintr-o reţea de linii paralele, orizontale şi verticale în care sunt încadrate datele statistice. Alături de funcţia de prezentare a rezultatelor prelucrării primare şi secundare a datelor statistice, tabelele statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor. Tabelele statistice conţin una sau mai multe serii statistice.
Tabelul statistic trebuie să fie elaborat după anumite reguli privind
elementele de conţinut şi de formă. În funcţie de rolul lor în analiza şi prelucrarea datelor statistice,
tabelele statistice pot fi: simple (descriptive); de prelucrare; pe grupe (obţinute în urma sistematizării datelor); combinate; de asociere.
CAPITOLUL 2
2.5. METODE GRAFICE DE DESCRIERE A DATELOR STATISTICE
Reprezentarea grafică este o metodă de descriere a datelor prin intermediul figurilor geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin diferite mijloace plastice de prezentare scoate în evidenţă ceea ce este caracteristic şi esenţial în evoluţia fenomenelor, în schimbările structurale, în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi natură sau calitativ diferite1.
• Cel mai adesea, graficele statistice sunt reprezentate într-un sistem de coordonate rectangulare (ortogonale), adică în raport şi proporţional cu două axe perpendiculare, dar se pot întâlni şi grafice reprezentate într-un sistem de coordonate polare.
o x
y
Myi
xi
a)
o x
rM
α
b)
Fig. 2.1 - Reprezentare în coordonate: a) rectangulare b) polare • Reţeaua graficului este alcătuită dintr-un sistem de linii verticale
şi orizontale sau de cercuri concentrice care ajută la construirea graficului. • Scara de reprezentare stabileşte corespondenţa dintre o unitate de
măsură aleasă pe grafic şi unitatea relativă la X (sau Y). Scările de repre-zentare pot fi aritmetice, logaritmice sau semilogaritmice.
• Legenda graficului are rolul de a explica diversele simboluri, haşuri, culori folosite pentru a facilita înţelegerea reprezentării construite.
1 D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
STATISTICĂ ECONOMICĂ
• În afara acestor elemente specifice reprezentărilor grafice, trebuie să subliniem necesitatea prezenţei unor elemente comune şi tabelelor statistice: titlul, sursa datelor, numerotarea, note explicative etc.
Pentru a reprezenta corect proporţiile şi rapoartele care se
înregistrează între datele statistice prin intermediul graficelor, utilizăm figuri geometrice, hărţi, diagrame figurale etc.
Principalele tipuri de grafice vor fi prezentate, în continuare, în funcţie de felul seriilor statistice în care au fost sistematizate datele.
2.5.1. Histograma şi poligonul frecvenţelor Pentru o serie de distribuţie de frecvenţe după o variabilă numerică
continuă (pe intervale), reprezentările grafice care ne permit să vizualizăm distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.
EXEMPLUL 2.6: Pentru seria de repartiţie de frecvenţe absolute pre-zentată în tabelul 2.3, histograma este (fig. 2.2.):
Fig. 2.2 - Histograma frecvenţelor absolute pentru salariul net al muncitorilor O altă posibilitate de reprezentare grafică a distribuţiei de frecvenţe
pentru o caracteristică numerică de tip continuu este poligonul frecvenţelor. EXEMPLUL 2.7: Pe baza datelor din tabelul 2.3, putem construi poli-
gonul frecvenţelor absolute, astfel (fig. 2.3 şi fig. 2.4.): Fig. 2.3 - Poligonul frecvenţelor absolute pentru salariul net al muncitorilor
Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane 0
5
10
15
20
25
30
35
40
x
y
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2
Fre
cven
þe
Salariul (mil. lei)
≈
0
5
10
15
20
25
30
35
40
x
y
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2
Fre
cven
þe
Salariul (mil. lei)
≈
Scara de reprezentare Ox: 0,7 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane
CAPITOLUL 2
Fig. 2.4 - Histograma şi poligonul frecvenţelor absolute
pentru salariul net al muncitorilor Trebuie să remarcăm că histograma şi poligonul frecvenţelor se pot
construi şi pe baza frecvenţelor relative. EXEMPLUL 2.8: Pe baza datelor din tabelul 2.3, utilizând frecvenţele
relative, histograma şi poligonul frecvenţelor relative este (fig. 2.5.):
Fig. 2.5 - Histograma şi poligonul frecvenţelor relative pentru salariul net al
muncitorilor
Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane 0
5
10
15
20
25
30
35
40
x
y
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2
Fre
cven
þe
Salariul (mil. lei)
≈
0
5
10
15
20
25
30
35
40
x
y
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2
Fre
cven
þere
lati
ve
(%)
Salariul (mil. lei)
≈
Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,6 cm = 2 persoane
STATISTICĂ ECONOMICĂ
Când intervalele devin suficient de mici, iar numărul de cazuri rămâne finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă netedă (fig. 2.6.)
a) set mic de date
b) Set foarte mare de date
Fig. 2.6 - Efectul volumului colectivităţii asupra aspectului poligonului frecvenţelor
Iată, deci, că histograma şi poligonul frecvenţelor oferă o primă
imagine asupra normalităţii sau tendinţei de normalitate, ori, din contră, asupra asimetriei profunde a unei serii de distribuţie de frecvenţe. O distribuţie normală, perfect simetrică (în forma clopotului lui Gauss-Laplace) (vezi fig. nr. 2.7.a) este foarte rar întâlnită în practică; cu toate
0
5
10
15
20
25
30
35
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
Intervale
Frec
vent
e
0
2
4
6
8
10
12
14
10 20 30 40 50 60 70 80 90
Intervale
Frec
vent
e
CAPITOLUL 2 acestea ea este o distribuţie teoretică la care se face adeseori apel în analiza statistică. În cele mai multe cazuri, distribuţiile de frecvenţe empirice au tendinţă de normalitate, dar un anumit grad de asimetrie (fig.2.7b şi fig.2.7.c). Există şi distribuţii profund asimetrice, în care frecvenţa maximă se întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele să descrească spre zero. Aceste distribuţii se numesc în formă de J (fig.2.7d şi fig.2.7e). De asemenea, se pot întâlni distribuţii în formă de U, cu frecvenţe maxime în ambele intervale extreme de variaţie şi cu frecvenţă minimă în jurul intervalului central — din mijlocul distribuţiei (fig.2.7f). Este firesc, aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a tendinţei de distribuţie a valorilor în colectivitatea cercetată.
o x
y
o x
y
o x
y
a) distribuţie normală, perfect simetrică
b) distribuţie cu tendinţă de normalitate, asimetrică
b) distribuţie cu tendinţă de normalitate, asimetrică
o x
y
o x
y
o x
y
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U
Fig. 2.7 - Forme ale distribuţiilor de frecvenţe
O serie de distribuţie de frecvenţe alcătuită după o variabilă
numerică discretă se reprezintă grafic prin poligonul frecvenţelor.
STATISTICĂ ECONOMICĂ
EXEMPLUL 2.9: Distribuţia elevilor dintr-o clasă după nota obţinută la o lucrare de control este cea prezentată în Tabelul 2.10. Reprezentarea grafică a distribuţiei se prezintă în graficul din fig. 2.8.
Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control Nota (xi) Număr de elevi (ni)
2 1 3 2 4 2 5 6 6 7 8 15 9 5 10 2
Total 40
Fig. 2.8 - Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de
control 2.5.2. Curba frecvenţelor cumulative (ogiva) O altă modalitate de descriere a datelor cantitative continue,
construită de această dată pe baza frecvenţelor cumulative este curba frecvenţelor cumulative (ogiva).
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota
Frec
vent
e
CAPITOLUL 2
Să subliniem mai întâi că frecvenţele cumulate sunt interpretate în relaţie cu limitele exacte ale intervalelor de grupare.
EXEMPLUL 2.10: Pe baza datelor obţinute în tabelul 2.4. se poate
construi grafic curba frecvenţelor cumulate crescător (fig. 2.9.)
Fig. 2.9 - Curba frecvenţelor cumulate crescător, pentru salariul net al
muncitorilor Suprapus peste curba frecvenţelor cumulate crescător, ori într-un
grafic separat, se poate reprezenta curba frecvenţelor cumulate descrescător. De asemenea, ogiva se poate reprezenta şi pe baza frecvenţelor relative cumulate.
EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).
0
10
20
30
40
50
60
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)
Frec
vent
e cu
mul
ate
≈
STATISTICĂ ECONOMICĂ
Fig. 2.10 - Curba frecvenţelor relative cumulate crescător
pentru salariul net al muncitorilor Reprezentarea grafică a frecvenţelor cumulate crescător pentru o
variabilă discretă, prin intermediul graficului frecvenţelor cumulate, va avea, de această dată, aspectul unei scări, pentru că nici o unitate statistică nu poate avea valoarea caracteristicii situată între variantele stabilite.
EXEMPLUL 2.12: Pe baza distribuţiei din tabelul 2.10 se poate deter-mina distribuţia de frecvenţe absolute cumulate crescător (Tabelul 2.11) şi reprezenta grafic în fig. 2.11.
0
0,2
0,4
0,6
0,8
1
1,2
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (mil. lei)
Frec
vent
e re
lativ
e cu
mul
ate
CAPITOLUL 2
Tabelul 2.11 Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control Nota (xi) Frecvenţe absolute cumulate
crescător (Fci) 2 1 3 3 4 5 5 11 6 18 8 33 9 38 10 40
o x
5
10
15
20
25
30
35
40
1 2 3 4 5 6 7 8 9 10 (nota)
Frecvenþe cumulate (Y)
Fig. 2.11 - Graficul frecvenţelor cumulate crescător pentru distribuţia elevilor după nota la lucrarea de control
2.5.3. Diagrama prin coloane şi diagrama prin benzi Alte modalităţi uzuale de a reprezenta grafic o serie de distribuţie
de frecvenţe absolute sau relative, pentru o variabilă calitativă (categorială) sunt diagrama prin coloane şi diagrama prin benzi.
STATISTICĂ ECONOMICĂ
0.45
0.25
0.57
0.92
0.96
1.35
1.93
2.3
12.16
27.41
45.7
0 10 20 30 40 50
Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Life
UNITA
SARA
ASIROM
Nederl.
Com
pani
e
Frecvenţe relative (%)
EXEMPLUL 2.13: Pe baza datelor din tabelul 2.5, care reprezintă o distribuţie de frecvenţe relative după o variabilă calitativă, reprezentarea grafică este prin diagrama prin coloane (fig. 2.12) sau diagrama prin benzi (fig. 2.13).
Fig. 2.12 - Diagramă prin coloane
Fig. 2.13 - Diagramă prin benzi
45.7
27.41
12.168.3
1.93 1.35 0.96 0.92 0.57 0.25 0.450
5
10
15
20
25
30
35
40
45
50
Nederl
ande
n
ASIROM
SARA
UNITA
AIG Li
fe
Garanta
Omniasig
Metrop
ol
Intera
m.
ARDAFAlte
le
Compania
Frec
venţ
e re
lativ
e (%
)
CAPITOLUL 2
2.5.4. Diagrama de structură O altă modalitate de a prezenta grafic datele pe care le avem la dis-
poziţie cu privire la o serie de distribuţie de frecvenţe (vizual homogradă) este diagrama de structură.
EXEMPLUL 2.14: Pe baza datelor din Tabelul 2.5., diagrama de
structură se prezintă astfel (fig. 2.14):
Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Life
UNITA
SARA
ASIROM
Nederl.a.
STATISTICĂ ECONOMICĂ
Fig. 2.14 - Diagrama de structură a contractelor de asigurări pe companii de asigurare, în România, 1999: a. prin cerc; b. prin cilindru; c. prin
dreptunghi; d. prin paralelipiped
0
20
40
60
80
100
%
Nederl.
ASIROM
SARA
UNITA
AIG Life
Garanta
Omniasig
Metropol
Interam.
ARDAF
Alteleb.
0102030405060708090
100
%
Nederl.
A SIROM
SA RA
UNITA
A IG Life
Garanta
Omnias ig
Metropol
Interam.
A RDA F
A ltelec.
0%
20%
40%
60%
80%
100%
%
Nederl.
ASIROM
SARA
UNITA
AIG Life
Garanta
Omniasig
Metropol
Interam.
ARDAF
Alteled.
CAPITOLUL 2
2.5.5. Diagrama de împrăştiere (corelograma)
În cazul datelor bivariate, sistematizate într-o serie de distribuţie de
frecvenţe bidimensională, reprezentarea grafică uzuală în sistemul de coor-donate rectangulare este diagrama de împrăştiere (despre care vom vorbi mai pe larg într-un capitol următor) (fig. 2.15)
50
100
150
200
250
1020 30 40 50 60 Cheltuieli cu
reclama (mld. lei)
Cantitãþi vândutedin produsul X
(mii bucãþi)* ** *
* * ** * *
* * ** * ** *
* **
* ** * ** * ** *
* * ** * *
* *
Fig. 2.15 - Diagramă de împrăştiere 2.5.6. Cronograma O serie cronologică se reprezintă grafic prin intermediul
cronogramei sau historiogramei. În sistemul de coordonate rectangulare, pe axa absciselor se marchează unităţile de timp (t) — momente sau intervale — iar pe axa ordonatelor valorile variabilei (yt).
Reprezentarea grafică a seriilor cronologice este prezentată mai pe larg în capitolul 6.
EXEMPLUL 2.15: Pe baza datelor din tabelul 2.8, reprezentarea grafică
prin intermediul cronogramei (prin segmente de linie sau coloane) este (fig. 2.16)
STATISTICĂ ECONOMICĂ
90.00
100.00
110.00
120.00
130.00
140.00
150.00
luni
Num
arul
de
exem
plar
e va
ndut
e(m
ii ex
empl
are)
a)
0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ianua
rie 20
01
februa
rie 20
01
martie
2001
aprili
e 200
1
mai 20
01
iunie
2001
iulie
2001
augu
st 200
1
septem
brie 2
001
octom
brie 2
001
noiem
brie 2
001
decem
brie 2
001
ianua
rie 20
02
februa
rie 20
01
Lunile
Num
arul
de
exem
plar
e va
ndut
e(m
ii ex
empl
are)
b)
Fig. 2.16 - Cronogramă trasată prin a) linii; b) coloane
CAPITOLUL 2
2.5.7. Diagrama polară În cazul în care seria cronologică prezintă variaţii sezoniere, pentru
reprezentarea grafică a evoluţiei unui fenomen putem folosi diagrama polară (radială), construită în sistemul de coordonate polare. Acest tip de diagramă se va prezenta mai pe larg în capitolul 6.
EXEMPLUL 2.16: Temperatura medie lunară a aerului la Bucureşti -
Filaret în anul 1996 se reprezintă grafic în fig. 2.17.
Temperatura medie lunara a aerului la Bucuresti-Filaret în anul 1996
-100
102030
Ian
Feb.
Mar.
Apr.
Mai
Iun.
Iul.
Aug.
Sept.
Oct.
Nov.
Dec.
Fig. 2.17 – Diagramă polară 2.5.8. Diagrama prin suprafeţe O serie teritorială se poate reprezenta grafic prin diagrame prin
coloane, benzi ori diagramă prin suprafeţe. În diagrama prin suprafeţe se construiesc, de obicei, pătrate sau cercuri, cu suprafeţele proporţionale cu valorile reprezentate.
În cazul fenomenelor complexe, care se descompun în produsul a
trei factori se poate folosi diagrama de volum trasată prin paralelipipedul dreptunghic. Cei trei factori se vor reprezenta pe lungimea, lăţimea şi înălţimea paralelipipedului, iar nivelul fenomenului complex prin volumul acestuia.
STATISTICĂ ECONOMICĂ
EXEMPLUL 2.17: Populaţia globului pe continente în anul 1998 se prezintă astfel (mil. locuitori, Tabelul 2.12):
Tabelul 2.12 Continent Populaţie (mil. loc.) Africa 778 America de Nord 472 America de Sud 332 Asia 3590 Europa 729 Reprezentarea grafică este redată în fig. 2.18. Legendă:
Africa
America de Nord America de Sud Asia Europa
Fig. 2.18 - Diagramă de suprafaţă
2.5.9. Alte tipuri de reprezentări grafice Dacă aceste diagrame pot fi construite şi pentru alte serii statistice
(de exemplu: serii de distribuţii de frecvenţe homograde), o modalitate specifică de reprezentare grafică a seriilor teritoriale este cartograma sau cartodiagrama, în care pe o hartă se construiesc diagrame (în cazul cartodiagramei), se haşurează sau se colorează diferit unităţile teritoriale (în cazul cartogramei), în funcţie de nivelul înregistrat al variabilei.
Să notăm că există şi alte reprezentări grafice (diagrama Venn, diagrama Chernoff) a căror acurateţe în construcţie este facilitată de utilizarea pachetelor informatice specializate.
CAPITOLUL 2
Întrebări recapitulative
1. Ce este sistematizarea datelor statistice? 2. Care sunt principiile după care se efectuează gruparea/clasificarea
datelor statistice? 3. Ce reprezintă clasificarea datelor statistice? 4. Cum se efectuează gruparea pe intervale de variaţie? 5. Definiţi conceptul de serie statistică. 6. Ce reprezintă frecvenţa relativă şi cum se calculează? 7. Arătaţi semnificaţia şi modul de obţinere a frecvenţelor cumulate,
absolute şi relative. Exemplificaţi. 8. Definiţi conceptele de serie heterogradă şi serie homogradă. 9. Seria statistică de distribuţie de frecvenţe bidimensională —
definiţie, formă de prezentare. 10. Ce reprezintă şi cum se construieşte tabelul de asociere? 11. Ce reprezintă seria cronologică? 12. Ce reprezintă seria teritorială? 13. Enumeraţi regulile de construire a tabelelor statistice. 14. Ce reprezintă graficul statistic? 15. Care sunt principalele reguli de construire a graficelor statistice? 16. Cum se reprezintă grafic o serie de distribuţii de frecvenţe? 17. Cum se construieşte ogiva? 18. Cum se reprezintă grafic o serie de distribuţii de frecvenţe pe
intervale neegale? 19. Cum se utilizează diagrama prin benzi şi diagrama prin coloane? 20. Cum se construieşte diagrama de structură? 21. Cum se utilizează diagrama prin suprafeţe? 22. Cum se construieşte corelograma? 23. Cum se reprezintă grafic seriile cronologice? 24. Cum se reprezintă grafic seriile teritoriale?