cap2

29
CAPITOLUL 2 CAPITOLUL 2 SISTEMATIZAREA ŞI PREZENTAREA DATELOR STATISTICE Consideraţii preliminare În acest capitol, vom lua în consideraţie primul pas în prelucrarea datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea, astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare. Termeni cheie cartodiagramă frecvenţă redusă cartogramă frecvenţă relativă clasificare funcţie de repartiţie corelogramă grafic statistic cronogramă grupare curbă cumulativă a frecvenţelor histogramă diagramă de structură poligon al frecvenţelor diagramă prin coloane serie cronologică distribuţie de probabilitate serie de distribuţie de frecvenţe distribuţie heterogradă serie statistică distribuţie homogradă serie teritorială distribuţie teoretică sistematizare frecvenţă absolută tabel statistic frecvenţă cumulată

Transcript of cap2

Page 1: cap2

CAPITOLUL 2

CAPITOLUL 2

SISTEMATIZAREA ŞI PREZENTAREA DATELOR STATISTICE

Consideraţii preliminare

În acest capitol, vom lua în consideraţie primul pas în prelucrarea

datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea, astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.

Termeni cheie

cartodiagramă frecvenţă redusă cartogramă frecvenţă relativă clasificare funcţie de repartiţie corelogramă grafic statistic cronogramă grupare curbă cumulativă a frecvenţelor histogramă diagramă de structură poligon al frecvenţelor diagramă prin coloane serie cronologică distribuţie de probabilitate serie de distribuţie de frecvenţe distribuţie heterogradă serie statistică distribuţie homogradă serie teritorială distribuţie teoretică sistematizare frecvenţă absolută tabel statistic frecvenţă cumulată

Page 2: cap2

STATISTICĂ ECONOMICĂ

Noţiuni teoretice

2.1. INTRODUCERE După ce datele statistice au fost colectate din surse de date publicate,

din observări totale sau din observări parţiale – ele trebuie organizate, în scopul de a avea o formă care să permită prelucrarea lor statistică diversă. Cum observarea parţială – în mod special eşantionarea probabilistă – salvează timp, resurse de muncă şi resurse băneşti, vom trata îndeosebi problema sistematizării datelor provenite din eşantioane. Cu toate acestea, trebuie să înţelegem că, indiferent dacă lucrăm cu date referitoare la colectivităţi parţiale ori la colectivităţi totale, atunci când seturile de date conţin în jur de 30 de observaţii sau peste acest număr (date de masă), cel mai bun mod de a le examina este să le sistematizăm şi apoi să le prezentăm în tabele şi grafice. Putem atunci, să extragem cele mai importante trăsături, prin analiza seriilor şi graficelor statistice.

2.2. GRUPAREA ŞI CLASIFICAREA DATELOR STATISTICE

După cum am văzut, în etapa de observare statistică se culeg date uni, bi sau multivariate, adică pentru fiecare unitate statistică se culeg date privitoare la o singură caracteristică sau la mai multe caracteristici considerate.

2.2.1. Principiile grupării/clasificării Sistematizarea datelor se realizează prin gruparea şi clasificarea

datelor statistice, adică prin împărţirea lor în grupe/clase omogene, după unul sau mai multe criterii de grupare/clasificare.

O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se asemene cât mai mult între ele din punctul de vedere al criteriului utilizat, adică dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici, date de prezenţa factorilor aleatori, întâmplători.

Page 3: cap2

CAPITOLUL 2

Criteriul de grupare/clasificare reprezintă variabila (caracteristica) statistică în funcţie de care sistematizăm datele. După cum avem de-a face cu un singur criteriu sau mai multe criterii de grupare/clasificare, vom vorbi de grupări/clasificări simple sau combinate.

Dacă sistematizarea datelor se face după o variabilă nenumerică,

procesul se numeşte clasificare. Gruparea reprezintă sistematizarea datelor după o variabilă

(caracteristică) numerică. În funcţie de tipul acesteia, gruparea se poate face după o variabilă discretă sau continuă.

2.2.2. Gruparea pe intervale de variaţie Intervalul de variaţie reprezintă un şir de valori ale variabilei

studiate, delimitat de intervalele vecine prin limita inferioară şi limita superioară. Intervalele de variaţie pot fi de mărime egală sau neegală.

• Pentru gruparea pe intervale de variaţie se recomandă utilizarea

unui număr moderat de grupe. Deseori, un număr de 4 până la 10 grupe este arbitrar recomandat, dar felul datelor poate necesita un alt număr de grupe.

Pentru alegerea numărului de intervale de grupare (r) se poate utiliza şi relaţia lui Sturges (în ipoteza repartiţiei aproximativ normale a unităţilor după variabila studiată):

nlog322,31r 10+= (2.1.) unde n reprezintă numărul total de unităţi din colectivitate (volumul colec-tivităţii).

• Pentru sistematizarea datelor pe intervale de variaţie se recomandă utilizarea intervalelor de mărime egală, cu excepţia cazurilor în care analiza datelor, descoperirea unor tipuri calitative în colectivitate, necesită folosirea unor intervale de mărime neegală.

• Mărimea intervalului (h) se recomandă a se rotunji la o valoare convenabilă.

• Punctul de plecare în alcătuirea intervalelor de grupare se alege, convenabil, 0 sau un număr întreg puţin mai mic decât valoarea minimă din setul de date.

Page 4: cap2

STATISTICĂ ECONOMICĂ

• Limitele intervalelor de grupare trebuie stabilite cu acurateţe, respectând precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt de această manieră).

• Limitele intervalelor de grupare se stabilesc exact, fără ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată fi încadrată într-o singură clasă.

Aşadar, pentru sistematizarea datelor pe intervale egale de grupare se

prezintă următorii paşi: 1. Se stabileşte amplitudinea variaţiei caracteristicii:

minmaxx xxA −= (2.2.) 2. Se stabileşte numărul de grupe, r, în care vor fi sistematizate

datele 3. Se calculează mărimea aproximativă a intervalelor de grupare:

rxx

rAh minmax −

=≈ (2.3.)

4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o valoare puţin mai mică):

xmin xmin+h xmin+h xmin+2h ..................................................... xmin + (r — 1)h xmin + r ⋅ h Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele prin

numărarea unităţilor care se încadrează în fiecare grupă. Dacă există grupe cu frecvenţă nulă, ori multe grupe cu o singură observaţie, poate fi necesară revizuirea mărimii intervalelor sau a numărului de intervale.

2.3. SERII STATISTICE

Rezultatul sistematizării datelor prin grupare/clasificare se constituie sub forma seriilor statistice.

DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor refe-

ritoare la manifestările unui fenomen colectiv sub forma a două şiruri de

Page 5: cap2

CAPITOLUL 2 date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.

2.3.1. Serii de distribuţie de frecvenţe pentru o variabilă

atributivă A. Vom începe, acum, cu rezultatul sistematizării pe intervale de

grupare, pentru o variabilă numerică continuă, pentru care se obţine o serie de distribuţie (repartiţie) de frecvenţe pe intervale, sub forma (Tabelul 2.1).

Tabelul 2.1.

Distribuţie de frecvenţe pe intervale de variaţie Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)

x1inf – x1sup x2inf – x2sup

. xinf – xisup

.

. xrinf – xrsup

n1 n2 . ni . . nr

Total ∑=

=

r

1iinn

OBSERVAŢII: • dacă intervalele sunt cu variaţie discontinuă, atunci:

x(i+1)inf = xisup + ∆ (2.4) unde ∆ este o unitate de discretizare • dacă intervalele sunt cu variaţie continuă, adică:

x(i+1)inf = xisup (2.5) atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă; • mărimea intervalului de grupare se calculează:

hi = xisup – xiinf , r,ii = (2.6) dacă intervalele sunt cu variaţie continuă, sau:

hi = x(i+1)inf – xi inf, r,ii = (2.7) sau

hi = xisup – x(i–1)sup, r,2i = (2.8) indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.

Page 6: cap2

STATISTICĂ ECONOMICĂ • pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni unităţi dintr-o grupă au valoarea variabilei egală cu centrul de interval (xi).

2hxx i

infii += (2.9)

sau, dacă intervalele sunt cu variaţie continuă:

2supinf ii

ixx

x+

= (2.10)

Pe lângă frecvenţa absolută (ni) care indică numărul total de unităţi

statistice care au valoarea variabilei situată într-un interval (xiinf – xisup), se poate calcula şi frecvenţa relativă a grupei, care indică proporţia din nu-mărul total de unităţi, care se încadrează în grupă:

nn

n

nn ir

1ii

i*i =

∑=

=

(2.11)

unde n reprezintă volumul total al colectivităţii. Exprimată în procente, frecvenţa relativă a grupei i este:

100nn

100n

nn i

r

1ii

i%*i =

∑=

=

(2.12)

Dacă utilizăm frecvenţele relative, obţinem o serie de distribuţie (repartiţie) de frecvenţe relative (Tabelul 2.2)

Tabelul 2.2.

Serie de distribuţie de frecvenţe relative Intervale de variaţie a variabilei Frecvenţe relative

X1inf – x1sup x2inf – x2sup

.

.

. xi inf – xi sup

.

. xrinf – xrsup

*1n *2n

.

. *in

.

. *rn

Total ∑=

=

r

1i

*in00,1

Page 7: cap2

CAPITOLUL 2

Frecvenţele absolute cumulate (Fci) reprezintă numărul unităţilor statistice care au valoarea variabilei mai mică (sau, eventual, egală) cu limita superioară a grupei (deci, au valoarea variabilei mai mare decât x1inf şi mai mică decât xisup).

∑==

i

1kkci nF (2.13)

Similar cu frecvenţele cumulate crescător, se pot calcula şi frecvenţe cumulate descrescător:

∑==

r

ikkdi nF (2.14)

∑==

r

ik

*k

*di nF (2.15)

EXEMPLUL 2.1 În urma sistematizării datelor cu privire la salariul

net încasat de o colectivitate de muncitori, s-a obţinut următoarea serie de repartiţie (Tabelul 2.3):

Tabelul 2.3.

Distribuţia salariaţilor după salariul net

Salariul net (mii lei)

Număr de salariaţi

(ni)

Frecvenţe relative *

in

Frecvenţe absolute

cumulate (Fci)

Frecvenţe relative

cumulate ( *ciF )

1,4 – 1,6 1,6 – 1,8 1,8 – 2,0 2,0 – 2,2 2,2 – 2,4 2,4 – 2,6 2,6 – 2,8 2,8 – 3,0 3,0 – 3,2

5 8 4

17 8 3 2 2 1

0,10 0,16 0,08 0,34 0,16 0,06 0,04 0,04 0,02

5 13 17 34 42 45 47 49 50

0,10 0,26 0,34 0,68 0,84 0,90 0,94 0,98 1,00

Total 50 1,00 — — Dacă intervalele sunt neegale, pentru asigurarea comparabilităţii

datelor se pot calcula frecvenţe reduse la un interval etalon (standard). Frecvenţa redusă (corectată) a unui interval ( cor

in ) se calculează prin raportarea frecvenţei absolute la un factor de corecţie (l) ce reprezintă numărul intervalelor etalon ce încap într-un interval de grupare:

Page 8: cap2

STATISTICĂ ECONOMICĂ

et

i

hh

l = (2.16)

ln

n icori = (2.17)

unde hi reprezintă mărimea intervalului i, r,1i = het reprezintă mărimea intervalului etalon (de regulă mărimea celui

mai mic interval de grupare). B. În cazul în care variabila de grupare este discretă şi gruparea se

efectuează pe variante, seria de distribuţie de frecvenţe este discretă sau pe variante.

EXEMPLUL 2.2: Un exemplu de distribuţie de frecvenţe după o va-

riabilă discretă este distribuţia divorţurilor din România în anul 2000 după numărul de copii minori rămaşi prin desfacerea căsătoriei (Tabelul 2.4), pentru care s-au calculat şi frecvenţele relative (col.2) şi frecvenţele cumu-late (col. 3 şi col. 4):

Tabelul 2.4.

Distribuţia divorţurilor după numărul de copii minori rămaşi prin desfacerea căsătoriei, în România, anul 2000

Număr de copii minori

Număr de divorţuri

(ni)

Frecvenţe relative ( *

in ) Frecvenţe absolute cumulate

(Fci)

Frecvenţe relative

cumulate ( *

ciF ) 0 1 2 3 4 0 18.614 0,465 18.614 0,465 1 14.518 0,363 33.132 0,828 2 5.351 0,134 38.483 0,962 3 1.062 0,027 39.545 0,989 4 317 0,008 39.862 0,997

5 şi peste 5 123 0,003 39.985 1,000 Total 39.985 1,000 — —

Seriile de distribuţie de frecvenţe alcătuite după o variabilă

cantitativă (numerică), adică cele descrise de paragrafele A şi B, poartă numele de distribuţii heterograde.

Page 9: cap2

CAPITOLUL 2

C. O distincţie aparte trebuie făcută pentru seriile de distribuţie de frecvenţe alcătuite după o variabilă calitativă (nenumerică) ce poartă numele de distribuţii homograde.

EXEMPLUL 2.3: O distribuţie homogradă, după o variabilă nenume-

rică măsurată pe o scală nominală este distribuţia contractelor de asigurare pe viaţă în România, în anul 1999, pe principalele companii (vezi Tabelul 2.5, unde se prezintă ca o distribuţie de frecvenţe relative):

Tabelul 2.5

Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe principalele companii

Compania Procent din numărul total de contracte încheiate (%)

Nederlanden ASIROM S.A. SARA MERKUR UNITA AIG Life Garanta Omniasig METROPOL S.A. Interamerican ARDAF Altele

45,70 27,41 12,16 8,30 1,93 1,35 0,96 0,92 0,57 0,25 0,45

Total 100,0 D. Seriile statistice de distribuţie de frecvenţe bidimensionale

sunt cele formate prin considerarea concomitentă a două variabile (X şi Y). Forma unei astfel de serii de distribuţie bidimensională este (Tabelul 2.6)

Page 10: cap2

STATISTICĂ ECONOMICĂ

Tabelul 2.6 Distribuţia de frecvenţe bidimensională

Intervale/variante pentru Y

Intervale/ Variante pentru X

y1 y2 ... yj ... ym Total

x1 x2 . . xi . . xr

n11 n12 ... n1j ... n1m n21 n22 ... n2j ... n2m . . . . . . . . . . . . . . . . . . . ni1 ni2 ... nij ... nim . . . . . . . . . . . . . . . . . . . . nr1 nr2 ... nrj .... nrm

n1. n2. ...

ni. ...

nr.

Total n.1 n.2 .... n.j ... n.m n.. În acest tabel trebuie să remarcăm că:

∑==

m

1jiji nn (2.18)

∑==

r

1iijj nn (2.19)

∑ ∑=∑=∑== ===

r

1i

m

1jij

m

1jj

r

1i.i n.nn..n (2.20)

O situaţie aparte o întâlnim în cazul variabilelor alternative, când

datele se pot prezenta într-un tabel de asociere de forma (Tabelul 2.7):

Tabelul 2.7 Tabel de asociere

Clasele lui Y Clasele lui X Y(y1) non Y(y2)

Total

X(x1) non X(x2)

n11 n21

n12 n22

n1. = n11 + n12 n2. = n21 + n22

Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22 2.3.2. Serii cronologice Seriile cronologice reprezintă seriile statistice ce se obţin prin

sistematizarea datelor după o variabilă de timp. O serie cronologică este

Page 11: cap2

CAPITOLUL 2 alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp. Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade), seria cronologică se numeşte de flux (de intervale). O serie cronologică se notează:

.n1, t,yt

sau y ... y ... y yn ... t ... 2 1

tnt21=

EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).

Tabelul 2.8

Evoluţia vânzărilor cotidianului naţional Libertatea

Anul Vânzările (mii exemplare)

ianuarie 2001 februarie 2001

martie 2001 aprilie 2001

mai 2001 iunie 2001 iulie 2001

august 2001 septembrie 2001 octombrie 2001 noiembrie 2001 decembrie 2001 ianuarie 2002 februarie 2001

104,0 103,8 104,5 99,2 124,0 127,8 108,7 110,0 116,7 123,8 148,0 133,0 139,0 143,0

2.3.3. Serii teritoriale Dacă variabila pentru care se sistematizează datele este o variabilă

de spaţiu (teritorială), adică elementul ce diferenţiază manifestările fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul este o serie teritorială (de spaţiu).

Page 12: cap2

STATISTICĂ ECONOMICĂ

EXEMPLUL 2.5: Rata şomajului în anul 1997 pentru 11 ţări din Europa a fost (Tabelul 2.9):

Tabelul 2.9 Rata şomajului

Ţara Rata şomajului (%) Austria Belgia

Bulgaria Elveţia Franţa

Germania Italia

Olanda România Spania Ungaria

7,1 13,2 13,7 5,2 12,4 12,5 12,3 5,5 10,4 20,8 10,4

2.4. PREZENTAREA DATELOR ÎN TABELE STATISTICE Tabelul statistic constituie o modalitate de prezentare a datelor

statistice şi este format dintr-o reţea de linii paralele, orizontale şi verticale în care sunt încadrate datele statistice. Alături de funcţia de prezentare a rezultatelor prelucrării primare şi secundare a datelor statistice, tabelele statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor. Tabelele statistice conţin una sau mai multe serii statistice.

Tabelul statistic trebuie să fie elaborat după anumite reguli privind

elementele de conţinut şi de formă. În funcţie de rolul lor în analiza şi prelucrarea datelor statistice,

tabelele statistice pot fi: simple (descriptive); de prelucrare; pe grupe (obţinute în urma sistematizării datelor); combinate; de asociere.

Page 13: cap2

CAPITOLUL 2

2.5. METODE GRAFICE DE DESCRIERE A DATELOR STATISTICE

Reprezentarea grafică este o metodă de descriere a datelor prin intermediul figurilor geometrice ori a figurilor naturale.

Graficul este o imagine spaţială, cu caracter convenţional, care prin diferite mijloace plastice de prezentare scoate în evidenţă ceea ce este caracteristic şi esenţial în evoluţia fenomenelor, în schimbările structurale, în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi natură sau calitativ diferite1.

• Cel mai adesea, graficele statistice sunt reprezentate într-un sistem de coordonate rectangulare (ortogonale), adică în raport şi proporţional cu două axe perpendiculare, dar se pot întâlni şi grafice reprezentate într-un sistem de coordonate polare.

o x

y

Myi

xi

a)

o x

rM

α

b)

Fig. 2.1 - Reprezentare în coordonate: a) rectangulare b) polare • Reţeaua graficului este alcătuită dintr-un sistem de linii verticale

şi orizontale sau de cercuri concentrice care ajută la construirea graficului. • Scara de reprezentare stabileşte corespondenţa dintre o unitate de

măsură aleasă pe grafic şi unitatea relativă la X (sau Y). Scările de repre-zentare pot fi aritmetice, logaritmice sau semilogaritmice.

• Legenda graficului are rolul de a explica diversele simboluri, haşuri, culori folosite pentru a facilita înţelegerea reprezentării construite.

1 D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-

reşti, 1968.

Page 14: cap2

STATISTICĂ ECONOMICĂ

• În afara acestor elemente specifice reprezentărilor grafice, trebuie să subliniem necesitatea prezenţei unor elemente comune şi tabelelor statistice: titlul, sursa datelor, numerotarea, note explicative etc.

Pentru a reprezenta corect proporţiile şi rapoartele care se

înregistrează între datele statistice prin intermediul graficelor, utilizăm figuri geometrice, hărţi, diagrame figurale etc.

Principalele tipuri de grafice vor fi prezentate, în continuare, în funcţie de felul seriilor statistice în care au fost sistematizate datele.

2.5.1. Histograma şi poligonul frecvenţelor Pentru o serie de distribuţie de frecvenţe după o variabilă numerică

continuă (pe intervale), reprezentările grafice care ne permit să vizualizăm distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.

EXEMPLUL 2.6: Pentru seria de repartiţie de frecvenţe absolute pre-zentată în tabelul 2.3, histograma este (fig. 2.2.):

Fig. 2.2 - Histograma frecvenţelor absolute pentru salariul net al muncitorilor O altă posibilitate de reprezentare grafică a distribuţiei de frecvenţe

pentru o caracteristică numerică de tip continuu este poligonul frecvenţelor. EXEMPLUL 2.7: Pe baza datelor din tabelul 2.3, putem construi poli-

gonul frecvenţelor absolute, astfel (fig. 2.3 şi fig. 2.4.): Fig. 2.3 - Poligonul frecvenţelor absolute pentru salariul net al muncitorilor

Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane 0

5

10

15

20

25

30

35

40

x

y

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2

Fre

cven

þe

Salariul (mil. lei)

0

5

10

15

20

25

30

35

40

x

y

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2

Fre

cven

þe

Salariul (mil. lei)

Scara de reprezentare Ox: 0,7 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane

Page 15: cap2

CAPITOLUL 2

Fig. 2.4 - Histograma şi poligonul frecvenţelor absolute

pentru salariul net al muncitorilor Trebuie să remarcăm că histograma şi poligonul frecvenţelor se pot

construi şi pe baza frecvenţelor relative. EXEMPLUL 2.8: Pe baza datelor din tabelul 2.3, utilizând frecvenţele

relative, histograma şi poligonul frecvenţelor relative este (fig. 2.5.):

Fig. 2.5 - Histograma şi poligonul frecvenţelor relative pentru salariul net al

muncitorilor

Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,5 cm = 2 persoane 0

5

10

15

20

25

30

35

40

x

y

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2

Fre

cven

þe

Salariul (mil. lei)

0

5

10

15

20

25

30

35

40

x

y

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2

Fre

cven

þere

lati

ve

(%)

Salariul (mil. lei)

Scara de reprezentare Ox: 0,8 cm = 0,2 mil. lei Oy: 0,6 cm = 2 persoane

Page 16: cap2

STATISTICĂ ECONOMICĂ

Când intervalele devin suficient de mici, iar numărul de cazuri rămâne finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă netedă (fig. 2.6.)

a) set mic de date

b) Set foarte mare de date

Fig. 2.6 - Efectul volumului colectivităţii asupra aspectului poligonului frecvenţelor

Iată, deci, că histograma şi poligonul frecvenţelor oferă o primă

imagine asupra normalităţii sau tendinţei de normalitate, ori, din contră, asupra asimetriei profunde a unei serii de distribuţie de frecvenţe. O distribuţie normală, perfect simetrică (în forma clopotului lui Gauss-Laplace) (vezi fig. nr. 2.7.a) este foarte rar întâlnită în practică; cu toate

0

5

10

15

20

25

30

35

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

Intervale

Frec

vent

e

0

2

4

6

8

10

12

14

10 20 30 40 50 60 70 80 90

Intervale

Frec

vent

e

Page 17: cap2

CAPITOLUL 2 acestea ea este o distribuţie teoretică la care se face adeseori apel în analiza statistică. În cele mai multe cazuri, distribuţiile de frecvenţe empirice au tendinţă de normalitate, dar un anumit grad de asimetrie (fig.2.7b şi fig.2.7.c). Există şi distribuţii profund asimetrice, în care frecvenţa maximă se întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele să descrească spre zero. Aceste distribuţii se numesc în formă de J (fig.2.7d şi fig.2.7e). De asemenea, se pot întâlni distribuţii în formă de U, cu frecvenţe maxime în ambele intervale extreme de variaţie şi cu frecvenţă minimă în jurul intervalului central — din mijlocul distribuţiei (fig.2.7f). Este firesc, aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a tendinţei de distribuţie a valorilor în colectivitatea cercetată.

o x

y

o x

y

o x

y

a) distribuţie normală, perfect simetrică

b) distribuţie cu tendinţă de normalitate, asimetrică

b) distribuţie cu tendinţă de normalitate, asimetrică

o x

y

o x

y

o x

y

d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U

Fig. 2.7 - Forme ale distribuţiilor de frecvenţe

O serie de distribuţie de frecvenţe alcătuită după o variabilă

numerică discretă se reprezintă grafic prin poligonul frecvenţelor.

Page 18: cap2

STATISTICĂ ECONOMICĂ

EXEMPLUL 2.9: Distribuţia elevilor dintr-o clasă după nota obţinută la o lucrare de control este cea prezentată în Tabelul 2.10. Reprezentarea grafică a distribuţiei se prezintă în graficul din fig. 2.8.

Tabelul 2.10

Distribuţia elevilor după nota obţinută la o lucrare de control Nota (xi) Număr de elevi (ni)

2 1 3 2 4 2 5 6 6 7 8 15 9 5 10 2

Total 40

Fig. 2.8 - Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de

control 2.5.2. Curba frecvenţelor cumulative (ogiva) O altă modalitate de descriere a datelor cantitative continue,

construită de această dată pe baza frecvenţelor cumulative este curba frecvenţelor cumulative (ogiva).

0

2

4

6

8

10

12

14

16

0 1 2 3 4 5 6 7 8 9 10 11 12

Nota

Frec

vent

e

Page 19: cap2

CAPITOLUL 2

Să subliniem mai întâi că frecvenţele cumulate sunt interpretate în relaţie cu limitele exacte ale intervalelor de grupare.

EXEMPLUL 2.10: Pe baza datelor obţinute în tabelul 2.4. se poate

construi grafic curba frecvenţelor cumulate crescător (fig. 2.9.)

Fig. 2.9 - Curba frecvenţelor cumulate crescător, pentru salariul net al

muncitorilor Suprapus peste curba frecvenţelor cumulate crescător, ori într-un

grafic separat, se poate reprezenta curba frecvenţelor cumulate descrescător. De asemenea, ogiva se poate reprezenta şi pe baza frecvenţelor relative cumulate.

EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-

strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).

0

10

20

30

40

50

60

1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2

Salariu (mil. lei)

Frec

vent

e cu

mul

ate

Page 20: cap2

STATISTICĂ ECONOMICĂ

Fig. 2.10 - Curba frecvenţelor relative cumulate crescător

pentru salariul net al muncitorilor Reprezentarea grafică a frecvenţelor cumulate crescător pentru o

variabilă discretă, prin intermediul graficului frecvenţelor cumulate, va avea, de această dată, aspectul unei scări, pentru că nici o unitate statistică nu poate avea valoarea caracteristicii situată între variantele stabilite.

EXEMPLUL 2.12: Pe baza distribuţiei din tabelul 2.10 se poate deter-mina distribuţia de frecvenţe absolute cumulate crescător (Tabelul 2.11) şi reprezenta grafic în fig. 2.11.

0

0,2

0,4

0,6

0,8

1

1,2

1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2

Salariu (mil. lei)

Frec

vent

e re

lativ

e cu

mul

ate

Page 21: cap2

CAPITOLUL 2

Tabelul 2.11 Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de

control Nota (xi) Frecvenţe absolute cumulate

crescător (Fci) 2 1 3 3 4 5 5 11 6 18 8 33 9 38 10 40

o x

5

10

15

20

25

30

35

40

1 2 3 4 5 6 7 8 9 10 (nota)

Frecvenþe cumulate (Y)

Fig. 2.11 - Graficul frecvenţelor cumulate crescător pentru distribuţia elevilor după nota la lucrarea de control

2.5.3. Diagrama prin coloane şi diagrama prin benzi Alte modalităţi uzuale de a reprezenta grafic o serie de distribuţie

de frecvenţe absolute sau relative, pentru o variabilă calitativă (categorială) sunt diagrama prin coloane şi diagrama prin benzi.

Page 22: cap2

STATISTICĂ ECONOMICĂ

0.45

0.25

0.57

0.92

0.96

1.35

1.93

2.3

12.16

27.41

45.7

0 10 20 30 40 50

Altele

ARDAF

Interam.

Metropol

Omniasig

Garanta

AIG Life

UNITA

SARA

ASIROM

Nederl.

Com

pani

e

Frecvenţe relative (%)

EXEMPLUL 2.13: Pe baza datelor din tabelul 2.5, care reprezintă o distribuţie de frecvenţe relative după o variabilă calitativă, reprezentarea grafică este prin diagrama prin coloane (fig. 2.12) sau diagrama prin benzi (fig. 2.13).

Fig. 2.12 - Diagramă prin coloane

Fig. 2.13 - Diagramă prin benzi

45.7

27.41

12.168.3

1.93 1.35 0.96 0.92 0.57 0.25 0.450

5

10

15

20

25

30

35

40

45

50

Nederl

ande

n

ASIROM

SARA

UNITA

AIG Li

fe

Garanta

Omniasig

Metrop

ol

Intera

m.

ARDAFAlte

le

Compania

Frec

venţ

e re

lativ

e (%

)

Page 23: cap2

CAPITOLUL 2

2.5.4. Diagrama de structură O altă modalitate de a prezenta grafic datele pe care le avem la dis-

poziţie cu privire la o serie de distribuţie de frecvenţe (vizual homogradă) este diagrama de structură.

EXEMPLUL 2.14: Pe baza datelor din Tabelul 2.5., diagrama de

structură se prezintă astfel (fig. 2.14):

Altele

ARDAF

Interam.

Metropol

Omniasig

Garanta

AIG Life

UNITA

SARA

ASIROM

Nederl.a.

Page 24: cap2

STATISTICĂ ECONOMICĂ

Fig. 2.14 - Diagrama de structură a contractelor de asigurări pe companii de asigurare, în România, 1999: a. prin cerc; b. prin cilindru; c. prin

dreptunghi; d. prin paralelipiped

0

20

40

60

80

100

%

Nederl.

ASIROM

SARA

UNITA

AIG Life

Garanta

Omniasig

Metropol

Interam.

ARDAF

Alteleb.

0102030405060708090

100

%

Nederl.

A SIROM

SA RA

UNITA

A IG Life

Garanta

Omnias ig

Metropol

Interam.

A RDA F

A ltelec.

0%

20%

40%

60%

80%

100%

%

Nederl.

ASIROM

SARA

UNITA

AIG Life

Garanta

Omniasig

Metropol

Interam.

ARDAF

Alteled.

Page 25: cap2

CAPITOLUL 2

2.5.5. Diagrama de împrăştiere (corelograma)

În cazul datelor bivariate, sistematizate într-o serie de distribuţie de

frecvenţe bidimensională, reprezentarea grafică uzuală în sistemul de coor-donate rectangulare este diagrama de împrăştiere (despre care vom vorbi mai pe larg într-un capitol următor) (fig. 2.15)

50

100

150

200

250

1020 30 40 50 60 Cheltuieli cu

reclama (mld. lei)

Cantitãþi vândutedin produsul X

(mii bucãþi)* ** *

* * ** * *

* * ** * ** *

* **

* ** * ** * ** *

* * ** * *

* *

Fig. 2.15 - Diagramă de împrăştiere 2.5.6. Cronograma O serie cronologică se reprezintă grafic prin intermediul

cronogramei sau historiogramei. În sistemul de coordonate rectangulare, pe axa absciselor se marchează unităţile de timp (t) — momente sau intervale — iar pe axa ordonatelor valorile variabilei (yt).

Reprezentarea grafică a seriilor cronologice este prezentată mai pe larg în capitolul 6.

EXEMPLUL 2.15: Pe baza datelor din tabelul 2.8, reprezentarea grafică

prin intermediul cronogramei (prin segmente de linie sau coloane) este (fig. 2.16)

Page 26: cap2

STATISTICĂ ECONOMICĂ

90.00

100.00

110.00

120.00

130.00

140.00

150.00

luni

Num

arul

de

exem

plar

e va

ndut

e(m

ii ex

empl

are)

a)

0.00

20.00

40.00

60.00

80.00

100.00

120.00

140.00

160.00

ianua

rie 20

01

februa

rie 20

01

martie

2001

aprili

e 200

1

mai 20

01

iunie

2001

iulie

2001

augu

st 200

1

septem

brie 2

001

octom

brie 2

001

noiem

brie 2

001

decem

brie 2

001

ianua

rie 20

02

februa

rie 20

01

Lunile

Num

arul

de

exem

plar

e va

ndut

e(m

ii ex

empl

are)

b)

Fig. 2.16 - Cronogramă trasată prin a) linii; b) coloane

Page 27: cap2

CAPITOLUL 2

2.5.7. Diagrama polară În cazul în care seria cronologică prezintă variaţii sezoniere, pentru

reprezentarea grafică a evoluţiei unui fenomen putem folosi diagrama polară (radială), construită în sistemul de coordonate polare. Acest tip de diagramă se va prezenta mai pe larg în capitolul 6.

EXEMPLUL 2.16: Temperatura medie lunară a aerului la Bucureşti -

Filaret în anul 1996 se reprezintă grafic în fig. 2.17.

Temperatura medie lunara a aerului la Bucuresti-Filaret în anul 1996

-100

102030

Ian

Feb.

Mar.

Apr.

Mai

Iun.

Iul.

Aug.

Sept.

Oct.

Nov.

Dec.

Fig. 2.17 – Diagramă polară 2.5.8. Diagrama prin suprafeţe O serie teritorială se poate reprezenta grafic prin diagrame prin

coloane, benzi ori diagramă prin suprafeţe. În diagrama prin suprafeţe se construiesc, de obicei, pătrate sau cercuri, cu suprafeţele proporţionale cu valorile reprezentate.

În cazul fenomenelor complexe, care se descompun în produsul a

trei factori se poate folosi diagrama de volum trasată prin paralelipipedul dreptunghic. Cei trei factori se vor reprezenta pe lungimea, lăţimea şi înălţimea paralelipipedului, iar nivelul fenomenului complex prin volumul acestuia.

Page 28: cap2

STATISTICĂ ECONOMICĂ

EXEMPLUL 2.17: Populaţia globului pe continente în anul 1998 se prezintă astfel (mil. locuitori, Tabelul 2.12):

Tabelul 2.12 Continent Populaţie (mil. loc.) Africa 778 America de Nord 472 America de Sud 332 Asia 3590 Europa 729 Reprezentarea grafică este redată în fig. 2.18. Legendă:

Africa

America de Nord America de Sud Asia Europa

Fig. 2.18 - Diagramă de suprafaţă

2.5.9. Alte tipuri de reprezentări grafice Dacă aceste diagrame pot fi construite şi pentru alte serii statistice

(de exemplu: serii de distribuţii de frecvenţe homograde), o modalitate specifică de reprezentare grafică a seriilor teritoriale este cartograma sau cartodiagrama, în care pe o hartă se construiesc diagrame (în cazul cartodiagramei), se haşurează sau se colorează diferit unităţile teritoriale (în cazul cartogramei), în funcţie de nivelul înregistrat al variabilei.

Să notăm că există şi alte reprezentări grafice (diagrama Venn, diagrama Chernoff) a căror acurateţe în construcţie este facilitată de utilizarea pachetelor informatice specializate.

Page 29: cap2

CAPITOLUL 2

Întrebări recapitulative

1. Ce este sistematizarea datelor statistice? 2. Care sunt principiile după care se efectuează gruparea/clasificarea

datelor statistice? 3. Ce reprezintă clasificarea datelor statistice? 4. Cum se efectuează gruparea pe intervale de variaţie? 5. Definiţi conceptul de serie statistică. 6. Ce reprezintă frecvenţa relativă şi cum se calculează? 7. Arătaţi semnificaţia şi modul de obţinere a frecvenţelor cumulate,

absolute şi relative. Exemplificaţi. 8. Definiţi conceptele de serie heterogradă şi serie homogradă. 9. Seria statistică de distribuţie de frecvenţe bidimensională —

definiţie, formă de prezentare. 10. Ce reprezintă şi cum se construieşte tabelul de asociere? 11. Ce reprezintă seria cronologică? 12. Ce reprezintă seria teritorială? 13. Enumeraţi regulile de construire a tabelelor statistice. 14. Ce reprezintă graficul statistic? 15. Care sunt principalele reguli de construire a graficelor statistice? 16. Cum se reprezintă grafic o serie de distribuţii de frecvenţe? 17. Cum se construieşte ogiva? 18. Cum se reprezintă grafic o serie de distribuţii de frecvenţe pe

intervale neegale? 19. Cum se utilizează diagrama prin benzi şi diagrama prin coloane? 20. Cum se construieşte diagrama de structură? 21. Cum se utilizează diagrama prin suprafeţe? 22. Cum se construieşte corelograma? 23. Cum se reprezintă grafic seriile cronologice? 24. Cum se reprezintă grafic seriile teritoriale?