statistica.doc

47
UNIVERSITATEA „AL. I. CUZA” IAŞI FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR ŞCOALA POSTUNIVERSITARĂ „FIBAS” Analiza statistica a veniturilor functionarilor publici din Primaria Iasi COORDONATOR ŞTIINŢIFIC, PROF. UNIV. DR. ELISABETA JABA

description

statistica

Transcript of statistica.doc

Page 1: statistica.doc

UNIVERSITATEA „AL. I. CUZA” IAŞI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

ŞCOALA POSTUNIVERSITARĂ „FIBAS”

Analiza statistica

a veniturilor functionarilor

publici

din Primaria Iasi

COORDONATOR ŞTIINŢIFIC,

PROF. UNIV. DR. ELISABETA JABA

STUDENTĂ

Page 2: statistica.doc

COZMA MARIA STEFANIA (căs. NUNUT)

An I, Economie si Gestiune Financiar-Bancara

CUPRINS

1. INTRODUCERE......................................................................................................3

1.1 Definirea problemei.............................................................................................3

1.2 Obiectivul proiectului...........................................................................................4

2. CONSTRUIREA BAZEI DE DATE......................................................................4

2.1. Alegerea variabilelor analizate............................................................................4

2.2. Definirea variabilelor şi introducerea datelor în SPSS.......................................4

3. VERIFICAREA BAZEI DE DATE.......................................................................6

3.1 Depistarea outlieri-lor..........................................................................................6

3.2 Verificarea normalităţii distribuţiilor..................................................................7

4. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR..................................11

4.1 Descrierea statistică a variabilelor nominale.....................................................11

4.2 Descrierea statistică a variabielor numerice......................................................13

5. ANALIZA STATISTICĂ BIVARIATĂ A DATELOR.....................................17

5.1 Analiza statistică a gradului de asociere între două variabile.............................17

5.2 Analiza de regresie şi corelaţie...........................................................................18

5.3 Analiza dispersională (ANOVA)........................................................................22

6. ESTIMAREA ŞI TESTAREA STATISTICĂ......................................................25

6.1 ESTIMAREA PARAMETRILOR PRIN INTERVAL DE ÎNCREDERE..25

6.1.1 Estimarea prin interval de încredere a unei medii şi unei proporţii..25

6.1.2 Estimarea prin interval de încredere a diferenţei dintre două

medii şi două proporţii.......................................................................27

2

Page 3: statistica.doc

6.2 TESTAREA STATISTICĂ..............................................................................28

6.2.1 Testarea unei medii şi unei proporţii.................................................28

6.2.2 Testarea diferenţei dintre două medii şi două proporţii.....................30

7. CONCLUZII.............................................................................................................32

BIBLIOGRAFIE.............................................................................................................33

1. INTRODUCERE

1.1 Definirea problemei

Funcţionarii publici reprezintă acea categorie de angajaţi ce îşi desfăşoară activitatea în

instituţiile publice (Primărie. Prefectură, Administraţie publică, Trezorerie etc).

În cazul Primăriei Municipiului Iaşi, funcţionarii publici activează în diferite departamente

cum ar fi: cabinetul primarului, direcţia economică, direcţia juridică, direcţia pieţe, serviciul de

administrare urbană, investiţii, direcţia de dezvoltare urbană, serviciul ajutor social, starea civilă,

serviciul contabilitate, biroul control fiscal, audit public intern, departamentul informatizare.

Salariul tarifar (de bază) al funcţionarilor publici depinde de funcţia pe care o deţin în

interiorul unuia sau altuia dintre departamente.

Salariul brut este format din salariul tarifar, sporul de vechime, salariul de merit şi sporul de

conducere.

Lunar se pot acorda stimulente care au la bază încasările anilor precedenţi. Stimulentele sunt

influenţate de departament.

1.2 Obiectivul proiectului

În acest proiect am dorit să analizez influenţa nivelului de educaţie asupra salariului de bază,

să identific care este legătura între departamentul în care activează un funcţionar şi mărimea

stimulentelor primite, cum influenţează numărul de ani de vechime sporul de vechime acordat.

3

Page 4: statistica.doc

2. CONSTRUIREA BAZEI DE DATE

2.1 Alegerea variabilelor analizate

Pentru a analiza diferenţele în veniturilor cuvenite funcţionarilor publici şi factorii care

determină aceste diferenţe am considerat 30 de funcţionari din cadrul Primăriei Iaşi. Pentru fiecare

funcţionar am înregistrat departamentul în care activează, funcţia pe care o deţine, salariul tarifar,

vechimea, nivelul studiilor, nivelul salariului de merit, sporurile de conducere, stimulente.

2.2 Definirea variabilelor şi introducerea datelor în SPSS

Definirea variabilelor presupune precizarea atributelor variabilelor (numele, tipul, lungimea,

eticheta etc.) în coloanele foii Variable View din fereastra Data Editor.

Dintre variabilele considerate 3 sunt variabile nominale şi 6 sunt variabile numerice. Pentru a

utiliza în analiză variabilele Departamentul şi Nivelul de studii acestea au fost transformate în

variabile numerice prin atribuirea de coduri categoriilor acestor variabile.

Variabilele considerate au fost definite în SPSS astfel:

- functia – Funcţia deţinută în cadrul Primăriei, variabilă atributivă (String), lungimea 25

caractere, variabilă nominală;

- depart – Departamentul , variabilă atributivă transformată în variabilă numerică, având

următoarele valori:

0. cabinet primar

1. direcţia tehnică

2. direcţia economică

- salar – Salariul tarifar (de bază), variabilă numerică, de tip scală;

- vechime – Numărul de ani de vechime, variabilă numerică, de tip scală;

4

Page 5: statistica.doc

- studii – Nivelul de studii, variabilă atributivă transformată în variabilă numerică, tip ordinală,

având următoarele valori:

0. studii superioare

1. studii liceale

2. studii gimnaziale

- spor_vec – Sporul de vechime, variabilă numerică, de tip scală;

- sal_meri – Salariul de merit, variabilă numerică, de tip scală;

- spor_con – Sporuri de conducere, variabilă numerică, de tip scală;

- stimul – Stimulente, variabilă numerică, de tip scală;

- stim_dn – Stimulente – da/nu, variabilă dichotomică transformată în variabilă numerică,

având următoarele valori:

0. nu (nu primesc stimulente)

1. da (primesc stimulente)

- sal_m_dn – Salariul de merit – da/nu, variabilă dichotomică transformată în variabilă

numerică, având următoarele valori:

0. nu (nu primesc salariu de merit)

1. da (primesc salariu de merit)

- sal_brut Salariul brut, variabilă numerică obţinută cu ajutorul opţiunii Transform/ Compute

prin însumarea variabilelelor: Salariul tarifar (de bază), Sporul de vechime, Salariul de merit,

Sporuri de conducere.

Informaţii privind atributele unei variabile pot fi citite alegând opţiunea Utilities/Variables.

De exemplu, pentru variabila functia, putem vizualiza următoarele informaţii:

Datele au fost introduse în celulele foii Data View din fereastra Data Editor. În total sunt 30

de funcţionari din trei departamente din cadrul Primăriei Municipiului Iaşi. Pentru fiecare funcţionar

au fost înregistrate funcţia, salariul tarifar, vechimea, nivelul de studii etc.

5

Page 6: statistica.doc

3 VERIFICAREA BAZEI DE DATE

3.1 Depistarea outlieri-lor

Pentru a verifica dacă sunt outlier-i sau alte valori extreme putem utiliza diagrama Boxplot

creată prin opţiunea Analyze/ Descriptive Statistics/ Explore/ Plots.

Am obţinut următoarele diagrame Boxplot pentru variabilele de mai jos:

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

Salariul tarifar (de baza) 30 100.0% 0 .0% 30 100.0%

Numarul de ani vechime 30 100.0% 0 .0% 30 100.0%

Sporul de vechime 30 100.0% 0 .0% 30 100.0%

6

Page 7: statistica.doc

7

Page 8: statistica.doc

3.2 Verificarea normalităţii distribuţiilor

Condiţia de normalitate a variabilelor este cerută în procesul de inferenţă statistică.

Majoritatea testelor parametrice necesită îndeplinirea condiţiei de normalitate.

Pentru a verifica normalitatea unei distribuţii cu ajutorului programului SPSS putem folosi:

- histograma, boxplot, P-P plot, Q-Q plot;

- indicatorii din statistica descriptivă şi teste statistice.

Pentru variabilele salariul tarifar, sporul de vechime şi numărul de ani de vechime am obţinut

următoarele histograme:

8

Page 9: statistica.doc

Folosirea histogramei pentru a verifica dacă o distribuţie este normală presupune compararea

histogramei variabilei observate cu modelul curba Gauss. Histogramele obţinute prezintă un grad

mare de asimetrie, nu putem afirma că distribuţiile sunt normale.

Diagramele Q-Q plot arată, pentru variabila salariul tarifar, că punctele sunt deviate de la

linia dreaptă. Aceste deviaţii indică abateri de la normalitate.

9

Page 10: statistica.doc

Pentru a elimina outlier-ii şi valorile extreme prezentate de diagrama Boxplot, am exclus din

baza de date funcţionarii cu valori ridicate ale salariului tarifar. Pentru aceasta, am folosit opţiunea

Data/Select Cases şi am pus condiţia de selectare a acelor cazuri pentru care salariul tarifar este mai

mic de 1.000 lei. Astfel, dintre cele 30 de cazuri au fost selectate 25.

SPSS a creat astfel o nouă variabilă, cu numele implicit de filter_$ şi având eticheta salariu <

1000 (FILTER).

Histogramele obţinute pentru cele trei variabile, după eliminarea oultie-ilor, prezentate mai

jos, arată o reducere a asimetriei, mai ales pentru variabila salariul tarifar.

10

Page 11: statistica.doc

Diagramele Q-Q plot, după eliminarea outlier-ilor, arată o dispunere a punctelor de-a lungul

liniei drepte.

11

Page 12: statistica.doc

4. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR

4.1 Descrierea statistică a variabilelor nominale

Pentru analiza variabilelor nominale am utilizat opţiunea Analyze/ Descriptive Statistics/

Frequencies.

Pentru fiecare dintre variabilele analizate şi anume, departamentul şi nivelul de studii, am

obţinut tabele de frecvenţă şi graficele Pie.

Pentru variabilele nominale se poate calcula proporţia şi modul iar pentru variabilele ordinale

se poate calcula şi mediana.

Departamentul

8 26.7 26.7 26.7

14 46.7 46.7 73.3

8 26.7 26.7 100.0

30 100.0 100.0

cabinet primar

directia tehnica

directia economica

Total

ValidFrequency Percent Valid Percent

CumulativePercent

12

Page 13: statistica.doc

Departamentul

26.7%

46.7%

26.7%

directia economica

directia tehnica

cabinet primar

Cei 30 de funcţionari sunt repartizaţi pe departamente astfel: 8 funcţionari lucrează în

Cabinetul primarului, 14 funcţionari lucrează în cadrul Direcţiei tehnice, 8 funcţionari lucrează în

cadrul Direcţiei economice.

Repartizarea funcţionarilor pe departamente poate fi vizualizată în graficul de mai sus:

- 46,7% (cea mai mare proporţie) funcţionarii din Direcţia tehnică;

- 26,7% funcţionarii din Cabinetul primarului;

- 26,7% funcţionarii din Direcţia economică.

Din tabelul de frecvenţă de mai jos, observăm că majoritatea funcţionarilor au studii

superioare. Doar 6 funcţionari au studii medii şi 5 funcţionari au studii gimnaziale.

Graficul Pie de mai jos arată că cea mai mare pondere o au funcţionarii cu studii superioare

(63,3%). Categoria funcţionarilor cu studii medii reprezintă 20% iar funcţionarii cu studii gimnaziale

reprezintă 16,7%.

Nivelul de studii

19 63.3 63.3 63.3

6 20.0 20.0 83.3

5 16.7 16.7 100.0

30 100.0 100.0

superioare

medii

gimnaziale

Total

ValidFrequency Percent Valid Percent

CumulativePercent

13

Page 14: statistica.doc

Nivelul de studii

16.7%

20.0%

63.3%

gimnaziale

medii

superioare

Statistics

30 30

0 0

2.00 1.00

2 1

Valid

Missing

N

Median

Mode

DepartamentNivelul de

studii

4.2 Descrierea statistică a variabielor numerice

Variabilele salariul tarifar, numărul de ani de vechime şi sporul de vechime sunt

variabile numerice. Pentru analiza lor am folosit opţiunea Analyze/ Descriptive Statistics/

Frequencies şi Analyze/ Descriptive Statistics/ Descriptives…

Pentru o variabilă numerică se pot calcula indicatorii tendinţei centrale (media, mediana,

modul), indicatorii dispersiei (amplitudinea, varianţa, abaterea medie pătratică) şi indicatorii

formei (coeficientul de asimetrie şi coeficientul de boltire ).

Rezultatele obţinute pentru distribuţiile fără outlier-i sunt prezentate în tabelele de mai jos.

Un funcţionar obţine un salariul mediu tarifar lunar de 739,96 lei, are în medie 11,52 ani

vechime şi primeşte, lunar, un spor mediu de vechime de 102,84 lei.

Jumătate dintre funcţionari (50%) obţin un salariu tarifar lunar mai mic de 751 lei, au până la

7 ani vechime şi primesc un spor de vechime până la 67 leiAbaterea medie pătratică arată cu cât se

abate în medie salariul tarifar lunar obţinut de o persoană faţă de salariul mediu tarifar.

14

Page 15: statistica.doc

Abaterea medie pătratică pentru variabila salariul tarifar este 151,050 lei, adică aproximativ

68% dintre funcţionari obţin un salariu tarifar lunar cuprins într-un interval egal cu salariu mediu

tarifar plus/minus valoarea abaterii medii pătratice: 739,96 ± 151,050 lei = (588.91 ; 891.01) lei.

Abaterea medie pătratică pentru variabila numărul de ani de vechime este 9,22 ani, adică

aproximativ 68% dintre funcţionari au vechimea cuprinsă într-un interval egal cu numărul mediu de

ani de vechime plus/minus valoarea abaterii medii pătratice: 11,52 ± 9,22 ani = (3.3; 20,74) ani.

Abaterea medie pătratică pentru variabila sporul de vechime este 89,724 lei, adică

aproximativ 68% dintre funcţionari obţin un spor de vechime lunar cuprins într-un interval egal cu

sporul mediu de vechime plus/minus valoarea abaterii medii pătratice:102,84 ± 89,724 lei = (13,12;

192,56) lei.

Eroarea standard a mediei (eroarea medie de reprezentativitate) este folosită pentru estimarea,

prin interval de încredere a mediei populaţiei.

Pentru variabila salariul tarifar coeficientul de asimetrie (skewness) are valoarea (β1=-

0,027).

Coeficientul de boltire (kurtosis) măsoară răspândirea fiecărei observaţii în jurul unei valori centrale. Pentru

toate cele trei variabile analizate, coeficientul de boltire este mai mic ca 0, indicând o grupare mai slabă în jurul valorii

centrale, deci distribuţiile sunt platicurtice.

Statistics

Salariul tarifar

(de baza)

Numarul de ani

vechime

Sporul de

vechime

N 25 25 25

Mean 739.96 11.52 102.84

Std. Error of Mean 30.210 1.844 17.945

Median 751.00 7.00 67.00

Std. Deviation 151.050 9.220 89.724

Variance 22816.123 85.010 8050.307

Skewness -.027 1.141 1.047

Std. Error of Skewness .464 .464 .464

Kurtosis -1.442 -.132 .813

Std. Error of Kurtosis .902 .902 .902

Range 448 30 351

Minimum 506 2 0

Maximum 954 32 351

Sum 18499 288 2571

15

Page 16: statistica.doc

Descriptives

Statistic Std. Error

Salariul tarifar (de baza) Mean 739.96 30.210

95% Confidence Interval for

Mean

Lower Bound 677.61

Upper Bound 802.31

5% Trimmed Mean 741.04

Median 751.00

Variance 2.282E4

Std. Deviation 151.050

Minimum 506

Maximum 954

Range 448

Interquartile Range 300

Skewness -.027 .464

Kurtosis -1.442 .902

Numarul de ani vechime Mean 11.52 1.844

95% Confidence Interval for

Mean

Lower Bound 7.71

Upper Bound 15.33

5% Trimmed Mean 10.94

Median 7.00

Variance 85.010

Std. Deviation 9.220

Minimum 2

Maximum 32

Range 30

Interquartile Range 12

Skewness 1.141 .464

Kurtosis -.132 .902

Sporul de vechime Mean 102.84 17.945

95% Confidence Interval for

Mean

Lower Bound 65.80

Upper Bound 139.88

16

Page 17: statistica.doc

5% Trimmed Mean 96.06

Median 67.00

Variance 8.050E3

Std. Deviation 89.724

Minimum 0

Maximum 351

Range 351

Interquartile Range 130

Skewness 1.047 .464

Kurtosis .813 .902

Pentru reprezentarea grafică a celor trei variabile numerice am folosit histograma şi curba

frecvenţelor.

Observăm alungirea spre dreapta a curbelor de frecvenţă ceea ce arată asimetrie pozitivă. Cea

mai accentuată asimetrie prezintă distribuţia funcţionarilor după sporul de vechime obţinut.

De asemenea, curbele de frecvenţă sunt aplatizate, mai ales pentru variabila salariul tarifar.

17

Page 18: statistica.doc

5 ANALIZA STATISTICĂ BIVARIATĂ A DATELOR

5.1 Analiza statistică a gradului de asociere între două variabile

Pentru o distribuţie bivariată cu ambele variabile nominale putem obţine:

- tabelele de asociere şi frecvenţele condiţionate;

- analiza diferenţelor calitative prin calculul şi interpretarea lui hi-pătrat.

Pentru analiza gradului de asociere dintre variabilele departamentul şi stimulente – da/nu

am folosit opţiunea Analyze/ Descriptive Statistics/ Crosstabs.

În tabelul rezumat al procedeului sunt precizate variabilele analizate:

Case Processing Summary

25 100.0% 0 .0% 25 100.0%Departamentul *Stimulente - da/nu

N Percent N Percent N Percent

Valid Missing Total

Cases

Tabelul de asociere de mai jos prezintă frecvenţele absolute condiţionate. Cei 5 funcţionari

din cabinetul primarului, nici un funcţionar nu primeşte stimulente. Din cei 13 funcţionari din cadrul

direcţiei tehnice, nici un funcţionar nu primeşte stimulente.

Departamentul * Stimulente da/nu Crosstabulation

Count

Stimulente da/nu

Total

nu (nu primesc

stimulente)

da (primesc

stimulente)

Departamentul cabinet primar 5 0 5

directia tehnica 13 0 13

directia economica 3 4 7

Total 21 4 25

18

Page 19: statistica.doc

Pentru a verifica legătura dintre cele două variabile se foloseşte testul hi-pătrat. În tabelul de

mai jos s-a obţinut valoarea testului hi-pătrat egală cu 12,245 pentru 2 grade de libertate. Valoarea

Sig. (egală cu 0,002) asociată cu statistica hi-pătrat este mică (< 0.05), fapt de ne permite să afirmăm

că există legătură semnificativă între variabila departamentul şi stimulente – da/nu.

Chi-Square Tests

Value df

Asymp. Sig. (2-

sided)

Pearson Chi-Square 12.245a 2 .002

Likelihood Ratio 12.423 2 .002

Linear-by-Linear Association 8.170 1 .004

N of Valid Cases 25

a. 4 cells (66.7%) have expected count less than 5. The minimum

expected count is .80.

5.2 Analiza de corelaţie şi regresie

A) Analiza de corelaţie

Pentru a determina gradul de intensitate a legăturii dintre variabilele numerice salariul

tarifar, numărul de ani de vechime şi sporul de vechime folosim indicatorii intensităţii corelaţiei

obţinuţi în analiza de corelaţie.

În programul SPSS am folosit opţiunea Analyze/ Correlate/ Bivariate…

În output sunt prezentate statisticile pentru fiecare variabilă. În tabelul Descriptive Statistics

sunt calculate media şi abaterea medie pătratică.

Descriptive Statistics

Mean Std. Deviation N

Salariul tarifar (de baza) 739.96 151.050 25

Numarul de ani vechime 11.52 9.220 25

Sporul de vechime 102.84 89.724 25

19

Page 20: statistica.doc

Tabelul Correlations este un tabel cu matricea coeficienţilor de corelaţie. De o parte şi de alta

a diagonalei tabelului sunt prezentate valorile coeficienţilor de corelaţie Pearson dintre variabile luate

două câte două.

Correlations

Salariul tarifar

(de baza)

Numarul de ani

vechime

Sporul de

vechime

Salariul tarifar (de baza) Pearson Correlation 1 .469* .590**

Sig. (2-tailed) .018 .002

N 25 25 25

Numarul de ani vechime Pearson Correlation .469* 1 .935**

Sig. (2-tailed) .018 .000

N 25 25 25

Sporul de vechime Pearson Correlation .590** .935** 1

Sig. (2-tailed) .002 .000

N 25 25 25

*. Correlation is significant at the 0.05 level (2-tailed).

**. Correlation is significant at the 0.01 level (2-tailed).

Pentru variabilele salariul tarifar şi numărul de ani de vechime s-a obţinut un coeficient de

corelaţie Pearson egal cu 0,469 ceea ce sugerează că între variabile există o corelaţie directă dar nu

foarte puternică.

Pentru variabilele salariul tarifar şi sporul de vechime s-a obţinut un coeficient de corelaţie

Pearson egal cu 0,590 ceea ce sugerează că între variabile există o corelaţie directă.

Pentru variabilele numărul de ani de vechime şi sporul de vechime s-a obţinut un

coeficient de corelaţie Pearson egal cu 0,935 ceea ce sugerează că între variabile există o corelaţie

directă şi foarte puternică, valoarea coeficientului fiind aproape de valoarea unu.

Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testului t. Valoarea

Sig. corespunzătoare este mai mică decât 0,05 pentru toate corelaţiile, evidenţiind obţinerea unui

coeficient de corelaţie semnificativ.

20

Page 21: statistica.doc

B) Analiza de regresie

Analiza de regresie este folosită pentru:

- estimarea valorilor unei variabile considerând valorile unei alte variabile;

- evaluarea măsurii în care variabila dependentă poate fi explicată prin variabila independentă.

Pentru a stabili şi analiza modelul de regresie dintre variabilele numărul de ani de vechime

şi sporul de vechime am ales opţiunea Analyze/ Regression/ Linear…

Variabilele introduse în model sunt prezentate în tabelul de mai jos:

- variabila independentă: numărul de ani de vechime;

- variabila dependentă: sporul de vechime.

Variables Entered/Removedb

Numarulde ani devechime

a . Enter

Model1

VariablesEntered

VariablesRemoved Method

All requested variables entered.a.

Dependent Variable: Sporul de vechimeb.

Tabelul Model Summary prezintă valoarea coeficientului de corelaţie (R), valoarea raportului

de determinaţie (R2), valoarea ajustată a lui R şi eroarea standard a estimaţiei.

Valoarea coeficientului de corelaţie este egală cu 0,935, ceea ce indică o legătură liniară

directă şi foarte puternică între cele două variabile analizate.

R2 = 0,874 arată că variaţia variabilei dependente este explicată în proporţie de 87,4% prin

modelul de regresie.

Model Summary

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate

1 .935a .874 .868 32.548

a. Predictors: (Constant), Numarul de ani vechime

Tabelul Regression ANOVA prezintă rezultatele analizei varianţei variabilei dependente sub

influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii asupra sumei pătratelor

abaterilor variabilei dependente, datorate modelului de regresie şi factorului reziduu, gradele de

libertate, estimaţiile varianţelor datorate celor două surse de variaţie, raportul F şi Sig.

21

Page 22: statistica.doc

Testul F obţinut este egal cu 159,375, iar valoarea Sig. corespunzătoare statisticii Fisher este

mică (< 0.05) deci relaţia dintre cele două variabile considerate este semnificativă.

ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 168841.200 1 168841.200 159.375 .000a

Residual 24366.160 23 1059.398

Total 193207.360 24

a. Predictors: (Constant), Numarul de ani vechime

b. Dependent Variable: Sporul de vechime

Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie estimat,

eorile standard, valorile statisticii test şi valorile Sig. corespunzătoare.

Considerăm că între cele două variabile există o legătură liniară, modelul de regresie având

următoarea formă:

- la nivelul populaţiei;

- la nivelul eşantionului;

unde,

- X – variabila dependentă, aleatoare;

- Y – variabila independentă, non-aleatoare;

- e – variabila aleatoare eroare sau reziduu ;

- a – ordonata la origine (arată valoarea variabilei Y când X este egal cu 0);

- b – panta dreptei, numit şi coeficient de regresie;

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig.B Std. Error Beta

1 (Constant) -1.958 10.549 -.186 .854

Numarul de ani vechime 9.097 .721 .935 12.624 .000

a. Dependent Variable: Sporul de vechime

22

Page 23: statistica.doc

Din tabelul de mai sus, obţinem valorile estimaţiilor parametrilor de regresie şi anume

valorile lui a şi b.

Astfel, a = -1,958 iar b = 9,097.

Valoarea pozitivă a coeficientului de regresie b indică o legătură directă între cele două

variabile analizate.

Dacă b = 9,097, atunci la o creştere cu o unitate (un an) a numărului de ani de vechime,

sporul de vechime creşte, în medie, cu ,097 lei.

Modelul de regresie al legăturii dintre numărul de ani de vechime şi sporul de vechime

poate fi scris:

Y = -1,958 + 9,097*X

Testarea semnificaţiei parametrilor de regresie se face cu ajutorul testului t, pentru a afla care

este probabilitatea ca fiecare parametru să fie nul:

H0: β = 0

Valoarea Sig. = 0,000 arată că pentru un risc parametrul este semnificativ statistic.

Deci β (panta dreptei de regresie) corespunde unei legături semnificative între cele două variabile.

5.3 Analiza dispersională (ANOVA)

ANOVA (Analysis of Variance) este un procedeu de analiză a varianţei unei variabile

numerice (salariul tarifar) sub influenţa unei variabile de grupare (nivelul de studii).

Prin acest procedeu se compară mediile a trei subpopulaţii definite de variabila de grupare

(variabila independentă). Demersul în SPSS este: Analyze/ Compare Means/ One-Way ANOVA.

Pentru fiecare categorie de funcţionari (cu studii superioare, medii gimnaziale), s-a calculat salariul mediu tarifar, abaterea medie pătratică, eroarea standard, intervalul de încredere al mediei, valorile minimă şi maximă.

23

Page 24: statistica.doc

Descriptives

Salariul tarifar (de baza)

N Mean Std. Deviation Std. Error

95% Confidence Interval for

Mean

Minimum MaximumLower Bound Upper Bound

studii superioare 14 855.43 81.703 21.836 808.25 902.60 708 954

studii liceale 6 638.83 33.493 13.673 603.68 673.98 605 672

studii gimnaziale 5 538.00 28.452 12.724 502.67 573.33 506 578

Total 25 739.96 151.050 30.210 677.61 802.31 506 954

Salariul mediu tarifar obţinut de funcţionarii cu studii superioare este de 855,43 lei, salariul

mediu tarifar obţinut de funcţionarii cu studii medii este de 638,83 lei, salariul mediu tarifar obţinut

de funcţionarii cu studii gimnaziale este de 538 lei.

Ipoteza nulă, ipoteza de testat prin acest procedeu, presupune egalitatea a trei sau mai multe

medii:

H0: μ1 = μ2 = μ3 unde μi este media grupei i

Interpretarea rezultatelor ANOVA vizează două teste:

- testul de omogenitate a varianţelor. Acest test determină care test este adecvat comparării

mediilor;

- testul ANOVA. Acest test verifică dacă cel puţin două medii diferă între ele.

Testul Levene – Testul omogenităţii varianţelor verifică dacă varianţele grupelor sunt egale.

Valoarea Sig. pentru acest test este egală cu 0,001, este mai mică decât 0,05 ceea ce sugerează că

varianţele celor trei grupe nu sunt egale. Este încălcată, astfel, restricţia de homoscedasticitate.

24

Page 25: statistica.doc

Test of Homogeneity of Variances

Salariul tarifar (de baza)

Levene Statistic df1 df2 Sig.

9.998 2 22 .001

În tabelul ANOVA sunt prezentate: statistica test Fisher, valoarea Sig. şi elemente de calcul

pentru statistica F.

ANOVA

Salariul tarifar (de baza)

Sum of Squares df Mean Square F Sig.

Between Groups 451960.698 2 225980.349 51.990 .000

Within Groups 95626.262 22 4346.648

Total 547586.960 24

Raportul Fisher se calculează ca raport între estimatorul varianţei explicate şi estimatorul

varianţei reziduale:

unde:

SE2 - estimatorul varianţei intergrupe;

SR2 - estimatorul varianţei intragrupe (din interiorul grupelor).

Valoarea calculată a raportului Fisher este mare (51,99), cu o probabilitate asociată Sig.

(0,000) mai mică decât 0,05. Acest lucru evidenţiază faptul că ipoteza de egalitate a mediilor pe

grupe de respinge (respingem H0) deci nivelul studiilor influenţează semnificativ nivelul salariului

tarifar lunar.

Din graficul mediilor se observă diferenţe între salariul mediu tarifar obţinut de funcţionarii

cu studii superioare, medii şi respectiv gimnaziale.

25

Page 26: statistica.doc

26

Page 27: statistica.doc

6 ESTIMAREA ŞI TESTAREA STATISTICĂ

6.1 Estimarea parametrilor prin interval de încredere

Estimarea prin interval de încredere presupune aflarea limitelor de încredere ale unui interval

care acoperă valoarea adevărată a unui parametru al populaţiei Estimarea prin interval de încredere

ţine seama de fluctuaţiile distribuţiei de selecţie a estimatorului parametrului considerat.

Parametrii sunt estimaţi pe baza valorilor tipice de sondaj, rezultate din prelucrarea datelor

unui eşantion.

6.1.1 Estimarea prin interval de încredere a unei medii şi unei proporţii

Dorim să estimăm prin interval de încredere salariul mediu tarifar obţinut de toţi funcţionarii

din cadrul Primăriei Municipiului Iaşi vom folosi estimarea prin I.C: a mediei.

Intervalul de încredere pentru parametrul μ (media populaţiei) pleacă de la o ipoteză a

distribuţiei mediilor de selecţie.

La nivelul unui eşantion, intervalul este:

când se cunoaşte σ

respectiv

când nu se cunoaşte σ

Pentru a obţine intervalul de încredere în SPSS alegem opţiunea Analzye/ Descriptive

Statistics/ Explore şi precizăm în caseta Confidence Intterval for Mean nivelul de încredere dorit

(95%).

Pentru a calcula intervalul de încredere al proporţiei funcţionarilor cu studii superioare în

populaţia funcţionarilor folosind SPSS presupune efectuarea unui set de operaţii:

Calculul proporţiei la nivelul eşantionului observat

Cu ajutorul opţiunii Frequencies aflăm o proporţie a funcţionarilor cu studii superioare de

63,3%.

27

Page 28: statistica.doc

Nivelul de studii

Frequency Percent Valid Percent

Cumulative

Percent

Valid studii superioare 19 63.3 63.3 63.3

studii liceale 6 20.0 20.0 83.3

studii gimnaziale 5 16.7 16.7 100.0

Total 30 100.0 100.0

Calculul erorii Sp (eroarea standard după relaţia )

Pentru f = 63,3%, n = 30 aflăm

Calculul limitelor I.C.

Considerând un scor z = 1,96, obţinem:

Interpretare

Ne putem aştepta, cu o încredere de 95%, ca proporţia funcţionarilor cu studii superioare în

totalul funcţionarilor să fie cuprinsă între 45,66% şi 80,94%.

6.1.2 Estimarea prin interval de încredere a diferenţei dintre două medii şi

două proporţii

Estimarea prin interval de încredere a diferenţei dintre salariul mediu obţinut de funcţionarii

cu studii superioare şi funcţionarii cu studii medii presupune calculul I.C. după formula:

În SPSS, intervalul de încredere a diferenţei dintre două medii (μ1 – μ2) poate fi obţinut în

tabelul Independent Samples Test.

28

Page 29: statistica.doc

Independent Samples Test

Levene's Test for

Equality of

Variances t-test for Equality of Means

F Sig. t df Sig. (2-tailed)

Mean

Difference

Std. Error

Difference

95% Confidence Interval

of the Difference

Lower Upper

Salariul tarifar

(de baza)

Equal variances

assumed2.663 .116 4.063 23 .000 292.061 71.886 143.353 440.769

Equal variances

not assumed6.971 21.450 .000 292.061 41.896 205.044 379.078

Cu o încredere de 95%, ne putem aştepta ca diferenţa dintre salariul mediu tarifar al

funcţionarilor cu studii superioare şi salariul mediu tarifar al funcţionarilor cu studii medii este

cuprinsă între (205,044 lei; 379,078 lei).

6.2 Testarea statistică

6.2.1 Testarea unei medii şi unei proporţii

Testele asupra mediilor, respectiv proporţiilor sunt folosite pentru a verifica dacă o medie sau

proporţie diferă semnificativ de o valoare specificată.

A) Testarea unei medii

Dorim să testăm dacă salariul mediu tarifar obţinut lunar de funcţionarii Primăriei diferă

semnificativ de valoarea de 700 lei.

Pentru a testa egalitatea unei medii cu o valoare specificată folosim opţiunea Analyze/

Compare Means/ One-Sample T Test…

Output-urile , One-Sample Statistics şi One-Sample T Test pentru variabila salariul tarifar

prezintă valoarea medie observată egală cu 739,96 lei, valoarea specificată egală cu 700 lei, diferenţa

dintre valoarea observată şi valoarea ipotetică de 39,96 lei.

29

Page 30: statistica.doc

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

Salariul tarifar (de baza) 25 739.96 151.050 30.210

One-Sample Test

Test Value = 700

t df Sig. (2-tailed) Mean Difference

95% Confidence Interval of the

Difference

Lower Upper

Salariul tarifar (de baza) 1.323 24 .198 39.960 -22.39 102.31

Ipoteza de egalitate a mediilor pentru a verifica dacă sunt diferenţe semnificative între

populaţiile din care s-au extras eşantioanele observate este:

H0: μ = μ0 (μ = 700 lei)

Testul ales pentru verificarea egalităţii dintre μ şi valoarea de 700 lei este:

Valoarea calculată a testului este egală cu 1,323. Valoarea Sig. asociată testului este mai mare

decât valoarea de 0,05, ceea ce arată că se acceptă ipoteza H0, ipoteza de egalitate a mediilor. Deci,

nu există diferenţă semnificativă între valoarea medie observată şi cea specificată (700 lei).

Intervalul de încredere pentru diferenţa dintre cele două valori conţine pe zero, deci diferenţa

nu este semnificativă.

30

Page 31: statistica.doc

B) Testarea unei proporţii

Dorim să verificăm dacă proporţia funcţionarilor cu studii superioare diferă semnificativ de

50%.

Folosim în SPSS opţiunea Analyze/ Nonparametric Tests/ Binomial…

Acest procedeu testează ipoteze cu privire la o variabilă care poate lua doar două valori.

Deoarece variabila nivelul de studii are trei categorii (studii superioare, medii şi gimnaziale) am

folosit opţiunea Cut Point şi am definit două grupe:

- Grup 1 – nivel de studii <= 1 (studii superioare);

- Grup 2 – nivel de studii > 1 (studii medii şi gimnaziale).

Am ales proporţia de testare (Test Proportion ) egală cu 0,50.

Descriptive Statistics

25 1.64 .81 1 3 1.00 1.00 2.00Nivelul de studiiN Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th

Percentiles

Binomial Test

<= 1 14 .56 .50 .690

> 1 11 .44

25 1.00

Group 1

Group 2

Total

Nivelul de studiiCategory N

ObservedProp. Test Prop.

Exact Sig.(2-tailed)

Din tabelul Binomial Test citim că proporţia observată din eşantion pentru grupa

funcţionarilor cu studii superioare este de 56%, proporţia specificată este 50%. Valoarea Sig.

asociată testului (0,690) este mai mare decât 0,05. Putem afirma, cu o încredere de 95%, că proporţia

funcţionarilor cu studii superioare nu diferă semnificativ de proporţia specificată de 50%.

6.2.2 Testarea diferenţei dintre două medii şi două proporţii

A) Testarea diferenţei dintre două medii

Pentru a testa dacă salariul mediu tarifar al funcţionarilor cu studii superioare diferă

semnificativ de salariul mediu tarifar al persoanelor cu studii medii folosim opţiunea Analyze/

Compare Means/ Independent-Samples T Test.

Ipoteza de egalitate a mediilor celor două grupe este:

H0: μ1 = μ2

31

Page 32: statistica.doc

La nivelul celor 25 de funcţionari observaţi, salariul mediu tarifar obţinut lunar de

funcţionarii cu studii superioare (14 funcţionari) este 6855,43 lei iar salariul mediu tarifar obţinut

lunar de cei 6 funcţionari cu studii medii este 638,83 lei.

Group Statistics

Nivelul de studii N Mean Std. Deviation Std. Error Mean

Salariul tarifar (de baza) studii superioare 14 855.43 81.703 21.836

studii liceale 6 638.83 33.493 13.673

Calculul statisticii test pentru compararea mediilor a două populaţii cere să se verifice dacă

deviaţiile standard la nivelul celor două grupe sunt semnificativ diferite . Se foloseşte testul Levene

de egalitate a varianţelor.

Independent Samples Test

Levene's Test for

Equality of

Variances t-test for Equality of Means

F Sig. t df Sig. (2-tailed)

Mean

Difference

Std. Error

Difference

95% Confidence Interval

of the Difference

Lower Upper

Salariul tarifar

(de baza)

Equal variances

assumed2.663 .116 4.063 23 .000 292.061 71.886 143.353 440.769

Equal variances

not assumed6.971 21.450 .000 292.061 41.896 205.044 379.078

B) Testarea diferenţei dintre două proporţii

Pentru a verifica dacă distribuţia de frecvenţă variabilei nivelul de studii (variabilă care are

trei categorii: superioare, medii şi gimnaziale) corespunde cu distribuţia teoretică a frecvenţelor

relative folosim testul hi-pătrat.

Am folosit opţiunea Analyze/ Nonparametric Tests/ Chi-Square Test…

32

Page 33: statistica.doc

Nivelul de studii

14 8.3 5.7

6 8.3 -2.3

5 8.3 -3.3

25

superioare

medii

gimnaziale

Total

Observed N Expected N Residual

În tabelul frecvenţelor, sunt comparate frecvenţele observate (Observed N) cu frecvenţele

teoretice (Expected N). Din cei 25 de funcţionari, 14 funcţionari au studii superioare, 6 funcţionari au

studii medii şi 5 funcţionari au studii gimnaziale.

Ipoteza de nul presupune că toate categoriile au proporţii egale (25/3). Conform acesteia

pentru fiecare categorie ar trebui să fie câte 8 funcţionari.

Test Statistics

5.840

2

.054

Chi-Square a

df

Asymp. Sig.

Nivelul destudii

0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 8.3.

a.

Valoarea testului hi-pătrat este 5,840. Valoarea Asymp. Sig. este mai mare decât 0,05 deci se

acceptă ipoteza de nul.

33

Page 34: statistica.doc

7 CONCLUZII

Funcţionarii publici din Primăria municipiului Iaşi incluşi în analiză sunt repartizaţi pe trei

mari departamente şi anume:

- 46,7% (cea mai mare proporţie) funcţionarii din Direcţia tehnică;

- 26,7% funcţionarii din Cabinetul primarului;

- 26,7% funcţionarii din Direcţia economică.

Majoritatea funcţionarilor au studii superioare (63,3%). Categoria funcţionarilor cu studii

medii reprezintă 20% iar funcţionarii cu studii gimnaziale reprezintă 16,7%.

În urma analizei univariate asupra variabilelor cantitative, putem concluziona că un

funcţionar din Primăria Iaşi obţine un salariul mediu tarifar lunar de 739.96 lei, are în medie 11.52

ani vechime şi primeşte, lunar, un spor mediu de vechime de 102.84 lei.

Analiza de asociere a permis testarea legăturii dintre departamente şi acordarea de stimulente.

Din cei 25 de funcţionari, nici un funcţionar din cabinetul primarului sau din cadrul direcţiei tehnice

nu primeşte stimulente.

Între variabilele numărul de ani de vechime şi sporul de vechime există o corelaţie directă şi

foarte puternică. Modelul legăturii dintre cele două variabile a fost estimat cu ajutorul analizei de

regresie.

ANOVA a permis testarea influenţei variabilei de grupare (nivelul de studii) asupra unei

variabile numerice (salariul tarifar). Salariul mediu tarifar obţinut de funcţionarii cu studii superioare

este de 855,43 lei, salariul mediu tarifar obţinut de funcţionarii cu studii medii este de 638,83 lei,

salariul mediu tarifar obţinut de funcţionarii cu studii gimnaziale este de 538 lei. Deci, salariile medii

tarifare diferă între grupele de funcţionari cu studii superioare, medii şi gimnaziale.

34

Page 35: statistica.doc

BIBLIOGRAFIE

1. Jaba, E., Statistica, ediţia a III-a, Editura Economică, Bucureşti, 2002;

2. Jaba, E., Grama, A., Analiza statistică cu SPSS sub Windows, Editura Polirom, Iaşi, 2004.

35