statistica.doc
-
Upload
cmariastefania1467 -
Category
Documents
-
view
23 -
download
2
description
Transcript of statistica.doc
UNIVERSITATEA „AL. I. CUZA” IAŞI
FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR
ŞCOALA POSTUNIVERSITARĂ „FIBAS”
Analiza statistica
a veniturilor functionarilor
publici
din Primaria Iasi
COORDONATOR ŞTIINŢIFIC,
PROF. UNIV. DR. ELISABETA JABA
STUDENTĂ
COZMA MARIA STEFANIA (căs. NUNUT)
An I, Economie si Gestiune Financiar-Bancara
CUPRINS
1. INTRODUCERE......................................................................................................3
1.1 Definirea problemei.............................................................................................3
1.2 Obiectivul proiectului...........................................................................................4
2. CONSTRUIREA BAZEI DE DATE......................................................................4
2.1. Alegerea variabilelor analizate............................................................................4
2.2. Definirea variabilelor şi introducerea datelor în SPSS.......................................4
3. VERIFICAREA BAZEI DE DATE.......................................................................6
3.1 Depistarea outlieri-lor..........................................................................................6
3.2 Verificarea normalităţii distribuţiilor..................................................................7
4. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR..................................11
4.1 Descrierea statistică a variabilelor nominale.....................................................11
4.2 Descrierea statistică a variabielor numerice......................................................13
5. ANALIZA STATISTICĂ BIVARIATĂ A DATELOR.....................................17
5.1 Analiza statistică a gradului de asociere între două variabile.............................17
5.2 Analiza de regresie şi corelaţie...........................................................................18
5.3 Analiza dispersională (ANOVA)........................................................................22
6. ESTIMAREA ŞI TESTAREA STATISTICĂ......................................................25
6.1 ESTIMAREA PARAMETRILOR PRIN INTERVAL DE ÎNCREDERE..25
6.1.1 Estimarea prin interval de încredere a unei medii şi unei proporţii..25
6.1.2 Estimarea prin interval de încredere a diferenţei dintre două
medii şi două proporţii.......................................................................27
2
6.2 TESTAREA STATISTICĂ..............................................................................28
6.2.1 Testarea unei medii şi unei proporţii.................................................28
6.2.2 Testarea diferenţei dintre două medii şi două proporţii.....................30
7. CONCLUZII.............................................................................................................32
BIBLIOGRAFIE.............................................................................................................33
1. INTRODUCERE
1.1 Definirea problemei
Funcţionarii publici reprezintă acea categorie de angajaţi ce îşi desfăşoară activitatea în
instituţiile publice (Primărie. Prefectură, Administraţie publică, Trezorerie etc).
În cazul Primăriei Municipiului Iaşi, funcţionarii publici activează în diferite departamente
cum ar fi: cabinetul primarului, direcţia economică, direcţia juridică, direcţia pieţe, serviciul de
administrare urbană, investiţii, direcţia de dezvoltare urbană, serviciul ajutor social, starea civilă,
serviciul contabilitate, biroul control fiscal, audit public intern, departamentul informatizare.
Salariul tarifar (de bază) al funcţionarilor publici depinde de funcţia pe care o deţin în
interiorul unuia sau altuia dintre departamente.
Salariul brut este format din salariul tarifar, sporul de vechime, salariul de merit şi sporul de
conducere.
Lunar se pot acorda stimulente care au la bază încasările anilor precedenţi. Stimulentele sunt
influenţate de departament.
1.2 Obiectivul proiectului
În acest proiect am dorit să analizez influenţa nivelului de educaţie asupra salariului de bază,
să identific care este legătura între departamentul în care activează un funcţionar şi mărimea
stimulentelor primite, cum influenţează numărul de ani de vechime sporul de vechime acordat.
3
2. CONSTRUIREA BAZEI DE DATE
2.1 Alegerea variabilelor analizate
Pentru a analiza diferenţele în veniturilor cuvenite funcţionarilor publici şi factorii care
determină aceste diferenţe am considerat 30 de funcţionari din cadrul Primăriei Iaşi. Pentru fiecare
funcţionar am înregistrat departamentul în care activează, funcţia pe care o deţine, salariul tarifar,
vechimea, nivelul studiilor, nivelul salariului de merit, sporurile de conducere, stimulente.
2.2 Definirea variabilelor şi introducerea datelor în SPSS
Definirea variabilelor presupune precizarea atributelor variabilelor (numele, tipul, lungimea,
eticheta etc.) în coloanele foii Variable View din fereastra Data Editor.
Dintre variabilele considerate 3 sunt variabile nominale şi 6 sunt variabile numerice. Pentru a
utiliza în analiză variabilele Departamentul şi Nivelul de studii acestea au fost transformate în
variabile numerice prin atribuirea de coduri categoriilor acestor variabile.
Variabilele considerate au fost definite în SPSS astfel:
- functia – Funcţia deţinută în cadrul Primăriei, variabilă atributivă (String), lungimea 25
caractere, variabilă nominală;
- depart – Departamentul , variabilă atributivă transformată în variabilă numerică, având
următoarele valori:
0. cabinet primar
1. direcţia tehnică
2. direcţia economică
- salar – Salariul tarifar (de bază), variabilă numerică, de tip scală;
- vechime – Numărul de ani de vechime, variabilă numerică, de tip scală;
4
- studii – Nivelul de studii, variabilă atributivă transformată în variabilă numerică, tip ordinală,
având următoarele valori:
0. studii superioare
1. studii liceale
2. studii gimnaziale
- spor_vec – Sporul de vechime, variabilă numerică, de tip scală;
- sal_meri – Salariul de merit, variabilă numerică, de tip scală;
- spor_con – Sporuri de conducere, variabilă numerică, de tip scală;
- stimul – Stimulente, variabilă numerică, de tip scală;
- stim_dn – Stimulente – da/nu, variabilă dichotomică transformată în variabilă numerică,
având următoarele valori:
0. nu (nu primesc stimulente)
1. da (primesc stimulente)
- sal_m_dn – Salariul de merit – da/nu, variabilă dichotomică transformată în variabilă
numerică, având următoarele valori:
0. nu (nu primesc salariu de merit)
1. da (primesc salariu de merit)
- sal_brut Salariul brut, variabilă numerică obţinută cu ajutorul opţiunii Transform/ Compute
prin însumarea variabilelelor: Salariul tarifar (de bază), Sporul de vechime, Salariul de merit,
Sporuri de conducere.
Informaţii privind atributele unei variabile pot fi citite alegând opţiunea Utilities/Variables.
De exemplu, pentru variabila functia, putem vizualiza următoarele informaţii:
Datele au fost introduse în celulele foii Data View din fereastra Data Editor. În total sunt 30
de funcţionari din trei departamente din cadrul Primăriei Municipiului Iaşi. Pentru fiecare funcţionar
au fost înregistrate funcţia, salariul tarifar, vechimea, nivelul de studii etc.
5
3 VERIFICAREA BAZEI DE DATE
3.1 Depistarea outlieri-lor
Pentru a verifica dacă sunt outlier-i sau alte valori extreme putem utiliza diagrama Boxplot
creată prin opţiunea Analyze/ Descriptive Statistics/ Explore/ Plots.
Am obţinut următoarele diagrame Boxplot pentru variabilele de mai jos:
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
Salariul tarifar (de baza) 30 100.0% 0 .0% 30 100.0%
Numarul de ani vechime 30 100.0% 0 .0% 30 100.0%
Sporul de vechime 30 100.0% 0 .0% 30 100.0%
6
7
3.2 Verificarea normalităţii distribuţiilor
Condiţia de normalitate a variabilelor este cerută în procesul de inferenţă statistică.
Majoritatea testelor parametrice necesită îndeplinirea condiţiei de normalitate.
Pentru a verifica normalitatea unei distribuţii cu ajutorului programului SPSS putem folosi:
- histograma, boxplot, P-P plot, Q-Q plot;
- indicatorii din statistica descriptivă şi teste statistice.
Pentru variabilele salariul tarifar, sporul de vechime şi numărul de ani de vechime am obţinut
următoarele histograme:
8
Folosirea histogramei pentru a verifica dacă o distribuţie este normală presupune compararea
histogramei variabilei observate cu modelul curba Gauss. Histogramele obţinute prezintă un grad
mare de asimetrie, nu putem afirma că distribuţiile sunt normale.
Diagramele Q-Q plot arată, pentru variabila salariul tarifar, că punctele sunt deviate de la
linia dreaptă. Aceste deviaţii indică abateri de la normalitate.
9
Pentru a elimina outlier-ii şi valorile extreme prezentate de diagrama Boxplot, am exclus din
baza de date funcţionarii cu valori ridicate ale salariului tarifar. Pentru aceasta, am folosit opţiunea
Data/Select Cases şi am pus condiţia de selectare a acelor cazuri pentru care salariul tarifar este mai
mic de 1.000 lei. Astfel, dintre cele 30 de cazuri au fost selectate 25.
SPSS a creat astfel o nouă variabilă, cu numele implicit de filter_$ şi având eticheta salariu <
1000 (FILTER).
Histogramele obţinute pentru cele trei variabile, după eliminarea oultie-ilor, prezentate mai
jos, arată o reducere a asimetriei, mai ales pentru variabila salariul tarifar.
10
Diagramele Q-Q plot, după eliminarea outlier-ilor, arată o dispunere a punctelor de-a lungul
liniei drepte.
11
4. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR
4.1 Descrierea statistică a variabilelor nominale
Pentru analiza variabilelor nominale am utilizat opţiunea Analyze/ Descriptive Statistics/
Frequencies.
Pentru fiecare dintre variabilele analizate şi anume, departamentul şi nivelul de studii, am
obţinut tabele de frecvenţă şi graficele Pie.
Pentru variabilele nominale se poate calcula proporţia şi modul iar pentru variabilele ordinale
se poate calcula şi mediana.
Departamentul
8 26.7 26.7 26.7
14 46.7 46.7 73.3
8 26.7 26.7 100.0
30 100.0 100.0
cabinet primar
directia tehnica
directia economica
Total
ValidFrequency Percent Valid Percent
CumulativePercent
12
Departamentul
26.7%
46.7%
26.7%
directia economica
directia tehnica
cabinet primar
Cei 30 de funcţionari sunt repartizaţi pe departamente astfel: 8 funcţionari lucrează în
Cabinetul primarului, 14 funcţionari lucrează în cadrul Direcţiei tehnice, 8 funcţionari lucrează în
cadrul Direcţiei economice.
Repartizarea funcţionarilor pe departamente poate fi vizualizată în graficul de mai sus:
- 46,7% (cea mai mare proporţie) funcţionarii din Direcţia tehnică;
- 26,7% funcţionarii din Cabinetul primarului;
- 26,7% funcţionarii din Direcţia economică.
Din tabelul de frecvenţă de mai jos, observăm că majoritatea funcţionarilor au studii
superioare. Doar 6 funcţionari au studii medii şi 5 funcţionari au studii gimnaziale.
Graficul Pie de mai jos arată că cea mai mare pondere o au funcţionarii cu studii superioare
(63,3%). Categoria funcţionarilor cu studii medii reprezintă 20% iar funcţionarii cu studii gimnaziale
reprezintă 16,7%.
Nivelul de studii
19 63.3 63.3 63.3
6 20.0 20.0 83.3
5 16.7 16.7 100.0
30 100.0 100.0
superioare
medii
gimnaziale
Total
ValidFrequency Percent Valid Percent
CumulativePercent
13
Nivelul de studii
16.7%
20.0%
63.3%
gimnaziale
medii
superioare
Statistics
30 30
0 0
2.00 1.00
2 1
Valid
Missing
N
Median
Mode
DepartamentNivelul de
studii
4.2 Descrierea statistică a variabielor numerice
Variabilele salariul tarifar, numărul de ani de vechime şi sporul de vechime sunt
variabile numerice. Pentru analiza lor am folosit opţiunea Analyze/ Descriptive Statistics/
Frequencies şi Analyze/ Descriptive Statistics/ Descriptives…
Pentru o variabilă numerică se pot calcula indicatorii tendinţei centrale (media, mediana,
modul), indicatorii dispersiei (amplitudinea, varianţa, abaterea medie pătratică) şi indicatorii
formei (coeficientul de asimetrie şi coeficientul de boltire ).
Rezultatele obţinute pentru distribuţiile fără outlier-i sunt prezentate în tabelele de mai jos.
Un funcţionar obţine un salariul mediu tarifar lunar de 739,96 lei, are în medie 11,52 ani
vechime şi primeşte, lunar, un spor mediu de vechime de 102,84 lei.
Jumătate dintre funcţionari (50%) obţin un salariu tarifar lunar mai mic de 751 lei, au până la
7 ani vechime şi primesc un spor de vechime până la 67 leiAbaterea medie pătratică arată cu cât se
abate în medie salariul tarifar lunar obţinut de o persoană faţă de salariul mediu tarifar.
14
Abaterea medie pătratică pentru variabila salariul tarifar este 151,050 lei, adică aproximativ
68% dintre funcţionari obţin un salariu tarifar lunar cuprins într-un interval egal cu salariu mediu
tarifar plus/minus valoarea abaterii medii pătratice: 739,96 ± 151,050 lei = (588.91 ; 891.01) lei.
Abaterea medie pătratică pentru variabila numărul de ani de vechime este 9,22 ani, adică
aproximativ 68% dintre funcţionari au vechimea cuprinsă într-un interval egal cu numărul mediu de
ani de vechime plus/minus valoarea abaterii medii pătratice: 11,52 ± 9,22 ani = (3.3; 20,74) ani.
Abaterea medie pătratică pentru variabila sporul de vechime este 89,724 lei, adică
aproximativ 68% dintre funcţionari obţin un spor de vechime lunar cuprins într-un interval egal cu
sporul mediu de vechime plus/minus valoarea abaterii medii pătratice:102,84 ± 89,724 lei = (13,12;
192,56) lei.
Eroarea standard a mediei (eroarea medie de reprezentativitate) este folosită pentru estimarea,
prin interval de încredere a mediei populaţiei.
Pentru variabila salariul tarifar coeficientul de asimetrie (skewness) are valoarea (β1=-
0,027).
Coeficientul de boltire (kurtosis) măsoară răspândirea fiecărei observaţii în jurul unei valori centrale. Pentru
toate cele trei variabile analizate, coeficientul de boltire este mai mic ca 0, indicând o grupare mai slabă în jurul valorii
centrale, deci distribuţiile sunt platicurtice.
Statistics
Salariul tarifar
(de baza)
Numarul de ani
vechime
Sporul de
vechime
N 25 25 25
Mean 739.96 11.52 102.84
Std. Error of Mean 30.210 1.844 17.945
Median 751.00 7.00 67.00
Std. Deviation 151.050 9.220 89.724
Variance 22816.123 85.010 8050.307
Skewness -.027 1.141 1.047
Std. Error of Skewness .464 .464 .464
Kurtosis -1.442 -.132 .813
Std. Error of Kurtosis .902 .902 .902
Range 448 30 351
Minimum 506 2 0
Maximum 954 32 351
Sum 18499 288 2571
15
Descriptives
Statistic Std. Error
Salariul tarifar (de baza) Mean 739.96 30.210
95% Confidence Interval for
Mean
Lower Bound 677.61
Upper Bound 802.31
5% Trimmed Mean 741.04
Median 751.00
Variance 2.282E4
Std. Deviation 151.050
Minimum 506
Maximum 954
Range 448
Interquartile Range 300
Skewness -.027 .464
Kurtosis -1.442 .902
Numarul de ani vechime Mean 11.52 1.844
95% Confidence Interval for
Mean
Lower Bound 7.71
Upper Bound 15.33
5% Trimmed Mean 10.94
Median 7.00
Variance 85.010
Std. Deviation 9.220
Minimum 2
Maximum 32
Range 30
Interquartile Range 12
Skewness 1.141 .464
Kurtosis -.132 .902
Sporul de vechime Mean 102.84 17.945
95% Confidence Interval for
Mean
Lower Bound 65.80
Upper Bound 139.88
16
5% Trimmed Mean 96.06
Median 67.00
Variance 8.050E3
Std. Deviation 89.724
Minimum 0
Maximum 351
Range 351
Interquartile Range 130
Skewness 1.047 .464
Kurtosis .813 .902
Pentru reprezentarea grafică a celor trei variabile numerice am folosit histograma şi curba
frecvenţelor.
Observăm alungirea spre dreapta a curbelor de frecvenţă ceea ce arată asimetrie pozitivă. Cea
mai accentuată asimetrie prezintă distribuţia funcţionarilor după sporul de vechime obţinut.
De asemenea, curbele de frecvenţă sunt aplatizate, mai ales pentru variabila salariul tarifar.
17
5 ANALIZA STATISTICĂ BIVARIATĂ A DATELOR
5.1 Analiza statistică a gradului de asociere între două variabile
Pentru o distribuţie bivariată cu ambele variabile nominale putem obţine:
- tabelele de asociere şi frecvenţele condiţionate;
- analiza diferenţelor calitative prin calculul şi interpretarea lui hi-pătrat.
Pentru analiza gradului de asociere dintre variabilele departamentul şi stimulente – da/nu
am folosit opţiunea Analyze/ Descriptive Statistics/ Crosstabs.
În tabelul rezumat al procedeului sunt precizate variabilele analizate:
Case Processing Summary
25 100.0% 0 .0% 25 100.0%Departamentul *Stimulente - da/nu
N Percent N Percent N Percent
Valid Missing Total
Cases
Tabelul de asociere de mai jos prezintă frecvenţele absolute condiţionate. Cei 5 funcţionari
din cabinetul primarului, nici un funcţionar nu primeşte stimulente. Din cei 13 funcţionari din cadrul
direcţiei tehnice, nici un funcţionar nu primeşte stimulente.
Departamentul * Stimulente da/nu Crosstabulation
Count
Stimulente da/nu
Total
nu (nu primesc
stimulente)
da (primesc
stimulente)
Departamentul cabinet primar 5 0 5
directia tehnica 13 0 13
directia economica 3 4 7
Total 21 4 25
18
Pentru a verifica legătura dintre cele două variabile se foloseşte testul hi-pătrat. În tabelul de
mai jos s-a obţinut valoarea testului hi-pătrat egală cu 12,245 pentru 2 grade de libertate. Valoarea
Sig. (egală cu 0,002) asociată cu statistica hi-pătrat este mică (< 0.05), fapt de ne permite să afirmăm
că există legătură semnificativă între variabila departamentul şi stimulente – da/nu.
Chi-Square Tests
Value df
Asymp. Sig. (2-
sided)
Pearson Chi-Square 12.245a 2 .002
Likelihood Ratio 12.423 2 .002
Linear-by-Linear Association 8.170 1 .004
N of Valid Cases 25
a. 4 cells (66.7%) have expected count less than 5. The minimum
expected count is .80.
5.2 Analiza de corelaţie şi regresie
A) Analiza de corelaţie
Pentru a determina gradul de intensitate a legăturii dintre variabilele numerice salariul
tarifar, numărul de ani de vechime şi sporul de vechime folosim indicatorii intensităţii corelaţiei
obţinuţi în analiza de corelaţie.
În programul SPSS am folosit opţiunea Analyze/ Correlate/ Bivariate…
În output sunt prezentate statisticile pentru fiecare variabilă. În tabelul Descriptive Statistics
sunt calculate media şi abaterea medie pătratică.
Descriptive Statistics
Mean Std. Deviation N
Salariul tarifar (de baza) 739.96 151.050 25
Numarul de ani vechime 11.52 9.220 25
Sporul de vechime 102.84 89.724 25
19
Tabelul Correlations este un tabel cu matricea coeficienţilor de corelaţie. De o parte şi de alta
a diagonalei tabelului sunt prezentate valorile coeficienţilor de corelaţie Pearson dintre variabile luate
două câte două.
Correlations
Salariul tarifar
(de baza)
Numarul de ani
vechime
Sporul de
vechime
Salariul tarifar (de baza) Pearson Correlation 1 .469* .590**
Sig. (2-tailed) .018 .002
N 25 25 25
Numarul de ani vechime Pearson Correlation .469* 1 .935**
Sig. (2-tailed) .018 .000
N 25 25 25
Sporul de vechime Pearson Correlation .590** .935** 1
Sig. (2-tailed) .002 .000
N 25 25 25
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
Pentru variabilele salariul tarifar şi numărul de ani de vechime s-a obţinut un coeficient de
corelaţie Pearson egal cu 0,469 ceea ce sugerează că între variabile există o corelaţie directă dar nu
foarte puternică.
Pentru variabilele salariul tarifar şi sporul de vechime s-a obţinut un coeficient de corelaţie
Pearson egal cu 0,590 ceea ce sugerează că între variabile există o corelaţie directă.
Pentru variabilele numărul de ani de vechime şi sporul de vechime s-a obţinut un
coeficient de corelaţie Pearson egal cu 0,935 ceea ce sugerează că între variabile există o corelaţie
directă şi foarte puternică, valoarea coeficientului fiind aproape de valoarea unu.
Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testului t. Valoarea
Sig. corespunzătoare este mai mică decât 0,05 pentru toate corelaţiile, evidenţiind obţinerea unui
coeficient de corelaţie semnificativ.
20
B) Analiza de regresie
Analiza de regresie este folosită pentru:
- estimarea valorilor unei variabile considerând valorile unei alte variabile;
- evaluarea măsurii în care variabila dependentă poate fi explicată prin variabila independentă.
Pentru a stabili şi analiza modelul de regresie dintre variabilele numărul de ani de vechime
şi sporul de vechime am ales opţiunea Analyze/ Regression/ Linear…
Variabilele introduse în model sunt prezentate în tabelul de mai jos:
- variabila independentă: numărul de ani de vechime;
- variabila dependentă: sporul de vechime.
Variables Entered/Removedb
Numarulde ani devechime
a . Enter
Model1
VariablesEntered
VariablesRemoved Method
All requested variables entered.a.
Dependent Variable: Sporul de vechimeb.
Tabelul Model Summary prezintă valoarea coeficientului de corelaţie (R), valoarea raportului
de determinaţie (R2), valoarea ajustată a lui R şi eroarea standard a estimaţiei.
Valoarea coeficientului de corelaţie este egală cu 0,935, ceea ce indică o legătură liniară
directă şi foarte puternică între cele două variabile analizate.
R2 = 0,874 arată că variaţia variabilei dependente este explicată în proporţie de 87,4% prin
modelul de regresie.
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .935a .874 .868 32.548
a. Predictors: (Constant), Numarul de ani vechime
Tabelul Regression ANOVA prezintă rezultatele analizei varianţei variabilei dependente sub
influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii asupra sumei pătratelor
abaterilor variabilei dependente, datorate modelului de regresie şi factorului reziduu, gradele de
libertate, estimaţiile varianţelor datorate celor două surse de variaţie, raportul F şi Sig.
21
Testul F obţinut este egal cu 159,375, iar valoarea Sig. corespunzătoare statisticii Fisher este
mică (< 0.05) deci relaţia dintre cele două variabile considerate este semnificativă.
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 168841.200 1 168841.200 159.375 .000a
Residual 24366.160 23 1059.398
Total 193207.360 24
a. Predictors: (Constant), Numarul de ani vechime
b. Dependent Variable: Sporul de vechime
Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie estimat,
eorile standard, valorile statisticii test şi valorile Sig. corespunzătoare.
Considerăm că între cele două variabile există o legătură liniară, modelul de regresie având
următoarea formă:
- la nivelul populaţiei;
- la nivelul eşantionului;
unde,
- X – variabila dependentă, aleatoare;
- Y – variabila independentă, non-aleatoare;
- e – variabila aleatoare eroare sau reziduu ;
- a – ordonata la origine (arată valoarea variabilei Y când X este egal cu 0);
- b – panta dreptei, numit şi coeficient de regresie;
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -1.958 10.549 -.186 .854
Numarul de ani vechime 9.097 .721 .935 12.624 .000
a. Dependent Variable: Sporul de vechime
22
Din tabelul de mai sus, obţinem valorile estimaţiilor parametrilor de regresie şi anume
valorile lui a şi b.
Astfel, a = -1,958 iar b = 9,097.
Valoarea pozitivă a coeficientului de regresie b indică o legătură directă între cele două
variabile analizate.
Dacă b = 9,097, atunci la o creştere cu o unitate (un an) a numărului de ani de vechime,
sporul de vechime creşte, în medie, cu ,097 lei.
Modelul de regresie al legăturii dintre numărul de ani de vechime şi sporul de vechime
poate fi scris:
Y = -1,958 + 9,097*X
Testarea semnificaţiei parametrilor de regresie se face cu ajutorul testului t, pentru a afla care
este probabilitatea ca fiecare parametru să fie nul:
H0: β = 0
Valoarea Sig. = 0,000 arată că pentru un risc parametrul este semnificativ statistic.
Deci β (panta dreptei de regresie) corespunde unei legături semnificative între cele două variabile.
5.3 Analiza dispersională (ANOVA)
ANOVA (Analysis of Variance) este un procedeu de analiză a varianţei unei variabile
numerice (salariul tarifar) sub influenţa unei variabile de grupare (nivelul de studii).
Prin acest procedeu se compară mediile a trei subpopulaţii definite de variabila de grupare
(variabila independentă). Demersul în SPSS este: Analyze/ Compare Means/ One-Way ANOVA.
Pentru fiecare categorie de funcţionari (cu studii superioare, medii gimnaziale), s-a calculat salariul mediu tarifar, abaterea medie pătratică, eroarea standard, intervalul de încredere al mediei, valorile minimă şi maximă.
23
Descriptives
Salariul tarifar (de baza)
N Mean Std. Deviation Std. Error
95% Confidence Interval for
Mean
Minimum MaximumLower Bound Upper Bound
studii superioare 14 855.43 81.703 21.836 808.25 902.60 708 954
studii liceale 6 638.83 33.493 13.673 603.68 673.98 605 672
studii gimnaziale 5 538.00 28.452 12.724 502.67 573.33 506 578
Total 25 739.96 151.050 30.210 677.61 802.31 506 954
Salariul mediu tarifar obţinut de funcţionarii cu studii superioare este de 855,43 lei, salariul
mediu tarifar obţinut de funcţionarii cu studii medii este de 638,83 lei, salariul mediu tarifar obţinut
de funcţionarii cu studii gimnaziale este de 538 lei.
Ipoteza nulă, ipoteza de testat prin acest procedeu, presupune egalitatea a trei sau mai multe
medii:
H0: μ1 = μ2 = μ3 unde μi este media grupei i
Interpretarea rezultatelor ANOVA vizează două teste:
- testul de omogenitate a varianţelor. Acest test determină care test este adecvat comparării
mediilor;
- testul ANOVA. Acest test verifică dacă cel puţin două medii diferă între ele.
Testul Levene – Testul omogenităţii varianţelor verifică dacă varianţele grupelor sunt egale.
Valoarea Sig. pentru acest test este egală cu 0,001, este mai mică decât 0,05 ceea ce sugerează că
varianţele celor trei grupe nu sunt egale. Este încălcată, astfel, restricţia de homoscedasticitate.
24
Test of Homogeneity of Variances
Salariul tarifar (de baza)
Levene Statistic df1 df2 Sig.
9.998 2 22 .001
În tabelul ANOVA sunt prezentate: statistica test Fisher, valoarea Sig. şi elemente de calcul
pentru statistica F.
ANOVA
Salariul tarifar (de baza)
Sum of Squares df Mean Square F Sig.
Between Groups 451960.698 2 225980.349 51.990 .000
Within Groups 95626.262 22 4346.648
Total 547586.960 24
Raportul Fisher se calculează ca raport între estimatorul varianţei explicate şi estimatorul
varianţei reziduale:
unde:
SE2 - estimatorul varianţei intergrupe;
SR2 - estimatorul varianţei intragrupe (din interiorul grupelor).
Valoarea calculată a raportului Fisher este mare (51,99), cu o probabilitate asociată Sig.
(0,000) mai mică decât 0,05. Acest lucru evidenţiază faptul că ipoteza de egalitate a mediilor pe
grupe de respinge (respingem H0) deci nivelul studiilor influenţează semnificativ nivelul salariului
tarifar lunar.
Din graficul mediilor se observă diferenţe între salariul mediu tarifar obţinut de funcţionarii
cu studii superioare, medii şi respectiv gimnaziale.
25
26
6 ESTIMAREA ŞI TESTAREA STATISTICĂ
6.1 Estimarea parametrilor prin interval de încredere
Estimarea prin interval de încredere presupune aflarea limitelor de încredere ale unui interval
care acoperă valoarea adevărată a unui parametru al populaţiei Estimarea prin interval de încredere
ţine seama de fluctuaţiile distribuţiei de selecţie a estimatorului parametrului considerat.
Parametrii sunt estimaţi pe baza valorilor tipice de sondaj, rezultate din prelucrarea datelor
unui eşantion.
6.1.1 Estimarea prin interval de încredere a unei medii şi unei proporţii
Dorim să estimăm prin interval de încredere salariul mediu tarifar obţinut de toţi funcţionarii
din cadrul Primăriei Municipiului Iaşi vom folosi estimarea prin I.C: a mediei.
Intervalul de încredere pentru parametrul μ (media populaţiei) pleacă de la o ipoteză a
distribuţiei mediilor de selecţie.
La nivelul unui eşantion, intervalul este:
când se cunoaşte σ
respectiv
când nu se cunoaşte σ
Pentru a obţine intervalul de încredere în SPSS alegem opţiunea Analzye/ Descriptive
Statistics/ Explore şi precizăm în caseta Confidence Intterval for Mean nivelul de încredere dorit
(95%).
Pentru a calcula intervalul de încredere al proporţiei funcţionarilor cu studii superioare în
populaţia funcţionarilor folosind SPSS presupune efectuarea unui set de operaţii:
Calculul proporţiei la nivelul eşantionului observat
Cu ajutorul opţiunii Frequencies aflăm o proporţie a funcţionarilor cu studii superioare de
63,3%.
27
Nivelul de studii
Frequency Percent Valid Percent
Cumulative
Percent
Valid studii superioare 19 63.3 63.3 63.3
studii liceale 6 20.0 20.0 83.3
studii gimnaziale 5 16.7 16.7 100.0
Total 30 100.0 100.0
Calculul erorii Sp (eroarea standard după relaţia )
Pentru f = 63,3%, n = 30 aflăm
Calculul limitelor I.C.
Considerând un scor z = 1,96, obţinem:
Interpretare
Ne putem aştepta, cu o încredere de 95%, ca proporţia funcţionarilor cu studii superioare în
totalul funcţionarilor să fie cuprinsă între 45,66% şi 80,94%.
6.1.2 Estimarea prin interval de încredere a diferenţei dintre două medii şi
două proporţii
Estimarea prin interval de încredere a diferenţei dintre salariul mediu obţinut de funcţionarii
cu studii superioare şi funcţionarii cu studii medii presupune calculul I.C. după formula:
În SPSS, intervalul de încredere a diferenţei dintre două medii (μ1 – μ2) poate fi obţinut în
tabelul Independent Samples Test.
28
Independent Samples Test
Levene's Test for
Equality of
Variances t-test for Equality of Means
F Sig. t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence Interval
of the Difference
Lower Upper
Salariul tarifar
(de baza)
Equal variances
assumed2.663 .116 4.063 23 .000 292.061 71.886 143.353 440.769
Equal variances
not assumed6.971 21.450 .000 292.061 41.896 205.044 379.078
Cu o încredere de 95%, ne putem aştepta ca diferenţa dintre salariul mediu tarifar al
funcţionarilor cu studii superioare şi salariul mediu tarifar al funcţionarilor cu studii medii este
cuprinsă între (205,044 lei; 379,078 lei).
6.2 Testarea statistică
6.2.1 Testarea unei medii şi unei proporţii
Testele asupra mediilor, respectiv proporţiilor sunt folosite pentru a verifica dacă o medie sau
proporţie diferă semnificativ de o valoare specificată.
A) Testarea unei medii
Dorim să testăm dacă salariul mediu tarifar obţinut lunar de funcţionarii Primăriei diferă
semnificativ de valoarea de 700 lei.
Pentru a testa egalitatea unei medii cu o valoare specificată folosim opţiunea Analyze/
Compare Means/ One-Sample T Test…
Output-urile , One-Sample Statistics şi One-Sample T Test pentru variabila salariul tarifar
prezintă valoarea medie observată egală cu 739,96 lei, valoarea specificată egală cu 700 lei, diferenţa
dintre valoarea observată şi valoarea ipotetică de 39,96 lei.
29
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
Salariul tarifar (de baza) 25 739.96 151.050 30.210
One-Sample Test
Test Value = 700
t df Sig. (2-tailed) Mean Difference
95% Confidence Interval of the
Difference
Lower Upper
Salariul tarifar (de baza) 1.323 24 .198 39.960 -22.39 102.31
Ipoteza de egalitate a mediilor pentru a verifica dacă sunt diferenţe semnificative între
populaţiile din care s-au extras eşantioanele observate este:
H0: μ = μ0 (μ = 700 lei)
Testul ales pentru verificarea egalităţii dintre μ şi valoarea de 700 lei este:
Valoarea calculată a testului este egală cu 1,323. Valoarea Sig. asociată testului este mai mare
decât valoarea de 0,05, ceea ce arată că se acceptă ipoteza H0, ipoteza de egalitate a mediilor. Deci,
nu există diferenţă semnificativă între valoarea medie observată şi cea specificată (700 lei).
Intervalul de încredere pentru diferenţa dintre cele două valori conţine pe zero, deci diferenţa
nu este semnificativă.
30
B) Testarea unei proporţii
Dorim să verificăm dacă proporţia funcţionarilor cu studii superioare diferă semnificativ de
50%.
Folosim în SPSS opţiunea Analyze/ Nonparametric Tests/ Binomial…
Acest procedeu testează ipoteze cu privire la o variabilă care poate lua doar două valori.
Deoarece variabila nivelul de studii are trei categorii (studii superioare, medii şi gimnaziale) am
folosit opţiunea Cut Point şi am definit două grupe:
- Grup 1 – nivel de studii <= 1 (studii superioare);
- Grup 2 – nivel de studii > 1 (studii medii şi gimnaziale).
Am ales proporţia de testare (Test Proportion ) egală cu 0,50.
Descriptive Statistics
25 1.64 .81 1 3 1.00 1.00 2.00Nivelul de studiiN Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th
Percentiles
Binomial Test
<= 1 14 .56 .50 .690
> 1 11 .44
25 1.00
Group 1
Group 2
Total
Nivelul de studiiCategory N
ObservedProp. Test Prop.
Exact Sig.(2-tailed)
Din tabelul Binomial Test citim că proporţia observată din eşantion pentru grupa
funcţionarilor cu studii superioare este de 56%, proporţia specificată este 50%. Valoarea Sig.
asociată testului (0,690) este mai mare decât 0,05. Putem afirma, cu o încredere de 95%, că proporţia
funcţionarilor cu studii superioare nu diferă semnificativ de proporţia specificată de 50%.
6.2.2 Testarea diferenţei dintre două medii şi două proporţii
A) Testarea diferenţei dintre două medii
Pentru a testa dacă salariul mediu tarifar al funcţionarilor cu studii superioare diferă
semnificativ de salariul mediu tarifar al persoanelor cu studii medii folosim opţiunea Analyze/
Compare Means/ Independent-Samples T Test.
Ipoteza de egalitate a mediilor celor două grupe este:
H0: μ1 = μ2
31
La nivelul celor 25 de funcţionari observaţi, salariul mediu tarifar obţinut lunar de
funcţionarii cu studii superioare (14 funcţionari) este 6855,43 lei iar salariul mediu tarifar obţinut
lunar de cei 6 funcţionari cu studii medii este 638,83 lei.
Group Statistics
Nivelul de studii N Mean Std. Deviation Std. Error Mean
Salariul tarifar (de baza) studii superioare 14 855.43 81.703 21.836
studii liceale 6 638.83 33.493 13.673
Calculul statisticii test pentru compararea mediilor a două populaţii cere să se verifice dacă
deviaţiile standard la nivelul celor două grupe sunt semnificativ diferite . Se foloseşte testul Levene
de egalitate a varianţelor.
Independent Samples Test
Levene's Test for
Equality of
Variances t-test for Equality of Means
F Sig. t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence Interval
of the Difference
Lower Upper
Salariul tarifar
(de baza)
Equal variances
assumed2.663 .116 4.063 23 .000 292.061 71.886 143.353 440.769
Equal variances
not assumed6.971 21.450 .000 292.061 41.896 205.044 379.078
B) Testarea diferenţei dintre două proporţii
Pentru a verifica dacă distribuţia de frecvenţă variabilei nivelul de studii (variabilă care are
trei categorii: superioare, medii şi gimnaziale) corespunde cu distribuţia teoretică a frecvenţelor
relative folosim testul hi-pătrat.
Am folosit opţiunea Analyze/ Nonparametric Tests/ Chi-Square Test…
32
Nivelul de studii
14 8.3 5.7
6 8.3 -2.3
5 8.3 -3.3
25
superioare
medii
gimnaziale
Total
Observed N Expected N Residual
În tabelul frecvenţelor, sunt comparate frecvenţele observate (Observed N) cu frecvenţele
teoretice (Expected N). Din cei 25 de funcţionari, 14 funcţionari au studii superioare, 6 funcţionari au
studii medii şi 5 funcţionari au studii gimnaziale.
Ipoteza de nul presupune că toate categoriile au proporţii egale (25/3). Conform acesteia
pentru fiecare categorie ar trebui să fie câte 8 funcţionari.
Test Statistics
5.840
2
.054
Chi-Square a
df
Asymp. Sig.
Nivelul destudii
0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 8.3.
a.
Valoarea testului hi-pătrat este 5,840. Valoarea Asymp. Sig. este mai mare decât 0,05 deci se
acceptă ipoteza de nul.
33
7 CONCLUZII
Funcţionarii publici din Primăria municipiului Iaşi incluşi în analiză sunt repartizaţi pe trei
mari departamente şi anume:
- 46,7% (cea mai mare proporţie) funcţionarii din Direcţia tehnică;
- 26,7% funcţionarii din Cabinetul primarului;
- 26,7% funcţionarii din Direcţia economică.
Majoritatea funcţionarilor au studii superioare (63,3%). Categoria funcţionarilor cu studii
medii reprezintă 20% iar funcţionarii cu studii gimnaziale reprezintă 16,7%.
În urma analizei univariate asupra variabilelor cantitative, putem concluziona că un
funcţionar din Primăria Iaşi obţine un salariul mediu tarifar lunar de 739.96 lei, are în medie 11.52
ani vechime şi primeşte, lunar, un spor mediu de vechime de 102.84 lei.
Analiza de asociere a permis testarea legăturii dintre departamente şi acordarea de stimulente.
Din cei 25 de funcţionari, nici un funcţionar din cabinetul primarului sau din cadrul direcţiei tehnice
nu primeşte stimulente.
Între variabilele numărul de ani de vechime şi sporul de vechime există o corelaţie directă şi
foarte puternică. Modelul legăturii dintre cele două variabile a fost estimat cu ajutorul analizei de
regresie.
ANOVA a permis testarea influenţei variabilei de grupare (nivelul de studii) asupra unei
variabile numerice (salariul tarifar). Salariul mediu tarifar obţinut de funcţionarii cu studii superioare
este de 855,43 lei, salariul mediu tarifar obţinut de funcţionarii cu studii medii este de 638,83 lei,
salariul mediu tarifar obţinut de funcţionarii cu studii gimnaziale este de 538 lei. Deci, salariile medii
tarifare diferă între grupele de funcţionari cu studii superioare, medii şi gimnaziale.
34
BIBLIOGRAFIE
1. Jaba, E., Statistica, ediţia a III-a, Editura Economică, Bucureşti, 2002;
2. Jaba, E., Grama, A., Analiza statistică cu SPSS sub Windows, Editura Polirom, Iaşi, 2004.
35