Document Practica
-
Upload
velicu-valerii -
Category
Documents
-
view
3.094 -
download
0
Transcript of Document Practica
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
1
Structura Proiectului
1.Introducere..................................................................................................................................................................2
2.Analiza statistică a unei serii de date înregistrate la un moment dat .........................................................................3
2.1 Alegerea variabilelor statistice .............................................................................................................................3
2.2 Analiza statistică univariată a variabilelor statistice ............................................................................................4
2.2.1 Analiza statistică univariată a variabilelor cantitative...................................................................................4
2.2.1.1 Numărul populaţiei pe judeţe ................................................................................................................4
2.2.1.2 Câştigul salarial net pe judeţe ..............................................................................................................11
2.2.2 Analiza statistică univariată a variabilelor cantitative.................................................................................16
2.2.2.1 Regiunea de dezvoltare .......................................................................................................................16
2.2.2.2 Nivelul câştigului salarial ......................................................................................................................17
2.3 Analiza bivariată a variabilelor statistice ............................................................................................................18
2.3.1 Analiza bivariată a variabilelor cantitative ..................................................................................................18
2.3.2 Analiza bivariată a variabilelor calitative(Regiunea de dezvoltare şi nivelul câştigului net) .......................19
2.4 Estimarea prin interval de încredere a mediei ...................................................................................................21
2.4.1 Estimarea prin interval de încredere a unei medii ......................................................................................21
2.4.1.1 Estimarea prin nterval de încredere a mediei populaţiei.....................................................................22
2.4.1.2 Estimarea prin interval de încredere a mediei salariului net ...............................................................22
2.5 Testarea statistică...............................................................................................................................................23
2.5.1 Testarea ipotezelor asupra unui eşantion...................................................................................................23
2.5.2 Testarea ipotezelor asupra 2 eşantioane independente.............................................................................25
2.5.3 Testarea ipotezelor asupra 3 sau mai multe eşantioane independente.....................................................26
3. Analiza statistică descriptivă a unei serii de timp.....................................................................................................28
3.1 Prezentarea variabilei statistice .........................................................................................................................28
3.2 Analiza statistică folosind indici statistici simpli.................................................................................................28
3.2.1 Indicii absoluţi..............................................................................................................................................28
3.2.1 Indici relativi ................................................................................................................................................29
3.2.3 Indici exprimaţi prin valori medii.................................................................................................................30
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
2
1.Introducere
Obiectul de cercetare al prezentului proiect este efectuarea unei analize statistice asupra uneiserii de date înregistrate la un moment dat,folosind medote descriptive şi inferenţiale, cât şianaliza descriptivă a unei serii statistice de timp.
Mi-am propus ca în acest proiect să analizez judeţele României după 4 variabile statistice,2cantitative ,reprezentate de „Numărul populaţiei” şi „Câştigul salarial net(lunar)” şi 2 variabilecalitative ,”Regiunea de dezvoltare” şi „Nivelul câştigului salarial”.
Datele, sunt reale, preluate din Anuarul statistic 2010.
Între variabilele alese este o legătură directă.Putem observa că cu cât judeţele sunt mai în centrulţării, cu atât nivelul salariului este mai mare.
Pentru analiza variabilelor voi folosi o serie de indicatori,indicatori ai mediei, indicatori aivariaţiei, indicatori ai asimetriei şi boltirii, estimaţii prin interval de încredere, testarea ipotezelorasupra unul ţi mai multe eşantioane.
Pentru realizarea obiectului acestui proiect datele vor fi introduse în programul SPSS.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
3
2.Analiza statistică a unei serii de date înregistrate la un moment dat
2.1 Alegerea variabilelor statistice
Variabilele statistice vor fi prezentate într-un tabel:
Nr.Crt. Judeţ Reg.dedezvoltare
Populaţia Câştigul salarialnet
Nivelulcâştigului
salarial1 ILFOV Bucureşti - Ilfov 312317 1697 peste medie2 BUCUREŞTI 1) Bucureşti - Ilfov 1944226 1831 peste medie3 ALBA Centru 373755 1142 sub medie4 BRAŞOV Centru 597439 1323 peste medie5 COVASNA Centru 222710 1037 sub medie6 HARGHITA Centru 324638 1099 sub medie7 MUREŞ Centru 580815 1207 sub medie8 SIBIU Centru 425134 1311 peste medie9 BACĂU Nord - Est 716176 1319 peste medie
10 BOTOŞANI Nord - Est 448423 1122 sub medie11 IAŞI Nord - Est 829973 1310 peste medie12 NEAMŢ Nord - Est 562489 1080 sub medie13 SUCEAVA Nord - Est 706720 1117 sub medie14 VASLUI Nord - Est 450269 1126 sub medie15 BIHOR Nord - Vest 593055 1025 sub medie16 BISTRIŢA-NĂSĂUD Nord - Vest 317205 1115 sub medie17 CLUJ Nord - Vest 690299 1387 peste medie18 MARAMUREŞ Nord - Vest 511311 1046 sub medie19 SATU MARE Nord - Vest 364938 1064 sub medie20 SĂLAJ Nord - Vest 241840 1152 sub medie21 BRĂILA Sud - Est 360191 1180 sub medie22 BUZĂU Sud - Est 482684 1166 sub medie23 CONSTANŢA Sud - Est 722360 1391 peste medie24 GALAŢI Sud - Est 609480 1254 peste medie25 TULCEA Sud - Est 247444 1180 sub medie26 VRANCEA Sud - Est 390596 1091 sub medie27 ARGEŞ Sud - Muntenia 640871 1374 peste medie28 CĂLĂRAŞI Sud - Muntenia 312879 1120 sub medie29 DÂMBOVIŢA Sud - Muntenia 530354 1232 sub medie30 GIURGIU Sud - Muntenia 281204 1265 peste medie31 IALOMIŢA Sud - Muntenia 287780 1131 sub medie32 PRAHOVA Sud - Muntenia 815657 1403 peste medie33 TELEORMAN Sud - Muntenia 402462 1122 sub medie34 DOLJ Sud - Vest Oltenia 705345 1302 peste medie35 GORJ Sud - Vest Oltenia 377718 1490 peste medie36 MEHEDINŢI Sud - Vest Oltenia 292917 1296 peste medie37 OLT Sud - Vest Oltenia 466821 1263 peste medie
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
4
38 VÂLCEA Sud - Vest Oltenia 407764 1176 sub medie39 ARAD Vest 455952 1215 sub medie40 CARAŞ-SEVERIN Vest 322941 1148 sub medie41 HUNEDOARA Vest 464739 1231 sub medie42 TIMIŞ Vest 678068 1357 peste medie
În continuare se extrage un eşantion aleator nerepetat,conform pasului de numărare care esteegal cu 2, obţinut din raportul volumului intregii populatii (N=42) la volumul eşantionului(n=2).Astfel obţinem:
Nr.Crt. Judeţ Reg.dedezcoltare
Populaţia Câştigulsalarial net
Nivelulcâştigului
salarial1 ILFOV Bucureşti - Ilfov 312317 1697 peste medie2 ALBA Centru 373755 1142 sub medie3 COVASNA Centru 222710 1037 sub medie4 MUREŞ Centru 580815 1207 sub medie5 BACĂU Nord - Est 716176 1319 peste medie6 IAŞI Nord - Est 829973 1310 peste medie7 SUCEAVA Nord - Est 706720 1117 sub medie8 BIHOR Nord - Vest 593055 1025 sub medie9 CLUJ Nord - Vest 690299 1387 peste medie
10 SATU MARE Nord - Vest 364938 1064 sub medie11 BRĂILA Sud - Est 360191 1180 sub medie12 CONSTANŢA Sud - Est 722360 1391 peste medie13 TULCEA Sud - Est 247444 1180 sub medie14 ARGEŞ Sud - Muntenia 640871 1374 peste medie15 DÂMBOVIŢA Sud - Muntenia 530354 1232 sub medie16 IALOMIŢA Sud - Muntenia 287780 1131 sub medie17 TELEORMAN Sud - Muntenia 402462 1122 sub medie18 GORJ Sud - Vest Oltenia 377718 1490 peste medie19 OLT Sud - Vest Oltenia 466821 1263 peste medie20 ARAD Vest 455952 1215 sub medie21 HUNEDOARA Vest 464739 1231 sub medie
2.2 Analiza statistică univariată a variabilelor statistice
2.2.1 Analiza statistică univariată a variabilelor cantitative
2.2.1.1 Numărul populaţiei pe judeţe
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
5
MĂRIMI MEDIIStatistics
Nr.PopulatieiN Valid 21
Missing 0Mean 492735.71
43Median 464739.00
00Mode 222710.00
(a)Percentiles 25 362564.50
0050 464739.00
0075 665585.00
00a Multiple modes exist. The smallest value is shown
INTERPRETĂRI:
Media(Mean) = 492735,71 ,ceea ce reprezintă valoarea medie a populaţiei pe judeţe pentrueşantionul extras.
Mediana(Median) =464739 , ceea ce înseamnă că 50% din judeţele din eşantion au o populaţiede până la 464739 locuitori şi 50 % din judeţe au peste 464739 locuitori.
Modul(Mode) = 222710 ,ceea ce înseamna că cele mai multe judeţe din eşantionul extras au opopulaţie de 222170 locuitori.
Quartila 1 = 362564.5 . 25 % din judeţele din eşantion au o populaţie de până la 362 564 locuitori, iar 75% peste 362564 locuitori.
Quartila 2 = 464739. 50% din judeţele din eşantion au o populaţie de până la 464739 locuitori şi50% din judeţe au peste 464739 locuitori.
Quartila 3 = 665585. 75% din judeţele din eşantion au o populaţie de până la 665585 locuitori,şi25% din judeţe peste 665585 locuitori.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
6
Nr.Populatiei
Frequency Percent Valid PercentCumulative
PercentValid 222710.00 1 4.8 4.8 4.8
247444.00 1 4.8 4.8 9.5287780.00 1 4.8 4.8 14.3312317.00 1 4.8 4.8 19.0360191.00 1 4.8 4.8 23.8364938.00 1 4.8 4.8 28.6373755.00 1 4.8 4.8 33.3377718.00 1 4.8 4.8 38.1402462.00 1 4.8 4.8 42.9455952.00 1 4.8 4.8 47.6464739.00 1 4.8 4.8 52.4466821.00 1 4.8 4.8 57.1530354.00 1 4.8 4.8 61.9580815.00 1 4.8 4.8 66.7593055.00 1 4.8 4.8 71.4640871.00 1 4.8 4.8 76.2690299.00 1 4.8 4.8 81.0706720.00 1 4.8 4.8 85.7716176.00 1 4.8 4.8 90.5722360.00 1 4.8 4.8 95.2829973.00 1 4.8 4.8 100.0Total 21 100.0 100.0
OBSERVAŢII:
4.8% din judeţe au o populaţie de 640871 locuitori.
19% din judeţe au o populaţie de până la 312317 locuitori.
90.5% din judeţe au o populaţie de până la 716176 locuitori.
INDICATORI AI VARIAŢIEI:
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
7
Statistics
Nr.PopulatieiN Valid 21
Missing 0Std. Deviation 176389.73
743Variance 31113339
471.815Range 607263.00Minimum 222710.00Maximum 829973.00Percentiles 25 362564.50
0050 464739.00
0075 665585.00
00
INTERPRETĂRI:
Abaterea standard(STD.Deviation) = 176389.73. Arată cu cît variază, în medie, numărul populațieial județelor din România, din eșantionul extras, față de nivelul mediu al distribuției .În acest caz :
Numărul populaţiei judeţelor din România pentru eşsntionul extras,în medie variază faţă denivelul mediu al distibuţiei cu 176390 locuitori.
Varianţa nu se interpretează.
Coeficientul de variaţie:= = ,, ∗ 100 =35,79%. ă ţ ă, ă −ă, ă.Amplitudinea(Range)= 607263.A fost calculată scăzând valoarea minimă (Minimum) din valoareamaximă(Maximum).
INDICATORII ASIMETRIEI ŞI BOLTIRII
Statistics
Nr.PopulatieiN Valid 21
Missing 0Skewness .269Std. Error of Skewness .501Kurtosis -1.049Std. Error of Kurtosis .972
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
8
Coeficientul de asimetrie Pearson(Skewness) egal 0,269 arată o distribuţie asimetrică la dreapta.
Coeficientul de boltire Ficher (Kurtosis) ega cu -1,049 arată o distribuţe platicurtică.
Interpretarea grafică a variabilei NR.Populaţiei din România în anul 2009.
Nr.Populatiei Stem-and-Leaf Plot
Frequency Stem & Leaf
3.00 2 . 2485.00 3 . 166774.00 4 . 05663.00 5 . 3892.00 6 . 493.00 7 . 0121.00 8 . 2
900000.00800000.00700000.00600000.00500000.00400000.00300000.00200000.00
Nr.Populatiei
5
4
3
2
1
0
Freq
uenc
y
Mean =492735.7143Std. Dev. =176389.73743N = 21
Histogram
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
9
Stem width: 100000.0Each leaf: 1 case(s)
Diagrama BOX-PLOT
INDICATORII CONCENTRĂRII
Concentrarea arată aglomerarea unităţilor populaţiei în jurul unei valori.
Curba de concentrare este reprezentarea grafică a variabilei “q” în funcție de variabila “p”.Valorilecelor două variabile sunt definite de relațiile:
Nr.Populatiei
900000.00
800000.00
700000.00
600000.00
500000.00
400000.00
300000.00
200000.00
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
10
,
ii
ii n
Np cu ni ,1 , unde nNN iii 1
;
,
ii
ii nx
Lqi
cu ni ,1 , unde nxLL iiii 1 ;
Unde, p i- efectivele relative cumulate până la nivelul “i” al caracteristicii de grupare;
qi- valorile globale relative cumulate până la același nivel “i” al caracteristicii de grupare.
Pentru analiza concentrării se va folosi indicele Gini:
Considerând k=3,Obţinem:−Sub-425131 9
425131-627552 6627552-829973 6
Total 21
Indicile Gini al concentrării, după metoda triunghilor (se bazează pe calculul variabilelor p și q).
= ( − )∗ ∗ ∗
Sub-425131 9
323920.5 2915285 2915285 0.27908 9 0.42857 0.24917 0.199346 0.049829
425131-627552 6
526341.5 3158049 6073334 0.58140 15 0.71428 0.71428 0.581408 0.132877
627552-829973 6
728762.5 4372575 10445909 1 21 1 0 0 0
21 10445909 0.182707
Deci = 0,18 ,ceea ce arată o concentrare slabă a variabilei analizate.
Indicele Gini are valori cuprinse intre 0 şi 1,o valoare ce tinde spre 1 arată o concentrareputernică.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
11
2.2.1.2 Câştigul salarial net pe judeţe
MARIMI MEDIIStatistics
Salariul_netN Valid 21
Missing 3Mean 1243.5238Median 1215.0000Mode 1180.00Percentiles 25 1126.5000
50 1215.000075 1346.5000
INTERPRETĂRI:
Media(Mean) = 1243,5238 ,ceea ce reprezintă valoarea medie a salariului net pe judeţe pentrueşantionul extras.
Mediana(Median)=1215 , ceea ce înseamnă că 50% din judeţele din eşantion au un salariu net depână la 1215 lei şi 50 % din judeţe au peste 1215 lei.
Modul(Mode) = 1180 ,ceea ce înseamna că cele mai multe judeţe din eşantionul extras au unsalariu net de 1180 lei.
Quartila 1 = 1126,5 . 25 % din judeţele din eşantion au un salariu net de până la 1126,5 lei , iar75% peste 1126,5 lei.
Quartila 2 = 1215. 50% din judeţele din eşantion au un salariu net de până la 1215 lei şi 50% dinjudeţe au peste 1215 lei.
Quartila 3 = 1346,5. 75% din judeţele din eşantion au un salariu net de până la 1346,5 lei şi 25%din judeţe peste 1346,5 lei.
Salariul_net
Frequency Percent Valid PercentCumulative
PercentValid 1025.00 1 4.2 4.8 4.8
1037.00 1 4.2 4.8 9.51064.00 1 4.2 4.8 14.31117.00 1 4.2 4.8 19.01122.00 1 4.2 4.8 23.8
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
12
1131.00 1 4.2 4.8 28.61142.00 1 4.2 4.8 33.31180.00 2 8.3 9.5 42.91207.00 1 4.2 4.8 47.61215.00 1 4.2 4.8 52.41231.00 1 4.2 4.8 57.11232.00 1 4.2 4.8 61.91263.00 1 4.2 4.8 66.71310.00 1 4.2 4.8 71.41319.00 1 4.2 4.8 76.21374.00 1 4.2 4.8 81.01387.00 1 4.2 4.8 85.71391.00 1 4.2 4.8 90.51490.00 1 4.2 4.8 95.21697.00 1 4.2 4.8 100.0Total 21 87.5 100.0
Missing System 3 12.5Total 24 100.0
INTERPRETARE:
8,3% din judeţele din eşantion au un salariu net de 1180 lei.
28,6% din judeţele din eşantion au un salariu net de pînă la 1131 lei.
85,7% din judeţele din eşantion au un salariu net de până la 1387 lei.
INDICATORII VARIAŢIEIStatistics
Salariul_netN Valid 21
Missing 3Std. Deviation 161.72990Variance 26156.562Range 672.00Minimum 1025.00Maximum 1697.00
Abaterea standard(Std.Deviation) = 161,72990. Arată cu cît variază, în medie, salariul net aljudețelor din România, din eșantionul extras, față de nivelul mediu al distribuției.În acest caz :
Salariul net al judeţelor din România pentru eşsntionul extras,în medie variază faţă de nivelulmediu al distibuţiei cu 161,72990 lei.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
13
Varianţa nu se interpretează.
Coeficientul de variaţie:= = , , ∗ 100 =13%. ă ţ ă, ă −ă, ă.Amplitudinea(Range)= 672.A fost calculată scăzând valoarea minimă (Minimum) din valoareamaximă(Maximum).
INDICATORII ASIMETRIEI ŞI BOLTIRIIStatistics
Salariul_netN Valid 21
Missing 3Skewness 1.116Std. Error of Skewness .501Kurtosis 1.737Std. Error of Kurtosis .972
Coeficientul de asimetrie Pearson(Skewness) egal cu 1,116 arată o distribuţie asimetrică ladreapta.
Coeficientul de boltire Ficher (Kurtosis) egal cu 1,737 arată o distribuţe leptocurtică.
Interpretarea grafică a variabilei Câştigul salarial net pe judeţe:
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
14
__
Diagrama BOX-PLOT
1700.001600.001500.001400.001300.001200.001100.001000.00
Salariul_net
6
5
4
3
2
1
0
Freq
uenc
y
Mean = 1243.5238Std. Dev. = 161.7299N = 21
Histogram
Salarul_net
1700.00
1600.00
1500.00
1400.00
1300.00
1200.00
1100.00
1000.00
1
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
15
INDICATORII CONCENTRĂRII
Concentrarea arată aglomerarea unităţilor populaţiei în jurul unei valori.
Curba de concentrare este reprezentarea grafică a variabilei “q” în funcție de variabila “p”.Valorilecelor două variabile sunt definite de relațiile:
,
ii
ii n
Np cu ni ,1 , unde nNN iii 1
;
,
ii
ii nx
Lqi
cu ni ,1 , unde nxLL iiii 1 ;
Unde, p i- efectivele relative cumulate până la nivelul “i” al caracteristicii de grupare;
qi- valorile globale relative cumulate până la același nivel “i” al caracteristicii de grupare.
Pentru analiza concentrării se va folosi indicele Gini:
Considerând k=3,Obţinem:−Sub 1249 13
1249-1473 61473-1697 2
Indicile Gini al concentrării, după metoda triunghilor :
= ( − )∗ ∗ ∗
Sub1249 13 1137 14781 14781 0.565953 13 0.6190 0.5439 0.5121 0.03191249-1473 6 1361 8166 22947 0.878623 19 0.9048 0.9048 0.8786 0.02611473-1697 2 1585 3170 26117 1 21 1 0 0 0
21 26117 0.0580
Deci = 0,0580 ,ceea ce arată o concentrare slabă a variabilei analizate.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
16
Indicele Gini are valori cuprinse intre 0 şi 1,o valoare ce tinde spre 1 arată o concentrareputernică.
2.2.2 Analiza statistică univariată a variabilelor cantitative
2.2.2.1 Regiunea de dezvoltare
Reg_de_Dezv
Frequency Percent Valid PercentCumulative
PercentValid Bucuresti - Ilfov 1 4.8 4.8 4.8
Centru 3 14.3 14.3 19.0Nord - Est 3 14.3 14.3 33.3Nord - Vest 3 14.3 14.3 47.6Sud - Est 3 14.3 14.3 61.9Sud - Muntenia 4 19.0 19.0 81.0Sud - Vest Oltenia 2 9.5 9.5 90.5Vest 2 9.5 9.5 100.0
Total 21 100.0 100.0
INTERPRETĂRI:
Regiunea Sud-Muntenia reprezintă 19% din totalul regiunilor implicate în eşantion.
Regiunea Sud-Est reprezintă 14,3% din totalul regiunilor implicate în eşantion.
Regiunea Vest reprezintă 9,5% din totalul regiunilor implicate în eşantion.
47,6 % reprezintă ponderea ocupată de regiunile Bucuresti-Ilfov,Centru,Nord-Est,Nord-Vest.
19% reprezintă procentajul ocupa de regiunile Bucuresti-Ilfov şi Centru.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
17
Se observă că regiunea Sud-Muntenia este cel mai des întânită,având cea mai mare frecvenţă(4).
2.2.2.2 Nivelul câştigului salarial
Niv_castig_sal
Frequency Percent Valid PercentCumulative
PercentValid peste medie 8 38.1 38.1 38.1
sub medie 13 61.9 61.9 100.0Total 21 100.0 100.0
INTERPRETĂRI:
8 (38,1%)din judeţele eşantionului au nivelul salariului net peste medie, iar 13 (61,9%) judeţe submedie.
38,1% reprezintă procentajul acoperit de judeţele cu un salsriul net peste medie.
3
4
22
Structura judeţelor din România în anul 2009 peregiuni de dezvoltare
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
17
Se observă că regiunea Sud-Muntenia este cel mai des întânită,având cea mai mare frecvenţă(4).
2.2.2.2 Nivelul câştigului salarial
Niv_castig_sal
Frequency Percent Valid PercentCumulative
PercentValid peste medie 8 38.1 38.1 38.1
sub medie 13 61.9 61.9 100.0Total 21 100.0 100.0
INTERPRETĂRI:
8 (38,1%)din judeţele eşantionului au nivelul salariului net peste medie, iar 13 (61,9%) judeţe submedie.
38,1% reprezintă procentajul acoperit de judeţele cu un salsriul net peste medie.
13
3
33
2
Structura judeţelor din România în anul 2009 peregiuni de dezvoltare
Bucuresti - Ilfov
Centru
Nord - Est
Nord - Vest
Sud - Est
Sud - Muntenia
Sud - Vest Oltenia
Vest
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
17
Se observă că regiunea Sud-Muntenia este cel mai des întânită,având cea mai mare frecvenţă(4).
2.2.2.2 Nivelul câştigului salarial
Niv_castig_sal
Frequency Percent Valid PercentCumulative
PercentValid peste medie 8 38.1 38.1 38.1
sub medie 13 61.9 61.9 100.0Total 21 100.0 100.0
INTERPRETĂRI:
8 (38,1%)din judeţele eşantionului au nivelul salariului net peste medie, iar 13 (61,9%) judeţe submedie.
38,1% reprezintă procentajul acoperit de judeţele cu un salsriul net peste medie.
Structura judeţelor din România în anul 2009 peregiuni de dezvoltare
Bucuresti - Ilfov
Centru
Nord - Est
Nord - Vest
Sud - Est
Sud - Muntenia
Sud - Vest Oltenia
Vest
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
18
2.3 Analiza bivariată a variabilelor statistice
2.3.1 Analiza bivariată a variabilelor cantitative
Din output-ul prezentat rezultă statisticile pentru fiecare variabilă şi coeficientul de corelaţiePearson.Acest tabel rerezintă matricea coeficienţilor de corelaţie.
Observăm că coeficientul de corelaţie Pearson obţinut este egal cu 0,189.De aici rezultă ca întrevariabilele studiate este o legătură directă,ambele variind în acelaşi sens.
Cu cât numarul populaţiei este mai mare şi salariul net aferent acelui judeţ este mai mare.
8
13
Structura judeţelor din România dupa nivelulcâştigului salarial net
peste medie
sub medie
Correlations
1 .189.412
21 21.189 1.412
21 21
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
Nr_pop
Sal_net
Nr_pop Sal_net
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
19
Între cele 2 variabile există o corelaţie slabă,deoarece coeficientul de corelaţie Pearson tinde spre0.
2.3.2 Analiza bivariată a variabilelor calitative(Regiunea de dezvoltare şinivelul câştigului net)
SalariuRegiunea
Nivelul salariului pestemedie
Nivelul salariului submedie Total:
Bucuresti - Ilfov 1 0 1Centru 0 3 3Nord - Est 2 1 3Nord - Vest 1 2 3Sud - Est 1 2 3Sud - Muntenia 1 3 4Sud - Vest Oltenia 2 0 2Vest 0 2 2
Total: 8 13 21
2 din judeţele din regiunea Nord-Est au nivelul salariului peste medie.
3 judeţe din regiunea Sud-Muntenia au salariul net sub medie.
1 judeţ din regiunea Sud-Estică au salariul net peste medie.
FRECVENŢE RELATIVE
Frecvenţe relative parţiale = ..Frecvenţe relative parţiale
0.047619048 00 0.142857143
0.095238095 0.0476190480.047619048 0.0952380950.047619048 0.0952380950.047619048 0.1428571430.095238095 0
0 0.0952380959,52 % din judeţe aparţin regiunii Nord-Est cu un salariu peste medie.
14,28% din judeţe aparţin regiunii Centrale cu un salariu net sub medie.
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
20
4,76 %din judeţe aparţin regiunii Sud-Muntenia cun un salariu net peste medie.
Frecvenţe relative marginale
SalariuRegiunea
Nivelulsalariului
peste medie
Nivelulsalariului sub
medie Total:Frecv.rel
marginaleBucuresti - Ilfov 1 0 1 1 0 0.047619048Centru 0 3 3 0 3 0.142857143Nord - Est 2 1 3 2 1 0.142857143Nord - Vest 1 2 3 1 2 0.142857143Sud - Est 1 2 3 1 2 0.142857143Sud - Muntenia 1 3 4 1 3 0.19047619Sud - Vest
Oltenia 2 0 2 2 0 0.095238095Vest 0 2 2 0 2 0.095238095
Total: 8 13 21 0.380952381 0.619047619 1
38,09 % din judeţe au un salariu net peste medie.
61,90% din judeţe au un salariu net sub medie.
14,28% din judeţe aparţin regiunii Centrale.
19,04% din judeţe aparţin regiunii Sud-Muntenia.
9,52% din judeţe aparţin regiunii de Vest.
Frecvenţe relative condiţionate
SalariuRegiunea
Nivelulsalariului
peste medie
Nivelulsalariuluisub medie Total: / = ∙ / = ∙
Bucuresti -Ilfov 1 0 1 1 0 0.125 0
Centru 0 3 3 0 1 0 0.230769Nord - Est 2 1 3 0.666667 0.333333 0.25 0.076923Nord - Vest 1 2 3 0.333333 0.666667 0.125 0.153846Sud - Est 1 2 3 0.333333 0.666667 0.125 0.153846Sud -
Muntenia 1 3 4 0.25 0.75 0.125 0.230769Sud - Vest
Oltenia 2 0 2 1 0 0.25 0Vest 0 2 2 0 1 0 0.153846
Total: 8 13 21
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
21
Din totalul judeţelor din regiunea Sud-Muntenia , 25% au salariul net peste medie şi 75% submedie.
Dintotalul judeţelor din regiunea Nord-Estică , 66,66% au salariul net peste medie şi 33,34% submedie.
În regiunea centrală nivelul salariului este 100% sub medie.
În regiunea Bucureşti-Ilfov nivelul salariului net este 100% peste medie.
25% din totalul judeţelor ce posedă un salariu net peste medie sunt din regiunea Nord-Estică.
23,07% din totalul judeţelor ce posedă un salariu net sub medie sunt din regiunea Sud.Muntenia.
12,5% din totalul judeţelor cu un salariu net peste medie sunt din regiunea Nord-Vestică.
2.4 Estimarea prin interval de încredere a mediei
2.4.1 Estimarea prin interval de încredere a unei medii
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Peste medie
0.047619048
0.095238095
0.047619048
0.047619048
0.047619048
0.095238095
Structura judeţelor după regiune şi Salariul net
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
21
Din totalul judeţelor din regiunea Sud-Muntenia , 25% au salariul net peste medie şi 75% submedie.
Dintotalul judeţelor din regiunea Nord-Estică , 66,66% au salariul net peste medie şi 33,34% submedie.
În regiunea centrală nivelul salariului este 100% sub medie.
În regiunea Bucureşti-Ilfov nivelul salariului net este 100% peste medie.
25% din totalul judeţelor ce posedă un salariu net peste medie sunt din regiunea Nord-Estică.
23,07% din totalul judeţelor ce posedă un salariu net sub medie sunt din regiunea Sud.Muntenia.
12,5% din totalul judeţelor cu un salariu net peste medie sunt din regiunea Nord-Vestică.
2.4 Estimarea prin interval de încredere a mediei
2.4.1 Estimarea prin interval de încredere a unei medii
Peste medieSub medie
0.047619048 0.142857143
0.0952380950.047619048
0.047619048
0.095238095
0.0476190480.095238095
0.047619048 0.142857143
0.095238095 0.095238095
Structura judeţelor după regiune şi Salariul net
Vest
Sud - Vest Oltenia
Sud - Muntenia
Sud - Est
Nord - Vest
Nord - Est
Centru
Bucuresti - Ilfov
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
21
Din totalul judeţelor din regiunea Sud-Muntenia , 25% au salariul net peste medie şi 75% submedie.
Dintotalul judeţelor din regiunea Nord-Estică , 66,66% au salariul net peste medie şi 33,34% submedie.
În regiunea centrală nivelul salariului este 100% sub medie.
În regiunea Bucureşti-Ilfov nivelul salariului net este 100% peste medie.
25% din totalul judeţelor ce posedă un salariu net peste medie sunt din regiunea Nord-Estică.
23,07% din totalul judeţelor ce posedă un salariu net sub medie sunt din regiunea Sud.Muntenia.
12,5% din totalul judeţelor cu un salariu net peste medie sunt din regiunea Nord-Vestică.
2.4 Estimarea prin interval de încredere a mediei
2.4.1 Estimarea prin interval de încredere a unei medii
Structura judeţelor după regiune şi Salariul net
Vest
Sud - Vest Oltenia
Sud - Muntenia
Sud - Est
Nord - Vest
Nord - Est
Centru
Bucuresti - Ilfov
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
22
2.4.1.1 Estimarea prin nterval de încredere a mediei populaţiei
One-Sample Statistics
N Mean Std. DeviationStd. Error
MeanNr_pop 21 492735.71
43 176389.73743 38491.39636
One-Sample Test
Test Value = 0
t df Sig. (2-tailed)Mean
Difference
95% Confidence Intervalof the Difference
Lower UpperNr_pop 12.801 20 .000 492735.714
29412444.06
84573027.36
01
ÎN CAZUL CERCETAT AVEM:
Media: 492735,71 ≈ 492736 locuitori
Abaterea Standart: 176389,73743 ≈ 176390
Eroarea standard: 38491,396
Limita inferioară a intervalului de încredere: 412444.0684
Limita superioară a intervalului de încredere: 573027,3601
INTERPRETARE:
Se poate garanta cu o probabilitate de 95% că populaţia medie a întregii populaţii din care a fostextras eşantionul este acoperită de intervalul [412444 ; 573027]
2.4.1.2 Estimarea prin interval de încredere a mediei salariului net
One-Sample Statistics
N Mean Std. DeviationStd. Error
MeanSalariul_net 21 1243.5238 161.72990 35.29236
One-Sample Test
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
23
Test Value = 0
t df Sig. (2-tailed)Mean
Difference
95% Confidence Intervalof the Difference
Lower UpperSalariul_net 35.235 20 .000 1243.52381 1169.9052 1317.1424
ÎN CAZUL CERCETAT AVEM:
Media: 1243,5238 lei
Abaterea Standart: 161,7299 lei
Eroarea standard: 35,29236 lei
Limita inferioară a intervalului de încredere: 1169,9052 lei
Limita superioară a intervalului de încredere: 1317,1424 lei
INTERPRETARE:
Se poate garanta cu o probabilitate de 95% că salariul mediu net al întregii populaţii din care afost extras eşantionul este acoperită de intervalul [1169,9052 ; 1317,1424]
2.5 Testarea statistică
2.5.1 Testarea ipotezelor asupra unui eşantion
Se va testa dacă media populaţiei judeţelor din eşantion este egală cu media populaţieijudeţelor din întreaga Românie.
IPOTEZELE STATISTICE: : =: ≠ALEGEREA TESTULUI STATISTIC:
Se va folosi statistica t (Student) ,deoarece volumul eşantionului este mai mic decât 30.(n<30)
REGULA DE DECIZIE:
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
24
Dacă tt teorcalc se respinge ipoteza H 0 , se acceptă ipoteza H 1 .
Dacă tt teorcalc se acceptă ipoteza H 0 .
One-Sample Statistics
N Mean Std. DeviationStd. Error
MeanNr_populatiei 21 492735.71
43 176389.73743 38491.39636
One-Sample Test
Test Value = 511189.5
t df Sig. (2-tailed)Mean
Difference
95% Confidence Intervalof the Difference
Lower UpperNr_populatiei
-.479 20 .637-
18453.78571
-98745.431
6
61837.8601
Din output-ul prezentat observăm ca valoarea Sig= 0,637 . Având riscul asumat = 0,05 , Sig>,deci se acceptă ipoteza nulă.În rezultat se poate garanta cu o probabilitate de 95% că nu existădiferenţe semnificative între media eşantionului şi media întregii populaţii.
Se va testa dacă proporţia judeţelor din eşantion cu nivelul salariului peste medie este egal cuproporţia judeţelor cu nivelul salariului peste medie din întreaga Românie.
IPOTEZE STATISTICE:
pH p00 :
pH p01 :
TESTUL STATISTIC:
Valoarea se va calculca cu ajutorul statisticii t , după forula: nff
f pt calc )1(
0
REGULA DE DECIZIE:
Dacă tt teorcalc se respinge ipoteza H 0 , se acceptă ipoteza H 1 .
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
25
Dacă tt teorcalc se acceptă ipoteza H 0 .
Proporţia judeţelor din eşantion cu nivelul salariului peste medie:
= 821 ∗ 100 = 38,09Proporţia judeţelor cu nivelul salariului peste medie din întreaga Românie:
= 1642 ∗ 100 = 38,09CALCULAREA VALORII TEST:
= 38,09 − 38,0938,09(100 − 38,09)/√21 = 0= 2,080-Valoarea se citeţte din tabelul Student.
Comparând cele 2 valori obţinute | | < - se acceptă ipoteza
Deci, Se poate garanta cu o probabilitate de 95% că proporţia judeţelor din eşantion cu nivelulsalariului peste medie este egală cu proporţia judeţelor din România cu nivelul salariului pestemedie.
2.5.2 Testarea ipotezelor asupra 2 eşantioane independente
peste medie sub medie1697 11421319 10371310 12071387 11171391 10251374 10641490 11801263 1180
12321131112212151231
IPOTEZE STATISTICE:
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
26
: − = 0: − ≠ 0TESTUL STATISTIC:
Pentru calcul se va folosi testul statistic t , calculat după formula := −+
REGULA DE DECIZIE:
Dacă tt teorcalcse respinge ipoteza H 0 , se acceptă ipoteza H 1 ,pentru un risc %5
Dacă tt teorcalcse acceptă ipoteza H 0 .
t-Test: Two-Sample Assuming Unequal Variances
Variable 1 Variable 2Mean 1403.875 1144.846154Variance 18649.26786 5025.141026Observations 8 13Hypothesized Mean Difference 0df 9t Stat 4.968745483P(T<=t) one-tail 0.000385614t Critical one-tail 1.833112923P(T<=t) two-tail 0.000771228t Critical two-tail 2.262157158
Din datele obţinute observăm | | = 4,96 > = 1.96 ,de unde rezultă că se respindeipoteza nulă.
Se poate garanta cu o probabilitate de 95% că există diferenţe semnificative între mediile celor 2eşantioane.
2.5.3 Testarea ipotezelor asupra 3 sau mai multe eşantioane independente
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
27
IPOTEZE STATISTICE : = ⋯: ≠ ≠ ⋯TESTAREA SE VA FACE DUPĂ STATISTICA FICHER
= − 1−k-1 măsoară variaţia sub influenţa factoriloe esenţiali de grupare
n-k măsoară variaţia sub influenţa factorilor întâmplători de grupare
REGULA DE DECIZIE :
Dacă > , , sau Sig< , se respinge ipoteza
Dacă ≤ , , sau Sig ≥ , se acceptă ipoteza
Anova: SingleFactor
SUMMARYGroups Count Sum Average Variance
Column 1 1 1697 1697 #DIV/0!Column 2 3 3386 1128.666667 7358.333333Column 3 3 3746 1248.666667 13022.33333Column 4 3 3476 1158.666667 39482.33333Column 5 3 3751 1250.333333 14840.33333Column 6 4 4859 1214.75 13758.25Column 7 2 2753 1376.5 25764.5Column 8 2 2446 1223 128
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
28
ANOVASource of Variation SS df MS F P-value F crit
Between Groups 306557.3214 7 43793.90306 2.628759495 0.062904137 2.832097502Within Groups 216573.9167 13 16659.53205
Total 523131.2381 20
= 2,6287 < = 2,832 ,se acceptă ipoteza
INTERPRETARE:
Se poate garanta cu o probabilitate de 95% că factorul de grupare “Regiunea de dezvoltare” nuare nici o influenţă semnificativă asupra valorii salariului net.
3. Analiza statistică descriptivă a unei serii de timp
3.1 Prezentarea variabilei statistice
Variabila statistică este numărul mediu al pensionarilor în mii de personae din anul 2000 până înanul 2009, şi este prezentată în tabelul de mai jos:
Anul 2000 2001 2001 2003 2004 2005 2006 2007 2008 2009Nr.Pensionarilor 6154 6351 6378 6303 6233 6067 5806 5745 5701 5689
3.2 Analiza statistică folosind indici statistici simpli
3.2.1 Indicii absoluţi
Indicii obsoluţi, sau sporul absolut, exprimă variaţia absolută a nivelului variabilei “numarul depensionari” pe parcursul perioadei de timp 2000-2009. Sporul absolut se va calcula cu bază fixă,∆ = − ,şi bază în lanţ , ∆ = − .
Datele vor fi sistematizate intr-un tabel:
Anul Nr.Pensionarilor Sporul absolutCu bază fixă Cu baza în lanţ
2000 6154 - -2001 6351 197 197
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
29
2002 6378 224 272003 6303 149 -752004 6233 79 -702005 6067 -87 -1662006 5806 -348 -2612007 5745 -409 -612008 5701 -453 -442009 5689 -465 -12
INTERPRETARE:
Numarul de pensionari din România a crescut cu 149 mii personae in anul 2003 faţă deanul 2000.
Numărul de pensionari din România a scăzut cu 409 mii personae în anul 2007 faţă de anul2000.
Numărul de pensionari din România a scăzut în anul 2005 faţă de 2004 cu 166 miipersoane.
Numărul de pensionari din România a scăzut în anul 2009 faţă de anul 2008 cu 12 miipersoane.
3.2.1 Indici relativi
Indicii în mărime relativă sunt ritmul (indicele) de variaţie şi ritmul sporului, care la rîndul lor secalculează cu bază fixă şi cu baza în lanţ.
Anul Nr.Pensionarilor Ritmul de variaţie Ritmul sporuluiCu bază fixă Cu baza în
lanţCu bazăfixă(%)
Cu baza înlanţ(%)
2000 6154 - - - -2001 6351 1,0320 1,0320 3,20 3,202002 6378 1,0364 1,0043 3,64 0,432003 6303 1,0242 0,9882 2,42 -1,182004 6233 1,0128 0,9889 1,28 -1,112005 6067 0,9859 0,9734 -1,41 -2,662006 5806 0,9435 0,9570 -5,65 -4,302007 5745 0,9335 0,9895 -6,65 -1,052008 5701 0,9264 0,9923 -7,36 -0,772009 5689 0,9244 0,9979 -7,56 -0,21
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
30
INTERPRETĂRI:
Numărul de pensionari din România a crescut în anul 2004 de 1,0128 ori faţă de anul 2000,sau cu1,28% .
Numărul de pensionari din România acrescut în anul 2007 faţă de anul 2006 de 0,9895 ,adică ascăzut cu 1,05 % in 2007 faţă de 2006.
3.2.3 Indici exprimaţi prin valori medii
Indicatorii medii sunt Nivelul mediu,Sporul mediu,Ritmul mediu, şi ritmul mediu al sporului.
A.NIVELUL MEDIU
= ∑ = 6042710 = 6042.7( )Numărul mediu anual de pensionari este de 6042,7mii de persoane (6 042 700).
B.SPORUL MEDIU
∆ = ∑ ∆− 1 = 197 + 27 − 75 − 70 − 166 − 261 − 61 − 44 − 1210 − 1 = −4659 = −51.666În medie numărul de pensionari din România, a scăzut cu 51666 pensionari pe an.
C.RITMUL MEDIU
= = 0.9913În medie numărul de pensionari din România a crescut de 0,9913 ori pe an.
D.RITMUL MEDIU AL SPORULUI
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
31
= ( − 1) ∗ 100 = (0.9913 − 1) ∗ 100 = 0.0087 ∗ 100 = 0.87%În medie numărul de pensionari din România, a scăzut cu 0,87% anual.
Interpretarea grafică a variabilei Nr.de pensionari din România din 2000 până în 2009.
5200
5400
5600
5800
6000
6200
6400
2000 2001 2002
6154
6351 6378
NUMĂRUL MEDIU AL PENSIONARILOR DINROMÂNIA
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
31
= ( − 1) ∗ 100 = (0.9913 − 1) ∗ 100 = 0.0087 ∗ 100 = 0.87%În medie numărul de pensionari din România, a scăzut cu 0,87% anual.
Interpretarea grafică a variabilei Nr.de pensionari din România din 2000 până în 2009.
2002 2003 2004 2005 2006 2007 2008
63786303
6233
6067
58065745 5701
NUMĂRUL MEDIU AL PENSIONARILOR DINROMÂNIA
PRACTICĂ DE SPECIALITATE ÎN STATISTICĂ 28 iunie 2012
31
= ( − 1) ∗ 100 = (0.9913 − 1) ∗ 100 = 0.0087 ∗ 100 = 0.87%În medie numărul de pensionari din România, a scăzut cu 0,87% anual.
Interpretarea grafică a variabilei Nr.de pensionari din România din 2000 până în 2009.
2008 2009
5701 5689
NUMĂRUL MEDIU AL PENSIONARILOR DINROMÂNIA