Proiect SPSS - Nivel de Trai

20
Universitatea Dunarea de Jos Galati Facultatea de Economie si Administrarea Afacerilor Instrumente software pentru prelucrarea statistica a datelor Proiect semestrial SPSS

description

Proiect SPSS - Nivel de Trai

Transcript of Proiect SPSS - Nivel de Trai

Page 1: Proiect SPSS - Nivel de Trai

Universitatea Dunarea de Jos Galati

Facultatea de Economie si Administrarea Afacerilor

Instrumente software pentru prelucrarea statistica a datelor

Proiect semestrial

SPSS

SIMR II

Page 2: Proiect SPSS - Nivel de Trai

2

Cuprins

1. Descrierea problemei de studiat si alegerea variabilelor analizate........................................................3

2. Realizarea bazei de date in SPSS si definirea variabilelor....................................................................3

3. Indicatorii tendintei centrale..................................................................................................................4

3.1. Media aritmetica................................................................................................................................4

3.2. Modulul...............................................................................................................................................6

3.3. Mediana...............................................................................................................................................6

3.4. Media geometrica................................................................................................................................7

4. Indicatorii variatiei.................................................................................................................................8

4.1. Dispersia.............................................................................................................................................8

4.2. Amplitudinea.......................................................................................................................................8

4.3. Abaterea standard................................................................................................................................9

4.4. Coeficientul de variatie.......................................................................................................................9

5. Tabel de frecventa................................................................................................................................10

5.1. Tabel de frecventa pentru o variabila calitativa................................................................................10

5.2. Tabel de frecventa pentru o variabila cantitativa..............................................................................10

6. Grafic de tip “pie”................................................................................................................................11

7. Coeficientul de corelatie Pearson.........................................................................................................11

8. Testarea ipotezelor statistice................................................................................................................12

8.1. Testarea egalitatii unei medii cu o valoare specificata.....................................................................12

8.2. Testarea diferentei intre 2 medii.......................................................................................................13

9. Impartirea unei variabile cantitative in interval...................................................................................13

10. Ecuatia de regresie................................................................................................................................14

Page 3: Proiect SPSS - Nivel de Trai

2

1. Descrierea problemei de studiat si alegerea variabilelor analizate

Scopul acestui studiu a fost aflarea opiniei oamenilor in legatura cu mai multe aspect din viata lor, cum ar fi: modalitatile de petrecere a timpului liber, ocupatia, nivelul de trai, salariul.

Pe scurt, prin intermediul acestui studiu am dorit sa aflam cum apreciaza oamenii nivelul lor de trai prin prisma salariului, raportat la o serie de factori: varsta, vechime, numarul membrilor din familie, nivelul de educatie etc.

Pentru a analiza acest subiect si a obtine niste rezultate cat mai apropiate de adevar, chestionarul ar trebui sa fie aplicat unui esantion mult mai mare insa pentru acest proiect am realizat o baza de date cu un esantion de 30 de personae cu varsta cuprinsa intre 18 si 77 de ani. Chestionarul este format dintr-un set de intrebari deschise dar si cateva confidential referitoare la situatia financiara prezenta raportata la cea din trecut.

2. Realizarea bazei de date in SPSS si definirea variabilelor

Atributele variabilelor sunt definite in fereastra Data View – Variable View.

Definirea variabilelor in baza de date, prin fereastra Variable View:

Page 4: Proiect SPSS - Nivel de Trai

2

Popularea bazei de date, folosind fereastra Data View:

3. Indicatorii tendintei centrale

3.1. Media aritmetica

Am calculat media aritmetica a tuturor variabilelor de tip numeric (membri_familie, varsta, educatie, trai, timp_liber,concediu si vechime)

Ca atare, pentru:

- numarului membrilor din familie in medie cei 30 de intervievati au aproximativ cate 4 membri in familie.

- varsta intervievatilor este in medie de 38 de ani.

Page 5: Proiect SPSS - Nivel de Trai

2

- au un salariu de aproximativ 1687 lei

- in medie, nivelul de educatie se afla intre liceu si postliceala

- nivelul de trai in medie, printre cei 30 de intervievati este aproximav la fel

- ca modalitati de petrecere a timpului liber prefera vacantele in tara sau in strainatate

- media zilelor de concediu se afla intre 10 si 15 zile

- vechimea in munca aproximativ 5-10 ani.

Prin intermediul meniului Analyze ->Compare Means->Means am calculat:

- media aritmetica a salariului in functie de varsta

- media aritmetica a varstei in functie de sex

- media aritmetica a numarului membrilor din familie in functie de mediul de provenienta

Page 6: Proiect SPSS - Nivel de Trai

2

De unde rezulta ca, atat in mediul urban cat si in cel rural numarul membrilor din familie este de aproximativ 4 persoane si ca din totul a 30 de intervievati, media varstei celor de sex masculin este de aproximativ 38 de ani iar a sexului feminin este de aproximativ 34 de ani.

3.2. Modulul

Modulul ne indica acea valoare a variabilei care corespunde celui mai mare numar de unitati sau aceea care are cea mai mare frecventa de aparitie.

In cazul nostru:

- numarul membrilor de familie a celor mai multi dintre intervievati este 3

- varsta a celor mai multi dintre intervievati este de 45

- salariul lunar este de 1200

- nivelul de educatie a celor mai multi este faculatea sau colegiul

- nivelul de trai perceput de majoritatea intervievatilor este mai bun

- majoritatea intervievatilor prefera plimbarile in aer liber, nu au avut zile de concediu iar vechimea in munca este de 2-5 ani

3.3. Mediana

Mediana imparte numarul unitatilor investigate in 2 parti egale.

Page 7: Proiect SPSS - Nivel de Trai

2

Astfel, valoarea numarului membrilor din familie ce imparte distributia aferenta celor 30 de intervievati in 2 parti de volum egal este de 4.

- varsta este de aproximativ 36 de ani

- salariul lunar este de 1275 lei

- nivelul de educatii este postliceala

- nivelul de trai este aproximativ la fel

- modalitatea de petrecere a timpului liber sunt vacantele in tara

- numarul de zile de concediu mai putin de 10 zile

- vechimea in munca intre 2-5 ani

3.4. Media geometrica

Media geometrica reprezintă acea valoare a caracteristicii observate care dacă ar înlocui fiecare valoare individuală din serie produsul acestora nu s-ar modifica, calculata de asemenea prin intermediul meniului Analyze ->Compare Means->Means->Geometric Mean.

- media geometrica a salariului in functie de ocupatie si de nivelul de educatie

- mediageometrica a vechimii in functie de sex

Page 8: Proiect SPSS - Nivel de Trai

2

4. Indicatorii variatiei

4.1. Dispersia

Dispersia este un indicator cu un character economic abstract, rezultatul obtinut exprimandu-se in buc2, ceea ce din punct de vedere economic nu poate fi interpretat.

4.2. Amplitudinea

Page 9: Proiect SPSS - Nivel de Trai

2

Este un indicator simplu al variatiei care ofera o imagine generala asupra dispersiei, fiind distanta dintre nivelul maxim si minim al variabilei.

In cazul nostru, pentru variabila salariu, distanta dintre cel mai mic salariu in randul celor intervievati de 299,99 lei si cel mai mare 6000 lei, este de 5700,01 lei.

4.3. Abaterea standard

Abaterea standard reprezinta media patratica a nivelurilor individuale ale caracteristicii fata de media lor.

Deoarece salariul este o caracteristica statistica cu variatie discreta, se va rotunji rezultatul la valoarea intreaga 1570 lei/persoana.

Putem concluziona ca fiecare persoana din cele 30 intervievate, s-a abatut de la salariul mediu al esantionului selectat, in medie cu 1570 lei/persoana.

4.4. Coeficientul de variatie

Se calculeaza ca raport intre abaterea medie si nivelul mediu al variabilei, iar pentru a se interpreta mai usor se exprima in procente.

In cazul varstei intervievatului, valorile determinate ale coeficientului de variatie este mai mare de 35%, astfel concluzionam ca esantionul de 30 de persoane analizate este unul eterogen din perspectiva variabilei varsta si, totodata, rezulta ca media varstei este mai putin reprezentativa din punct de vedere static.

Page 10: Proiect SPSS - Nivel de Trai

2

5. Tabel de frecventa

5.1. Tabel de frecventa pentru o variabila calitativa

Luand in considerarea variabila calitativa ocupatia intervievtului, observam ca majoritatea de 13,3 % din totalul de 100% sunt asistent call center urmat apoi de un procent de 10% de ocupatiile profesor si pensioner.

Cel mai mic procent il ocupa ocupatia de director, casnic si manager acestea avand un procent de 3,3% din totalul de intervievati.

5.2. Tabel de frecventa pentru o variabila cantitativa

Page 11: Proiect SPSS - Nivel de Trai

2

Pentru variabila cantitativa am luat in considerare numarul membrilor din familie unde se poate observa ca frecventa cea mai mare si anume de 11 raspunsuri din 30 a fost ca intervievatul face parte dintr-o familie cu 3 membri. Cea mai mica frecventa 3,3% dintr-un singur raspuns rezulta ca o singura persoana din 30 are in familie 8 membri.

6. Grafic de tip “pie”

Ponderea persoanelor cuprinse in esantion, in functie de sexul acestora, respectiv 43,33% de sex feminin si majoritatea de 56,67% de sex masculin.

7. Coeficientul de corelatie Pearson

Page 12: Proiect SPSS - Nivel de Trai

2

Pentru aceasta corelatie am folosit o variabila numerica salariu si o variabila ordinala vechimea in munca. Astfel, dorim sa aflam daca intre cele 2 variabile exista vreo legatura, asociere, corelatie.

Observam ca r Pearson = 0,031 foarte aproape de valoarea 0 ceea ce inseamna ca exista o relatie foarte slaba intre cele 2 variabile.

Valoarea Sig. (2-tailed)= 0,872 > 0,5 intareste concluzia ca, statistic vorbind, nu exista nici o legatura semnificativa intre cele 2 variabile, rezultand astfel ca descresterile si cresterile intr-o variabila nu are o legatura semnificativa cu descresterile si cresterile in cea de-a doua variabila.

8. Testarea ipotezelor statistice

8.1. Testarea egalitatii unei medii cu o valoare specificata

Pentru a testa egalitatea unei medii cu o valoare specificata am ales variabila salariu. Se va analiza daca salariul curent al unei persoane difera sau nu de 1400 RON. Testarea egalitatii salariului mediu la nivel de esantion cu valoare fixa se realizeaza cu optiunea One Sample T test.

Output-ul ne spune ca avem un numar N=30 de observanti, ca avem o medie aritmetica a salariului de 1686,72 RON, o abatere standard de 1570,47 si o eroare standard a mediei aritmetice de 286,72.

Din cel de-al doilea tabel rezulta ca testul t privind media unui singur esantion este 1 iar valoarea p este 0,326 care este mai mare decat 0,05 , considerate in Confidence Interval de unde rezulta ca salariul intervievatilor nu este semnificativ diferita de valoarea 1400 RON. Testul t pozitiv ne indica faptul ca salariul mediu al esantionului este mai mare de 1400 RON.

Page 13: Proiect SPSS - Nivel de Trai

2

8.2. Testarea diferentei intre 2 medii

Testarea se realizeaza cu ajutorul testului Independent Samples T test. Demersul este :

Analyze->Compare Means -> Independent Samples T test. Se va testa daca bugetul inainte de criza este acelasi pentru sexul feminine si masculin. Ipoteza privind egalitatea mediilor se formuleaza astfel:

H0: X1 = X2

H1: X1 ≠ X2

Testul t este egal cu 0,605 respectiv 0,626 cu o probabilitate Sig. de 0,55 si 0,536> 0,05, ceea ce arata ca intre cele 2 medii ale bugetului lunar pentru cele 2 sexe (1840 lei pentru masculin si 1486 pentru feminine) exista diferente semnificative.

9. Impartirea unei variabile cantitative in interval

Rezolvarea a fost facuta in Excel, impartinf variabila cantitativa varsta in intervale egale de 10 unitati.

Page 14: Proiect SPSS - Nivel de Trai

2

Cu ajutorul functie Pivot Table am creat tabela pivot ce avea ca si continut varstele celor 30 de intervievati. Cu ajutorul functie Group am impartit variabila in intervale egale incepand de la 18 (varsta minima) pana la 69 (varsta maxima)

In dreptul coloanei Total se afla frecventa aparitiei varstelor cuprinse in intervalul indicat din coloana din stanga.

In coloana Xi se calculeaza media aritmetica pe fiecare interval, media finala a intervalelor fiind de 38,5 ani.

10. Ecuatia de regresie

A fost realizata deasemenea in Excel, unde pentru acest tip de analiza am utilizat doua variabile numerice si anume, nivel de trai (variabila endogena)si salariul/ venitul persoanei(variabila exogena) deoarece nivelul de trai depinde de salariul/ veniul persoanei in cauza.

Page 15: Proiect SPSS - Nivel de Trai

2

1. Coeficientul multiplu de corelatie R= 0,44517432 € [0;1], iar cu cat valoarea lui R este mai aproape de 0, cu atat legatura este mai slaba intre cele doua variabile si cu cat e mai aproape de 1, legatura este mai stransa. In cazul nostru R= 0,44, arata o legatura slaba intre cele 2 variabile.

2. Coeficientul de determinare R Square arata ca 19,81 % din variatia nivelului de trai este explicata de variatia salariului

3. Adjusted R square este valoarea corecta a coeficientului de determinare R si anume 0,169

11. Distributia statistica

11.1. Distributia statistica normala a unei variabile cantitative continue

Pentru aceasta am folosit variabila numarul membrilor din familie iar prin intermediul meniului Tranform - Compute Variable am ales la Function Group CDF & Non central CDF - CDF. Normal. Noua coloana adaugata in baza de date am denumit-o Distributia_normala.

Formula de forma CDF.normal(quant, mean,stddev ) am inlocuit-o cu

Quant = valoarea variabilei Distributia_normala pentru care vrem sa aflam densitatea de repartitie

Mean= media aritmetica a distributiei normale

Stddev= abaterea standard a distributiei normale

Acesta distributie avand forma CDF.normal(membri_familie, 4.1, 1.56) rezultatul fiind urmatorul:

Interpretare: Returneaza probabilitatea cumulativa ca o valoare din distributia normala, cu media si abaterea standard specificata va fi mai mica decat Distributia_normala