73099431-Proiect-SPSS-Cosmetice

25
CUPRINS CUPRINS Proiect SPSS.............................................. 1 1.1. Descrierea problemei de studiat.....................1 1.2. Alegerea variabilelor analizate.....................1 1.3. Realizare bazei de date în SPSS și definirea variabilelor.............................................1 1.4.Verificarea bazei de date........................................................ ...................................2 1. Depistarea outlierilor................................................. ...........................................2 1.5. Analiza statistică univariată a datelor.........3 1. Descrierea statistică a variabilelor nominale. .3 2. Descrierea statistică a variabilelor numerice. .5 1.6. Analiza statistică bivariată a datelor..........9 1. Analiza statistică a gradului de asociere între două variabile...........................................9 2. Analiza de regresie și corelaţie..............10 1.7. Estimarea și testarea statistică...............13 1. . .Estimarea prin interval de încredere a unei medii……………………………..13 2...................................... Testarea statistică.................................................. ..............................................15 a)...Testarea mediei……………………………………………………………..15

Transcript of 73099431-Proiect-SPSS-Cosmetice

Page 1: 73099431-Proiect-SPSS-Cosmetice

CUPRINS

CUPRINS

Proiect SPSS........................................................................................................................1

1.1. Descrierea problemei de studiat............................................................................11.2. Alegerea variabilelor analizate..............................................................................11.3. Realizare bazei de date în SPSS și definirea variabilelor.....................................1

1.4. Verificarea bazei de date...........................................................................................2

1. Depistarea outlierilor............................................................................................2

1.5. Analiza statistică univariată a datelor......................................................................3

1. Descrierea statistică a variabilelor nominale........................................................3 2. Descrierea statistică a variabilelor numerice........................................................5

1.6. Analiza statistică bivariată a datelor........................................................................9

1. Analiza statistică a gradului de asociere între două variabile...............................9 2. Analiza de regresie şi corelaţie...........................................................................10

1.7. Estimarea şi testarea statistică...............................................................................13

1. Estimarea prin interval de încredere a unei medii……………………………..13

2. Testarea statistică................................................................................................15

a)Testarea mediei……………………………………………………………..15 b) Testarea diferenţei dintre două medii...........................................................16

CONCLUZII......................................................................................................................18

BIBLIOGRAFIE................................................................................................................19

Page 2: 73099431-Proiect-SPSS-Cosmetice

Proiect SPSS

1.1. Descrierea problemei de studiat

Ceea ce se dorește a se studia prin intermediul acestui proiect este legătura care

există între cererea de cosmetice și diverși factori (prețul pe care o persoană e dispusă să

îl plătească, venitul, marca) în cazul tinerilor cu vârsta până în 25 de ani.

În ziua de azi, tinerii, atât femei, cât și bărbați, sunt tot mai mari consumatori de

produse de cosmetică.

1.2. Alegerea variabilelor analizate

Pentru a analiza problema mai sus menționată, am utilizat un eșantion format din

35 de persoane, cu vârsta până în 25 de ani. S-au înregistrat date referitoare la vârstă, sex,

anul de studiu, preferinţa pentru o anumită marcă de cosmetice, venitul lunar al

persoanei, preţul pe care aceasta este dispusă sa îl plătească pentru diferite produse

cumpărate şi cantitatea de produse cosmetice cumpărate pe lună.

Baza de date din SPSS conține: vârsta, sexul, venitul, marca de cosmetice

preferată, preţul de plătit şi cantitatea. Acestea vor constitui baza de date Cosmetice.sav.

1.3. Realizare bazei de date în SPSS și definirea variabilelor

Atributele acestor variabile sunt definite în fereastra Data Editor –VariableView:

Figura 1. Fereastra Data Editor – Variable View pentru BD Cosmetice.sav

1

Page 3: 73099431-Proiect-SPSS-Cosmetice

1.4. Verificarea bazei de date

1. Depistarea outlierilor

Pentru depistarea outlierilor am folosit diagrama Box plot, care este folosită

pentru prezentarea unei distribuţii după o variabilă numerică. Pas cu pas această diagramă

ne depistează outlierii care trebuie eliminaţi.

Variabilele numerice care s-au luat în considerare sunt prețul și cantitatea pe care

tinerii o achiziționează într-o lună.

Pentru a depista outlierile am ales meniul Analyze – Descriptive Statistics –

Explore – Plots, outlierile fiind depistate implicit.

Pentru variabila PREȚ:

Figura 2. Diagrama Boxplot pentru variabila PREȚ

2

Page 4: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Diagrama ne prezintă o distribuţie omogenă cu asimetrie pozitivă fără

outlieri, deci nu există valori aberante.

Pentru variabila CANTITATE:

Figura 3. Diagrama Boxplot pentru variabila CANTITATE

Interpretare: Diagrama ne arată outlierii în acest caz.

1.5. Analiza statistică univariată a datelor

1. Descrierea statistică a variabilelor nominale

Vom analiza drept variabilă nominală, marca produselor cosmetice preferate. Cele

Vom selecta meniul Analyze – Descriptive Statistics – Frequencies – Statistics (unde la

Central Tendency se bifează Mode) şi Charts (unde la Chart Type se bifează Pie sau Bar,

iar la Chart Value Frequencies sau Percentages). Astfel, se obţin următoarele rezultate:

3

Page 5: 73099431-Proiect-SPSS-Cosmetice

Figura 4. Diagrama Pie pentru variabila MARCA de cosmetice preferată

4

Page 6: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Atât tabelul de mai sus, cât și graficul de tip plăcintă, arată faptul că, între

preferințele tinerelor, firma Avon deține procentul cel mai mare (40%), urmată de

Oriflame, cu 28.57%, de ELF cu 14.29% și de Loreal, cu 11.43%. Pe ultimul loc, între

preferințe, se află Rimmel cu 5.71%.

2. Descrierea statistică a variabilelor numerice

În acest caz, demersul este asemănător celui de mai sus. Diferența constă în faptul

că bifăm toţi indicatorii din Statistics, iar la Charts se bifează Histograms. Am făcut acest

lucru pentru 3 variabile (cantitatea cumpărată, venit și preț). Rezultate care se obțin sunt

următoarele:

Interpretare:

MEDIA (Mean): Prin urmare, o persoană care cumpără, în medie, 2.11 produse

cosmetic, are un venit lunar mediu de 1382.86 lei și este dispusă să plătească pentru

achiziționarea de produse cosmetice, în medie, 71.6 lei.

MEDIANA (Median): 50% dintre persoane cumpără până în 2 produse, au un

venit de până la 1200 lei și sunt dispuse să plătească până la 55 lei pentru cosmetice, în

5

Page 7: 73099431-Proiect-SPSS-Cosmetice

timp ce 50% dintre persoane firme cumpără peste 2 produse, au un venit de peste 1200 lei

și sunt dispuse să plătească peste 55 lei pentru cosmetice.

MODUL (Mode): Cele mai multe persoane achiziționează 2 produse cosmetice pe

lună, au un venit de 1200 lei pe lună și sunt dispuse să plătească 45 lei pentru a

achiziționa cosmetice.

ABATEREA MEDIE PĂTRATICĂ (std.deviation): În medie, cantitatea de

produse cosmetice cumpărate pe lună se abate de la cantitatea medie cu 1.051, în plus sau

în minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, în plus sau în

minus, cu 663.097 lei, iar prețul dispus să fie plătit se abate de la cel mediu cu 50.518 lei.

Coeficientul de variaţie atribuit cantității este de 50% >35% (std.deviation/mean *

100), coeficientul de variaţie pentru venituri lunare este de 48% >35%, iar coeficientul de

variaţie corespunzător prețului este de 71%>35% ceea ce conduce la o distribuţie

eterogenă.

Coeficientul de asimetrie, Skewness=1.373>0 indică o distribuţie asimetrică la

dreapta, leptocurtică (coeficientul boltirii, adică Kurtosis=1.888>0). Histograma are rolul

de a confirma grafic rezultatele descrise mai sus.

6

Page 8: 73099431-Proiect-SPSS-Cosmetice

7

Page 9: 73099431-Proiect-SPSS-Cosmetice

Figura 5. Histogramă pentru variabila CANTITATE

Figura 6. Histogramă pentru variabila VENIT

8

Page 10: 73099431-Proiect-SPSS-Cosmetice

Figura 7. Histogramă pentru variabila PREȚ

Interpretare: Pentru cele trei variabile se citesc în tabel principalii indicatori: media,

mediana, varianţa, modul, valorile minime şi valorile maxime (vezi interpretare mai sus).

1.6. Analiza statistică bivariată a datelor

1. Analiza statistică a gradului de asociere între două variabile

Gradul de asociere se poate studia pentru variabilele nominale, în acest caz sexul

persoanei şi marca preferată. Gradul de asociere presupune obţinerea tabelului de

asociere, în care sunt prezentate relaţiile dintre variabilele categoriale. Se utilizează

Analyze – Descriptive Statistics – Crosstabs.

9

Page 11: 73099431-Proiect-SPSS-Cosmetice

Interpretare: În eşantionul analizat sunt 7 persoane de sex feminin care folosesc cu

precădere marca AVON, 4 care folosesc ELF, 3 cumpără LOREAL, 5 cumpără

ORIFLAME, iar restul de 2 folosesc RIMMEL. În rândul persoanelor de sex masculin, 7

folosesc AVON, 1 ELF, 1 LOREAL, iar 5 persoane folosesc ORIFLAME.

2. Analiza de regresie şi corelaţie

Dorim să măsurăm gradul de intensitate al legăturii dintre două variabile

numerice, și anume prețul și cantitatea cumpărată.

Folosim meniul Analyze – Correlate – Bivariate.

10

Page 12: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Coeficientul de corelaţie a lui Pearson obţinut este 0,692 (mai apropiat de

1), valoare care arată că între Cantitatea de produse cumpărate pe lună și Prețul dispus să

fie plătit există o bună asociere şi asocierea este pozitivă, adică valori crescute ale

cantității indică valori crescute ale prețului.

Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testului

t. Valoarea Sig. corespunzătoare, egală cu 0.000, evidenţiază că s-a obţinut un coeficient

de corelaţie semnificativ la un prag de 0.000, adică sunt şanse mai mici de 1% (α = 0.01)

de a greși în a afirma că între cele două variabile există o corelație semnificativă.

Pentru a estima parametrii modelului de regresie, intrăm în meniul Analyze –

Regression – Linear, prin care se deschide fereastra de dialog Linear Regession. Urmând

paşii necesari, în output se analizează Model Summary, ANOVA, Coefficients.

Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea

raportului de determinaţie R2 şi eroarea standard a estimaţiei.

11

Page 13: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Valoarea lui R este 0.692, ceea ce indică faptul că între cele două variabile

există o legătură directă. Valoarea lui R2 este 0.479, ceea ce indică faptul că 47.9% din

variaţia variabilei Y este explicată prin variaţia variabilei X. Aceasta este o valoare destul

de mică, ceea ce înseamnă că modelul ales nu explică foarte bine legătura dintre

variabile.

Tabelul Regession ANOVA prezintă rezultatele analizei varianţei variabilei

dependente sub influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii

asupra sumei pătratelor abaterilor variabilei dependente, gradele de libertate, estimaţiile

varianţelor datorate celor două surse de variaţie, raportul F şi Sig.

Interpretare: În cazul variabilelor considerate, valoarea Sig. pentru F este mai mică decât

0.05, fiind 0.000, prin urmare relația liniară dintre cele două variabile considerate este

semnificativă. Modelul ales ajustează bine datele din eșantionul ales.

Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie

estimat, erorile standard ale acestora, coeficienţii de regresie standardizaţi cu erorile

standard corespunzătoare, precum şi valorile statisticii test t şi valorile Sig.

corespunzătoare.

12

Page 14: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Pentru o încredere de 95% se observă că în cazul ambilor coeficienţi

valoarea lui Sig. este mai mică decât 0.05, ceea ce înseamnă că aceştia sunt semnificativ

diferiţi de 0.

Astfel, ecuaţia de regresie are următoarea formă:

Y =1.084+ 0.014 X

1.7. Estimarea şi testarea statistică

1. Estimarea prin interval de încredere a unei medii

Am optat pentru o estimare prin interval de încredere. Acest lucru presupune

aflarea limitelor de încredere ale unui interval care acoperă valoarea adevărată a unui

parametru al populaţiei (media sau proporţia în acest caz). Calculul intervalului de

încredere pentru o medie sau pentru o proporţie presupune parcurgerea următorilor paşi:

Calculul valorii tipice de sondaj (media sau proporţia);

Determinarea variabilităţii estimatorului considerat;

Alegerea intervalului de încredere (95% şi 99%);

Calculul limitelor intervalului de încredere.

În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z

corespunzător, eroarea standard a mediei, limita inferioară şi limita superioară a

intervalului de încredere. Pentru baza de date Cosmetice.sav se va calcula media

cosmeticelor care se cumpără pe o perioadă o lună de zile şi intervalul de încredere

corespunzător. Pentru aceasta se parcurge demersul: meniul Analyze – Descriptives

Statistics – Explore. Se stabileşte nivelul de încredere de 95%, şi apoi de 99%.

13

Page 15: 73099431-Proiect-SPSS-Cosmetice

Pentru un nivel de încredere de 95%, se obțin următoarele rezultate:

Interpretare: Se poate spune cu o încredere de 95% că numărul de produse cosmetice

cumpărate într-un lună de zile este cuprins între 1.75 şi 2.48.

Pentru un nivel de încredere de 99%, output-ul este cel de mai jos:

14

Page 16: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Se poate spune cu o încredere de 99% că numărul de produse cosmetice

cumpărate într-un lună de zile este cuprins între 1.63 şi 2.60.

2. Testarea statistică

Testele asupra mediilor sunt folosite pentru a verifica dacă o medie diferă

semnificativ de o valoare specificată (ipotetică) sau pentru a compara două sau mai multe

medii între ele pentru a testa dacă există diferenţe semnificative între ele.

a) Testarea mediei

Testarea mediei cu o valoare specificată se realizează utilizând procedeul One-

Sample T Test (Analyze – Compare Means – One-Sample T Test). Se va analiza dacă

numărul mediu al produselor cosmetice achiziționate de o persoană pe parcursul unei luni

diferă sau nu de 0.

15

Page 17: 73099431-Proiect-SPSS-Cosmetice

Interpretare: Valoarea medie observată este 2.11. Valoarea specificată inițial este 0.

Diferenţa dintre valoarea medie observată şi valoarea ipotetică este 2.11. Având în vedere

că valoarea Sig.=0.178>0.05, atunci între valoarea medie observată şi valoarea ipotetică

există diferenţe semnificative.

b) Testarea diferenţei dintre două medii

Testarea se realizează cu ajutorul testului Independent-Samples T Test. Demersul

este: Analyze – Compare Means – Independent-Samples T Test. Se va testa dacă

cantatitea medie de cosmetice cumpărare pe lună este acceeași pentru sexul feminin și

pentru cel masculin.

16

Page 18: 73099431-Proiect-SPSS-Cosmetice

Interpretare: În acest caz testul t este egal cu -3.127 cu o probabilitate Sig. de

0.004<0.05, ceea ce arată că mediile numărului de produse cosmetice cumpărate pe lună,

pentru cele două grupe (1,57 pentru maculin şi 2.48 pentru feminin) diferă semnificativ.

La aceeaşi concluzie se poate ajunge analizând şi limitele intervalului de încredere, care

nu conţin valoarea 0.

17

Page 19: 73099431-Proiect-SPSS-Cosmetice

CONCLUZII

În urma realizării acestui proiect reiese faptul că cererea față de produsele

cosmetice depinde, într-o oarecare măsură, de preţul pe care persoana în cauză este

dispus să îl plătească.. De asemenea, se observă, așa cum era și se așteptat, că la nivelul

întregii populaţii există diferenţe semnificative între proporţia persoanelor de sex feminin

care utilizează cosmetice și proporţia persoanelor de sex masculin.

18

Page 20: 73099431-Proiect-SPSS-Cosmetice

BIBLIOGRAFIE

1. Jaba, Elisabeta, Statistică, ediţia a III-a, Editura Economică, Bucureşti, 2002

2. Jaba, Elisabeta; Grama, Ana, Analiza statistică cu SPSS sub Windows, Editura

Polirom, 2004

3. Jaba, Elisabeta, Econometrie aplicată, Ed. Univ. Al.I.Cuza

19