73099431-Proiect-SPSS-Cosmetice
Transcript of 73099431-Proiect-SPSS-Cosmetice
CUPRINS
CUPRINS
Proiect SPSS........................................................................................................................1
1.1. Descrierea problemei de studiat............................................................................11.2. Alegerea variabilelor analizate..............................................................................11.3. Realizare bazei de date în SPSS și definirea variabilelor.....................................1
1.4. Verificarea bazei de date...........................................................................................2
1. Depistarea outlierilor............................................................................................2
1.5. Analiza statistică univariată a datelor......................................................................3
1. Descrierea statistică a variabilelor nominale........................................................3 2. Descrierea statistică a variabilelor numerice........................................................5
1.6. Analiza statistică bivariată a datelor........................................................................9
1. Analiza statistică a gradului de asociere între două variabile...............................9 2. Analiza de regresie şi corelaţie...........................................................................10
1.7. Estimarea şi testarea statistică...............................................................................13
1. Estimarea prin interval de încredere a unei medii……………………………..13
2. Testarea statistică................................................................................................15
a)Testarea mediei……………………………………………………………..15 b) Testarea diferenţei dintre două medii...........................................................16
CONCLUZII......................................................................................................................18
BIBLIOGRAFIE................................................................................................................19
Proiect SPSS
1.1. Descrierea problemei de studiat
Ceea ce se dorește a se studia prin intermediul acestui proiect este legătura care
există între cererea de cosmetice și diverși factori (prețul pe care o persoană e dispusă să
îl plătească, venitul, marca) în cazul tinerilor cu vârsta până în 25 de ani.
În ziua de azi, tinerii, atât femei, cât și bărbați, sunt tot mai mari consumatori de
produse de cosmetică.
1.2. Alegerea variabilelor analizate
Pentru a analiza problema mai sus menționată, am utilizat un eșantion format din
35 de persoane, cu vârsta până în 25 de ani. S-au înregistrat date referitoare la vârstă, sex,
anul de studiu, preferinţa pentru o anumită marcă de cosmetice, venitul lunar al
persoanei, preţul pe care aceasta este dispusă sa îl plătească pentru diferite produse
cumpărate şi cantitatea de produse cosmetice cumpărate pe lună.
Baza de date din SPSS conține: vârsta, sexul, venitul, marca de cosmetice
preferată, preţul de plătit şi cantitatea. Acestea vor constitui baza de date Cosmetice.sav.
1.3. Realizare bazei de date în SPSS și definirea variabilelor
Atributele acestor variabile sunt definite în fereastra Data Editor –VariableView:
Figura 1. Fereastra Data Editor – Variable View pentru BD Cosmetice.sav
1
1.4. Verificarea bazei de date
1. Depistarea outlierilor
Pentru depistarea outlierilor am folosit diagrama Box plot, care este folosită
pentru prezentarea unei distribuţii după o variabilă numerică. Pas cu pas această diagramă
ne depistează outlierii care trebuie eliminaţi.
Variabilele numerice care s-au luat în considerare sunt prețul și cantitatea pe care
tinerii o achiziționează într-o lună.
Pentru a depista outlierile am ales meniul Analyze – Descriptive Statistics –
Explore – Plots, outlierile fiind depistate implicit.
Pentru variabila PREȚ:
Figura 2. Diagrama Boxplot pentru variabila PREȚ
2
Interpretare: Diagrama ne prezintă o distribuţie omogenă cu asimetrie pozitivă fără
outlieri, deci nu există valori aberante.
Pentru variabila CANTITATE:
Figura 3. Diagrama Boxplot pentru variabila CANTITATE
Interpretare: Diagrama ne arată outlierii în acest caz.
1.5. Analiza statistică univariată a datelor
1. Descrierea statistică a variabilelor nominale
Vom analiza drept variabilă nominală, marca produselor cosmetice preferate. Cele
Vom selecta meniul Analyze – Descriptive Statistics – Frequencies – Statistics (unde la
Central Tendency se bifează Mode) şi Charts (unde la Chart Type se bifează Pie sau Bar,
iar la Chart Value Frequencies sau Percentages). Astfel, se obţin următoarele rezultate:
3
Figura 4. Diagrama Pie pentru variabila MARCA de cosmetice preferată
4
Interpretare: Atât tabelul de mai sus, cât și graficul de tip plăcintă, arată faptul că, între
preferințele tinerelor, firma Avon deține procentul cel mai mare (40%), urmată de
Oriflame, cu 28.57%, de ELF cu 14.29% și de Loreal, cu 11.43%. Pe ultimul loc, între
preferințe, se află Rimmel cu 5.71%.
2. Descrierea statistică a variabilelor numerice
În acest caz, demersul este asemănător celui de mai sus. Diferența constă în faptul
că bifăm toţi indicatorii din Statistics, iar la Charts se bifează Histograms. Am făcut acest
lucru pentru 3 variabile (cantitatea cumpărată, venit și preț). Rezultate care se obțin sunt
următoarele:
Interpretare:
MEDIA (Mean): Prin urmare, o persoană care cumpără, în medie, 2.11 produse
cosmetic, are un venit lunar mediu de 1382.86 lei și este dispusă să plătească pentru
achiziționarea de produse cosmetice, în medie, 71.6 lei.
MEDIANA (Median): 50% dintre persoane cumpără până în 2 produse, au un
venit de până la 1200 lei și sunt dispuse să plătească până la 55 lei pentru cosmetice, în
5
timp ce 50% dintre persoane firme cumpără peste 2 produse, au un venit de peste 1200 lei
și sunt dispuse să plătească peste 55 lei pentru cosmetice.
MODUL (Mode): Cele mai multe persoane achiziționează 2 produse cosmetice pe
lună, au un venit de 1200 lei pe lună și sunt dispuse să plătească 45 lei pentru a
achiziționa cosmetice.
ABATEREA MEDIE PĂTRATICĂ (std.deviation): În medie, cantitatea de
produse cosmetice cumpărate pe lună se abate de la cantitatea medie cu 1.051, în plus sau
în minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, în plus sau în
minus, cu 663.097 lei, iar prețul dispus să fie plătit se abate de la cel mediu cu 50.518 lei.
Coeficientul de variaţie atribuit cantității este de 50% >35% (std.deviation/mean *
100), coeficientul de variaţie pentru venituri lunare este de 48% >35%, iar coeficientul de
variaţie corespunzător prețului este de 71%>35% ceea ce conduce la o distribuţie
eterogenă.
Coeficientul de asimetrie, Skewness=1.373>0 indică o distribuţie asimetrică la
dreapta, leptocurtică (coeficientul boltirii, adică Kurtosis=1.888>0). Histograma are rolul
de a confirma grafic rezultatele descrise mai sus.
6
7
Figura 5. Histogramă pentru variabila CANTITATE
Figura 6. Histogramă pentru variabila VENIT
8
Figura 7. Histogramă pentru variabila PREȚ
Interpretare: Pentru cele trei variabile se citesc în tabel principalii indicatori: media,
mediana, varianţa, modul, valorile minime şi valorile maxime (vezi interpretare mai sus).
1.6. Analiza statistică bivariată a datelor
1. Analiza statistică a gradului de asociere între două variabile
Gradul de asociere se poate studia pentru variabilele nominale, în acest caz sexul
persoanei şi marca preferată. Gradul de asociere presupune obţinerea tabelului de
asociere, în care sunt prezentate relaţiile dintre variabilele categoriale. Se utilizează
Analyze – Descriptive Statistics – Crosstabs.
9
Interpretare: În eşantionul analizat sunt 7 persoane de sex feminin care folosesc cu
precădere marca AVON, 4 care folosesc ELF, 3 cumpără LOREAL, 5 cumpără
ORIFLAME, iar restul de 2 folosesc RIMMEL. În rândul persoanelor de sex masculin, 7
folosesc AVON, 1 ELF, 1 LOREAL, iar 5 persoane folosesc ORIFLAME.
2. Analiza de regresie şi corelaţie
Dorim să măsurăm gradul de intensitate al legăturii dintre două variabile
numerice, și anume prețul și cantitatea cumpărată.
Folosim meniul Analyze – Correlate – Bivariate.
10
Interpretare: Coeficientul de corelaţie a lui Pearson obţinut este 0,692 (mai apropiat de
1), valoare care arată că între Cantitatea de produse cumpărate pe lună și Prețul dispus să
fie plătit există o bună asociere şi asocierea este pozitivă, adică valori crescute ale
cantității indică valori crescute ale prețului.
Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testului
t. Valoarea Sig. corespunzătoare, egală cu 0.000, evidenţiază că s-a obţinut un coeficient
de corelaţie semnificativ la un prag de 0.000, adică sunt şanse mai mici de 1% (α = 0.01)
de a greși în a afirma că între cele două variabile există o corelație semnificativă.
Pentru a estima parametrii modelului de regresie, intrăm în meniul Analyze –
Regression – Linear, prin care se deschide fereastra de dialog Linear Regession. Urmând
paşii necesari, în output se analizează Model Summary, ANOVA, Coefficients.
Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea
raportului de determinaţie R2 şi eroarea standard a estimaţiei.
11
Interpretare: Valoarea lui R este 0.692, ceea ce indică faptul că între cele două variabile
există o legătură directă. Valoarea lui R2 este 0.479, ceea ce indică faptul că 47.9% din
variaţia variabilei Y este explicată prin variaţia variabilei X. Aceasta este o valoare destul
de mică, ceea ce înseamnă că modelul ales nu explică foarte bine legătura dintre
variabile.
Tabelul Regession ANOVA prezintă rezultatele analizei varianţei variabilei
dependente sub influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii
asupra sumei pătratelor abaterilor variabilei dependente, gradele de libertate, estimaţiile
varianţelor datorate celor două surse de variaţie, raportul F şi Sig.
Interpretare: În cazul variabilelor considerate, valoarea Sig. pentru F este mai mică decât
0.05, fiind 0.000, prin urmare relația liniară dintre cele două variabile considerate este
semnificativă. Modelul ales ajustează bine datele din eșantionul ales.
Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie
estimat, erorile standard ale acestora, coeficienţii de regresie standardizaţi cu erorile
standard corespunzătoare, precum şi valorile statisticii test t şi valorile Sig.
corespunzătoare.
12
Interpretare: Pentru o încredere de 95% se observă că în cazul ambilor coeficienţi
valoarea lui Sig. este mai mică decât 0.05, ceea ce înseamnă că aceştia sunt semnificativ
diferiţi de 0.
Astfel, ecuaţia de regresie are următoarea formă:
Y =1.084+ 0.014 X
1.7. Estimarea şi testarea statistică
1. Estimarea prin interval de încredere a unei medii
Am optat pentru o estimare prin interval de încredere. Acest lucru presupune
aflarea limitelor de încredere ale unui interval care acoperă valoarea adevărată a unui
parametru al populaţiei (media sau proporţia în acest caz). Calculul intervalului de
încredere pentru o medie sau pentru o proporţie presupune parcurgerea următorilor paşi:
Calculul valorii tipice de sondaj (media sau proporţia);
Determinarea variabilităţii estimatorului considerat;
Alegerea intervalului de încredere (95% şi 99%);
Calculul limitelor intervalului de încredere.
În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z
corespunzător, eroarea standard a mediei, limita inferioară şi limita superioară a
intervalului de încredere. Pentru baza de date Cosmetice.sav se va calcula media
cosmeticelor care se cumpără pe o perioadă o lună de zile şi intervalul de încredere
corespunzător. Pentru aceasta se parcurge demersul: meniul Analyze – Descriptives
Statistics – Explore. Se stabileşte nivelul de încredere de 95%, şi apoi de 99%.
13
Pentru un nivel de încredere de 95%, se obțin următoarele rezultate:
Interpretare: Se poate spune cu o încredere de 95% că numărul de produse cosmetice
cumpărate într-un lună de zile este cuprins între 1.75 şi 2.48.
Pentru un nivel de încredere de 99%, output-ul este cel de mai jos:
14
Interpretare: Se poate spune cu o încredere de 99% că numărul de produse cosmetice
cumpărate într-un lună de zile este cuprins între 1.63 şi 2.60.
2. Testarea statistică
Testele asupra mediilor sunt folosite pentru a verifica dacă o medie diferă
semnificativ de o valoare specificată (ipotetică) sau pentru a compara două sau mai multe
medii între ele pentru a testa dacă există diferenţe semnificative între ele.
a) Testarea mediei
Testarea mediei cu o valoare specificată se realizează utilizând procedeul One-
Sample T Test (Analyze – Compare Means – One-Sample T Test). Se va analiza dacă
numărul mediu al produselor cosmetice achiziționate de o persoană pe parcursul unei luni
diferă sau nu de 0.
15
Interpretare: Valoarea medie observată este 2.11. Valoarea specificată inițial este 0.
Diferenţa dintre valoarea medie observată şi valoarea ipotetică este 2.11. Având în vedere
că valoarea Sig.=0.178>0.05, atunci între valoarea medie observată şi valoarea ipotetică
există diferenţe semnificative.
b) Testarea diferenţei dintre două medii
Testarea se realizează cu ajutorul testului Independent-Samples T Test. Demersul
este: Analyze – Compare Means – Independent-Samples T Test. Se va testa dacă
cantatitea medie de cosmetice cumpărare pe lună este acceeași pentru sexul feminin și
pentru cel masculin.
16
Interpretare: În acest caz testul t este egal cu -3.127 cu o probabilitate Sig. de
0.004<0.05, ceea ce arată că mediile numărului de produse cosmetice cumpărate pe lună,
pentru cele două grupe (1,57 pentru maculin şi 2.48 pentru feminin) diferă semnificativ.
La aceeaşi concluzie se poate ajunge analizând şi limitele intervalului de încredere, care
nu conţin valoarea 0.
17
CONCLUZII
În urma realizării acestui proiect reiese faptul că cererea față de produsele
cosmetice depinde, într-o oarecare măsură, de preţul pe care persoana în cauză este
dispus să îl plătească.. De asemenea, se observă, așa cum era și se așteptat, că la nivelul
întregii populaţii există diferenţe semnificative între proporţia persoanelor de sex feminin
care utilizează cosmetice și proporţia persoanelor de sex masculin.
18
BIBLIOGRAFIE
1. Jaba, Elisabeta, Statistică, ediţia a III-a, Editura Economică, Bucureşti, 2002
2. Jaba, Elisabeta; Grama, Ana, Analiza statistică cu SPSS sub Windows, Editura
Polirom, 2004
3. Jaba, Elisabeta, Econometrie aplicată, Ed. Univ. Al.I.Cuza
19