Proiect SPSS- Cosmetice

download Proiect SPSS- Cosmetice

of 20

Transcript of Proiect SPSS- Cosmetice

CUPRINSCUPRINS............................................................................................................................1 Proiect SPSS........................................................................................................................2 Descrierea problemei de studiat.......................................................................................2 Alegerea variabilelor analizate........................................................................................2 Realizare bazei de date n SPSS i definirea variabilelor................................................2 Verificarea bazei de date.....................................................................................................3 Depistarea outlierilor...........................................................................................................3 1.5. Analiza statistic univariat a datelor ..........................................................................4 Descrierea statistic a variabilelor nominale...................................................................4 Descrierea statistic a variabilelor numerice...................................................................6 1.6. Analiza statistic bivariat a datelor...........................................................................10 Analiza statistic a gradului de asociere ntre dou variabile........................................10 Analiza de regresie i corelaie......................................................................................11 1.7. Estimarea i testarea statistic....................................................................................14 Estimarea prin interval de ncredere a unei medii.............................................................14 Testarea statistic...........................................................................................................16 Testarea mediei .........................................................................................................16 CONCLUZII......................................................................................................................19 BIBLIOGRAFIE................................................................................................................20

Proiect SPSSDescrierea problemei de studiat Ceea ce se dorete a se studia prin intermediul acestui proiect este legtura care exist ntre cererea de cosmetice i diveri factori (preul pe care o persoan e dispus s l plteasc, venitul, marca) n cazul tinerilor cu vrsta pn n 25 de ani. n ziua de azi, tinerii, att femei, ct i brbai, sunt tot mai mari consumatori de produse de cosmetic. Alegerea variabilelor analizate Pentru a analiza problema mai sus menionat, am utilizat un eantion format din 35 de persoane, cu vrsta pn n 25 de ani. S-au nregistrat date referitoare la vrst, sex, anul de studiu, preferina pentru o anumit marc de cosmetice, venitul lunar al persoanei, preul pe care aceasta este dispus sa l plteasc pentru diferite produse cumprate i cantitatea de produse cosmetice cumprate pe lun. Baza de date din SPSS conine: vrsta, sexul, venitul, marca de cosmetice preferat, preul de pltit i cantitatea. Acestea vor constitui baza de date Cosmetice.sav. Realizare bazei de date n SPSS i definirea variabilelor Atributele acestor variabile sunt definite n fereastra Data Editor VariableView:

Figura 1. Fereastra Data Editor Variable View pentru BD Cosmetice.sav

2

Verificarea bazei de date Depistarea outlierilor Pentru depistarea outlierilor am folosit diagrama Box plot, care este folosit pentru prezentarea unei distribuii dup o variabil numeric. Pas cu pas aceast diagram ne depisteaz outlierii care trebuie eliminai. Variabilele numerice care s-au luat n considerare sunt preul i cantitatea pe care tinerii o achiziioneaz ntr-o lun. Pentru a depista outlierile am ales meniul Analyze Descriptive Statistics Explore Plots, outlierile fiind depistate implicit. Pentru variabila PRE:

Figura 2. Diagrama Boxplot pentru variabila PRE Interpretare: Diagrama ne prezint o distribuie omogen cu asimetrie pozitiv fr outlieri, deci nu exist valori aberante. 3

Pentru variabila CANTITATE:

Figura 3. Diagrama Boxplot pentru variabila CANTITATE Interpretare: Diagrama ne arat outlierii n acest caz. 1.5. Analiza statistic univariat a datelor Descrierea statistic a variabilelor nominale Vom analiza drept variabil nominal, marca produselor cosmetice preferate. Cele Vom selecta meniul Analyze Descriptive Statistics Frequencies Statistics (unde la Central Tendency se bifeaz Mode) i Charts (unde la Chart Type se bifeaz Pie sau Bar, iar la Chart Value Frequencies sau Percentages). Astfel, se obin urmtoarele rezultate:

4

Figura 4. Diagrama Pie pentru variabila MARCA de cosmetice preferat

5

Interpretare: Att tabelul de mai sus, ct i graficul de tip plcint, arat faptul c, ntre preferinele tinerelor, firma Avon deine procentul cel mai mare (40%), urmat de Oriflame, cu 28.57%, de ELF cu 14.29% i de Loreal, cu 11.43%. Pe ultimul loc, ntre preferine, se afl Rimmel cu 5.71%. Descrierea statistic a variabilelor numerice n acest caz, demersul este asemntor celui de mai sus. Diferena const n faptul c bifm toi indicatorii din Statistics, iar la Charts se bifeaz Histograms. Am fcut acest lucru pentru 3 variabile (cantitatea cumprat, venit i pre). Rezultate care se obin sunt urmtoarele:

Interpretare: MEDIA (Mean): Prin urmare, o persoan care cumpr, n medie, 2.11 produse cosmetic, are un venit lunar mediu de 1382.86 lei i este dispus s plteasc pentru achiziionarea de produse cosmetice, n medie, 71.6 lei. MEDIANA (Median): 50% dintre persoane cumpr pn n 2 produse, au un venit de pn la 1200 lei i sunt dispuse s plteasc pn la 55 lei pentru cosmetice, n 6

timp ce 50% dintre persoane firme cumpr peste 2 produse, au un venit de peste 1200 lei i sunt dispuse s plteasc peste 55 lei pentru cosmetice. MODUL (Mode): Cele mai multe persoane achiziioneaz 2 produse cosmetice pe lun, au un venit de 1200 lei pe lun i sunt dispuse s plteasc 45 lei pentru a achiziiona cosmetice. ABATEREA MEDIE PTRATIC (std.deviation): n medie, cantitatea de produse cosmetice cumprate pe lun se abate de la cantitatea medie cu 1.051, n plus sau n minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, n plus sau n minus, cu 663.097 lei, iar preul dispus s fie pltit se abate de la cel mediu cu 50.518 lei. Coeficientul de variaie atribuit cantitii este de 50% >35% (std.deviation/mean * 100), coeficientul de variaie pentru venituri lunare este de 48% >35%, iar coeficientul de variaie corespunztor preului este de 71%>35% ceea ce conduce la o distribuie eterogen. Coeficientul de asimetrie, Skewness=1.373>0 indic o distribuie asimetric la dreapta, leptocurtic (coeficientul boltirii, adic Kurtosis=1.888>0). Histograma are rolul de a confirma grafic rezultatele descrise mai sus.

7

8

Figura 5. Histogram pentru variabila CANTITATE

Figura 6. Histogram pentru variabila VENIT 9

Figura 7. Histogram pentru variabila PRE Interpretare: Pentru cele trei variabile se citesc n tabel principalii indicatori: media, mediana, variana, modul, valorile minime i valorile maxime (vezi interpretare mai sus).

1.6. Analiza statistic bivariat a datelor Analiza statistic a gradului de asociere ntre dou variabile Gradul de asociere se poate studia pentru variabilele nominale, n acest caz sexul persoanei i marca preferat. Gradul de asociere presupune obinerea tabelului de asociere, n care sunt prezentate relaiile dintre variabilele categoriale. Se utilizeaz Analyze Descriptive Statistics Crosstabs.

10

Interpretare: n eantionul analizat sunt 7 persoane de sex feminin care folosesc cu precdere marca AVON, 4 care folosesc ELF, 3 cumpr LOREAL, 5 cumpr ORIFLAME, iar restul de 2 folosesc RIMMEL. n rndul persoanelor de sex masculin, 7 folosesc AVON, 1 ELF, 1 LOREAL, iar 5 persoane folosesc ORIFLAME. Analiza de regresie i corelaie Dorim s msurm gradul de intensitate al legturii dintre dou variabile numerice, i anume preul i cantitatea cumprat. Folosim meniul Analyze Correlate Bivariate.

11

Interpretare: Coeficientul de corelaie a lui Pearson obinut este 0,692 (mai apropiat de 1), valoare care arat c ntre Cantitatea de produse cumprate pe lun i Preul dispus s fie pltit exist o bun asociere i asocierea este pozitiv, adic valori crescute ale cantitii indic valori crescute ale preului. Testarea semnificaiei coeficientului de corelaie este realizat cu ajutorul testului t. Valoarea Sig. corespunztoare, egal cu 0.000, evideniaz c s-a obinut un coeficient de corelaie semnificativ la un prag de 0.000, adic sunt anse mai mici de 1% ( = 0.01) de a grei n a afirma c ntre cele dou variabile exist o corelaie semnificativ. Pentru a estima parametrii modelului de regresie, intrm n meniul Analyze Regression Linear, prin care se deschide fereastra de dialog Linear Regession. Urmnd paii necesari, n output se analizeaz Model Summary, ANOVA, Coefficients. Tabelul Model Summary prezint valoarea coeficientului de corelaie R, valoarea raportului de determinaie R2 i eroarea standard a estimaiei.

12

Interpretare: Valoarea lui R este 0.692, ceea ce indic faptul c ntre cele dou variabile exist o legtur direct. Valoarea lui R2 este 0.479, ceea ce indic faptul c 47.9% din variaia variabilei Y este explicat prin variaia variabilei X. Aceasta este o valoare destul de mic, ceea ce nseamn c modelul ales nu explic foarte bine legtura dintre variabile. Tabelul Regession ANOVA prezint rezultatele analizei varianei variabilei dependente sub influena factorului de regresie i a factorului reziduu. Prezint informaii asupra sumei ptratelor abaterilor variabilei dependente, gradele de libertate, estimaiile varianelor datorate celor dou surse de variaie, raportul F i Sig.

Interpretare: n cazul variabilelor considerate, valoarea Sig. pentru F este mai mic dect 0.05, fiind 0.000, prin urmare relaia liniar dintre cele dou variabile considerate este semnificativ. Modelul ales ajusteaz bine datele din eantionul ales. Tabelul Coefficients prezint coeficienii nestandardizai ai modelului de regresie estimat, erorile standard ale acestora, coeficienii de regresie standardizai cu erorile standard corespunztoare, precum i valorile statisticii test t i valorile Sig. corespunztoare.

13

Interpretare: Pentru o ncredere de 95% se observ c n cazul ambilor coeficieni valoarea lui Sig. este mai mic dect 0.05, ceea ce nseamn c acetia sunt semnificativ diferii de 0. Astfel, ecuaia de regresie are urmtoarea form: Y =1.084+ 0.014 X 1.7. Estimarea i testarea statistic Estimarea prin interval de ncredere a unei medii Am optat pentru o estimare prin interval de ncredere. Acest lucru presupune aflarea limitelor de ncredere ale unui interval care acoper valoarea adevrat a unui parametru al populaiei (media sau proporia n acest caz). Calculul intervalului de ncredere pentru o medie sau pentru o proporie presupune parcurgerea urmtorilor pai: Calculul valorii tipice de sondaj (media sau proporia); Determinarea variabilitii estimatorului considerat; Alegerea intervalului de ncredere (95% i 99%); Calculul limitelor intervalului de ncredere. n cazul mediei SPSS calculeaz valoarea tipic de sondaj, scorul Z corespunztor, eroarea standard a mediei, limita inferioar i limita superioar a intervalului de ncredere. Pentru baza de date Cosmetice.sav se va calcula media cosmeticelor care se cumpr pe o perioad o lun de zile i intervalul de ncredere corespunztor. Pentru aceasta se parcurge demersul: meniul Analyze Descriptives Statistics Explore. Se stabilete nivelul de ncredere de 95%, i apoi de 99%.

14

Pentru un nivel de ncredere de 95%, se obin urmtoarele rezultate:

Interpretare: Se poate spune cu o ncredere de 95% c numrul de produse cosmetice cumprate ntr-un lun de zile este cuprins ntre 1.75 i 2.48. Pentru un nivel de ncredere de 99%, output-ul este cel de mai jos:

15

Interpretare: Se poate spune cu o ncredere de 99% c numrul de produse cosmetice cumprate ntr-un lun de zile este cuprins ntre 1.63 i 2.60. Testarea statistic Testele asupra mediilor sunt folosite pentru a verifica dac o medie difer semnificativ de o valoare specificat (ipotetic) sau pentru a compara dou sau mai multe medii ntre ele pentru a testa dac exist diferene semnificative ntre ele. Testarea mediei Testarea mediei cu o valoare specificat se realizeaz utiliznd procedeul OneSample T Test (Analyze Compare Means One-Sample T Test). Se va analiza dac numrul mediu al produselor cosmetice achiziionate de o persoan pe parcursul unei luni difer sau nu de 0.

16

Interpretare: Valoarea medie observat este 2.11. Valoarea specificat iniial este 0. Diferena dintre valoarea medie observat i valoarea ipotetic este 2.11. Avnd n vedere c valoarea Sig.=0.178>0.05, atunci ntre valoarea medie observat i valoarea ipotetic exist diferene semnificative. a) Testarea diferenei dintre dou medii Testarea se realizeaz cu ajutorul testului Independent-Samples T Test. Demersul este: Analyze Compare Means Independent-Samples T Test. Se va testa dac cantatitea medie de cosmetice cumprare pe lun este acceeai pentru sexul feminin i pentru cel masculin.

17

Interpretare: n acest caz testul t este egal cu -3.127 cu o probabilitate Sig. de 0.004