Statistica cu SPSS dupa Opariuc-Dan C.pdf

download Statistica cu SPSS dupa Opariuc-Dan C.pdf

of 154

Transcript of Statistica cu SPSS dupa Opariuc-Dan C.pdf

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    1/154

    I.3 Prezentare generalSPSSfor Windows

    2

    SPSS sub Windows reprezint un

    pachet de programe interactiv, de utilitate

    general, destinat analizelor de date #i in-

    clude multiple facilit&i #i tehnici de natur

    statistic. Pachetul de programe SPSS sub

    Windows reprezint o aplica&ie care folo-se#te ntreaga func&ionalitate a sistemului

    de operare Windows, regsind n structura sa

    utilizarea mausului, ferestrele redimensionabi-

    le #i scalabile, meniuri derulante, casete de

    dialog etc. De#i majoritatea utilizatorilor vor fi

    complet satisfcu&i utiliznd doar interfa&a

    graficpe care SPSS o pune la dispozi&ie, to-

    tu#i pachetul de programe dispune #i de un

    puternic limbaj de comenzi prin care se pot

    realiza activit&i automate (scripturi) ce deter-

    2Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucrunu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezintmarcnre-

    gistratSPSS Inc.

    Figura 1.2 Lansarea programuluiSPSS for Windows

    Figura 1.3 Fereastra logoSPSS for Windows

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    2/154

    Cristian Opariuc-Dan

    31

    min eficientizarea ac&iunilor utilizate n mod frecvent sau efectuarea unor

    ac&iuni complexe, indisponibile n interfa&a grafic(SPSS, 2001).

    Programul SPSS, la fel ca orice altaplica&ie sub sistemul de operareWindows, indiferent de versiunea acestuia, la instalare #i creeazun grup de

    pictograme (iconuri) n sec&iunea Programsa meniului Startdin sistemul de

    operare Windows. Pentru a putea lansa n execu&ie aplica&ia, va trebui ca mai

    nti s efectua&i clic cu maus-ul pe butonul start al desktop-ului Windows,

    buton situat de obicei n partea din stnga jos a ecranului. Apoi merge&i la

    sec&iunea Programs #i se va deschide o nou list

    care con&ine toate programele instalate n calculato-rul dumneavoastr(ei bine, cel pu&in programele la

    care ave&i acces dumneavoastr). n aceast list,

    cuta&i grupul de programe SPSS for Windows,

    grup n care ve&i gsi pictogramele de lansare ale

    aplica&iei SPSS. Probabil c a&i identificat deja n

    acest grup de programe pictograma numit SPSS

    for Windows. Aceasta este imaginea pe care vatrebui sface&i clic pentru a porni aplica&ia.3

    SPSS este un program extrem de complex.

    Lansarea acestuia debuteaz cu prezentarea unei

    ferestre introductive, denumit #i fereastr logo. Ea cuprinde informa&ii

    despre versiunea programului (n cazul nostru, SPSS 12.0 Standard), deoare-

    ce exist#i versiuni server, mai complexe, versiuni demonstrative (ca aceeape care o pute&i descrca gratuit de la http://www.spss.com) sau student

    pentru nv&are etc., precum #i despre posesorul licen&ei de utilizare a acestui

    produs informatic. Se cunoa#te faptul c, n conformitate cu legea dreptului

    3Desigur, n situa&ia n care SPSS for Windows este deja instalat pe calculatorul dumnea-voastr. Dacnu ave&i instalat SPSS for Windows, pute&i descrca o versiune demonstrativde 30 de zile de pe site-ul http://www.spss.comAsigura&i-vcave&i o conexiune suficient

    de rapid#i de stabilla Internet, deoarece fi#ierul este destul de mare (aproximativ 160 MB)

    Figura 1.4 Fereastra introductiv

    http://www.spss.com/http://www.spss.com/http://www.spss.com/http://www.spss.com/http://www.spss.com/
  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    3/154

    Statisticaplicatn #tiin&ele socio-umane

    32

    de autor #i protec&ia crea&iilor intelectuale, un produs software poate fi utilizat

    doar n cazul n care se posed o licen& de utilizare pentru acesta, altfel

    riscndu-se pedepse severe, contraven&ionale sau de naturpenal.Dupcteva secunde, fereastra de prezentare se dezactiveaz, iar apli-

    ca&ia prezinto interfa&prietenoasprin care ne invit s trecem la treab.

    Putem n aceastetapslansm n execu&ie un program tutorial care ne va

    forma abilit&ile de baz n vederea utilizrii acestui pachet informatic com-

    plex; de asemenea, putem trece direct la introducerea datelor sau putem rula

    o cerere predefinit, se poate crea o noucerere de date sau se poate deschide

    o bazde date existent, situa-&ie n care va trebui s preci-

    zm loca&ia acesteia. Nu n

    ultimul rnd, putem deschide o

    bazde date ntr-un alt format,

    de exemplu Excel, Statistica

    sau SAS, iar SPSS va #ti s

    converteasc aceste date pen-tru a le face disponibile.

    Exist, de asemenea, n

    partea de jos a acestui formu-

    lar introductiv, o caset denumitDont show this dialog in the future.

    Daco ve&i bifa, ave&i posibilitatea ca, la viitoarea lansare a produsului, s

    nu se mai afi#eze formularul, caz n care programul va trece direct n fereas-tra principalSPSS.

    Desigur, selectarea unei op&iuni dintre cele prezentate mai sus nu n-

    seamn#i executarea acesteia de ctre SPSS. Pentru a lansa n execu&ie op&i-

    unea aleas, va trebui apsat, obligatoriu, butonul OK. Apsarea butonului

    Cancelindicprogramului ctrebuie sprseascformularul introductiv #i

    Figura 1.5 Fereastra principalSPSS

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    4/154

    Cristian Opariuc-Dan

    33

    s lanseze fereastra principal SPSS n modul de lucru configurat pentru o

    noubazde date.

    n acest moment, nu ne intereseazniciuna dintre op&iunile predefini-te, astfel nct vom apsa butonul Cancel. Iat c formularul prezentat mai

    sus a disprut, fcnd loc ferestrei principale SPSS. S privim cu aten&ie

    aceastnouinterfa&cu utilizatorul.

    Ca orice alt aplica&ie Windows, SPSS posedo barde titlu bara

    albastrdin partea de sus a ferestrei , n partea stnga acesteia afi#ndu-se

    mesajul Untitled SPSS Data Editor. Acest mesaj ne informeaz c ne

    aflm n fereastra de date (editare a datelor) din SPSS #i cbaza de date nu a

    fost ncsalvat(n momentul salvrii, textul Untitled este nlocuit cu nu-

    mele fi#ierului salvat pe disc). n partea dreapta barei de titlu, avem cele trei

    butoane clasice ale oricrei ferestre Windows: butonul de minimizare sau de

    transfer al aplica&iei n bara de sarcini, butonul de maximizare extindere a

    aplica&iei pe ntregul ecran sau de restaurare a aplica&iei la dimensiunile ini&i-

    ale #i butonul de nchidere a aplica&iei, acel buton n formde X.Sub barade titlu, se aflmeniurile, serii de etichete purtnd fiecare un nume (n limba

    englez), prin intermediul crora putem comanda SPSS #i putem efectua ope-

    ra&iile #i prelucrrile de care acesta este capabil. Nu vom insista acum asupra

    explicrii tuturor meniurilor, acest lucru l vom face pe parcursul prezentului

    curs. Bara de meniuri este urmatde bara de instrumente mici butoane cu

    aspectul unor pictograme care, n general, dubleazanumite func&ii din meni-

    uri, func&ii mai des folosite. SPSS prezinto barde instrumente dinamic,adic aspectul butoanelor #i, desigur, func&ionalitatea acestora se modific

    rela&ionat contextului n care ne aflm. De exemplu, vom avea anumite bu-

    toane n modul de introducere a datelor #i

    alte butoane n modul de definire a varia-

    bilelor ori n modul de afi#are a rezultate-

    lor analizelor de date.Figura 1.6 Sec&iunea de

    editare a datelor

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    5/154

    Statisticaplicatn #tiin&ele socio-umane

    34

    Dupbara de instrumente, apare sec&iunea de editare a datelor. Aceas-

    ta este format dintr-o parte needitabil, informativ, partea din stnga, n

    care se afi#eazn permanen&pozi&ia celulei active (celulpe care am selec-tat-o). Formatul acestui identificator este un numr urmat de doupuncte #i

    apoi numele variabilei (spre exemplu, 8:timenseamncsuntem pozi&iona&i

    pe rndul 8 a opta nregistrare a variabilei timp). Partea editabil arat

    ntotdeauna valoarea acestei variabile n pozi&ia specificat (n cazul nostru,

    la rndul 8 al variabilei timp se aflvaloarea 34).

    Cea mai mare parte a ferestrei principale SPSS este dedicatsec&iunii

    de date. Observm cdatele, n SPSS, sunt organizate tabelar, pe linii #i co-loane, analog altor aplica&ii mai cunoscute, cum ar fi foile de calcul tabelar

    (Excel) sau bazele de date (FoxPro sau Access). Liniile (nregistrrile) sunt

    identificate prin numere, iar coloanele reprezint variabilele. ntr-o baz de

    date goal, toate variabilele sunt denumite implicit var, iar aceast de-

    numire este scriscu culoarea gri, reprezentnd faptul cacestea nu au fost

    ncdefinite. Navigarea prin baza de date se poate face cu cele doucasete de

    derulare (numite #i lifturi sau controale de derulare), situate n partea dreapt,respectiv n partea de jos a ferestrei de date, la fel ca n orice program Win-

    dows.

    Sec&iunea de date con&ine, n partea din stnga-

    jos, doi marcatori de sec&iune foarte importan&i: Data

    View #i Variable View. Aceste elemente permit co-

    mutarea ntre modul de vizualizare a datelor dintr-obazde date (sec&iunea Data View) #i modul de defini-

    re a variabilelor (sec&iunea Variable View).

    n partea de jos a programului SPSS, se afl bara de status cu dou

    sec&iuni: sec&iunea de informa&ii, n partea stng, unde se afi#eaz scurte

    instruc&iuni despre diferitele func&ii ale meniurilor sau ale barei de instrumen-

    te, #i sec&iunea de stare a procesorului SPSS unde se afi#eazinforma&ii refe-

    Figura 1.7 Marcato-rii de sec&iune

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    6/154

    Cristian Opariuc-Dan

    35

    ritoare la rularea unor sarcini mari consumatoare de timp. n general, ncepe-

    rea unei prelucrri statistice se poate face doar n condi&iile n care vede&i

    mesajul SPSS Processor is ready n aceastsec&iune.Prsirea programului SPSS se poate face fie apsnd butonul de n-

    chidere al aplica&iei X din col&ul din dreapta sus al ferestrei principale, fie

    folosind meniul File #i apoi Exit. Daca&i fcut prelucrri de date sau modi-

    ficri n baza de date, programul vva solicita mai nti salvarea documentu-

    lui, ca msurde protec&ie mpotriva pierderii de informa&ie. Despre salvare,

    ns, discutm n subcapitolul urmtor.

    I.3.1 Bazele de date creare, salvare, deschidere

    Dupce ne-am familiarizat cu interfa&a

    programului SPSS, este momentul s vedem

    cum putem deschide o baz de date existent

    #i care sunt elementele componente ale aceste-

    ia. SPSS vine nso&it de o serie de baze de date

    demonstrative n scopul facilitrii procesuluide nv&are. Pe parcursul acestor exerci&ii,

    vom folosi, din ra&iuni de compatibilitate,

    aceste exemple de baze de date oferite de ctre

    productorii programului SPSS.

    Deschiderea unei baze de date n sco-

    pul efecturii prelucrrilor statistice se poate

    face prin mai multe metode, rmnnd la lati-

    tudinea dumneavoastr#i potrivit experien&ei pe care o ave&i salege&i meto-

    da care vconvine mai mult.

    Prima metod este aceea prin care apelm la meniul File (Fi#ier) #i

    apoi pozi&ionm cursorul maus-ului pe submeniul Open(Deschide). Apare o

    listde unde putem deschide o bazde date (Data), o procedurde sintax

    Figura 1.8 Deschidereaunei baze de date

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    7/154

    Statisticaplicatn #tiin&ele socio-umane

    36

    (Syntax) o foaie de rezultate (Output), un set de comenzi (Script) sau un alt

    tip de fi#ier (Other). Pentru a deschide o baz de date, va trebui selectat

    op&iunea Data.Observa&i cfiecare dintre aceste op&iuni este urmatde punc-te de suspensie (). ntotdeauna cnd ve&i ntlni aceste puncte de suspensie

    alturi de o comandWindows (nu doar n SPSS, ci #i n orice program Win-

    dows), va trebui s#ti&i cacea comandvinvitla dialog. Adicse va des-

    chide o noufereastr, de unde va trebui salege&i ceva sau sfurniza&i anu-

    mite informa&ii programului pentru a putea executa comanda respectiv.

    O altmetodprin care pute&i deschide o bazde date este folosirea

    a#a- numitelor taste rapide. De obicei, meniurile sunt nso&ite de combina&iide taste prin care pute&i efectua direct o anumitsarcin. n loc sapelm la

    meniul File, apoi Open #i apoi Data, putem pur #i simplu s &inem apsat

    tasta Ctrln timp ce apsm tasta O (de la Open). O astfel de combina&ie se

    noteazprin Ctrl+O, nota&ie pe care o vom folosi pe ntreg parcursul acestui

    curs. Vom observa c aceastcombina&ie are acela#i efect ca #i parcurgerea

    primei metode, avantajul fiind acela ceste mult mai rapid.

    A treia metod apeleaz la numitele taste fierbin&i (hot-keys). O

    tastfierbinte este o tastfolositn combina&ie cu tasta Alt. Dacve&i pri-

    vi cu aten&ie meniurile, ve&i putea observa cunele litere sunt subliniate de

    exemplu, n meniul File este subliniat litera F. ,innd apsat tasta Alt#i

    apsnd apoi tasta F, vom ob&ine deschiderea meniului File, ca #i cnd am

    efectua clic pe acesta. n mod analog, notarea acestei combina&ii se face folo-

    sind conven&ia Alt+F. Deci, pentru a deschide o bazde date, putem folosicombina&iile Alt+Fdeschiderea meniului File #i apoi Alt+Odeschiderea

    submeniului Open, iar, n final, Alt+A accesarea op&iunii Data. Aceasta

    este, dacdori&i, o navigare prin meniuri frmaus.

    Ultima metod se refer la folosirea barei de instrumente pentru a

    deschide o bazde date. Pur #i simplu apsa&i pe primul buton de pe bara de

    instrumente, acela care are aspectul unui dosar deschis.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    8/154

    Cristian Opariuc-Dan

    37

    Indiferent de metoda folosit, efectul va fi acela#i: deschiderea unei

    casete de dialog, din care pute&i alege baza de date pe care o ve&i ncrca (v

    mai aminti&i nota referitoare la punctele de suspensie?).Sanalizm pu&in aceastnoufe-

    reastr. n partea de sus avem o listderu-

    lant intitulatLook in: Apsnd sgeata

    orientatn jos din partea dreapta acestei

    casete, vom putea alege directorul n care

    este localizat baza noastr de date. Ob-

    servm cdirectorul curent este directorulaplica&iei (SPSS), iar n sec&iunea de sub

    aceastcaseteste afi#at con&inutul acestui

    dosar. Pute&i astfel selecta orice director n

    care ave&i fi#iere recunoscute de SPSS, pentru a le putea afi#a #i/sau deschide.

    Alturi de caseta Look in,se aflo serie de butoane care controleaznaviga-

    rea prin structura de directoare de pe discul dumneavoastr.Primul buton, cel

    de forma unei sge&i orientate n partea stng, permite navigarea la ultimaac&iune efectuat. Dac, de exemplu, din directorul SPSS v-a&i pozi&ionat pe

    directorul Windows, apsnd acest buton ve&i reveni din nou n directorul

    SPSS. La prima deschidere a acestei casete de dialog, butonul este inactiv,

    deoarece nu a&i efectuat ncnici o ac&iune care sfie nregistrat.Al doilea

    buton, de forma unui dosar cu o sgeatorientat n sus, permite navigarea

    ascendentprin arborele de directoare. La o primapsare, vve&i deplasa n

    directorul Program Files, la urmtoarea vve&i situa n directorul rdcinC#i a#a mai departe. Cel de-al treilea butonpermite crearea unui nou director

    n directorul curent. Apsnd pe el, ve&i putea crea un nou director, numit

    New Folder, denumire pe care o ve&i putea modifica dupdorin&. n sfr#it,

    ultimul buton controleaz modul n care se afi#eaz pictogramele n caseta

    central. Pute&i alege vizualizarea pictogramelor n format mare, mic, sub

    formde listsau listdetaliat.

    Figura 1.9 Fereastra de selectare afi#ierului n vederea deschiderii

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    9/154

    Statisticaplicatn #tiin&ele socio-umane

    38

    Fereastra centralafi#eaz, dupcum am men&ionat, structura de sub-

    directoare #i fi#iere a directorului curent. Pute&i efectua dublu clic pe numele

    unui director pentru a afi#a con&inutul acestuia sau pe numele unui fi#ier pen-tru a-l deschide n mod direct (fra mai apsa butonul Open). Dacefectua&i

    doar un simplu clic, numele fi#ierului selectat va fi afi#at n caseta File name

    #i va trebui sfolosi&i apoi butonul Openpentru a-l deschide. Caseta derulan-

    tFiles of typereprezintun filtru pentru fi#ierele afi#ate. Daco vom des-

    chide, efectund clic pe sgeata orientatn jos din partea dreapta acesteia,

    vom putea alege ce anume tip de fi#iere s se afi#eze n sec&iunea central.

    Observm c, de#i directorul SPSS con&ine mai multe fi#iere, sunt afi#atedoar fi#ierele cu extensia .sav, adicfi#ierele care con&in baze de date SPSS,

    deoarece n aceastcasetde filtrare s-a ales extensia .sav. Putem alege alte

    extensii de fi#iere care sunt afi#ate, de exemplu formatul Excel (.xls) sau

    dBase (.dbf), iar SPSS va afi#a doar fi#ierele ce au aceastextensie.

    Deschiderea propriu-zis a unui fi#ier se face fie efectund clic pe

    acesta #i apsnd butonul Open,fie efectund dublu clic pe numele fi#ierului.

    Spre exemplu, vom ncrca baza de date Cars din directorul implicit SPSS,bazde date ce reprezintun inventar al diferitelor tipuri de ma#ini #i al ca-

    racteristicilor acestora.

    Dupdeschidere, observm cs-a modificat aspectul ferestrei princi-

    pale SPSS. n primul rnd, n bara de titlu a aprut mesajul Cars SPSS Da-

    ta Editor, mesaj ce ne informeazcam deschis baza de date Cars #i c

    ea este pregtitpentru analiz. De asemenea, constatm cstructura acesteiaeste compusdin opt variabile, fiecare dintre ele reprezentnd o anumitca-

    racteristica ma#inilor. Ultima variabil, variabila Filter_$ este o variabil

    internfolositde programul SPSS pentru o filtrare anterioara datelor, vari-

    abil pe care ne propunem s o #tergem. Cum? Efectund clic pe numele

    acesteia. Observm cntregul con&inut al coloanei Filter_$ s-a selectat. n

    continuare, apsm tasta Delete, situatpe tastatur, n partea dreapta gru-

    pului principal de taste, iar variabila a fost eliminatmpreuncu toate datele

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    10/154

    Cristian Opariuc-Dan

    39

    acesteia. Felicitri. Iat #i prima dumneavoastr interven&ie real n SPSS.

    Dup cum bine #tim, orice prim interven&ie ntr-un program nseamn o

    #tergere a ceva. Nici noi nu puteam face excep&ie!Baza de date deschisde ctre dumneavoastra fost afi#atn sec&iu-

    nea Data view, fapt care ne atrage aten&ia cn acest mod putem afi#a #i ur-

    mri con&inutul datelor din baza de date. Dacvom efectua clic pe sec&iunea

    Variable view,vom intra n modul de definire a datelor. Dupcum ne spune

    #i numele sec&iunii, aici putem vizualiza #i edita denumirea, tipul #i alte in-

    forma&ii referitoare la variabile. Ca sfolosim un limbaj mai tehnic, dac n

    Data view ne aflm n sec&iunea datelor propriu-zise, n Variable view neaflm n sec&iunea meta-datelor, adicn sec&iunea informa&iilor despre date,

    unde putem interveni asupra structurii lor interne. Vom clarifica imediat, prin

    cteva exemple, aceste aspecte.

    Astfel, prima variabil, denumitmpg este o variabilnumeric, ce

    acceptmaximum 4 caractere (adic cifre ntre 0 #i 9999) #i fr zecimale.

    Numele mpg nu este nsun nume intuitiv #i nu ne putem da seama cu pre-

    cizie la ce se referaceastvariabil. Din pcate, doar versiunile de SPSS de

    la 13.0 n sus acceptnume de variabile cu mai mult de 8 caractere, nsnu

    se permite includerea spa&iilor sau a altor semne de punctua&ie n denumirea

    acestora #i de aceea va trebui sfim foarte restrictivi n momentul n care le

    crem. Pentru a n&elege mai u#or la ce anume se refero anumitvariabil,

    Figura 1.10 Sec&iunea de definire a variabilelor

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    11/154

    Statisticaplicatn #tiin&ele socio-umane

    40

    avem posibilitatea de a o eticheta, adicde a include un text descriptiv asoci-

    at numelui ei. n cazul nostru, eticheta variabilei ne informeazcmpg se

    refer la Miles per Gallon, adic la consumul automobilului exprimat ndistan&a pe care acesta o poate parcurge cu un galon de combustibil.

    Urmtoarea sec&iune prezintvalorile pe care le putem defini pentru

    respectiva variabil. Iat, n cazul variabilei origin, care se referla &ara de

    produc&ie a ma#inilor, observm cs-a asociat valoarea 1 pentru ma#inile de

    produc&ie american, valoarea 2 pentru cele de produc&ie european#i valoa-

    rea 3 pentru cele japoneze.

    n spa&iul destinat definirii variabilelor, avem, de asemenea, posibili-

    tatea de a controla modul de tratare a cazurilor lips, alinierea datelor n ca-

    drul celulelor #i definirea tipului de variabil nominal, ordinal#i scalar.

    Efectund clic pe aceste sec&iuni, a&i observat c, uneori, apare n par-

    tea dreapta acestora fie un buton cu punctele de suspensie care va deschide

    o casetde dialog unde se pot controla parametrii valorilor acceptate, fie un

    buton de incrementare/decrementare cu ajutorul cruia pute&i mri, respectivmic#ora o anumitvaloare, fie o casetde selec&ie sgeata orientatn jos

    prin care pute&i deschide o list, de unde sselecta&i anumite valori.

    Exerciiu practic:

    n exerci&iul care urmeaz vom traduce pur #i simplu n romne#te

    structura acestei baze de date #i vom salva baza de date sub un nou nume,

    Masini (aten&ie, nu folosi&i diacriticele romne#ti n scrierea literelor, prinurmare, n acest caz, nu folosi&i litera #, ci s. Deci nu vom salva cu Ma#ini,

    ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS

    (aceea#i men&iune referitoare la diacritice).

    n cazul primei variabile, numele va rmne acela#i, iar noi vom mo-

    difica doar descrierea. Vom da clic n sec&iunea Label, acolo unde se afl

    afi#at textul Miles per Gallon #i vom scrie textul Mile per galon.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    12/154

    Cristian Opariuc-Dan

    41

    A doua variabilse nume#te engine. Vom schimba numele acesteia

    n cilindree (ne-am ncadrat n 8 caractere), fcnd clic n coloana Name#i

    scriind noul nume. Eticheta va deveni, pentru a doua variabil, Capacitatecilindric, pe care o ve&i modifica dupexemplul primei variabile.

    Procedm la fel n cazul variabilelor 2, 3, 4, 5 #i 6, lsnd traducerea

    din englez n romn la latitudinea dumneavoastr. Aten&ie, ns, la acel

    maximum de 8 caractere cnd redenumi&i o variabil.

    Variabila numrul 7 se refer la

    &ara de origine a ma#inilor. O vom rede-

    numi origine #i vom modifica, desigur,

    eticheta. Exist ns, la acest nivel, un

    element n plus, #i anume coloana Va-

    lues. Vmai aminti&i probabil de ma#ini-

    le americane, europene #i japoneze. Da-

    cvom da clic pe celula corespunztoare

    coloanei Values pentru aceastvariabil,constatm apari&ia unui mic buton cu puncte de suspensie n partea dreapta

    celulei. Apsnd acest buton se deschide o noufereastr, fereastra de confi-

    gurare a valorilor asociate. Vorbeam anterior despre ma#ini de produc&ie

    american, european#i japonez. n aceastcasetvedem lista acestor aso-

    cieri n partea de jos. n stnga listei, exist3 butoane: Addcu ajutorul cruia

    putem crea o nou asociere, Change prin care putem modifica o asociere

    selectat#i Removecare #terge, eliminasocierea selectat. Noi ne-am pro-pus straducem aceaststructurde date n limba romn. Vom efectua clic

    pe prima asociere 1 = American. Constatm c, automat, n caseta Valuea

    aprut cifra 1, iar n caseta Value Labeltextul American. Putem deduce cu

    u#urin& c valorii 1 i s-a asociat textul American(apropo, la ce nivel de

    msurare ne aflm aici #i ce fel de variabileste aceasta?). De asemenea, s-a

    activat butonul Remove, SPSS presupunnd c dorim s eliminm aceast

    asociere din moment ce am selectat-o. Pentru a modifica textul, efectum clic

    Figura 1.11 Etichetarea variabilelor denivel nominal #i ordinal

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    13/154

    Statisticaplicatn #tiin&ele socio-umane

    42

    n interiorul casetei Value Label#i scriem n loc de American, America

    (mai bine spus, #tergem un n). De data aceasta, se activeaz #i butonul

    Change, SPSS depistnd modificarea efectuat#i presupunnd cvom doriso #i aplicm efectiv. Dacve&i apsa acest buton (Change), ve&i constata c

    eticheta s-a modificat din 1 = American n 1 = America. Felicitri. A&i reali-

    zat prima traducere. Acum proceda&i la fel pentru Europa #i Japonia. De-

    sigur, oricnd pute&i include o nouasociere. Tasta&i cifra 4 n caseta Value

    (deoarece ar urma 4 n ordine logic) #i textul Romnia n caseta Value

    Label,apoi apsa&i butonul Add care a&i observat ca devenit activ. Astfel

    a&i asociat valoarea 4 ma#inilor de produc&ie romneasc. n momentul ncare a&i terminat de efectuat toate asocierile, apsa&i butonul OKpentru a le

    memora #i a prsi formularul. Re&ine&i capsarea butonului Cancelduce la

    prsirea formularului frmemorarea asocierilor.

    Apare totu#i o ntrebare. De ce s folosim aceste asocieri n loc de a

    scrie pur #i simplu n baza de date America, Europa #i Japonia? n

    primul rnd, pentru c este mai u#or. Imagina&i-v c ave&i de introdus un

    numr de 3000 de date n baza dumneavoastr de date. n loc s scrie&i defiecare datun text format din 6-8 caractere, ve&i tasta pur #i simplu 1 atunci

    cnd vreferi&i la America, 2 cnd vreferi&i la Europa #i 3 cnd vreferi&i la

    Japonia. SPSS va #ti, de fiecare dat, n urma asocierilor realizate n etapa

    anterioar, la ce anume se refer1, 2 #i 3. n al doilea rnd, de#i 1, 2 #i 3 sunt

    doar ni#te etichete pentru America, Europa #i Japonia, se preteazmult mai

    bine la prelucrrile statistice ulterioare, fiind date numerice.

    Proceda&i la fel #i cu ultima variabil, referitoare la numrul de cilin-

    dri ai motorului, pentru ca, n final, sob&ine&i structura completa bazei de

    date.

    Prin acest exerci&iu, ne-am deprins cu unele elemente ale configurrii

    structurii bazei de date. n continuare, vom salva baza de date modificatsub

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    14/154

    Cristian Opariuc-Dan

    43

    denumirea de Masini. Directorul folosit va fi C:\Exercitii SPSS (aten&ie

    la diacritice!).

    Pute&i alege meniul File #i op&iunea Save sau Save as, pute&i apsacombina&ia de taste Ctrl+S sau Alt+F, Alt+S sau pute&i apsa butonul de

    salvare de pe bara de instrumente (acela care are o dischet drept pictogra-

    m). Dar aten&ie! Diferen&a dintre op&iunea Save #i Save as este aceea c,

    folosind Save,se vor salva modificrile efectuate tot n baza de date ini&ial,

    n cazul nostru baza de date Cars. Noi ne-am propus ssalvm baza de date

    sub un alt nume #i ntr-un alt loc, deci nu vom putea folosi dect op&iunea

    Save as (Salveaz ca). Se va deschidecaseta de salvare a unei baze de date

    care are acela#i aspect ca #i caseta de

    deschidere a unei baze de date, cu ex-

    cep&ia butonului Open, n acest caz

    denumirea acestuia fiind Save. Folosind

    cuno#tin&ele dobndite anterior, va tre-

    bui svpozi&iona&i cu ajutorul caseteiSave in (echivalenta casetei Look in

    din fereastra de deschidere a bazei de

    date) n directorul rdcinC:\,screa&i un nou director folosind butonul de

    creare a unui director din acest formular pe care s-l denumi&i Exerci&ii

    SPSS, s efectua&i dublu clic pe acesta pentru a-l deschide #i s introduce&i

    numele bazei de date Masinin caseta File name. Apsa&i apoi butonul Save

    pentru a salva efectiv fi#ierul pe disc. A&i reu#it, nu-i a#a?

    n urma acestor opera&iuni, n bara de titlu SPSS va aprea mesajul

    Masini SPSS Data Editor, care ne informeaz c programul a salvat cu

    succes baza de date pe disc #i a activat-o.

    Reamintim faptul c, la crearea unei noi baze de date, folosirea oric-

    ror op&iuni de salvare (meniul File, butonul de pe bara de instrumente sau

    Figura 1.12 Fereastra de salvare aunei baze de date

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    15/154

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    16/154

    Cristian Opariuc-Dan

    45

    Dupconstruirea structurii de date, proceda&i la salvarea fi#ierului n

    locul precizat.

    Folosind cuno#tin&ele teoretice acumulate, preciza&i tipul fiecrei va-riabile create n acest exerci&iu.

    Ne propunem n continuare aprofundarea definirii variabilelor n

    SPSS. Pentru aceasta, ne vom folosi de baza de date IQ creat#i salvatn

    exerci&iul anterior. n sec&iunea Data View, am remarcat deja prezen&a a zece

    caracteristici prin care se poate defini o variabiln SPSS. Prima dintre aces-

    tea se referla numele variabilei (Name),caracteristicce nu presupune preamulte explica&ii. Numele variabilei reprezintmodul n care aceasta va fi ape-

    latn toate prelucrrile efectuate folosind baza de date. Nu putem nssnu

    precizm cSPSS impune o serie de restric&ii n denumirea variabilelor (ver-

    siunile mai mici de versiunea 13): n primul rnd, numele acestora snu de-

    p#easc 8 caractere, variabilele cu nume mai lungi de 8 caractere nefiind

    acceptate. Apoi, nu pot fi folosite spa&ii sau semne de punctua&ie n denumi-

    rea variabilelor, putnd fi ns folosit linia de subliniere pentru cazurile ncare dorim s abreviem o variabil format din dou cuvinte. De exemplu,

    dacavem o variabilcare se referla anul na#terii, o vom putea abrevia de-

    numind-o an_naste.Astfel, lungimea ei este de 8 caractere, fiind acceptatde

    SPSS, iar cele doucuvinte componente le-am separat printr-o linie de subli-

    niere, fapt de asemenea acceptat de SPSS. Nu conteazdacscriem numele

    variabilelor cu litere mari sau cu litere mici, deoarece, n final, SPSS le con-

    verte#te automat n litere mici. Din punctul de vedere al primei caracteristici,baza noastr de date IQ nu creeaz probleme, fiind definite cinci nume de

    variabile: numele, varsta, sexul, scoala #i iq.

    A doua caracteristicse referla tipul de date ce va fi stocat n aceste

    variabile (Type), caracteristicpe care nu am abordat-o n detaliu n timpul

    prezentrii noastre de pnacum. Aceast sec&iune con&ine un buton cu trei

    puncte de suspensie, pe care l putem apsa pentru a deschide fereastra de

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    17/154

    Statisticaplicatn #tiin&ele socio-umane

    46

    configurare a tipului de date. Aceasta con&ine o serie de butoane de op&iuni,

    dintre care putem selecta tipul de date pe care variabila noastr l va stoca,

    dupcum urmeaz:Tipul de date Numeric

    se refer la numere. Valorile

    acceptate vor fi, deci, numere, n

    format standard. Alegnd acest tip

    de date, putem stabili #i dimensiu-

    nea acestora valoarea maximpe

    care SPSS o poate accepta prinprecizarea numrului de caractere

    n cmpul Width #i numrul de

    caractere dupvirguln cmpul Decimal Places. De exemplu, numrul ma-

    xim de caractere 3 #i 2 caractere zecimale nseamncacea variabilpoate

    stoca valori numerice de la 0 pnla 999,99. Acest tip de date va scrie valori-

    le numerice frnici o separa&ie ntre sute #i mii #i folosind ca separator ze-

    cimal separatorul configurat al sistemului. Un exemplu de numr scris nacest format ar fi 78457845.57

    Tipul de date Comma se refer, de asemenea, la numere #i pot fi

    definite la fel ca tipul anterior, numai c acestea vor fi afi#ate folosindu-se

    virgula ca separator ntre valoarea sutelor #i valoarea miilor #i punctul ca se-

    parator al valorilor zecimale. De exemplu, o valoare numericn acest format

    ar arta astfel: 9,999.89. Este, practic, formatul numeric clasic american.Tipul de date Dot identic cu tipul de date anterior, doar cse in-

    verseazrolul punctului #i al virgulei. Relund acela#i exemplu, numrul de

    mai sus va fi scris astfel: 9.999,89 n acest caz recunoa#tem formatul rom-

    nesc.

    Tipul de date Scientific notation se referla modul #tiin&ific de

    afi#are a cifrelor, folosind litera E pentru a reprezenta puterile lui 10. Modul

    Figura 1.13 Stabilirea tipului de datea unei variabile

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    18/154

    Cristian Opariuc-Dan

    47

    de configurare a dimensiunii variabilei este acela#i, iar un exemplu de numr

    folosind aceast reprezentare poate fi 1.23E2 ceea ce semnific de fapt

    123.00.Tipul de date Date se refer

    la date calendaristice. Alegnd aceast

    op&iune, va trebui s configura&i, selec-

    tnd din lista ce se va deschide, modul de

    afi#are a datei calendaristice dintr-o mul-

    &ime de formate care vi se ofer.

    Tipul de date Dollar se refe-

    rla valori monetare, avndu-se n vede-

    re moneda american. Pute&i alege #i particulariza valoarea maximpe care o

    poate accepta variabila din lista ce se afi#eazsau pute&i particulariza aceast

    valoare, la fel ca n cazul valorilor numerice.

    Tipul de date Custom currency permite definirea unor valori

    monetare particularizate, valabile pentru alte &ri n afara Statelor Unite. Sepoate defini forma de prezentare a variabilei #i valoarea maximacceptat, la

    fel ca la tipul anterior.

    Tipul de date String stocheazdoar #iruri de caractere, cu alte

    cuvinte texte, frnici o posibilitate de prelucrare statistic. Poate fi definit

    #i aici dimensiunea maxim pe care o poate avea variabila din punctul de

    vedere al numrului de caractere acceptate. n cazul nostru, variabila nume

    este un exemplu excelent de variabilde tip string.

    Caracteristica a treia #i caracteristica a patra a unei variabile, respectiv

    Width#i Decimalsse referexact la valorile maxime pe care le pot accepta

    variabilele #i la numrul de zecimale, elemente pe care le-am discutat anteri-

    or, iar aceste doucaracteristici nu fac dect screeze o altposibilitate de

    definire a variabilelor sub acest aspect.

    Figura 1.14 Tipul de datecalendaristice

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    19/154

    Statisticaplicatn #tiin&ele socio-umane

    48

    n cazul exemplului nostru, constatm cavem o singurvariabilde

    tip string, variabila nume care poate accepta maxim 20 de caractere, toate

    celelalte variabile fiind de tip numeric; variabilele sexul #i #coala potaccepta doar o singurcifrfrzecimale, iar variabilele varsta #i iq pot

    accepta 3 cifre frzecimale. Aceastdefini&ie permite stocarea subiec&ilor cu

    numele format din maxim 20 de litere, vrsta poate lua valori de pnla 999,

    suficient, deci, pentru scopurile noastre, acela#i lucru fiind valabil #i pentru

    coeficientul de inteligen&. Sexul #i nivelul de #colarizare acceptdoar o sin-

    gurcifr, deoarece am convenit sasociem valoarea 1 cu sexul masculin #i 2

    cu sexul feminin, n mod analog procednd #i cu nivelul de #colarizare. Date-le au fost definite ca numerice pentru a crea posibilitatea interpretrii lor ulte-

    rioare, cunoscndu-se faptul cdatele de tip string nu pot fi interpretate sta-

    tistic.

    Urmtoarea caracteristic, caracteristica Label, permite includerea

    unei denumiri mai intuitive a variabilei, prin care spoatfi mai u#or identi-

    ficat#i recunoscut. Astfel, variabilei nume i putem da eticheta Numele

    subiec&ilor, variabila iq o putem eticheta drept Coeficientul de inteligen-& #i a#a mai departe. Putem include orice etichetdescriptivdorim pentru

    numele unei variabile, cu condi&ia ca lungimea acesteia snu dep#easc255

    de caractere. Deci aten&ie la scrierea romanelor n descrierea variabilelor!!!

    Aceastcaracteristicmai are nso func&ie important; SPSS include etiche-

    ta variabilelor n rapoartele finale rezultate n urma prelucrrii datelor. Dac

    crea&i un tabel de frecven&, SPSS nu va afi#a numai numele variabilei, de

    exemplu iq, ci va include #i descrierea acesteia, Coeficientul de inteligen-&, fcnd astfel mult mai estetice #i mai inteligibile foile de raport.

    Caracteristica Valuesam discutat-o pe larg n sec&iunile anterioare #i

    nu vom mai reveni asupra ei. Men&ionm doar cea permite clasificri (deci

    variabile categoriale) #i asocieri de valori. Spre exemplu, putem asocia valoa-

    rea 1 sexului masculin #i valoarea 2 sexului feminin, pentru a putea introduce

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    20/154

    Cristian Opariuc-Dan

    49

    mai u#or datele #i pentru a putea efectua prelucrri statistice la nivel de varia-

    bile nominale.

    Caracteristica Missingpermite defi-nirea modului n care vor fi tratate valorile

    lipsdin cadrul unei variabile. Uneori, este

    important scunoa#tem de ce lipsesc valori

    dintr-o variabil. Datele lipsse pot datora,

    spre exemplu, faptului c subiectul refuz

    srspundla o anumitntrebare sau fap-

    tului c ntrebarea nu este adresat aceluisubiect. Iatdousitua&ii care ar necesita un

    tratament separat al valorilor lips. Datele pe care le ve&i trata n mod explicit

    ca date lips pot fi supuse apoi unei analize statistice separate, fiind ini&ial

    excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-

    tionarele sociologice, se referla codificarea rspunsurilor de tip Nu #tiu/Nu

    rspund. Majoritatea cercettorilor codeazaceste variante cu 9 sau 99. Evi-

    dent, variantele incerte nu vor face obiectul prelucrrii ini&iale a datelor. Fo-losind aceastsec&iune se pot include aceste valori (9 sau 99) ca valori lips,

    SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei

    situa&ii. Situa&ia No missing values, cnd comunicm programului c nu

    dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare

    n cursul fiecrei prelucrri de date pe care o realizm, situa&ia Discrete

    missing values,cnd putem defini pn la trei valori care vor fi tratate ca

    valori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la unchestionar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 #i 3 sfie

    luate n calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta, vom

    include cifra 2 n prima dintre cele trei casete ale acestei sec&iuni.) #i situa&ia

    Range plus one optional discrete missing value, n care putem stabili un

    interval pentru care valorile vor fi tratate ca valori lips(spre exemplu, coefi-

    cien&ii de inteligen&cuprin#i ntre 10 #i 75), n plus existnd posibilitatea de

    Figura 1.15 Tratarea valorilor lips

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    21/154

    Statisticaplicatn #tiin&ele socio-umane

    50

    a include #i o valoare particular (discret), ca #i n situa&ia anterioar. n

    exemplul nostru de bazde date, nu avem nici un motiv de a trata n vreun fel

    valorile lips, deci nu vom configura aceastcaracteristic.Caracteristica Columns permite specificarea l&imii coloanei n care

    se vor afi#a valorile variabilelor n modul Data View. Implicit, coloanele au o

    l&ime egalcu 8 caractere. Putem include aici o altvaloare sau putem redi-

    mensiona l&imea coloanelor n modul Data View, prin tragerea cu ajutorul

    maus-ului a liniei de separa&ie dintre dou coloane. Introducerea diferitelor

    valori pentru aceastcaracteristicpermite ajustarea #i redimensionarea pre-

    cisa l&imii coloanelor. n cazul nostru, pentru variabila nume, dimensiu-nea implicitde 8 caractere va fi insuficientpentru prezentarea unui subiect

    cu numele Popescu Valentin, afi#ndu-se doar primele 8 caractere #i anume

    Popescu . Pentru a vedea ntregul nume, fie introduce&i valoarea 16 pentru

    caracteristica Columns a variabilei nume, fie trage&i cu ajutorul maus-ului

    linia de demarca&ie dintre coloana nume #i coloana varsta, pentru a mri

    l&imea coloanei de afi#are a numelui subiec&ilor. Aceastcaracteristic, ca #i

    urmtoarea, nu influen&eaz n niciun fel modul de prelucrare a datelor, cidoar aspectul tabelului de date din Data View.

    Caracteristica Align controleaz modul n care sunt aliniate valorile

    variabilelor n tabelul de date. Pute&i opta pentru o aliniere la stnga, centrare

    sau aliniere la dreapta a valorii variabilelor n cadrul coloanelor din Data

    View, fr a influen&a n vreun fel modul de prelucrare al variabilelor. Ca

    regulgeneral, variabilele de tip string se aliniaz la stnga, iar variabilelede tip numeric sau datcalendaristicse aliniazla dreapta pentru o mai bun

    lizibilitate n cadrul tabelelor de date.

    Ultima caracteristic, Measure, este n acela#i timp #i una foarte im-

    portant, permi&nd alegerea nivelului de msurare al variabilei. Se poate

    opta pentru dousau trei niveluri de msurare, n func&ie de tipul de variabil.

    Astfel, pentru variabila nume, care este o variabilde tip string, sunt dis-

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    22/154

    Cristian Opariuc-Dan

    51

    ponibile doar nivelurile nominal #i ordinal de msurare. Stocarea numelui #i a

    prenumelui are o valoare pur informativ#i nu permite nici mcar o clasifica-

    re a acestora. Nivelul de msurva fi deci nivelul nominal. Variabila varstaeste variabila numericprin care se stocheazvrsta subiec&ilor. Aceastva-

    riabil are intervale egale, zero absolut #i permite rapoarte n cadrul scalei,

    deci poate fi consideratla un nivel de msurare scalar4. Variabila sexul nu

    este altceva dect tot o variabilnominal, care nu permite dect o clasificare

    a persoanelor n func&ie de genul lor biologic. Variabila scoala poate fi pri-

    vitca o variabilnominal, dacinten&ionm doar sclasificm subiec&ii n

    func&ie de studiile absolvite, sau se poate accepta un nivel ordinal de msura-re la nivelul acesteia, dac ierarhizm subiec&ii n func&ie de gradul lor de

    #colarizare. Vom lua n considerare a doua situa&ie #i o vom accepta ca varia-

    bilordinal. n sfr#it, variabila iq este frdiscu&ie o variabilde tip or-

    dinal.

    Iatc, parcurgnd aceste etape, am reu#it n cele din urmsconstru-

    im structura unei baze de date simple n acord cu principiile #i domeniile de

    defini&ie ale variabilelor #i cu nivelul lor de msurare.

    Un aspect important pe care merits-l men&ionm se referla proce-

    sul de codare al variabilelor (proces pe care l-am ntlnit la codarea variabile-

    lor sex #i nivel de #colarizare). n general, cercettorii cu experien&cunosc

    intuitiv modalitatea de codare optima unei variabile. Pentru a veni n spriji-

    nul debutan&ilor, Newton #i Rudestam (1999) propun, n lucrarea Your

    statistical consultant, un set de reguli folosite n acest proces (Field, 2005). Toate datele trebuie codate numeric. Pentru a coda, de exemplu,

    sexul, am putea folosi #i M pentru masculin, respectiv F pen-

    tru feminin. Un asemenea proces de codare ar fi complet eronat,

    4 Ca observa&ie, n SPSS, nivelurile de msur de interval #i de raport au fost reunite subdenumirea generic de nivel de msur scalar. Proiectan&ii acestei aplica&ii au renun&at la

    distingerea celor dou, reunindu-le sub denumirea de nivel scalar.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    23/154

    Statisticaplicatn #tiin&ele socio-umane

    52

    deoarece ar limita radical posibilit&ile de prelucrare statistic a

    datelor. Recomandarea este aceea c, atunci cnd suntem n astfel

    de situa&ii, este de preferat sfolosim, de exemplu, 1 pentru Mas-culin #i 2 pentru Feminin. Aceste cifre nu au dect o valoare de

    etichet #i nu reprezint un proces de ierarhizare (nu spunem c

    masculinul este mai jos dect femininul deoarece are valoarea

    1). La fel de bine putem sscriem 2 masculin #i 1 feminin sau 5

    masculin #i 7 feminin. Acest proces de codare poart numele de

    codare dummy. Tot ceea ce trebuie sface&i este sre&ine&i codu-

    rile atribuite. Fiecare variabil#trebuie s#ocupe o coloan#distinct#n baza

    de date i fiecare subiect va ocupa o singur#nregistrare. Este

    foarte important ca datele unui subiect socupe un singur rnd n

    baza de date SPSS, iar fiecare coloansse refere doar la o singu-

    rvariabil. n cazul n care o variabileste msuratde mai mul-

    te ori (tipic pentru experimente de tip testare ini&ial testare fina-

    l), se vor aloca doucoloane pentru acea variabil, una care sserefere la testarea ini&ial#i una viznd testarea final. De exemplu,

    dacavem un experiment prin care, n urma unei tehnici oarecare,

    presupunem cmbunt&im memoria, va trebui stestm memo-

    ria subiec&ilor nainte de aplicarea tehnicii, s aplicm tehnica #i

    apoi s testm din nou memoria subiec&ilor, pentru a vedea dac

    au aprut modificri. n acest caz, putem defini cele douvariabile

    prin mem_inicare reprezinttestul ini&ial de memorie #i mem_fin

    care se referla testul final. Astfel, nu nclcm aceastregul, iar

    datele vor fi consistente.

    Toate codurile pentru o variabil#trebuie s#fie mutual exclu-

    sive. Cu alte cuvinte, nu trebuie sexiste dect un singur numr ce

    poate fi stocat ntr-o variabil. n anumite chestionare pot exista

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    24/154

    Cristian Opariuc-Dan

    53

    itemi care permit alegeri multiple (de exemplu, la solicitarea: Bi-

    fa&i din urmtoarea listpartidele cu care n mod sigur nu ve&i vo-

    ta la urmtoarele alegeri: pot fi variantele de rspuns PSD,PD, UDMR, PNGetc. n acest caz, subiectul poate alege un

    singur partid, doupartide sau le poate alege pe toate). O aseme-

    nea situa&ie impune crearea unui numr de variabile egal cu vari-

    antele de rspuns (de exemplu nu_PSD, nu_PD, nu_UDMR,

    nu_PNG) cu categorii dihotomice de genul 0 Neselectat, 1 Se-

    lectatcare vor fi analizate ulterior. De obicei, asemenea itemi au

    #i o categorie de genulAltul. Care_______prin intermediul creiasubiectul poate s-#i exprime liber op&iunea. n mod normal,

    aceast categorie se analizeaz prin alte metode #i nu folosind

    SPSS, deoarece variabilitatea rspunsurilor confero valoare sta-

    tisticfoarte redus.

    Fiecare variabil# trebuie codat# astfel nct s# se ob&in#ma-

    ximum de informa&ii.Categoriile sau valorile variabilei nu trebu-

    ie sintetizate n prima variant, ci trebuie incluse exact a#a cumapar pe formularele de colectare a datelor. Sintetizarea valorilor #i

    cumularea categoriilor poate fi fcutmai trziu, utiliznd func&ii-

    le specifice SPSS. De exemplu, se prefer introducerea exact a

    valorii pentru vrsta subiectului, n ani, #i nu ncadrarea subiectu-

    lui n categorii de vrst(sub 14 ani, ntre 14 #i 20 de ani, peste 20

    de ani etc.). Ini&ial, se va proiecta o variabil, varsta, care va stoca

    vrsta exacta subiec&ilor. Ulterior, dacse va dori transformarea

    acestei variabile scalare ntr-o variabildiscret, ordinal, numit

    grup_varsta, se pot folosi tehnici specifice de conversie. Ca idee

    general, ntotdeauna cnd este posibil, se vor folosi variabile con-

    tinui la un nivel de msurct mai aproape de scala de raport. Este

    u#or s transformm o variabil continu ntr-una discret, ns

    imposibil strecem de la o variabildiscretla una continu. Du-

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    25/154

    Statisticaplicatn #tiin&ele socio-umane

    54

    pcum #ti&i deja, valoarea informativcea mai ridicato au totu#i

    variabilele continui, astfel nct profita&i de ele.

    Fiecare subiect trebuie s#aib#o valoare pentru fiecare varia-

    bil#.Uneori nu este posibil sincludem valori n fiecare coloan,

    fie deoarece subiectul nu a rspuns, fie pentru citemul respectiv

    nu i se adreseaz. n acest caz, se recomandslsa&i acea celul

    liber, deoarece SPSS este astfel proiectat nct strateze celulele

    goale drept cazuri lips. Introducerea altor valori pentru cazurile

    lipspoate crea confuzii. Respecta&i ntotdeauna regula ceea ce e

    cel mai simplu este #i cel mai bun.

    Regulile de codare se vor aplica tuturor subiec&ilor.Acest lucru

    nseamn c nu pute&i aplica reguli valabile doar pentru anumi&i

    participan&i. De exemplu, dacdori&i ca anumite valori sfie trata-

    te ca valori lipspentru un anumit subiect, nu pute&i face acest lu-

    cru. Valorile lipsvor fi tratate similar pentru to&i subiec&ii.

    Folosi&i coduri n concordancu sensul scalei.Unele chestio-nare presupun tipuri de scale ordinale (de exemplu 1 niciodat, 2

    rareori, 3 uneori, 4 deseori, 5 ntotdeauna). De#i scalele pot

    fi codate #i invers (1 ntotdeauna, 2 deseori, 3 uneori, 4 ra-

    reori, 5 niciodat), se recomand pstrarea sensului natural al

    scalei pentru evitarea problemelor ulterioare referitoare la inter-

    pretare. Mai u#or asociem niciodat cu 1 dect niciodat cu 5.

    Oricum, chiar daculterior existsuficiente posibilit&i de recoda-re a valorilor astfel nct analiza s fie consistent, proiectarea

    adecvat a cercetrii #i codrii v poate scuti de bti de cap #i

    muncinutil.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    26/154

    Cristian Opariuc-Dan

    55

    Dupproiectarea bazei de date, se recoman-

    d listarea structurii acesteia (a meta-informa&iilor)

    n vederea consultrii ulterioare. Dacnu ve&i lucracteva luni cu baza de date, probabil cnu ve&i re&ine

    la ce se refer mem_ini sau mpg #i nici de ce tip

    este. SPSS prezint o modalitate u#oar de a afi#a

    structura bazei de date cu informa&ii complete. Nu

    trebuie dect saccesa&i meniul File#i apoi op&iunea

    Display Data File Information. Se va deschide o

    nousec&iune care v invitsalege&i ntre a afi#ainforma&iile bazei de date curente (Working File)

    sau cele ale unei alte baze de date de pe disc

    (External File). Noi suntem interesa&i de afi#area structurii bazei noastre

    de date (IQ.sav) #i vom alege, a#adar, prima op&iune.

    n fereastra de rezultate (Output), vor aprea o serie de tabele cores-

    punztoare defini&iilor variabilelor din baza de date, astfel:

    Variable Information

    1Numele

    subiectuluiNominal 14 Left A20 A20

    2Varsta

    subiectilorScale 8 Right F2 F2

    3 Genulbiologic al

    subiectilor

    Scale 8 Right F1 F1

    4

    Coeficientu

    l de

    inteligenta

    Scale 8 Right F3 F3

    Variable

    nume

    varsta

    sexul

    iq

    Position Label

    Measurement

    Level Column Width Alignment Print Format Write Format

    Variables in the working file

    Figura 1.16 Afi#area infor-ma&iilor despre baza de date

    Tabelul 1.1 Tabelul de structura bazei de date

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    27/154

    Statistic aplicat n tiinele socio-umane

    92

    III.2.5 Obinerea indicatorilor tendinei centrale n SPSS

    V mai amintii, cred, de baza de date creat n SPSS n capitolul unu

    i pe care am numit-o IQ. Haidei s o deschidem. Dac nu reuii, revedeiprimul capitol.

    Acum vom introduce cteva date n SPSS. Trecem, deci, n modul

    Data View prin apsarea tabulatorului din partea din stnga jos a progra-

    mului SPSS.

    Se afieaz o foaie de lucru, un tabel similar tabelului din Excel, n

    care, pe prima coloan, cea de culoare gri (capul de tabel), ntlnim numelevariabilelor definite anterior.

    Modul de lucru este analog celui din Excel. Se scriu pur i simplu da-

    tele n celule. Atenie! Avem dou variabile pentru care am asociat valori:

    variabila sexul i variabila scoala. Aici nu vom scrie cuvntul Mascu-

    lin sau Feminin, ci vom tasta 1 pentru Masculin i 2 pentru Feminin.

    La fel i n cazul variabilei scoala, vom tasta 1 pentru Primare, 2 pentru

    Gimnaziu i aa mai departe.

    Baza dumneavoastr de date trebuie s arate n final ca n figura de

    mai sus. O mic precizare. Pe bara de instrumente, penultimul buton se nu-

    mete Value Labels i arat ca n imaginea alturat. La o apsare a

    acestuia, butonul se activeaz, iar

    n baza de date se afieazetiche-

    tele asociaiilorfcute, ca n figu-

    ra alturat. La o nou apsare,

    etichetele asociaiilor nu se mai

    afieaz, ci se afieaz valorile

    asociaiilor ca n figura mare de

    mai sus.

    Figura 3.2Baza de date cu afiarea etichetelor

    asocierilor

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    28/154

    Cristian Opariuc-Dan

    93

    Dup ce am introdus cele 30 de date, vom salva baza de date i vom

    iniia procedura de extragere a indicatorilor tendinei centrale. Indicatorii

    tendinei centrale ne sunt furnizai prin interme-diul numeroaselor proceduri statistice. Cele mai

    simple comenzi, pentru a nu complica inutil ex-

    punerea, le gsim n meniul Analyzei apoi n

    meniul Descriptive Statistics. n traducere,

    analize statistici descriptive. Primele trei co-

    menzi din acest submeniu pot extrage indicatorii

    tendinei centrale. Vom analiza doar prima comand, comandaFrequencies, urmnd ca celelalte dou s le discutm cu alte ocazii,

    deoarece presupun i alte informaii.

    Comanda Frequencies sau

    frecveneprezint cele trei puncte, fapt

    care va duce la deschiderea unei noi case-

    te de dialog. Dai clic pe aceast comand

    i vei obine o caset ca cea din imagineade mai jos.

    n partea stng se afl o list cu

    toate variabilele din baza dumneavoastr

    de date. Alturi de aceast list, se afl un buton de transfer (acel buton cu o

    sgeat pe el). Urmeaz apoi lista

    Variable(s), care nseamn variabile-le pe care le introducem spre analiz.

    Pentru a introduce o variabil spre ana-

    liz, trebuie s o selectm, printr-un clic

    simplu pe numele acesteia, din lista de

    variabile din partea stng. O variabil

    selectat are fundalul albastru (sau o

    Figura 3.3Lansarea proce-durilor de analiz descriptiv

    pe frecvene

    Figura 3.4Caseta de analize descrip-

    tive utilizndu-se frecvenele

    Figura 3.5Includerea variabilelor spre

    analiz

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    29/154

    Statistic aplicat n tiinele socio-umane

    94

    alt culoare n funcie de schema de culori a calculatorului dumneavoastr).

    Dup ce o selectai, apsai butonul de transfer (care va avea sgeata orientat

    spre lista Variable(s)) pentru a transfera variabila dumneavoastr n listavariabilelor ce urmeaz a fi analizate. n figura din stnga, transferm variabi-

    la Varsta subiectilor din lista variabilelor din baza de date n lista variabile-

    lor supuse analizei. n final, va trebui s obinei o imagine ca cea de alturi.

    Observai c dac am transferat variabila Varsta subiectilor n lista variabi-

    lelor supuse analizei, butonul de transfer i-a schimbat sensul. Acum, dac

    apsm pe el, scoatem variabila noastr din lista variabilelor supuse anali-

    zei (dup ce, n prealabil, evident, o selectm)i o introducem n lista variabi-lelor totale din baza de date. Oricum, acest buton de transfer ne va nsoi

    permanent n analizele noastre, deoarece va trebui s spunem programului

    ce variabile s analizeze i pe care s nu le analizeze.

    Vom trece n revist acum toate comenzile din aceast fereastr, cu

    precizarea c unele dintre ele vor fi abordate n detaliu n cadrul altor capito-

    le.

    Caseta de bifare Display frequency tables informeaz aplicaia

    SPSS dac s afieze tabelul frecvenelor (n condiiile n care aceast caset

    o bifai) sau s nu-l afieze (n condiiile n care nu o bifai). Tabelul frecven-

    elor este acel tabel general, studiat la capitolul despre organizarea datelor,

    nainte de a grupa valorile n clase. Iat c, acum, am ales ca acest tabel al

    frecvenelor s fie afiat.

    n partea dreapt a acestui formular, se afl un numr de cinci butoanede acionare.

    Butonul OKeste butonul pe care vom apsa pentru a lansaanaliza, dup ce am configurat modul n care dorim ca analiza

    s fie efectuat.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    30/154

    Cristian Opariuc-Dan

    95

    Butonul Pasteeste un buton pe care nu-l vom folosi deloc.El permite lipirea codului care efectueaz analiza curent

    ntr-o fereastr de sintax de comenzi. El se adreseaz utiliza-torilor care doresc s fac programare n SPSS, utiliznd lim-

    bajul propriu de programare al acestei aplicaii.ntr-o alt lu-

    crare, vom aborda i aspecte legate de programarea n SPSS.

    Butonul Resetpermite reiniializarea ferestrei la starea eioriginal. Cu alte cuvinte, toate variabilele din lista de analiz

    sunt eliminate, toate configurrile de analiz pe care le-am f-

    cut sunt iniializate la valoarea lor implicit. Este un buton pecare-l vom folosi destul de frecvent.

    Butonul Canceleste butonul prin care renunm la analizi nchidem aceast fereastr, fr a mai efectua nicio operai-

    une.

    Butonul Helpeste butonul cu ajutorul cruia obinem asis-ten i informaii (n limba englez) referitoare la funciona-rea acestei proceduri. Dac tii englez, nu ezitai s-l utili-

    zai. SPSS are un tutorial excelent pe care l putei parcurge i

    nelege cu succes.

    n partea de jos a formularului,

    se afl trei butoane care permit configu-

    rarea statisticilor pe care le vom calcula.Butonul Statistics este bu-

    tonul pe care vom i apsa acum pentru

    a calcula indicatorii tendinei centrale.

    Dup cum i spune i numele, cu ajuto-

    rul acestui buton, putem stabili ce statis-

    tici descriptive vom analiza. Iat ccele

    Figura 3.6Fereastra de alegere a

    indicatorilor tendinei centrale

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    31/154

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    32/154

    Cristian Opariuc-Dan

    97

    vedem ce se ntmpl.

    Iat c a aprut fereastra de rezultate sau fereastra Output.Nu vom

    intra acum n detalii explicative ale acestei ferestre,pentru c s-ar putea s vsperiai de prea multe informaii i s trecei la Solitaire.Ne vom concentra

    asupra celor dou tabele pe care le-a generat SPSS n partea din dreapta a

    ferestrei de rezultate (partea cea mare), care nu reprezint altceva dect cele

    dou tabele pe care le-am solicitat. Primul tabel conine indicatorii tendinei

    centrale pe care i-am configurat n etapa anterioar.

    Tabelul se numete Statistics i conine n partea de sus numele va-

    riabilei, Varsta subiectilor, pentru a putea identifica variabila cu care ope-

    rm. Apoi ne d numrul de cazuri, N,i ne spune c sunt 30 de date vali-

    de (Valid) i zero date lips (Missing). Cu alte cuvinte, toi cei 30 de

    subieci au nregistrat vrsta lor. Nu exist nici un subiect la care s fi uitat

    s introducem aceast valoare. n continuare, ne spune c media de vrst

    este 29,33 (Mean), mediana este 29 (Median), iar modul. avem o

    problem. SPSS ne infor-meaz n josul tabelului c

    sunt mai multe valori cu

    frecvena cea mai mare i

    c o va afia pe cea mai

    mic, 24 (Multiple

    modes exist. The smallest

    value is shown). Acestaeste, deci, un singur mod real, cel inferior, i urmeaz s vedem care este i

    cealalt valoare modal, deoarece avem o distribuie cu mai multe moduri

    (multimodal).

    Statistics

    Varsta subiectilor

    30

    0

    29,33

    29,00

    24a

    Valid

    Missing

    N

    Mean

    Median

    Mode

    Mult iple modes exist. The smallest v alue is showna.

    Tabel 3.7Indicatorii tendinei centrale

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    33/154

    Cristian Opariuc-Dan

    101

    niciuna. Vomputea nsface media acestor dou eantioane. Adunm 178 cu

    165 i mprim la doi. Obinem 171,5 centimetri, un indicator mai precis

    pentru media populaiei. Iat c media eantioanelor este un indicator careaproximeaz mai bine media unei populaii. Cu ct avem mai multe eantioa-

    ne, cu att putem stabili mai precis media populaiei. Aceast caracteristica

    mediei eantioanelor de a tinde ctre media populaiei poart n statistic nu-

    mele de teorema limitei centrale. Asupra acestui aspect vom reveni i

    vom avea ocazia s-l tratm amnunit ntr-un alt capitol.

    IV.1Reprezentri grafice

    Am studiat n primul capitol o serie de repre-

    zentri grafice uzuale. Vom vedea cum putem repre-

    zenta grafic datele folosind SPSS i ce semnificaie

    au aceste reprezentri. Aadar, vom deschide baza de

    date creatanterior, baza de date IQ, i ne propunem

    s reprezentm datele noastre printr-un grafic cu ba-

    re.

    Vom folosi pentru

    aceasta meniul Graphs i

    apoi opiunea Bar n general, n meniul

    Graphs gsim toate posibilitile de reprezentare

    grafic a datelor pe care SPSS le pune la dispoziie8.

    n momentul n care am accesat opiunea

    Bar... apare o nou fereastr, n care va trebui s

    alegem tipul de grafic cu bare pe care dorim s-l re-

    prezentm. Avem la dispoziie trei variante: Sim-

    ple (simplu), Clustered (pe clusteri) i

    8n SPSS versiunea 15, modalitatea de construcie a graficelor difer radical, fiind mult mai

    simpl i mai inteligent. Vom aborda aspectele grafice ale aplicaieiSPSS 15, la sfritul

    acestui volum i n volumele viitoare

    Figura 4.1Meniul

    pentru graficul cu bare

    Figura 4.2Alegerea

    tipului de grafic cu bare

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    34/154

    Statistic aplicat n tiinele socio-umane

    102

    Stacked (aditiv). Graficul simplu ne permite reprezentarea cu bare doar a

    variabilei noastre (n cazul nostru vom folosi reprezentarea cu bare a coefici-

    entului de inteligen, iq). Graficul pe clusteri l folosim dac dorim s in-cludem o variabil categorial (de exemplu, dac dorim s prezentm compa-

    rativ coeficientul de inteligen al brbailor ial femeilor), iar graficul aditiv

    prezint valorile una deasupra alteia i se folosete atunci cnd urmrim s

    vedem cu ct crete o variabil n timp sau care este rezultatul cumulrii mai

    multor variabile. n cazul nostru, vom folosi graficul cu bare simplu. Aadar

    vom efectua clic pe imaginea graficului Simplepentru a-l selecta.

    Exist, dup cum putei observa, un numr de trei opiuni pe care leveifolosi: prima opiune, Summaries for group of casesarat c SPSS

    va parcurge categoriile unei singure variabile i va afia, pentru fiecare bar,

    categoria corespunztoare. A doua opiune, Summaries of separate varia-

    bles arat c dou sau mai multe variabile vor fi parcurse, iar barele vor

    indica fiecare dintre variabile. n sfrit, opiunea Values of individual cas-

    es ne spune c SPSS va lucra cu o singur variabil, iar barele vor reprezen-

    ta valorile sale. Aceasta este, de fapt, i opiunea care ne intereseaz pe noi.

    Alegem, deci, aceast opiune, dup care apsm butonul Definepentru a

    defini variabilele ce vor fi reprezentate.

    Apare o nou fereastr cu mai

    multe elemente. Recunoatem, n par-

    tea stng, lista variabilelor din baza

    noastr de date. n partea dreapt, pri-mul element l reprezint caseta Bars

    Represent care se refer la ceea ce

    vor reprezenta barele noastre. Variabi-

    la pe care dorim s o reprezentm este

    Coeficient de inteligen. O vom

    selecta i apoi vom apsa butonul de Figura 4.3Opiunile de reprezentare alegraficului simplu cu bare

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    35/154

    Cristian Opariuc-Dan

    103

    transfer pentru a o include n caseta Bars Represent ca n figura de maijos.

    Pentru moment, att avem de fcut n vederea trasrii graficului cu bare.

    Exist i alte opiuni pe care le putem folosi. Seciunea Category Labelsne permite s alegem dac pe axa

    categoriilor (axa OX) va fi afiat

    numrul fiecrui caz (opiunea

    Case number) sau valorile unei

    alte variabile categoriale pe care le

    vom specifica (opiunea

    Variable:). Seciunea Panelby permite gruparea barelor n

    funcie de o alt variabil categori-

    al. Gruparea poate fi efectuat fie

    pe linii, fie pe coloane, cazuri n

    care va trebui s specificm i vari-

    abilele categoriale n funcie de

    care se va face gruparea, introducndu-le n listele Rows: sauColumns:. Dac avem vreun ablon de grafic preferat, descrcat de pe

    Internet sau construit de noi, l putem folosi pentru a desena graficul nostru,

    bifnd caseta Use chart specification from: i apoi apsnd butonul Fi-

    le care se activeaz i ne invit s

    ncrcm acel fiier. Putem, de aseme-

    nea, da un titlu graficului nostru ap-

    snd butonul Titles. Utilizareaacestui buton v-o lsm dumneavoas-

    tr ca exerciiu. Dup ce am terminat

    de stabilit variabila pentru care dorim

    s trasm graficul, apsm butonul

    OK, care devine activ. SPSS va

    genera graficul n fereastra de rezultate

    Figura 4.4Reprezentarea prin grafic cu bare

    a QI pe nivele se colarizare i n funcie de sex

    302928272625242322212019181716151413121110987654321

    Case Number

    125

    120

    115

    110

    105

    100

    ValueCoeficientdeinteligenta

    Figura 4.5Graficul cu bare simplu al

    coeficientului de inteligen

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    36/154

    Statistic aplicat n tiinele socio-umane

    104

    (Output), rezultnd un desen ca n figura de mai sus. Iat, aadar, reprezenta-

    rea cu bare care ne intereseaz.

    Pentru a exemplifica i ce-lelalte faciliti ale acestei repre-

    zentri grafice, v prezentm, n

    figura alturat, un grafic cu bare,

    n care am folosit ca variabil eti-

    chet Nivelul de colarizare, iar

    graficul este mprit pe linii dup

    variabila Sexul subiecilor. Lan-snd procedura de desenare prin

    apsarea butonului OK, obinem

    urmtorul grafic cu bare:

    Observm dou grafice, n

    cel de jos fiind reprezentat coeficientul de inteligen al brbailor, iar n gra-

    ficul de sus cel al femeilor. Dac privim cu atenie pe axa OX, observm c,pentru fiecare bar, este indicat i nivelul de colarizare al subiectului respec-

    tiv. Dup ce vei stpni la un nivel suficient de ridicat lucrul n SPSS, vei

    putea face combinaii ntre variabile pentru a realiza grafice intuitive cu care

    s v susinei demonstraiile statistice.

    Exerciiu:

    Reprezentai, folosind un grafic cu bare, valorile variabilei Varsta

    subiectilor.

    n primul capitol discutam, de asemenea, despre poligonul frecvene-

    lor absolute (al valorilor individuale), al frecvenelor relative i al frecvene-

    lor cumulate absolute sau relative. Folosind SPSS, vom putea desena poligo-

    nul valorilor individuale prin folosirea unui grafic cu linii. Pentru aceasta,

    vom accesa, tot meniul Graphs i apoi, submeniul Line.La fel ca n

    Fa

    cu

    lta

    te

    Fa

    cu

    lta

    te

    Po

    stl

    ic

    ea

    la

    Li

    ce

    u

    Li

    ce

    u

    Li

    ce

    u

    Po

    stl

    ic

    ea

    la

    Po

    stl

    ic

    ea

    la

    Po

    stl

    ic

    ea

    la

    Po

    stl

    ic

    ea

    la

    Li

    ce

    u

    Li

    ce

    u

    Li

    ce

    u

    Li

    ce

    u

    Gi

    m

    na

    zi

    u

    Pr

    im

    ar

    e

    Pr

    im

    ar

    e

    Fa

    cu

    lta

    te

    Fa

    cu

    lta

    te

    Fa

    cu

    lta

    te

    Fa

    cu

    lta

    te

    Fa

    cu

    lta

    te

    Po

    stl

    ic

    ea

    la

    Po

    stl

    ic

    ea

    la

    Li

    ce

    u

    Li

    ce

    u

    Gi

    m

    na

    zi

    u

    Li

    ce

    u

    Li

    ce

    u

    Li

    ce

    u

    Nivelul de scolarizare

    125

    120

    115

    110

    105

    100

    ValueCoeficientde

    inteligenta

    125

    120

    115

    110

    105

    100

    Masculin

    Feminin

    Sexulsubiectilor

    Figura 4.6 - Reprezentarea prin grafic cu bare

    a QI pe nivele se colarizare i n funcie de sex

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    37/154

    Cristian Opariuc-Dan

    105

    graficul cu bare, se afieaz o nou fereastr care ne invit s alegem tipul

    graficului pe care-l dorim. Avem de ales ntre un grafic simplu (Simple),

    care ne intereseaz i pe noi, un grafic cu linii multiple (Multiple), cepermite trasarea a dou sau mai multe variabile pe ace-

    lai grafic i un grafic de tip pivot (Drop-line), cu

    ajutorul cruia putem reprezenta dou sau mai multe

    categorii de date. Pentru exemplul nostru, vom alege

    graficul de tip simplu. La fel ca n cazul graficului cu

    bare, i aici avem cele trei opiuni cu exact aceeai

    semnificaie. Vom alege, ca i n exemplul anterior,opiunea Values of individual cases,deoarece dorim

    s reprezentm un poligon al

    frecvenelor individuale. Pentru

    a putea lansa procedeul de definire a graficului, putem

    apsa butonul Define.

    Observm apariia unei ferestre identice cu fe-

    reastra pe care am ntlnit-o la graficul cu bare i careare exact aceeai funcionalitate. Nu vom intra din

    nou n detalii

    asupra elemen-

    telor pe care le

    gsim aici, deoarece ele au fost discu-

    tate la graficul cu bare. Vom transfera

    doar variabila Coeficient de inteli-

    gen, din lista variabilelor n lista

    Line Represents, pentru a indica

    programului SPSS variabila pe care

    urmeaz s o reprezinte prin linii. De

    fapt, aceasta este singura diferen

    ntre cele dou ferestre. n fereastra

    Figura 4.7Meniul

    pentru graficul cu linii

    Figura 4.8Selecta-rea tipului de grafic cu

    linii

    Figura 4.9Definirea graficului simplu cu

    linii

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    38/154

    Statistic aplicat n tiinele socio-umane

    106

    anterioar, acest element se numea Bar

    Represent, deoarece era vorba de un

    grafic cu bare, iar aici se numete LineRepresents, deoarece suntem n faa

    unui grafic cu linii.Nu ne rmne acum

    dect s apsm butonul OK care

    vedem c s-a activat, pentru a lansa pro-

    cedura de desenare a graficului. Iat, n

    fereastra de rezultate, apare dup cteva

    momente i poligonul frecvenelorindividuale pe

    care l-am solicitat.

    Cum am putea totui s reprezentm grafic

    poligonul frecvenelor absolute cumulate? Ne

    amintim, din capitolul despre organizarea datelor,

    c frecvenele cumulate se calculeaz prin aduga-

    rea frecvenei unei valori la frecvena cumulat avalorii anterioare, irul valorilor fiind un ir ordo-

    nat. La fel, am vzut c la desenarea unui grafic cu

    linii (sau cu bare) n SPSS, avem la dispoziie mai

    multe opiuni, iar

    noi nu am folosit

    dect opiunea Values of individual cases.

    De data aceasta, vom merge tot n meniulGraphs, opiunea Line.. . Nu vom mai

    alege acum Values of individual cases, ci

    Summaries for groups of cases, adic i

    vom comunica programului s cumuleze ntr-

    un fel valorile unei variabile. Rmnem tot la

    graficul simplu, deoarece ne intereseaz s

    Figura 4.11Configurareagraficului pentru

    recvenele cumulate

    Figura 4.12Stabilirea parametri-

    lor de configurare a frecvenelorcumulate

    302928272625242322212019181716151413121110987654321

    Case Number

    125

    120

    115

    110

    105

    100

    ValueCoeficientdeinteli

    genta

    Figura 4.10Poligonul frecvene-

    lor absolute pentru coeficientul deinteligen

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    39/154

    Cristian Opariuc-Dan

    107

    reprezentm o singur linie i nu un grup de linii sau categorii de linii. Lan-

    sm apoi procedura de definire a graficului, prin apsarea butonului

    Define.

    n momentul n care am schimbat opiunea cu care vom defini datele

    n zona grafic, evident, va aprea o alt fereastr de definiie a datelor, ca n

    figura alturat.

    Exist multe elemente comune cu fereastra anterioar, ns i seciuni

    specifice pe care vom ncerca s le descriem pe scurt. Cea mai important

    seciune este Line Represents, n care nu mai introducem pur i simplu

    variabila, ci definim modul n care vor fi cumulate datele. Putem opta pentru

    N of cases,prin care SPSS va numra apariiile fiecrei valori n irul de

    date, obinnd un poligon al frecvenelor absolute pe date grupate, Cum.

    N,adic apariiile fiecrei valori n irul de date (frecvenele), dar prezentate

    cumulat i exprimarea procentual a acestora (sau frecvenele relative i rela-

    tive cumulate)% of casesi Cum. %. Exist i posibilitatea s repre-

    zentm grafic anumite statistici, folosind opiunea Other statistics, situaien care va trebui s includem varia-

    bila pentru care vom extrage anumii

    indicatori statistici i, de asemenea,

    s precizm ce indicatori se vor fo-

    losi prin activarea butonului

    Change Statistic. Nu intrm

    acum n detalii legate de aceastopiune. n cazul nostru, am ales

    opiunea Cum. N,deoarece dorim

    s reprezentm frecvenele cumulate

    absolute. Avem de stabilit i variabi-

    la pentru care vom desena poligonul

    frecvenelor cumulate absolute, pe care trebuie s o introducem n cmpul

    Category Axis:,folosind butonul de transfer din faa acestui cmp. Acum,

    124121120111110109108107105104103101100

    Coeficient de inteligenta

    30

    25

    20

    15

    10

    5

    0

    CumulativeFrequency

    Figura 4.13Poligonul frecvenelor

    cumulate

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    40/154

    Statistic aplicat n tiinele socio-umane

    108

    nu mai trebuie dect s apsm butonul OK i obinem, iat, poligonul

    frecvenelor absolute cumulate aa cum ne-am dorit. Folosind celelalte trei

    opiuni, pot fi desenate poligoanele frecvenelor absolute i ale frecvenelorrelative i relative cumulate, activiti pe care vi le lsm ca exerciiu.

    Reprezentarea procentual a unor variabile

    categoriale, cum ar fi genul biologic sau nivelul

    de colarizare, se poate face, cel mai bine, folosind

    un grafic de tip plcint (pie), numit i diagram

    de structur. Cu ajutorul programului SPSS, vom

    ncerca s desenm graficul de tip plcint pentruvariabila nivel de colarizare. Pentru a reui acest

    lucru, vom apela tot

    la meniul Graphs

    i vom alege apoi

    submeniul Pie....

    De aceast dat, nu mai avem ce tip degrafic plcint s selectm, iar urmtoarea

    fereastr prezint doar cele trei opiuni pe care

    le-am discutat. Vom selecta acum prima

    opiune, Summaries for groups of

    cases, deoarece ne intereseaz s re-

    prezentm grafic frecvenele cu care

    apar subiecii cu studii primare, cei cugimnaziu, cu liceu etc. i, n plus,

    aceast reprezentare s aib un caracter

    procentual. Deci, alegnd aceast opi-

    une, SPSS va aduna cazurile care au o

    aceeai valoare.

    Figura 4.15Alegerea tipului de

    grafic

    Figura 4.16Configurarea reprezentrii

    prin diagram de structur

    Figura 4.14Meniul

    pentru diagramele destructur

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    41/154

    Cristian Opariuc-Dan

    109

    Pentru a defini graficul, procedm ca i n exemplul anterior, apsnd

    butonul Define. Se va deschide fereastra de definire a graficului, o fereas-

    tr pe care o cunoatem deja de la reprezentarea poligonului frecvenelor cu-mulate. Singura deosebire const n seciunea Slices Representssau, tra-

    dus, ce reprezint feliile plcintei. Evident, n aceast seciune am selectat

    opiunea % of cases,adic amcomunicat programului SPSS s-mi repre-

    zinte grafic procentul n care se gsete fiecare nivel al acestei variabile n

    eantionul total.

    Desigur, trebuie s precizm i variabila pentru care vor fi reprezenta-

    te grafic procentele. Acest lucru l putem face prin transferarea variabileiNivelul de colarizare din lista variabilelor din baza de date n caseta De-

    fine Slices by:Selectai, aadar, vari-

    abila n lista variabilelor din baza de

    date i apsai butonul de transfer din

    faa acestui element pentru a obine o

    imagine ca n figura alturat. n acest

    moment, se activeaz i butonul OK

    pe care va trebui s apsm pentru a

    lansa n execuieprocedura de desena-

    re a graficului. Dup cteva momente,

    obinemn fereastra de rezultate urm-

    torul grafic plcint:

    Observm c acest grafic prezint i o legend prin care suntem in-formai asupra categoriilor variabilei analizate. Putem cu uurin constata c

    majoritatea subiecilor sunt absolveni de liceu, apoi, n proporii relativ ega-

    le, absolveni de postliceal i facultate. Cei mai puini sunt cei cu studii pri-

    mare i gimnaziale.

    Iat, aadar, cteva metode extrem de simple prin care putem desena

    grafice intuitive utiliznd aplicaia SPSS. Toate aceste statistici pe care le-am

    Facultate

    Postliceala

    Liceu

    Gimnaziu

    Primare

    Nivelul de scolarizare

    Figura 4.17Diagrama de structur pentru

    nivelul de studii

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    42/154

    Statistic aplicat n tiinele socio-umane

    110

    prezentat i pe care le vom mai prezenta fac parte din analiza de date explo-

    ratorie,deoarece scopul acesteia este acela de a explora, de a cunoate struc-

    tura datelor analizate.

    V mai amintii, desigur,

    fereastra studiat n capitolul ante-

    rior, prin care am calculat indica-

    torii tendinei centrale. Iat-o, v-o

    reamintesc, iar dumneavoastr va

    trebui s gsii comenzile prin

    care s ajungei la ea, deoarecereprezentarea grafic a datelor se

    poate face i n acest mod. S in-

    troducem, la fel ca n capitolul

    anterior, variabila Coeficient de inteligen, pentru a extrage indicatorii

    tendinei centrale. Sper c v amintii cum se face. Dac nu, v dau un indi-

    ciu: folosii butonul Statistics. Iat c, lng acest buton, se afl un alt

    buton, butonul Chartspe care vom

    apsa. Se deschide o nou fereastr, n

    care putem stabili ce grafic s desenm

    pentru variabila introdus n analiz.

    Opiunea None nu deseneaz niciun

    fel de grafic i ignor setrile grafice.

    Opiunea Bar charts deseneaz un

    grafic cu bare, opiunea Pie charts

    deseneaz grafice plcint i, iat, opiu-

    nea Histograms: ne permite desena-

    rea unei histograme. Aceast opiune o

    ntlnim aici, alturi de caseta de bifare

    With normal curvece permite dese-

    narea curbei normale care caracterizeaz datele din variabila noastr.Nu vom

    Figura 4.18Selectarea variabilei ce ur-

    meaz s fie reprezentat

    Figura 4.19Modul de reprezentare

    grafic din analiza frecvenelor

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    43/154

    Cristian Opariuc-Dan

    111

    bifa acum aceast caset, deoarece despre curba normal vom discuta ntr-un

    alt capitol. Ne rezumm s alegem doar graficul sub form de histogram.

    Anumite grafice pot fi reprezentate sub form de frecvene absolute(opiunea Frequencies) sau sub form de frecvene relative (opiunea

    Percentages), prin selectarea uneia dintre cele dou opiuni din seciunea

    Chart Values. Folosind

    aceast fereastr, avem de

    configurat mult mai puine

    elemente. Deoarece am in-

    trodus anterior variabila pe

    care dorim s o analizm,

    SPSS va lua singur decizia

    modului n care va desena

    graficul. Apsm butonul

    Continue pentru a con-

    firma aciunea noastr i

    apoi butonul OKpentru a

    lansa analiza.

    Dup cteva momen-

    te, SPSS va extrage indicatorii tendinei centrale sub forma celor dou tabele

    discutate n capitolul anterior, ns ne va oferi i histograma variabilei Coe-

    ficient de inteligen, alturi de o serie de date din inventarul statistic de

    baz, pe care le vom discuta ntr-un alt capitol.

    IV.2Analiza grafic a tendinei centrale

    Afirmam n capitolul dedicat indicatorilor tendinei centrale c media

    este cel mai fin, cel mai precis indicator, ns ea are o problem este sen-

    sibil la scoruri extreme i, n acest caz, nu mai aproximeaz bine tendina

    central a setului de date. Totui, cum ne dm seama de existena acestor sco-

    ruri extreme? Tot analiza exploratorie ne vine n ajutor. Utiliznd reprezent-

    125120115110105100

    Coeficient de inteli enta

    5

    4

    3

    2

    1

    0

    Frequency

    Mean =111,33Std. Dev. =8,511

    N =30

    Histogram

    Figura 4.20Histograma pentru coeficientul

    de inteligen

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    44/154

    Statistic aplicat n tiinele socio-umane

    112

    rile de date de mai sus, ne putem face o imagine intuitiv asupra acestor sco-

    ruri extreme. Exist oare o metod mai precis de a le depista? Rspunsul

    este pozitiv i vom prezenta n continuare dou tipuri de grafice deosebite,dar care pot caracteriza mai precis scorurile extreme.

    IV.2.1 Graficul tulpin i frunze

    A fost conceput de ctre Tuckey (1977) i se aseamn foarte mult cu

    histogramele de frecvene, ns, spre deosebire de acestea, afieaz i scoruri-

    le individuale. Un asemenea grafic se deseneaz mai uor manual dect com-

    puterizat i ofer o imagine precis a distribuiei, deoarece alturi de repre-zentarea numeric ofer i o imagine vizual a datelor analizate(Dancey, i

    alii, 2002).

    Dac avem, de exemplu, urmtorul ir ordonat de date: 2, 12, 12, 19,

    19, 20, 20, 20, 25 i dorim s construim un grafic tulpin i frunze, acesta

    va arta dup cum urmeaz:

    Tulpina Frunzele

    0 21 22992 0005

    Oare ce informaiinoi ne aduce acest grafic i cum se interpreteaz?

    Destul de simplu. Tulpina reprezint valorile zecilor, iar frunzele valo-

    rile unitilor. Deci, tulpina 0 cuprinde scorurile de la 0 la 9, tulpina 1-

    scorurile de la 10 la 19, tulpina 2 - scorurile de la 20 la 29 i aa mai departe.Frunzele reprezint frecvenele scorului observat. Astfel, la tulpina 0 (scoruri

    ntre 0 i 9) avem o singur apariie a lui 2. La tulpina 1 (scoruri ntre 10 i

    19) avem frunza 2 de dou ori (adic dou apariii ale lui 12) i frunza 9 de

    dou ori (dou apariii ale lui 19). La tulpina 2 (scoruri ntre 20 i 29) avem

    frunza 0 cu trei apariii (trei scoruri de 20) i frunza 5 cu o singur apariie

    (un singur scor de 25). Simplu, nu? Iat c, dei seamn cu o histogram,

    acest grafic aduce n plusposibilitatea monitorizrii scorurilor individuale.

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    45/154

    Cristian Opariuc-Dan

    113

    Pentru a nelege mai bine, s considermun set mai voluminos de date:1, 1,

    2 ,2 ,2 , 5, 5, 5, 12, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 18, 18, 24, 24, 24,

    24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 28, 28, 28, 28, 28, 28, 28, 32, 32, 33,33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 42, 42, 42, 43, 43, 44. Pentru

    acest set de date, avem urmtorul grafic tulpin i frunze:

    0 112225551 22224444555882 444444555555588888883 223333444444555554 222334Prin aceast reprezentare avem o metod mai concis i mai sintetic

    de explorare a unui volum mare de date. Putem observa c scorurile de la

    tulpina 2 (ntre 20 i 29) sunt cele mai frecvente, iar datele sunt relativ grupa-

    te, fr scoruri extreme. n acest caz, am putea decide utilizarea mediei ca

    indicator al tendinei centrale. Comparativ, s considerm un ir de date cu

    scoruri extreme i s l reprezentm sub forma acestui grafic.

    0, 0, 0, 0, 0, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,

    5, 5, 5, 5, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 13,13, 13, 13, 13, 18, 18, 18, 23, 64

    Graficul pentru acest ir de date ar fi:

    0 00000222222223333333335555555555555557777777777777999999991 0000000333338882 36 4

    Observm c graficul ne indic faptul c majoritatea scorurilor se si-tueaz sub 20, ns avem i un scor extrem, scorul 64. Iat deci o situaie tip i-

    c, n care mediana va fi cel mai bun indicator al tendinei centrale. Totui,

    acest grafic efectuat pe blocuri de 10 valori nu este foarte informativ. Nu

    avem o reprezentare foarte clar a scorurilor sub 20, deoarece exist foarte

    multe. Prin urmare ar fi mai comod pentru noi s reprezentm grafic aceste

    scoruri folosind nu blocuri de 10, ci blocuri de cinci (ntre 0 i 4, apoi ntre 5

  • 8/14/2019 Statistica cu SPSS dupa Opariuc-Dan C.pdf

    46/154

    Statistic aplicat n tiinele socio-umane

    114

    i 9, ntre 10 i 14 i aa mai departe). Folosind un asemenea sistem, graficul

    devine:

    0. 00000222222223333333330* 5555555555555557777777777777999999991. 000000033333

    1* 888

    2. 3

    6. 4

    Observm c am folosit punctul (.) pentru a desemna prima jumtate a

    blocului (0-4) i stelua (*) pentru a desemna a doua jumtate a blocului (5-9). De data aceasta, lucrurile au devenit ceva mai clare. Existacelai scor

    extrem, 64, ns acum putem afirma precis c cei mai muli subieci au obi-

    nut rezultate ntre 5 i 9, ceea ce reprezint un plus de informaie. Rolul aces-

    tei reprezentri este mai ales acela de a identifica existena scorurilor extreme

    ntr-un set de date n vederea stabilirii indicatorului tendinei centrale ce va fi

    folosit.

    Discutam, pe la nceputul lucrrii noastre, despre situaia n care or-donm toate valorile posibile i apoi stabilim frecvenele absolute prin num-

    rarea apariiilor fiecrui scor individual. La fel, am abordat i problema orga-

    nizrii datelor n clase. Am vzut atunci c un numr mare de clase reprezint

    o abordare analitic, accentul cznd mai mult pe valori individuale i se

    pierde tendina de ansamblu. Analog, un numr mic de clase determin o

    perspectiv sintetic, unde vedem clar tendina de ansamblu, ns de pierde

    viziunea individual. Unul dintre avantajele incontestabile ale acestui graficeste acela c permite o viziune de ansamblu fr, ns, a se pierd