Aplicatii Computerizate de Analiza a Datelor

UNIVERSITATEA BABE-BOLYAI CLUJ-NAPOCA FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI SECIA PSIHOLOGIENVMNT LA DISTAN

APLICAII COMPUTERIZATE DE ANALIZ A DATELOR- SEMESTRUL II -

Asistent universitar. dr. Robert Balazsi Cercettor tiinific drd. Gabriel Vona

1

Aplicaii Computerizate de Analiz a DatelorPropuntori: Asist. Univ. drd. Robert Balazsi, Cercet. t. drd. Gabriel Vonas. Prerechizite: Introducere n Psihologie, Psihologie experimental i analiza datelor, Psihologie cognitiv Cerine: Pentru parcurgerea cu succes a acestui curs sunt necesare: nvarea suportului de curs electronic realizarea sarcinilor cerute pe parcursul semestrului (menionate la ANUNURI pe site-ul facultii n timpul semestrului). Examinare: Evaluarea se va realiza pe baz de colocviu. Nota final se compune din nota la examen n proporie de 50% (5 puncte) i nota la proiect pe semestru 50% (5 puncte) (predarea acestuia se face n sesiune nainte de examenul final).

Prezentare general Cursul Aplicaii Computerizate de Analiz a Datelor cuprinde apte module, care prezint procedurile prin care diverse softuri (programe) pot fi utilizate n demersul de cercetare: construcia unui design experimental, colectarea i procesarea statistic a datelor. Bazndu-se pe cunotinele de cercetare asimilate la cursurile anului nti, disciplina i propune s formeze deprinderi de utilizare a softurilor n cercetarea aplicat n psihologie. Vom prezenta dou programe: SuperLab i SPSS. SuperLab-ul este un soft care permite elaborarea i implementarea unor designuri experimentale simple i complexe (elaborarea unor stimuli experimentali, organizarea stimulilor conform designului, msurarea stimulilor, etc). Prin intermediul acestuia vom aborda mai multe paradigme clasice de investigarea a funciilor perceptive, cognitive superioare i a funciilor executive. Softul SPSS permite procesarea statistic a datelor colectate: calcule statistice descriptive i calcule statistice infereniale. Modulele cursului sunt: - Aplicarea softurilor experimentale n cercetare: programul SuperLab i elaborarea unui design experimental - Aplicarea softurilor statistice n cercetare: programul SPSS i elaborarea unei baze de date - Utilizarea SPSS n statistica descriptiv: modaliti de reprezentare grafic, calculul indicatorilor tendinei centrale, ai dispersiei i ai distribuiei. - Utilizarea SPSS n statistica inferenial: estimarea parametrilor populaiei. - Utilizarea SPSS n statistica inferenial: probleme de comparaii inter- i intra-grupale. - Utilizarea SPSS n studiile corelaionale. Vom prezenta succint tematica fiecrui modul, iar n final vom prezenta cteva tipuri de sarcini de aplicaii a cunotinelor.

2

Modul 1Aplicarea softurilor experimentale n cercetare: programul SuperLab i elaborarea unui design experimental Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: creeze, acceseze i s salveze un document elaborat n SuperLab. identifice bara de meniuri a softului Superlab i s cunoasc modul de utilizare a lor. cunoasc modul de codare a variabilelor independente. cunoasc modul de setare a parametrilor msurai. transpun descrierea procedurii unui experiment (variabile independente, variabile dependente) n structura softului SuperLab. n era sistemelor informatice cercetarea, indiferent de domeniu, nu poate s fac abstracie de avantajele inerente acestora. Urmnd aceeai tendin, cercetarea n domeniul psihologiei intr ntr-o nou er n care aplicaiile software sunt o component indispensabil a din ce n ce mai multe studii. Din aceast categorie de aplicaii putem delimita o clas de programe ce pot fi considerate platforme experimentale dedicate. Acest gen de aplicaii permite cercettorilor s implementeze ntr-un mod facil i intuitiv o gam foarte larg de tipuri i designuri experimentale. Caracterizate prin flexibilitate, modularitate i uurin n utilizare, ele ajut la creterea preciziei n msurare precum i la diminuarea timpului necesar nregistrrii i codrii rspunsurilor de ctre experimentator. Din aceast categorie de aplicaii fac parte: SuperLab, Inquisit, E-Prime. n continuare vom descrie aplicaia SuperLab i vom prezenta modalitatea de implementare a unui experiment prin intermediul acesteia. Ajuns la versiunea 4.0 aplicaia SuperLab se bazeaz pe o experien vast n domeniu oferind o gam larg de faciliti cercetrilor interesai n a o utiliza. Autorii programului pun la dispoziie celor interesai o versiune demo care poate fi descrcat de la adresa: http://www.superlab.com. Varianta demo are toate facilitile variantei cu licen ns poate fi utilizat doare pe o perioad de 30 de zile de la instalare i nu permite colectarea de date. Descrierea aplicaiei SuperLab. Dup instalarea aplicaiei pe calculator, n meniul Start al sistemului de operare identificm pictograma programului SuperLab, i printr-un click de mouse pe aceasta lansm aplicaia.

3

n imaginea de mai sus avem fereastra tipic a acestui program. Similar cu majoritatea programelor ce opereaz pe platforma Windows, avem prezente: o bar de titlu, o bar de meniuri i zona de lucru ce este compartimentat n trei seciuni: Blocks (blocuri), Trials (probe) i Events (evenimente). Bara de meniuri prezint urmtoarele opiuni: File comenzi ce permit operarea cu fiierele n care sunt stocate experimentele (deschiderea unei ferestre pentru crearea unui nou experiment (New), deschiderea unui experiment creat anterior (Open), salvarea unui experiment (Save, Save as) etc. )

-

Edit comenzi ce permit crearea (One New Event...) i operarea asupra blocurilor, probelor i evenimentelor (copiere (Copy), tergere (Delete), mutare (Cut), selectare (Select) etc.)

-

-

Experiment comenzi ce permit definirea mai multor parametrii ce in de designul experimental i de modalitatea de rulare a experimentului (culoarea de fundal (Background Color), modalitile de codare a probelor n fiierul de rezultate (Codes), variantele de rspuns ale subiecilor (Responses), alegerea dispozitivului prin intermediul cruia vor rspunde subiecii (Input from), alegerea categoriilor de informaii ce vor fi nregistrate n fiierul cu rspunsuri etc. )

4

-

Help ofer acces la un glosar de termeni legai de aplicaie precum i la alte informaii utile pentru a facilita utilizarea SuperLab.

Crearea i rularea unui experiment. Crearea unui experiment presupune definirea unui plan/design experimental. Design-ul experimental const n operaionalizarea variabilelor implicate (variabile independente i dependente) n experiment. n funcie de numrul de variabile implicate i de complexitatea lor design-urile experimentale pot fi: de baz, factoriale i mixte. Variabilele independente sunt acele variabile ce vor fi manipulate de ctre experimentator n cadrul studiului, iar variabilele dependente sunt cele msurate. Pentru mai multe detalii vezi suportul de curs din anul I al disciplinei Psihologie experimental i metode de analiz a datelor. Precum precizam anterior programul SuperLab are in fereastra principal trei seciuni distincte: blocuri (Blocks), probe (Trials) i evenimente (Events). Unitatea de baz ntr-un experiment creat n SuperLab este evenimentul. Acesta este n general prezentarea unui stimul subiectului. Mai multe evenimente constituie o prob, iar mai multe probe alctuiesc un bloc. Un experiment trebuie s aib cel puin un eveniment, o prob i un bloc. S presupunem c, n scop didactic, pentru a ne familiariza cu modalitatea de lucru n SuperLab am decis s realizm un experiment pentru a evidenia efectele interferenei prin intermediul unei probe de tipul counting stroop, prob elaborat de Bush i colab. (1998). Acest gen de probe se bazeaz pe crearea unei incongruene ntre numrul de cuvinte dintr-o grupare i sensul acestora. Subiectului i se cere s precizeze numrul de cuvinte din grupare ignornd semnificaia acestora. Interferena apare n momentul n care cuvintele din grupare semnific o cifr iar numrul lor difer de semnificaia acestora. (de exemplu avem cuvntul DOI scris de trei ori ). Pentru a realiza acest experiment vom utiliza un design experimental de baz, intrasubieci. Variabila independent va fi tipul de list parcurs, avnd dou modaliti: cu interferen i neutr (fr interferen), iar variabila dependent va fi timpul necesar parcurgerii listei. Mai jos avem cte un item exemplu din fiecare list:

Item exemplu din lista neutr

5

Item exemplu din lista de interferen Cele dou liste vor fi de cte 12 itemi fiecare. De asemenea 4 itemi din lista neutr vor fi utilizai n faza de acomodare a subiectului cu sarcina. Avnd definit planul experimental vom trece la implementarea acestuia. Pentru aceasta trebuie s decidem modalitatea de structurare n cadrul SuperLab a planului experimental. Avnd n vedere c vom avea trei seciuni majore n cadrul studiului nostru (prezentarea instruciunilor si a listei de acomodare, aplicarea listei neutre i aplicarea listei cu interferen) vom crea trei blocuri distincte ce vor conine probele i evenimentele aferente fiecrei seciuni. nainte ns de a implementa propriu-zis designul experimental este nevoie s setm anumii parametrii ce in de rularea experimentului nostru. Un prim parametru este cel al culorii de fundal. Aceasta se seteaz din meniul Experiment sub opiunea Background color (vezi figura de mai jos):

n exemplul nostru am optat pentru culoarea alb a fundalului. Urmtorul pas const n definirea codurilor (Codes) opiune ce se gsete n meniul Experiment. Aceste coduri ne permit o identificare mai uoar a itemilor notri n fiierul de rezultate. Ele sunt n special utile atunci cnd lucrm cu probe ce sunt prezentate randomizat (ntr-o ordine aleatoare). n cazul de fa vom avea dou coduri: Neutra i Interferen, primul avnd valoarea 1, iar cel deal doilea valoarea 2.

6

Vom utiliza aceste coduri pentru a identifica n fiierul de rezultate fiecare eveniment din care list face parte. n continuare vom definii lista cu rspunsurile corecte posibile. Pentru aceasta vom accesa opiunea Responses din meniul Experiment, unde vom aduga urmtoarele rspunsuri corecte posibile: 1,2,3 i 4 (acesta fiind numrul maxim de cuvinte ce pot fi ntr-o grupare) i (caracterul spaiu aferent brii de spaiu de pe tastatur, tast ce o vom utiliza pentru a confirma trecerea de la instruciuni la efectuarea probei)

Aplicaia SuperLab 2.0 ne ofer posibilitatea de a opta ntre mai multe variante de interaciune cu experimentul nostru (mai multe modaliti de a oferii rspunsuri). Pentru a alege dispozitivul pe care l vom utiliza accesm opiunea Input From din meniul Experiment:

Prin selectarea variantelor disponibile obinem o descriere, n partea dreapt a ferestrei, a avantajelor i dezavantajelor specifice fiecrui dispozitiv. Pentru studiul nostru vom utiliza Tastatura Standard (Standard Keyboard) ca i dispozitiv de intrare. Modalitatea de msurare a timpului este setat de la opiune Timer to use, iar valoarea implicit a acesteia (Multimedia Timer) va fi optim pentru majoritatea studiilor pe care le vom realiza cu ajutorul SuperLab 2.0.7

n continuare vom definii categoriile de informaii care dorim s fie nregistrate n fiierul de rspunsuri. Pentru aceasta vom accesa meniul Experiment i opiunea Preferences > Data file . Exist un set implicit de informaii ce sunt nregistrate la fiecare rulare a experimentului precum i un set de informaii opionale prezente n figura de mai jos, ce sunt nregistrate doar dac sunt bifate. Pentru studiul nostru sunt utile doar cele bifate n imaginea de mai jos:

Un ultim parametru ce trebuie setat nainte de a trece la crearea propriu-zis a blocurilor, probelor i evenimentelor este cel al managementului memoriei. Pentru aceasta vom accesa meniul Experiment i opiunea Preferences - > Memory . Prin intermediul acestei opiuni setm ct din experimentul nostru va fi pstrat n memoria RAM a calculatorului la momentul rulrii. Aceast opiune este important pentru c ne afecteaz timpul n care calculatorul reuete s afieze un eveniment pe monitorul calculatorului, lucru extrem de important n cazul studiilor / experimentelor realizate pe stimulare subliminal. n exemplul nostru diferenele de milisecunde generate de alegerea unei opiuni sau a alteia nu sunt semnificative ele fiind sistematice i afectnd n aceeai msur toi itemii. Ca atare vom opta pentru ultima variant care presupune ncrcarea pe rnd n memoria RAM a calculatorului a fiecrei probe.

8

Dup definirea tuturor parametrilor ce in de rularea experimentului, putem trece la crearea unui prim bloc n seciunea Blocks a ferestrei principale. Pentru aceasta selectm printr-un click de mouse zona respectiv (n urma selectrii se observ un chenar albastru n jurul acesteia) i din meniul Edit accesm opiunea: One New Block .

Introducem n cmpul Block name: 1 Instr i dm click pe butonul Ok. Astfel am creat primul bloc, care va fi vizibil n fereastra principal a programului. Observm c n fereastra de creare a unui bloc nou avem posibilitatea de a bifa opiunea: Randomize trials before running. Aceast opiune ne ofer posibilitatea s prezentm subiecilor probele asociate acestui bloc ntr-o ordine aleatoare. Dat fiind c n cazul de fa nu avem nevoie de o prezentare aleatoare a probelor, vom lsa aceast opiune nebifat. n mod similar vom crea i prima prob. Vom activa chenarul Trials, iar mai apoi din meniul Edit vom alege One New Trial . Vom numi aceast prob cu numele: 1.1 Instr.

Observm din imaginea de mai sus c n fereastra pentru definirea unei probe (Trial) avem posibilitatea de a alege ca aceast prob s fie utilizat doar pentru a oferii feedback (Use for feedback only) sau de a asocia acestei probe o valoare aferent unui cod (Code Values:) n acest caz nu vom asocia nici o valoare acestei probe deoarece ea este utilizat doar pentru a prezenta instruciunile experimentale subiecilor. Pentru a crea i primul eveniment urmm aceeai pai. Activm chenarul Events, iar mai apoi din meniul Edit alegem opiunea One New Event . Fereastra Event Editor are trei seciuni distincte: Input, Feedback i Event . n afar de acestea mai avem i cmpul n care vom trece numele evenimentului: 1.1.1 Instr. n fereastra de Input avem urmtoarele opiuni: Event accepts user input evenimentul permite primirea de rspunsuri din partea subiectului. Record and save response nregistreaz i salveaz rspunsul

9

-

End event: - Only after criterion response evenimentul se termin doar dup primirea unui rspuns criteriu End event: - After criterion response or time limit evenimentul se termin fie dup primirea unui rspuns criteriu fie dup expirarea unui timp limit End event: - Only after time limit evenimentul se termin doar dup expirarea timpului limit indiferent de rspunsul oferit.

n cazul n care optm pentru una dintre cele dou variante ce implic limit de timp, este necesar s introducem n cmpul Time limit is: valoarea n milisecunde a acesteia. Pentru varianta n care alegem una dintre opiunile cu rspuns criteriu trebuie s alegem ntre a avea ca i rspuns criteriu: orice tast apsat (Any key) sau o anumit tast specific pe care o putem alege dintre tastele definite anterior n cadrul opiunii Responses din meniul Experiment. Ultimul cmp din fereastra de Input este cel n care definim care este rspunsul corect pentru evenimentul n cauz (Correct responses:) Precum precizam anterior n acest cmp putem alege unul dintre rspunsurile definite anterior sau putem opta pentru nici un rspuns corect n cazul n care nu se preteaz evenimentului. Pentru evenimentul nostru specific, din figura de mai jos, vom opta pentru terminarea evenimentului dup un rspuns criteriu, iar acesta va fi bara de spaiu.

n cadrul seciunii Event vom definii coninutul propriu-zis al evenimentului nostru. Putem avea trei tipuri de coninuturi: Imagini, Text i Sunete. Acestea pot fi selectate din lisat de la opiunea Event Type. Pentru evenimentele ce vor prezenta imagini avem posibilitatea de a face urmtoarele setri: Poziie i dimensiune i Prezentare. n cadrul opiunii Poziie i dimensiune se pot seta: locaia exact de prezentare a imaginii pe ecran prin introducerea unor coordonate relative la rezoluia monitorului sau prin valori relative independente de rezoluie(centrat orizontal sau vertical) precum i dimensiunea imaginii (pstreaz dimensiunile iniiale, mrete imaginea pentru a ocupa tot ecranul sau se definesc noi dimensiuni pentru imagine). Prin intermediul opiunii Prezentare se poate seta: modalitatea de ncrcarea a imaginii (Use offscreen buffering), tergerea ecranului nainte de ncrcarea imaginii (Erase screen before presenting stimulus), transparena fundalului imaginii (Make picture background transparent) precum i un interval de timp de ateptare naintea afirii imaginii (Wait ms before strating to draw). Pentru a10

ncrca imaginea dorit dai click pe butonul File i alegei imaginea pe care dorii s o afiai. Este important de precizat c imaginile trebuie s fie n format .bmp, singurul format pe care l suport SuperLab 2.0. Cu ajutorul butonului Preview se poate vizualiza imaginea exact aa cum va apare ea pe monitor n momentul rulrii experimentului.

Pentru prezentarea unui text simplu (limitat la o singur linie i maxim 64 de caractere) putem opta pentru un eveniment cu coninut de tip text. Pentru acest text se pot seta: fontul, dimensiunea, culoarea (Style) i poziia (Position).

Cel de-al treilea tip de coninut ce l putem avea ntr-un eveniment este cel sonor. Pentru aceasta SuperLab 2.0 ne ofer posibilitatea de a ncrca fiiere n format .wav, acesta fiind singurul suportat. Fiierul de sunet se ncarc similar cu o imagine prin accesarea butonului File. Prin intermediul butonului Play sunetul poate fi audiat nainte de rularea lui n experimentul propriu-zis.

11

n afar de cele trei tipuri de coninuturi menionate mai sus, exist i un al patrulea tip de eveniment. Acesta nu are nici un coninut ns ne ofer posibilitatea de a introduce un interval de timp ntre doi stimuli (Inter-Stimulus Interval (ISI)). Acest interval de timp trebuie exprimat n milisecunde.

Revenind la evenimentul din exemplul nostru, vom apela la un coninut cu imagine ca urmare a faptului c instruciunea noastr va depii limita un singur rnd i 64 de caractere care ne este permis de un coninut de tip text (toate imaginile utilizate n experimentul descris vor fi disponibile n anexa acestui suport de curs). De asemenea setrile pentru opiunile Poziie i dimensiune i Prezentare vor rmne cele implicite. Avnd create primul bloc, prima prob i primul eveniment, vom trece la legarea acestora ntre ele. Pentru aceasta vom selecta blocul 1 Instr printr-un click de mouse i vom da click pe rombul prezent n dreptul probei 1.1 Instr. Similar vom proceda i pentru a lega proba 1.1 Instr de evenimentul 1.1.1 Instr (vezi figura de mai jos.)

12

Vom proceda similar pentru a crea i proba 1.2 L.A. care va conine cele patru evenimente aferente listei de acomodare. n cazul acestor patru evenimente vom oferii i feedback subiecilor pentru situaia n care vor da rspunsuri greite (nu vor apsa tasta corect pentru numrul de cuvinte afiat). n acest scop cele patru evenimente care fac parte din proba listei de acomodare vor avea definite la cmpul feedback, n cazul opiunii Incorrect proba 1.3 Raspuns (prob ce va avea asociat evenimentul cu mesajul de feedback).

Proba 1.3 Raspuns va fi creat anterior probei 1.2 L.A. i va avea bifat opiunea: Use for feedback only, avnd asociat evenimentul 1.3.5 Rasp gres. Spre deosebire de probele normale, cele dedicate pentru feedback nu pot fi asociate de un anumit bloc. De asemenea ele sunt marcate cu un triunghi i nu cu un romb cum sunt identificate probele normale. n imaginea de mai jos avem structura complet a primului bloc, care are legate de el cele dou probe: instruciunile i lista de acomodare, precum i evenimentele asociate acestora.

13

Este foarte important s nu uitm s salvm periodic experimentul la care lucrm prin utilizare opiunii Save din meniul File sau a combinaiei de taste Ctrl+S.

Avnd primul bloc creat vom trece la realizarea celorlalte dou blocuri ale experimentului nostru, care vor reprezenta lista cu grupuri de cuvinte neutre i lista cu grupuri de cuvinte cu interferen. Pentru fiecare dintre cele dou blocuri (2 Lista Neutra i 3 Lista Interf) vom avea o prob i un eveniment cu instruciunile legate de sarcina subiectului precum i o prob cu 12 evenimente reprezentnd grupurile de cuvinte din fiecare list. Este foarte important ca pentru aceste evenimente s bifm opiunea Record and save response i s alegem din lista de rspunsuri posibile rspunsul corect pentru fiecare n parte. Pentru a ne uura nelegerea structurii i organizrii probelor i evenimentelor n cele trei blocuri experimentale am recurs la urmtoare convenie de notare: fiecare bloc a fost numerotat cu o cifr de la 1 la 3. Fiecare prob ce ine de un anumit bloc va avea n numele su prima cifr cea a blocului de care este legat, urmat de o cifr ce ne identific ordinea probei n cadrul blocului (3.2 L.I. proba face parte din blocul 3 al Listei cu interferen i urmeaz dup proba 3.1 care este instruciunea pentru acest bloc i nainte de proba 3.3 care este instruciunea de final a experimentului). n14

cazul numelor evenimentelor pstrm aceeai convenie prima cifr reprezentnd blocul de care sunt legate (indirect prin intermediul probei de care sunt asociate), cea de-a doua cifr reprezint proba de care sunt asociate, iar ultima cifr reprezint numrul de ordine al evenimentului n cadrul probei respective. De asemenea n numele evenimentelor mai avem trecut cuvntul ce va apare n gruparea stimul i de cte ori este el prezent n gruparea respectiv. Folosind aceast convenie de notare ne va fi mult mai uor s vizualizm structura designului nostru experimental.

n acest moment avem implementat n experiment ambele modaliti ale variabilei independente (manipulate). Ele se regsesc n evenimentele pe care le-am creat i care sunt grupate n probele ce corespund celor dou modaliti definite anterior pentru variabila independent. Este foarte important de precizat c rularea blocurilor, probelor i evenimentelor n SuperLab se realizeaz secvenial (n ordinea n care sunt ele prezente n fereastr). Singura excepie de la aceast regula sunt probele utilizate doar pentru feedback, care vor fi rulate n momentul n care va fi satisfcut condiia din evenimentul n care sunt chemate (n exemplul nostru proba de feedback 1.3 Raspuns va fi rulat n cazul n care la unul din cele 4 evenimente ale listei de acomodare un subiect ofer un rspuns greit).15

Pentru a rula experimentul alegem opiunea Run din meniul Experiment sau folosim combinaia de taste: Ctrl+R. Aceasta va avea ca i efect apariia ferestrei de dialog din imaginea de mai jos:

n aceast fereastr vom trece numele subiectului (sau un cod alocat acestuia pentru a-i oferii confidenialitate). Opiunea de salvare a datelor generate de rularea experimentului o vom de bifa pe perioada construciei procedurii experimentale, cnd vom rula experimentul nostru nu cu intenia de a colecta date ci pentru a urmrii procedura de aplicare a acestuia i a corecta eventualele erori sesizate. Pentru salvarea datelor SuperLab 2.0 genereaz un fiier text cu extensia .dat. Este recomandat ca numele fiierului s fie legat de numele subiectului (sau de un cod alocat acestuia) pentru a ne fi mai uor ulterior n identificare acestora.

Pentru a ntrerupe rularea unui experiment apsm tasta Esc. Ca i recomandare, la rularea unui experiment este imperios recomandat s nchidei toate programele pentru a evita eventuale interferene ntre acestea i experimentul dumneavoastr. Dup rularea experimentului pentru a utiliza i prelucra statistic datele obinute este recomandat s realizm urmtorii pai. Vom deschide cu un editor de texte (ex. Notepad) fiierul de date generat ( n cazul nostru Subiect 1.dat). Marcm tot textul din acesta utiliznd combinaia de taste Ctrl+A i copiem coninutul acestuia ntr-un fiier Microsoft Excel. Pentru exemplul nostru vom obine ceva similar datelor din figura de mai jos:

16

Observm c avem prezente cele 4 coloane cu informaii pe care le-am selectat anterior cnd am definit parametrii experimentului (numele subiectului, numele probei, numele evenimentului i numrul evenimentului). Pe lng acestea mai sunt prezente trei coloane ce conin: rspunsul oferit de subiect la fiecare item din cele dou liste, codul de eroare (C dac rspunsul este corect, este identic cu cel setat ca fiind corect pentru evenimentul n cauz i E dac rspunsul este greit) i timpul de reacie pentru fiecare rspuns. Ultimele dou coloane ne ofer codurile asociate de ctre noi la crearea probelor pentru lista neutr i lista cu interferen. Acestea ne faciliteaz identificarea evenimentelor ce aparin celor dou liste. n vederea realizrii prelucrrilor statistice asupra datelor colectate vom calcula n Excel media timpilor de reacie pentru fiecare list n parte (excluznd timpii itemilor cu rspuns greit) i aceste valori le vom copia n baza de date SPSS special creat pentru acest experiment. n modulele urmtoare vom detalia procedurile utilizate pentru realizarea acestor prelucrri statistice cu ajutorul programului SPSS.

17

Modul 2Aplicarea softurilor statistice n cercetare: programul SPSS i elaborarea unei baze de date Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: lanseze n execuie programul SPSS, s creeze i s salveze un fiier n format *.saw diferenieze principale ferestre ale programului SPSS identifice n bara de comenzi principalele categorii de comenzi i funciile acestora defineasc n editorul de date variabilele relevante ale studiului Chiar dac a fost cndva, actual statistica aplicat nu mai este o lume strin i exotic pentru cercettorii din diferitele domenii ale tiinei. Un rol hotrtor n penetrarea practicii de cercetare de ctre statistic a avut-o informatizarea demersului statistic i apariia softurilor statistice. Utilizarea softurilor a permis ca cercettorii din diferite domenii ale tiinei s opereze cu modele matematice complexe fr a avea n prealabil o formare n matematica aplicat. Actual pe piaa softurilor statistice exist multe aplicaii de analiz statistic, SPSS fiind doar unul dintre acestea. Prima versiune a fost elaborat n 1968, variantele actuale (SPSS 14, SPSS 15) fiind considerate cele mai frecvent utilizate softuri statistice n cercetare (studii de marketing, anchete sociale, studii experimentale, etc.). Exist diferite verisuni ale programului, att pentru sistemul de operare Windows ct i pentru sisteme Mac OS X i Unix. Lansarea n execuie a programului SPSS 10.0 Dup instalarea programului SPSS 10.0 n meniul de Start al sistemului de operare identificai pictograma SPSS. 10.0 for Windows. Un click de mouse pe aceasta va avea ca i efect lansarea n execuie a programului SPSS 10.0 i va deschide fereastra de Editare a Datelor. Aceasta reprezint una din cele patru ferestre eseniale ale programului (fereastra de: Sintax, Output i Macros). Orice modificare efectuat n fereastra de Editare a Datelor (ex. definirea unei variabile, introducerea datelor unui subiect, etc) poate fi salvat prin accesarea n bara de comenzi a instruciunii FileSave... urmnd a se specifica denumirea sub care fiierul nou creat va fi salvat (cu extensia *.saw) i locaia acestuia. Structura programului SPSS 10.0 Principalele ferestre ale programului sunt cele ale: Editorului de Date, Sintaxei, Outputurilor i Macrosurilor. Fereastra de Sintax permite editarea i salvarea unor iruri de comenzi utilizate n mod frecvent. n fereastra Outputurilor sunt afiate rezultatele procesrilor statistice precum i eventualele mesaje de eroare. Fereastra Macrosurilor permite editarea unor scripturi ce permit facilitarea prelucrrii datelor. Fereastra Editorului de Date reprezint locul unde sunt introduse datele obinute n urma cercetrii. Aceast fereastr are dou componente: Editorul de Date i Editorul de Variabile. n Editorul de Date pe vertical (linii) avem subiecii. SPSS. 10.0 asigneaz n mod automat un numr fiecrui subiect introdus, vezi prima coloan numerotat a Editorului de Date (dar acest numr de identificare nu este unul stabil, la o sortare a datelor, n funcie de criteriul utilizat subiecii pot avea alt numr). Pe orizontal (coloane) avem nirate variabilele. Nu exist o setare implicit a variabilelor n ceea ce privete caracterul: continuu sau discret, independent sau dependent, calitativ sau cantitativ. Aceste caracteristici urmeaz a fi definite n mometul construciei bazei de date. n Editorul de Variabile pe orizontal avem variabilele i pe vertical avem caracteriticile acestora. Bara de meniuri a Editorului de Date

18

Bara de meniuri a Editorului de Date cuprinde o serie de comenzi grupate sub diferite denumiri. Dintre acestea le vom prezenta doar pe cele mai importante: - File: comenzi care permit operaii asupra fiierelor ce pot fi accesate de program (crearea, deschiderea, salvarea unui fiier, etc). - Edit: comenzi ce permit editarea bazei de date (ex. tergerea unor variabile, copierea unui set de date i reinserarea acestuia n alt parte a bazei de date, etc); - View: comenzi ce permit stabilirea elementelor de interfa a ferestrei de Editare a Datelor i trecerea de la Editorul de Date la Editorul de Variabile; - Data: comenzi ce permit efectuarea unor operaii asupra bazei de date (ex. restructurarea acesteia, eliminarea din prelucrarea statistic a unei pri a datelor, identificarea unui subiect cutat sau a unei valori cutate, etc); - Transform: permite modificarea iniial a datelor introduse n csuele Editorului de Date (ex. recodare, recalculare pe baza unei funcii prestabilite, ordonarea valorilor, etc); - Analyze: reprezint grupul de comenzi care permit efectuarea analizelor statistice; - Graph: comenzile care permit realizarea unor reprezentri grafice ale setului de date. Unele dintre aceste comenzi pot fi accesate direct din opiunile unor analizei statistice. Construcia unei baze de date n Editorul de Date al programului SPSS 10.0 Pentru a oferii informaiile legate de procedura de elaborare a unei baze de date, o s prezentm un studiu experimental. ntr-un studiu experimental Hyde & Jenkins (1973) au prezentat subiecilor o serie de liste de cuvinte. O parte a listelor conineau cuvinte relaionate semantic n timp ce altele conineau cuvinte nerelaionate semantic. Listele de cuvinte au fost nsoite de diferite tipuri de instruiuni: 1) evaluarea conotaiei afective a cuvintelor, 2) estimarea frecvenei n limbaj a cuvintelor, 3) detectarea literelor e i g n cuvintele din list, 4) identificarea categoriei gramaticale a cuvintelor i 5) decizia asupra compatibilitii cuvintelor cu un context propoziional prezentat n prealabil. Designul prezentat este unul bifactorial, cercettorii manipulnd dou variabile independente: gradul de asociere a cuvintelor (relaionate semantic sau nerelaionate) i strategia de parcurgere a listei (strategie definit prin tipul de instruciune oferit). Variabila msurat a fost numrul de cuvinte reactualizate. Prin comenzile deja cunoscute lansm n execuie programul SPSS 10.0. Selectm fereastra Editorului de Variabile pentru definirea acestora. n aceast fereastr vom definii att variabilele independente ct i cele dependente. De altfel programul nu face distincie ntre acestea, cercettorul prin caracteristicile definite difereniaz variabilele manipulate de cele msurate. n editorul variabilelor n prima linie vom trece denumirea primei variabile independente: gradul de asociere a cuvintelor. Aceast casu nu permite depirea a 8 caractere, ca urmare vom recurge la o prescurtare a denumirii, ex. gdaac. Dup stabilirea denumirii vom stabilii alte detalii ale acestei variabile: tipul variabilei (se refer la modul de codare a valorilor acestei variabile, n cazul nostru vom accepta setarea iniial numeric). Astfel cele dou modaliti ale variabilei gdaac vor fi codate cu 1 (pentru liste de cuvinte relaionate semantic) i 2 (pentru liste de cuvinte nerelaionate semantic). Setarea Width se refer la numrul caracterelor ce pot fi introduse n coloana variabilei definite. Specificarea Decimals ne permite setarea numrului de zecimale afiate n baza de date. Din moment ce avem o variabil independent codat numeric (subiecii sunt sau n grupul 1 sau n grupul 2) vom seta numrul zecimalelor la zero (nu exist posibilitatea ca unul din subieci s aib 1,5 ceea ce ar nsemna s nu fie inclus n niciuna din grupele definite pe baza modalitilor variabilei independente). Label reprezint eticheta variabilei prescurtate. Este foarte probabil ca o persoan care analizeaz datele introduse fr a avea infomaii despre denumirea variabilelor implicate n studiu, cu greu s i dea seama ce nseamn exact gdaac. Ca urmare aceast setare permite cercettorului nregistrarea n baza de date a denumirii in extenso a variabilei codate. Setarea Values este important n cazul variabilelor discrete, dac dorim s etichetm diferitele nivele ale acesteia. Variabila independent este una discret, avnd modaliti codate numeric, ns acestor numere le putem asigna etichete lingvistice. Accesnd aceast csu se va deschide o19

fereatr care permite asocierea unei etichete lingvistice fiecrui cod numeric. Stabilirea unei legturi se face prin comanda Add, dup ce am trecut n csuele potrivite valoarea numeric i eticheta lingvistic asociat (ex. 1 liste de cuvinte relaionate i 2 - liste de cuvinte nerelaionate). Pe coloana Missing vom specifica modalitatea de codare datelor lips. La aceast comand vom opta pentru a asocia valorile discrete lips cu 99. De obicei se alege o valoare care este n afara plajei de valori ale variabilei codate. Setarea Columns se refer la limea coloanei n care vor fi introduse valorile variabilei definite (specificarea unei valori este opional, din moment ce acest parametru poate fi modificat n fereastra Editorului de Date cu ajutorul mouse-ului). Setarea Align se refer la poziionarea n csu a valorii introduse, implicit fiind stabilit alinierea la dreapta. Ultima specificare se refer la scala de msur a variabilei. n cazul nostru variabila independent este una nominal, din moment ce toi subiecii sunt inclui ntr-o grup fr ca doi subieci s fie inclui n aceeai grup. Diferenele ntre grupe sunt de ordin calitativ, nici una din grupe nu parcurge mai multe liste sau liste cu mai multe cuvinte. Ceea ce se modific este caracterul relaionat sau nerelaionat al cuvintelor de pe list. n mod similar se procedeaz pentru a doua variabil independent denumind-o sdpal (la Label vom trece - Strategia de parcurgere a listei). n cazul variabilei dependente (numrul de cuvinte reactualizate - ndcr) la setarea Values nu vom eticheta fiecare valoare a variabilei, deoarece variabila msurat este una cantitativ (numeric prin excelen). n momentul n care se trece la Editorul de Date, denumirile variabilelor vor apare pe orizontal (fiecrei variabile i va corespunde o coloan). Ceea ce urmeaz este introducerea datelor n baza de date dup urmtorul algoritm: primul subiect aparine grupului care a citit lista de cuvinte relaionate semantic, n coloana gdaac va avea 1, n coloana sdpal vom trece 1 (face parte din grupul cruia i s-a cerut evaluarea conotaiei afective a cuvintelor) i la coloana ndcr vom trece numrul de cuvinte reactualizate de acest subiect.

20

Modul 3Utilizarea softurilor statistice n cercetare: modaliti de reprezentare grafic, calculul indicatorilor tendinei centrale, ai dispersiei i ai distribuiei. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: reprezinte grafic distribuia valorilor unei variabile (histograma) calculeze indicatorii ce descriu o distribuie: nclinarea i gradul de aplatizare calculeze indicatorii tendinei centrale: medie, median i mod calculeze indicatorii de dispersiei ai unei distribuii: abaterea standard, variana, eroarea standard a mediei, amplitudinea, minimul i maximul n modulul anterior am parcurs paii necesari configurrii unei baze de date (am definit variabilele independente i dependente) precum i cei necesari pentru introducerea datelor n aceasta. n continuare vom parcurge paii pentru a obine primele informaii de natur descriptiv despre eantionul nostru de date. Modaliti de reprezentare grafic SPSS-ul ne ofer mai multe variante pentru a reprezenta grafic valorile din baza de date. Precum am menionat in modulul anterior acestea se regsesc n meniul Graphs. Nu vom descrie toate modalitile de reprezentare grafic deoarece majoritatea nu se preteaz domeniului specific al cercetrii n psihologie. Vom prezenta succint modalitatea de realizare a unei Histograme. Histograma este o form de reprezentare grafic a distribuiei unei variabile numerice care ne permite s determinm intuitiv dac aceasta are o form simetric sau asimetric. n msura n care distribuia este simetric, apropiat de distribuia normal, putem utiliza teste statistice parametrice, iar n cazul unei distribuii asimetrice vom utiliza teste statistice neparametrice. Pentru mai multe detalii vezi suportul de curs An I al disciplinei Psihologie experimental i metode de analiz a datelor. S presupunem c am realizat o replicare n scop didactic a studiul anterior elaborat de Hyde & Jenkins (1973) i am obinut pe un lot de 20 de subieci ce au utilizat liste relaionate semantic, cu instruciune de estimare a frecvenei cuvintelor n limbaj, urmtoarele date:Subiect ndcr 1 20 2 12 3 28 4 18 5 20 6 22 7 24 8 18 9 19 10 25 11 27 12 26 13 23 14 20 15 22 16 23 17 15 18 18 19 15 20 22

Pentru a realiza o histogram n SPSS vom accesa meniul Graphs de unde vom alege opiunea Histogram . n fereastra astfel deschis vom alege din lista de variabile aflat n stnga numele variabilei pe care dorim s o reprezentm (n cazul de fa ndcr) i o vom aduga n cmpul Variable. De asemenea vom bifa i opiunea Display normal curve (Afieaz curba normal).

21

Precum se vede i din figura de mai sus pe axa X avem reprezentate valorile variabile, iar pe axa Y avem frecvena de apariie a acestora n eantionul nostru de date. n partea dreapt a histogramei avem trecute valorile: abaterii standard (Std. Dev), a mediei (Mean) i numrul de subieci / msurtori (N). De asemenea se poate observa c SPSS-ul afieaz etichetele variabilelor i nu acele nume de maxim 8 caractere, tocmai pentru a uura identificarea acestora. Indicatori ce descriu forma unei distribuii Precum am precizat anterior histograma ne permite s evalum la modul intuitiv dac o anumit distribuie de date este simetric (cvasinormal) sau nu. Pentru o evaluare mai acurat avem la dispoziie doi indicatori statistici de descriu forma unei distribuii: nclinarea (skewness) i gradul de aplatizare (kurtosis). nclinarea este un indicator al simetriei unei distribuii. Distribuia normal este perfect simetric i are un indicator de nclinare egal cu zero. Gradul de aplatizare este un indicator al gradului de grupare a valorilor n jurul tendinei centrale. n cazul distribuiei normale valoarea acestuia este egal cu zero. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm nclinarea i gradul de aplatizare i o adugm n lista Variable(s):. Tot n aceast fereastr accesm opiunea Statistics i bifm opiunile: Skewness i Kurtosis. Dnd click pe butonul Continue i mai apoi pe butonul Ok, n fereastra de Output vom obine urmtorul rezultat:

n tabelul de output pe lng valorile celor trei indicatori vom avea: numrul de subieci inclui n calcul i numrul de date lips (subieci ce nu au valori introduse n baza de date pentru variabila n cauz). O valoare a indicelui de nclinare sau a gradului de aplatizare22

care este peste de dou ori valoarea erorii standard a acestuia ne indic o distribuie asimetric. Indicatori ai tendinei centrale Urmtorul pas n a obine mai multe informaii legat de eantionul nostru de date este calcularea indicatorilor tendinei centrale. Cei trei indicatori ai tendinei centrale sunt: media, mediana i modul. Media este rezultatul mpririi sumei tuturor valorilor din eantionul de date la numrul de cazuri. n exemplul nostru acesta este totalul cuvintelor reactualizate de ctre toi cei 20 de subieci mprit la 20. Mediana este acea valoarea din eantionul de date, care se situeaz la jumtatea distanei dintre cea mai mic si cea mai mare valoare ntr-o list ordonat a acestora. Modul este acea valoare care are cea mai mare frecven de apariie n eantionul de date. Vom utiliza media ca i estimator al tendinei centrale n cazul n care distribuia datelor este cvasinormal. n cazul n care avem o distribuie asimetric mediana i modul vor estima mai acurat tendina central. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm indicatorii tendinei centrale i o adugm n lista Variable(s):. Accesm opiunea Statistics i bifm opiunile: Mean, Median, Mod i Sum. Dm click pe butonul Continue i mai apoi pe butonul Ok. n fereastra de Output vom obine urmtorul rezultat:

n cazul unei distribuii cvasinormale valorile medie, medianei i modului vor fi apropiate. n tabelul de output pe lng valorile celor trei indicatori vom avea: numrul de subieci inclui n calcul i numrul de date lips (subieci ce nu au valori introduse n baza de date pentru variabila n cauz). n cazul n care exist mai multe valori cu cea mai mare frecven de apariie n eantionul de date i ca atare nu avem un mod unic, SPSS-ul va trece n tabel valoarea cea mai mic dintre acestea. Indicatori ai dispersiei n afara tendinei centrale care ne spune unde se situeaz majoritatea datelor din eantion este foarte important s tim i cum sunt distribuite aceste valori n cadrul eantionului. SPSS ne ofer posibilitatea s calculm urmtorii indicatori ai dispersiei: eroarea standard a mediei, abaterea standard, variana, amplitudinea, minimul i maximul. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm indicatorii dispersiei i o adugm n lista Variable(s):. Accesm opiunea Statistics i bifm opiunile: Std. Deviation, Variance, Range, Minumum, Maximum i S.E. mean. Dm click pe butonul Continue i mai apoi pe butonul Ok. n fereastra de Output vom obine urmtorul rezultat:

23

Tabelul de output este similar cu cel obinut pentru indicatorii ce descriu forma distribuiei sau cel al tendinei centrale.

24

Modul 4Utilizarea SPSS n statistica inferenial: estimarea parametrilor populaiei. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: efectueze calculul de estimare a mediei n populaie utiliznd softul SPSS 10.0 interpreteze statistic rezultatele procesrii efectuate salveze fereastra rezultatelor obinute ntr-un fiier *.spo Una dintre aplicaiile eseniale ale inferenei statistice o reprezint problema estimrii parametrilor populaiei. Fr a intra n detaliile acestei probleme discutate n cadrul cursului de Psihologie experimental i metode de analiz a datelor (vezi suportul de curs Anul I), vom oferii un exemplu concret de cercetare, cteva date (doar n scop didactic) i ulterior vom descrie procedura de calcul a intervalului de ncredere prin utilizarea softului SPSS 10.0. Activitatea fizic reprezint o problem esenial a vieii cotidiene, lipsa acesteia crescnd riscul apariiei obezitii i a unor afeciuni cardio-vasculare. Pentru a estima gradul de risc al elevilor, cercettorii de la OMS au aplicat unui eantion de elevi un chestionar n care una din ntrebri se referea la numrul de ore/sptmn petrecute cu exerciii fizice. Scopul cercettorilor a fost de a estima, pe baza datelor eantionului, media n populaia int a numrului de ore de exerciiu fizic. ntrebarea care se pune este, cte ore pe sptmn aloc elevii n medie exerciiilor fizice? Aceast medie pe populaie nu poate fi calculat din moment ce nu avem posibilitatea de a chestiona ntreaga populaie. Ca urmare am recurs la aplicarea chestionarului doar la un eantion extras din populaia int. Doar n scop didactic, s presupunem c volumul eantionului este de n=20. Datele obinute sunt trecute n form tabelar mai jos:Subiect Ore/sptmn 1 5 2 5 3 2 4 3 5 7 6 5 7 4 8 3 9 6 10 2 11 8 12 4 13 5 14 6 15 4 16 5 17 6 18 2 19 3 20 4

Variabila msurat: numrul de ore/sptmn alocate exerciiului fizic a fost codat sub denumirea de oefs. n Editorul de Date vom avea o singur coloan i datele subiecilor implicai n studiu vor fi introduse n aceast coloan. Pentru a calcula intervalul de ncredere n care se situeaz, cu o anumit probabilitate, media populaiei vom utiliza programul SPSS 10.0. n meniul Analyze vom selecta comanda Descriptive Statistics Explore unde vom trece n csua Dependent List variabila msurat n studiu. La opiunea Statistics vom seta valoarea pragului , care implicit este setat la 5% (adic la un interval de ncredere de 95%) la 1% (adic vom opta pentru un interval de ncredere de 99%). Opiunea Statistics ne ofer posibilitatea de a alege prin bifare: calculul indicatorilor statistici i indicatorilor formei distribuiei (Descriptives), estimarea medianei n populaie (Mestimator), identificare valorilor extreme (Outliers) i distribuia n centile a datelor obinute (Percentile). n aces caz vom bifa doar opiunea Descriptives i vom trece la pasul urmtor cu ajutorul butonuli Continue. Opiunea Plots permite realizarea unor reprezentri grafice (ex. histogram), iar la Options putem seta criterii de management al datelor lips. La opiunea Display vom bifa Statistics pentru a rezuma procesarea doar la calcul statistic fr a cere efectuarea unor reprezentri grafice. Terminnd specificarea procesrilor se apas pe butonul OK. Outputul rezultat este prezentat mai jos:

25

Descriptives oefs Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 4.4500 3.3821 5.5179 4.3889 4.5000 2.787 1.66938 2.00 8.00 6.00 2.75 .248 -.373 Std. Error .37329

Lower Bound Upper Bound

.512 .992

Ceea ce ne intereseaz este valoarea mediei calculat pentru eantion (4.45), valoarea erorii standard (0.37) i limitele intervalului de ncredere, Limita inferioar = 3.38 i Limita superioar = 5.51. n rest procesarea ne mai ofer o serie de date descriptive: ale tendinei centrale n eantion (media ajustat (trimmed), mediana) ale dispersiei (varian, abatere standard, minim, maxim, amplitudinea intervalului de valori, diferena interquartil) i indicatori ai formei distribuiei (nclinarea i Gradul de aplatizare). n concluzie putem afirma (cu o anumit marj de eroare asumat) c media numrului de ore alocat exerciiului fizic n populaia elevilor este situat n intervalul 3.38 - 5.51. n condiiile n care rezultatele urmeaz a fi utilizate ulterior (ex. elaborarea ulterioar a unui raport de cercetare) dar nu se dorete reluarea pailor descrii anterior, fereastra Outputurilor poate fi salvat n format *.spo urmnd comenzile FileSave... i specificnd denumirea fiierului.

26

Modul 5Utilizarea SPSS n statistica inferenial: probleme de comparaii inter- i intra-grup. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date pentru un experiment inter-grup elaboreze baza de date pentru un experiment intra-grup s efectueze calculul coeficienilor statistici utiliznd programul SPSS 10.0 s interpreteze rezultatele analizelor statistice A. Calculul statistic inferenial al datelor rezultate dintr-un design cu eantioane independente S lum ca exemplu adaptata dup experimentul efectuat de Bower i colegii (1981) n scopul verificrii dependenei proceselor mnezice de contextul emoional. Un cercettor a mprit n mod aleator eantionul n dou grupe. n trans hipnotic subiecilor dintr-un grup (experimental) li s-a indus o stare de tristee i altora (grupul control), nu li s-a indus nici o stare emoional. n urma modificrii strii emoionale subiecii au citit un text despre o persoan, urmnd ca apoi s reactualizeze caracteristicile personajului prezentat n text. S-a evaluat numrul de trsturi negative reactualizate. Un set de date (doar n scop didactic) este prezentat n tabelul de mai jos:Grup Subiect Nr. trsturi negative 1 5 2 5 3 2 Grup control 4 3 5 7 6 5 7 4 8 3 9 6 10 2 11 8 12 4 13 5 Grup experimental 14 6 15 4 16 5 17 6 18 2 19 3 20 4

Mediile calculate pe cele dou grupuri sunt m1=4.2 i m2=4.7. Se pare c subiecii crora li s-a indus o stare emoional negativ au reactualizat mai multe trsturi negative. ntrebarea este n ce msur putem considera c aceast diferen poate fi atribuit interveniei sau reprezint doar un rezultat al randomizrii aleatoare a subiecilor n cele dou grupe? Pentru alte detalii ale raionamentului inferenial vezi suportul de curs An I al disciplinei Psihologie experimental i metode de analiz a datelor. Fiind vorba de un design de baz cu grupuri independente n baza de date vom defini dou variabile, variabila independent stare emoional indus (cu dou modaliti neutr, codat cu 1 i de tristee codat cu 2) i variabila dependent (numrul de trsturi negative reactualizate). Ca i exemplu subiectul 1 n prima coloan a Editorului de Date va avea 1 i n a dou coloan va avea 5; subiectul 16 va avea 2 n prima coloan (fiind din grupul experimental) i 6 n a doua coloan. Pentru a efectua compararea mediilor vom urma linia de comenzi AnalyzeCompare meansIndependet Sample t Test. n cmpul Grouping Variable vom introduce variabila independent i vom defini grupele prin Define Groups, Grupa 1 fiind 2 i Grupa 2 fiind 1. Codarea grupelor nu presupune ntotdeauna utilizarea cifrelor 1 i 2, la fel de bine am fi putut coda grupele cu 1001 i 48. Ceea ce ntreab programul este, care dintre grupe s fie grupa de referin, acesta fiind introdus ulterior (vezi numrtorul formulei de calcul al coeficientului t). n cazul nostru grupa de referin este 1, adic grupul a crei stare emoional nu a fost modificat. Dup definirea grupelor comparate n cmpul Test Variable vom introduce variabila dependent i apsm pe butonul OK. Rezultatele relevante ale procesrii apar n tabelul de mai jos:

27

In d e p e n d e n t S a m p le s T e s t L e v e n e 's T e s t f o r E q u a lity o f V a r ia n c e s t- te s t fo r E q u a lity o f M e a n s 9 5 % C o n fid e n c e In te r v a l o f th e D iffe r e n c e M ean S td . E rro r S ig . ( 2 - ta ile dD iffe r e n c e D iffe r e n c e L o w e r ) Upper 18 1 7 .9 9 8 .5 1 8 .5 1 8 .5 0 0 0 0 .5 0 0 0 0 .7 5 7 9 2 - 1 .0 9 2 3 3 2 .0 9 2 3 3 .7 5 7 9 2 - 1 .0 9 2 3 4 2 .0 9 2 3 4

cr

F E q u a l v a r ia n c e s .0 5 9 assum ed E q u a l v a r ia n c e s not assu m e d

S ig . .8 1 0

t .6 6 0 .6 6 0

df

Primele calcule se refer la asumpia omogenitii varianelor n populaie. Dac testul Levene este semnificativ atunci nseamn c varianele populaiilor din care provin cele dou grupuri nu sunt omogene, i vom interpreta al doilea rand al tabelului. n cazul de fa testul Levene este nesemnificativ, valoarea calculat a lui p este mult mai mare dect 0.05 (p=0.81) ca urmare vom interpreta datele primului rnd. Valoarea calculat a coeficientului t este 0.66, grad de libertate 18 (n1+n2-2 adic 10+10-2) i valoarea calculat a lui p pentru coeficientul t este 0.51, mult deasupra pragului de 0.05. n continuare n table mai apar: diferena dintre mediile grupelor, eroarea standard a distribuiei diferenelor de medii testat n baza ipotezei nule i limitele intervalului de ncredere a medie distribuiei diferenelor de medii aleatoare. Dac acest interval l include pe 0 atunci diferena este nesemnificativ. n consecin, nu am reuit s infirmm ipoteza nul suntem nevoii s suspendm decizia. Altfel formulat, diferena pe care am obinut-o n urma interveniei, valoric nu depete acele diferene pe care le-am fi putut obine prin simpla selecie aleatoare a dou grupe i efectuarea diferenei ntre mediile lor. B. Calculul statistic inferenial al datelor rezultate dintr-un design cu eantioane dependente ntr-un studiu experimental ipotetic, un cercettor i propune s investigheze ipactul pe care l are prezena unor distractori asupra gradului de nelegere a textului la vrstnici. n acest scop selecteaz un grup de subieci vrstnici i prezint acestora cte o prob de nelegere a textului. n prima situaie, cea de control, subiecii citesc un pasaj i ulterior rspund din memorie la ntrebrile formulate. n situaia experimental subiecii citesc un draft al unui text (altul dect cel din pre-test, dar de acelai grad de dificultate) din care ns nu au fost terse corecturile (exist idei, informaii care nu sunt relevante din punct de vedere al formei finale a textului). ntrebrile formulate i de aceast dat vizeaz textul, dar nu i pasajele tiate. Variabila msurat n ambele situaii este gradul de acuratee a rspunsurilor. Numrul de rspunsuri corecte nregistrate n celel dou situaii sunt prezentate n tabelul de mai jos.Grup Subiect Nr. Rspunsuri corecte 1 6 Situaie de control (pre-test) 2 3 3 2 4 3 5 4 6 5 7 6 8 3 9 4 10 2 1 6 2 4 Situaie experimental (post-test) 3 3 4 6 5 4 6 6 7 7 8 5 9 4 10 4

n cazul unui design intra-grup baza de date va conine dou variabile, ambele reprezentnd variabila msurat n cele dou contexte ale variabilei independente (situaia control i situaia experimental). n baza de date fiecare subiect va avea dou valori, una msurat n situaia de control i una msurat n situaia experimental. De exemplu, subiectul nr. 1 n situaia de control a nregistrat 6 rspunsuri corecte i n situaia de control tot 6. irul de comenzi care permite calcularea coeficientului t este urmtorul: AnalyzeCompare meansPaired Sample t Test. n cmpul Paired variables vom28

introduce perechea de valori ce urmeaz a fi comparat. Rezultatul afiat n fereastra outputurilor este cel prezentat mai jos. Paired Samples TestPaired Differences Std. Error 95% Confidence Interval Std. Deviation Mean of the Difference Lower -1.81137 Upper -.38863 t df Sig. (2-tailed)

Mean

-1.10000

.99443

.31447

-3.498

9

.007

Mean n acest caz reprezint media diferenelor, deoarece demersul inferenial se bazeaz pe diferene de scoruri i media acestor diferene (vezi suportul de curs anul I). Pentru aceste diferene se calculeaz o abatere standard (Std. Deviation) i o eroare standard (Std. Error Mean), pe baza formulelor de calcul deja cunoscute. Cunoaterea valorii erorii standard i setarea unui grad de toleran (prag alfa) permite calcularea unui interval de ncredere a mediei diferenelor. Dac acest interval include valoarea zero atunci diferenele ntre pre-test i post-test nu sunt semnificative. n cazul nostru intervalul nu include valoarea 0, valoarea calculat a testului t este -3,498 i valoarea lui p este de 0.007. p calculat este mai mic dect valoarea prag, de 0.05, ceea ce confirm nc odat semnificativitatea statistic a diferene ntre cele dou situaii experimentale.

29

Modul 6Utilizarea SPSS n studiile corelaionale Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date corespunztoare studiului corelaional calculeze coeficientul de corelaie potrivit naturii variabilelor msurate soluioneze problemele datelor lips interpreteze rezultatele obinute Efectuarea unor studii experimentale nu este soluia potrivit pentru orice context de cercetare. n anumite situaii trebuie s ne limitm la a stabilii relaii de covarian existente ntre dou sau mai multe variabile msurate. Rentorcndu-ne la exemplul de la modulul 4, s presupunem c ceea ce intereseaz echipa de cercetare este identificarea tulburrilor asociate lipsei activitii fizice, concentrndu-se mai ales asupra obezitii. Obezitatea a fost exprimat n numrul de kilograme deasupra celui prevzut conform vrstei, genului i nlimii. S presupunem (doar n scop didactic) c datele obinute ntrun studiu (n=20) sunt cele redate n tabelul de mai jos:Subieci Nr. Ore/Sptmn Kg peste normal 1 5 4 2 5 6 3 2 7 4 3 6 5 7 3 6 5 4 7 4 5 8 3 6 9 6 3 10 2 7 11 8 2 12 4 5 13 5 4 14 6 3 15 4 5 16 5 4 17 6 3 18 2 8 19 3 4 20 4 5

n baza de date vom definii dou variabile pentru cele dou variabile msurate (ore de activitate fizic pe sptmn i kg peste normal), ambele fiind de tip numeric. Pentru a calcula gradul de asociere al acestora vom recurge la calculul coeficientului de corelaie Pearson urmnd irul de comenzi AnalyzeCorrelateBivariate. n cmpul Variables vom introduce variabilele ce urmeaz a fi corelate, n cazul nostru cele dou variabile msurate. n continuare vom bifa coeficientul de corelaie ce urmeaz a fi calculat, n cazul de fa dat fiind c ambele variabile sunt numerice vom opta pentru coeficientul Pearson. Semnificaia coeficientului de corelaie calculat o vom verifica printr-un test two-tailed. La Options se poate seta calculul unor componente pariale ale coeficientului standardizat de corelaia Pearson (covariana, suma produselor) i date descriptive. Tot n aceast seciune putem seta strategia de management al datelor lips (discuia este relevant doar n cazul a trei sau mai multe variabile). n urma setrilor se apas butonul OK i se obine outputul prezentat mai jos.Correlations oefs oefs Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 20 -.897** .000 20 kpn -.897** .000 20 1 20

kpn

**. Correlation is significant at the 0.01 level (2-tailed).

n fereastra Outputurilor este afiat matricea de corelaie. Din moment ce este o matrice simetric, coeficienii prezentai de o parte i de alta a diagonalei principale sunt identici. Pe linii i pe coloane sunt prezentate aceleai variabile. Se observ c valoarea corelaiei ntre oefs (ore exerciiu fizic sptmnal) i kpn (kilograme peste normal) este de30

r =-.897. Valoarea calculat a lui p este mai mic dect 0.01 (n table apare 0.000, ceea ce nu nseamn c este 0). Probabilitatea ca s se obin doar datorit aleatorului o astfel de corelaie este mic, chiar foarte mic dar nu este zero. Pentru a evita o astfel de interpretare eronat, de obicei n prezentarea rezultatelor se trece 0.001.

31

Modul 7Utilizarea SPSS n analiza designurilor factoriale Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date corespunztoare unui studiu unifactorial i bifactorial calculeze indicatorii statistici ai principalelor efecte vizate n designurile factoriale sa efectueze comparaiile post-hoc interpreteze rezultatele obinute A. Calculul statistic inferenial al datelor rezultate dintr-un design unifactorial cu eantioane independente O practic impus n cercetarea efectului medicamentelor este de a implica n studiu un grup de placebo. Conform acestui plan, autorii unui studiu ipotetic i propun s verifice eficiena unui nou medicament n tratamentul depresiei. n acest scop selecteaz 30 de voluntari cu diagnostic clinic depresie, i i randomizeaz n trei grupe: control, placebo i experimental. Pacienii grupului experimental primesc medicaie antidepresiv; pacienii din grupul placebo primesc un medicament care nu conine substan activ; i pacienii grupul de control nu primesc nici o medicaie. Variabila dependent o reprezint intensitatea simptomatologiei nregistrat pe o scal de la 1-20 (1=depresie redus i 20=depresie accentuat). Rezultatele obinute sunt prezentate n tabelul de mai jos.Grup Control Placebo Experimental 16 13 10 13 14 12 Scor Scal de Depresie 12 16 12 13 12 10 14 15 9 15 13 14 16 12 12 13 12 10 14 13 11 12 15 14

n baza de date vom defini dou variabile, una pentru variabila independent (denumit grup) cu trei valori (1=grup control, 2=grup placebo i 3=grup experimental) i o variabil (denumit scor) pentru a nregistra scorurile msurate. Pentru a verifica semnificativitatea statistic a diferenelor vom recurge la analiz de varian pentru design unifactorial cu eantioane independente. Pentru a calcula valoarea testului F vom urma calea AnalyzeCompare meansOne-Way Anova. n rubrica Dependent list vom introduce variabila msurat (denumit scor) i n ribrica Factor vom introduce variabila care definete grupele variabile independente. La seciunea Options vom bifa Descriptives pentru a obine datele descriptive i Homogeneity of variance test pentru a verifica asumpia omogenitii varianelor n populaie. La opiunea Post-Hoc vom bifa una din opiunile de comparaie post-hoc, de obicei se utilizeaz Tukey sau Scheffe, n acest caz vom apela la cel de-al doilea. Rezultatele ferestrei output sunt cele prezentate mai jos. Descriptives95% Confidence Interval for Mean N 1.00 2.00 3.00 Total 10 10 10 30 Mean 13.8000 13.5000 11.4000 12.9000 Std. Deviation 1.47573 1.43372 1.71270 1.84484 Std. Error .46667 .45338 .54160 .33682 Lower Bound 12.7443 12.4744 10.1748 12.2111 Upper Bound 14.8557 14.5256 12.6252 13.5889 Minimum 12.00 12.00 9.00 9.00 Maximum 16.00 16.00 14.00 16.00

n acest tabel avem datele descriptive ale celor trei eantioane (N, Mean, Std. Deviation i Std. Error), precum i intervalele de ncredere (Lower Bound i Upper32

Bound) i intervalul de variabilitate a datelor (Minimum i Maximum). Se observ c exist diferene ntre mediile celor trei eantioane, cel mai amre scor l are grupul de control i cel mai mic aparine grupului experimental. Rezultatul oferit de testul de omogenitate al varianelor este nesemnificativ, p=0.8 (mai mare dect 0.05), ceea ce nseamn c datele satisfac criteriul omogenitii varianei n populaie. Pentru a verifica dac cel puin una din diferenele posibile (ntre grupele 1-2, 1-3, 2-3) este semnificativ vom citi tabelul umtor. ANOVASum of Squares 34.200 64.500 98.700 df 2 27 29 Mean Square 17.100 2.389 F 7.158 Sig. .003

Between Groups Within Groups Total

Raportul dintre variana inter- i variana intra-grup rezult un F(2,27)=7,158. Probabilitatea acestei valori pe baza ipotezei nule, adic probabilitatea de a obine o asemenea valoare prin selecia aleatoare a trei eantioane dintr-o populaie este p=0.003, mult mai mic dect valoarea prag (0.05). n baza acestui rezultata putem afirma cel puin una din comparaiile posibile este semnificativ statistic. Pentru a verifica, care dintre aceste comparaii este aceea vom citi tabelul comparaiilor post-hoc.Multiple Comparisons Dependent Variable: VAR00002 Scheffe Mean Difference (I-J) Std. Error .30000 .69121 2.40000* .69121 -.30000 .69121 2.10000* .69121 -2.40000* .69121 -2.10000* .69121

(I) VAR00001 (J) VAR00001 1.00 2.00 3.00 2.00 1.00 3.00 3.00 1.00 2.00

Sig. .910 .007 .910 .019 .007 .019

95% Confidence Interval Lower Bound Upper Bound -1.4903 2.0903 .6097 4.1903 -2.0903 1.4903 .3097 3.8903 -4.1903 -.6097 -3.8903 -.3097

*. The mean difference is significant at the .05 level.

Tabelul oferit de SPSS este unul redundant, din moment ce ne ofer toate comparaiile posibile (ex. Intre grupele 1 i 2, respectiv ntre grupele 2 i 1). n tabel vom urmri Mean Difference (diferenele de medii), Std. Error (eroarea standard), Sig. (valoarea calculat a lui p) i Confidence interval (intervalul de ncredere). Se observ c numai diferena dintre grupele 1-3 i 2-3 este semnificativ, valoarea calculat a lui p pentru prima comparaie este 0,007 i 0.019 pentru a doua, ambele fiind mai mici dect valoarea prag (0,05). Acest fapt este confirmat i de intervalul de ncredere afiat, numai n cazul acestor comparaii intervalul nu include valoarea 0, restul diferenelor fiind nesemnificativ. Datele obinute susin eficiena unui efect al interveniei medicamentoase, rezultatele obinute de acest difer semnificativ att de grupul de control ct i de grupul placebo. Nu s-a constatat nici o diferen ntre grupul de control i grupul placebo, ceea ce indic o absen a efectului placebo n acest studiu. B. Calculul statistic inferenial al datelor rezultate dintr-un design bifactorial cu eantioane independente Pentru a exemplifica modul de prelucrare a datelor obinute ntr-un design bifactorial, vom analiza un alt studiu ipotetic. Un grup de cercettori a ncercat s investigheze33

diferenele existente n memoria verbal a subiecilor tineri i vrstnici. n acest scop a selectat aleator un grup de subieci tineri (20) i un grup de subieci vrstnici (20). Dar pentru c exist diferene de gen n ceea ce privete abilitatea verbal general, cercettorii au hotrt s includ n studiu i variabila gen (femei i brbai). Variabila msurat a acestui cvasi-experiment este numrul de cuvinte reactualizate n proba de memorie. Rezultatele obinute sunt prezentate n tabelul de mai jos.Grup Tineri Vrstnici Femei Brbai Femei Brbai 16 13 10 9 13 14 12 10 Numr de cuvinte reactualizate 12 16 12 12 13 12 10 10 14 15 9 9 15 13 14 10 16 12 12 13 13 12 10 9 14 13 11 8 12 15 14 10

n baza de date vom defini trei variabile, dou pentru variabilele independente ale cercetrii. Prima variabil denumit vrst va avea dou modaliti, 1=tineri i 2=vrstnici, a doua variabil gen tot cu dou modaliti 1=femei i 2=brbai. n a treia variabil (denumit scor) vom introduce valorile variabilei msurate. Datele colectate vor fi analizate prin ANOVA bifactorial 2x2. Pentru a efectuat aceast analiz vom urma irul de comenzi AnalyzeGeneral Linear ModelUnivariate ... . n rubrica Dependent list vom introduce variabila dependent Scor, i n rubrica Fixed factors vom introduce variabilele independente ale modelului, Vrst i Gen. La Options ... vom cere afiarea mediilor pentru toate efectele (vrst, gen i vrst*gen). Pentru a derula procesare vom apsa OK. Rezultatele obinute sunt prezentate mai jos. n primul tabel este reprezentat structura designului utilizat i efectivul fiecrei csue. Between-Subjects Factorsvarsta gen 1.00 2.00 1.00 2.00 N 20 20 20 20

Pe aceeai structur, tabelul urmtor afieaz datele statistice descriptive (medie i abatere standard pentru fiecare csu a designului). Descriptive Statisticsvarsta 1.00 gen 1.00 2.00 Total 2.00 1.00 2.00 Total Total 1.00 2.00 Total Mean 13.8000 13.5000 13.6500 11.4000 10.0000 10.7000 12.6000 11.7500 12.1750 Std. Deviation 1.47573 1.43372 1.42441 1.71270 1.49071 1.71985 1.98415 2.29129 2.15891 N 10 10 20 10 10 20 20 20 40

Tabelul testului de omogenitate a varianelor n populaie i de aceast dat arat c setul de date respect asumpia omogenitii egalitii varianei n populaie, valoarea calculat a lui p este 0.777, mai mic e dect valoarea prag (0.05). Pentru a verifica semnificativitatea efectelor variabilelor implicate n studiu vom analiza tabelul urmtor.

34

Tests of Between-Subjects EffectsSource Corrected Model Intercept varsta gen varsta * gen Error Total Corrected Total Type III Sum of Squares 97.275(a) 5929.225 87.025 7.225 3.025 84.500 6111.000 181.775 df 3 1 1 1 1 36 40 39 Mean Square 32.425 5929.225 87.025 7.225 3.025 2.347 F 13.814 2526.060 37.076 3.078 1.289 Sig. .000 .000 .000 .088 .264

Primele dou linii se refer la abordarea ANOVA din punct de vedere a regresiei (n acest caz vom face abstracie de aceste date). n linia Vrst, Gen i Varsta*Gen observm c exist un efect al vrstei (p calculate este de 0.000 < 0.05), efectul genului nu este semnificativ (p calculat este 0.088 > 0.05) i nu exist efect semnificativ al interaciunii (p calculat este 0.264 > 0.05). Tabele descriptive reiau pentru fiecare variabil informaiile deja prezentate n tabelul general, oferind pentru fiecare i un calcul al intervalului de ncredere (vezi exemplul pentru variabila vrst). 1. varsta95% Confidence Interval varsta 1.00 2.00 Mean 13.650 10.700 Std. Error .343 .343 Lower Bound 12.955 10.005 Upper Bound 14.345 11.395

Pe baza rezultatelor statistice obinute putem afirma c n acest studiu exist un efect principal semnificativ statistic al vrstei, ns nu exist diferen semnificativ de gen i nici efect al interaciunii celor dou variabile.

35

Aplicatii Computerizate de Analiza a Datelor

Documents

Transcript of Aplicatii Computerizate de Analiza a Datelor