Metodologia cercetarii psihologice - Esantionarea

53
Curs 4. Esantionarea Curs Metodologie (II) / Dragos Iliescu

description

Metodologia cercetarii psihologice

Transcript of Metodologia cercetarii psihologice - Esantionarea

  • Curs 4. EsantionareaCurs Metodologie (II) / Dragos Iliescu

  • Ce analizam? Pe ce date? La ce moment?Cattell (1966) a propus un model sinteticCubul de covariaii (The Covariation Chart)

    Intentii: (1) un exemplu didactic, care s ndemne cercettorii la o gndire multidimensional atunci cnd i planific designurile (2) s ilustreze istoric modalitile i naterea unor noi modele i tehnici de analiz factorial (cum ar fi tehnicile P, O, S i T).

  • The Covariation ChartCubul covariaiilor const din trei dimensiuni, numite i moduri: subieci, variabile, ocazii.

    Aceste trei moduri formeaz un cub, o cutie, numit i cutia cu date (data box), ce are pe fiecare latur o serie de dou din aceste trei moduri.

    Conform lui Cattell (1966), aceast concepie sintetic privind relaiile dintre moduri sugereaz valoroase forme de cercetare care altfel ar putea fi ignorate.

  • Multiway Analysis (1)

  • Multiway Analysis (2)

  • Cubul covariaiilor, desfurat

  • Perechea R-QTehnica R, care este cel mai des folosit, ia n considerare date culese cu aceeai ocazie (modul constant), de la mai muli subieci (modul replicat), pe care le analizeaz din punctul de vedere al variabilelor implicate (modul factorizat).

    Tehnica Q, care este perechea sa, dei are acelai mod constant (date culese cu aceeai ocazie), consider date ce se refer la mai multe variabile (modul replicat) i le analizeaz din punctul de vedere al subiecilor de la care au fost culese (modul factorizat).Matricea de date folosit n tehnica Q va avea deci subieci pe coloane i variabilele pe linii, exact invers dect are matricea de date din R.

  • Perechea O-PTehnica O i tehnica P sunt opuse una alteia, fiind ambele ideale pentru studiile de caz

    Tehnica O folosete date culese de la acelai subiect, privitoare la mai multe variabile, ncercnd s deceleze diferene i similariti ntre diferitele ocazii la care respectivele date s-au manifestat.

    Tehnica P, pe de alt parte, culege date tot de la un singur subiect, dar ncearc s deceleze ce variabile s-au manifestat n diferite ocazii / evenimente.

  • Perechea O-P (contd.)Tehnica P este precursorul acelor designuri de cercetare numite astzi single-subject design.

    Este n mod deosebit util n analiza proceselor psihoterapeutice (Mintz & Luborski, 1970).

    Mintz & Luborski (1970) au selectat 60 de sesiuni diferite de terapie individual (ocazii, deci), ale aceluiai subiect. Acestea au fost evaluate de trei evaluatori diferii, pe 18 scale, fiecare reprezentnd o variabil diferit. Analiza factorial a relevat c cele 18 variabile se grupeaz n patru factori, care descriu relaia ntre pacient i terapeut (cei patru factori fiind cu mare probabilitate specifici doar pentru respectiva relaie). Din cei patru factori, doi corelau n mod semnificativ cu rezultatele terapiei.

  • Perechea O-P (contd.)Tehnica O ncearc s identifice similariti ntre comportamentele n diferite ocazii ale aceluiai subiect.

    Jones, Thompson & Miller (1980) au dorit s exemplifice pe ct posibil modelele didactice / pedagogice aflate la dispoziia profesorilor din Statele Unite. Au fost alese 16 modele didactice diferite (ocazii), care au fost evaluate din punctul de vedere a 33 de indicatori (variabile) de ctre un numr de 142 de subieci, fiecare din ei avnd de evaluat 5-6 din cele 16 modele.Atragem atenia asupra faptului c subiecii n ansamblu au fost considerai ca fiind entitate evaluatoare (deci subiectul din designul factorial). Analiza factorial a relevat trei meta-modele pedagogice, care stau astzi la baza nvmntului pre-universitar din Statele Unite.

  • Perechea S-TGorsuch (1983):Tehnicile S i T nu sunt folosite practic niciodat, pentru c generalizarea pe care ele ar putea-o ncerca ar fi limitat doar la o singur variabil

    Am putea specula c lipsa de folosire a tehnicilor S i T s-ar putea datora faptului c analiza factorial, ca metod de analiz, tinde n principal spre a releva diferene individualeDiferenele individuale sunt nelese de psihologie ca fiind variabile, deci un design n care variabila s fie modul constant este greu de conceput.

    Putem totusi imagina un design de tip S sau T?

  • ExempleResearch questions:

    doresc sa evaluez felul in care stresul ocupational se relationeaza cu sanatatea fizica

    doresc sa evaluez felul in care o persoana se raporteaza la diverse branduri

    doresc sa evaluez cum un copil reactioneaza mai mult sau mai putin agresiv in diverse situatii

    doresc sa evaluez cum o situatie suscita comportamente anxioase diferite la oameni diferiti

    doresc sa evaluez cum emotiile placute sunt induse la angajatii din IT prin diversi stimuli vizuali

    ...

  • Populatie, populatie-tinta, esantionPopulatie (population)

    Populatie tinta (target population)populatie de referintatoate cazurile care respecta anumite specificatii

    Esantion (sample)reprezinta o proportie (o parte) din populatia de referinta;un subset de elemente extras din populatia generala, care respecta caracteristicile de baza ale populatiei.

  • Populatie, populatie-tinta, esantion(contd.)

  • Tipuri de esantionare si reprezentativitateDaca populatia este destul de mica incat sa o masuram pe toata:cercetare recensamant (census research):Statisticienii britanici pot prezice cate persoane vor muri anul acesta. Cei sicilieni pot da chiar si niste nume...

    Daca populatia este prea mare, esantionam, dar dorim sa generalizam la nivelul populatieiReprezentativitatea este conditia pentru care esantionarea functioneazaProbability sampling: esantioane reprezentativeNonprobability samples: esantioane non-reprezentative

  • Pasi in esantionarePopulation definitiondefinirea populatiei

    Sampling framestabilirea cadrului de esantionare

    Sampling methodstabilirea metodei de esantionare

    Sample size:determinarea marimii esantionului

    Sampling & data collection: implementarea planului si culegerea datelor

    Review:compararea esantionului cu intentiile, pentru a evalua generalizabilitatea

  • Definirea populatieidefinim populatia catre care dorim sa generalizam rezultatele studiuluistabilim criterii de incluziune / excluziune

    Exemplul 1: dorim sa evaluam specificul anxietatii de testare in Romania

    Exemplul 2: dorim sa evaluam atitudinea tinerelor mame privind vaccinarea bebelusilor

  • Cadrul de esantionareeste o definitie operationala a populatiei definite pentru studiu

    spune in clar de unde luam participantii

    de ex.liste electoraleregistrul scolarcartea de telefonde pe stradadin gospodarii

  • Sampling method1. Probability SamplingA. Aleatorie simplaB. Esantionare sistematica (aleatorie)C. Esantionare stratificataD. Cluster Sampling

    2. Nonprobability Sampling A. Quota SamplingB. Purposive samplingC. Accidental/Convenience Sampling

  • 1A. Simple Random Sampling Fiecare membru are o sansa egala de a fi extras

    Avantajeminimizeaza erorile, interpretare facila

    Dezavantajeun esantion care nu reflecta structura populatiei de referinta Exemplu: analiza caracteristicilor esantionului indica faptul ca avem 54% barbati si 46 % femei biased sample

  • 1A. Simple Random Sampling (contd.)equal chance of selectionculegere a raspunsurilor de pe strada?carte de telefon?se rezolva cu random-digit dialing?liste electorale?

    random selectionno bias involved in the selection of the sample

  • Sir Ronald Aylmer Fisher(1890-1962)

  • Principiul randomizariiStudies in Crop Variation I, II, IIIBRILLIANT!!!

    Rothamsted Experimental Station, Harpenden, UKserii de date (longitudinal, time series)productia de grau ca functie a:precipitatiilor (climat fluctuant de la an la an)deteriorare a solului (efect usor descrescator)

  • Principiul randomizarii(contd.)Studies in Crop Variation Iefectul diferitelor mixuri de ingrasamant asupra cartofilor

    Idee:nu mai punem tipuri diferite de ingrasamant pe acelasi camp, in ani diferitici impartim campul in arii mai mici, ca o tabla de sahfertility gradient pentru camp (necunoscut: tine de inclinatia solului, diverse substante existente, umbra vs. soare etc.)

    daca punem tipuri diferite de ingrasamant pe casutele din nord vs. sud e posibil sa stam fix pe fertility gradientdaca punem alternativ, e posibil ca fertility gradient sa mearga NW-SE

  • 1B. Systematic Random Sampling Procedura:Pasul de esantionare: k=N/n Ex: 21623849/2000 = 10811Se va alege un numar la intamplare intre 1 si 10811 (sa zicem 233) si ulterior se va selecta fiecare al 10811-lea membru din populatie.

    Avantaje: Usurinta aplicarii metodei ex: posesia de automobile lux in populatia persoanelor cu venituri peste 1000 Euro lunar. Potentiala crestere a eficacitatii statistice (aceasta va fi cel putin la fel de eficienta ca in cazul SRS) (Kish, 1965)

    Dezavantaje:Ex: Sampling Frame Lista persoanelor care lucreaza in cazarme militare. Daca lista este alcatuita in ordinea gradelor poate fi extras un esantion omogen si nereprezentativ ex: doar ofiteri cu gradul locotenent sau maior

  • 1C. Esantionare StratificataProcedura:Stabilirea unor sub-grupe (populatii) in functie de anumite criterii mutual exclusive.Criteriile ar trebui sa fie relationate sau relevante pentru modelul de cercetare.

    Ex: posesia de carti si IQ-ul (intre 0 si 100, intre 100 si 1000, peste 1000) 3 grupe distincte.

    Procedura:Ulterior se va aplica una din tehnicile de esantionare mentionate anterior (ex: SRS sau Esantionarea Sistematica)

  • 1C. Esantionare Stratificata(contd.)Avantaje: asigura faptul ca diferitele sub-grupuri sunt reprezentate adecvat in structura si volumul esantionului;asigura un grad ridicat de control asupra esantionului minimizand erorile;cresterea preciziei analizelor statistice;poate facilita realizarea unor analize mai detaliate

    Dezavantaje:costuri ridicate sub aspect material durata cercetarii irelevanta criteriului de stratificare (ex: trasaturi de personalitate si IQ) pot fi generate grupuri irelevante

  • 1C. Esantionare Stratificata(contd.)Alocare proportionata N total = 15000, in functie de criteriul posesia de carti 4 grupe (n1=6000, n2=4200, n3=3300, n4=1500)Volumul esantionului = 750 participanti Sampling fraction = 750/15000=0.05Ex: n1 - 6000 X 0.05 = 300n4 - 1500 X 0.05 = 75

    Alocarea disproportionata surse de eroare la nivelul analizelor statistice

  • 1C. Esantionare Stratificata(contd.)

  • 1C. Esantionare Stratificata(contd.)Exercitiustudiu politic populatia tinta pentru un politician dintr-un anumit colegiu electoral N (populatia) = 70000n= 900Formulati criterii de stratificare

  • 1D. Cluster SamplingEsantionare in clustere

    Procedura:in loc sa fie esantionate elemente individuale, se vor esantiona grupuri de elemente

    Ex: evaluarea anxietatii de testare la elevii din clasa a IX a la nivel national N=255729n= 2000In medie fiecare liceu are 100 de elevi de clasa a IX a. Nu se vor selecta elevi din cadrul fiecarui liceu, ci se vor selecta licee

    Avantaje: Costuri reduse (materiale, timp, evaluatori)

  • 1D. Cluster Sampling (contd.)

  • 2A. Quota SamplingEsantionare pe cote

    Principiu:cercetatorul stabileste in mod deliberat proportiile pe care le au diferitele grupuri (straturi) din esantion

    de obicei supra-reprezinta anumite straturi astfel incat sa se asigure ca sunt totusi reprezentateEx.: dorim sa comparam nivelul de anxietate pentru diferite etnii: Romani vs. Maghiari vs. Romidar proportia de Romi din populatie este de doar 2%din 1000 de participanti, vom avea 20 de Romi: e suficient?

    uneori sub-reprezinta anumite straturi, pentru a nu irosi resurseEx.:dorim sa normam (etalonam) un test psihologicdorim sa avem reprezentate toate varsteledar conform recensamantului, 65% din populatia adulta este peste 40 de ani

  • 2A. Quota Sampling (contd.)Exemplu:dorim sa studiem felul in care se compara diferite religii, dar vrem sa comparam cel putin ortodocsi, catolici, protestanti si neo-protestantistim ca in populatie avem aproximativ 85% ortodocsi, 7% catolici, 6% protestanti si 1% neo-protestanticum esantionam?

  • 2B. Purposive samplingEsantionare pe obiectiv

    Principiu:un subset non-reprezentativ al populatiei, care serveste unui scop anumeEx:manageri de resurse umanenu cunoastem populatia, nu o putem specificavom include orice manager de resurse umane care ne sta la dispozitiedar ii vom cauta in mod activ

    Snowball sampling = este un tip de purposive sampling

  • 2C. Accidental/Convenience SamplingEsantionare de convenienta

    Principiu:includem orice participant este la indemanade ex. voluntari, sau o intreaga clasa etc.

  • Sample sizeCat de mare trebuie sa fie un esantion pentru ca analizele statistice sa fie precise si valide?

    ExempluPolitician, sondaj de opinie, N=1.500.000Parametrul de interes (proportia totala a oamenilor care il favorizeaza)Din esantion (n) este necesar sa se afle proportia de oameni care il favorizeaza (p)Datorita erorilor parametrul nu va niciodata egal cu pDiferenta dintre parametru si p = SAMPLING ERROR

  • Sample size (contd.)Teorema limitei centrale Pe masura ce creste volumul esantionului, distributia mediilor esantionate tinde sa se apropie de curba normala. Cu cat creste n, cu atat scade eroarea de esantionare;

    Power analysis

  • Power analysisSample size: de ce avem nevoie de esantion mai mare?avem asteptari privind cresterea fidelitatii in rezultatesi stim ca bigger is betterinsa de fapt noi avem nevoie de un esantion adecvat pentru scopul cercetariipentru respingerea sau nu (cu suficienta corectitudine) a ipotezei nule

  • Power analysis (contd.)

  • Power analysis (contd.)

  • Power analysis (contd.)

  • Power analysis (contd.)alpha:willingness of rejecting a true null hypothesisprobability of committing a type I errorfalse negative: negative pregnancy test when a woman is in fact pregnantalpha < .05

    betaprobability of committing a type II errorfalse positive: positive pregnancy test when a woman is not pregnant

    significance = 1 - alpha

    power = 1 - beta

  • Power analysis (contd.)Type I errors vs. Type II errors raport beta vs. alpha4:1 ratioalpha = .05beta = .20power = .80

  • Sampling error(s)Standard Error of Sampling:SES = (1/sqrt(N))*100+/- SES ne da abaterea fata de proportiile populatiei

    Standard Error of Proportion:SEP = sqrt((p(1-p)/N))Daca p reprezinta o estimare perfecta a parametrului, atunci Standard error of proportion = 0+/- SEP ne da intervalul de incredere al proportiilor estimate

    Ex.in cazul politicianului, daca p=.50, n=100

  • Sample size (contd.)European Federation of Psychologists Associations (EFPA, 2006)Dimensiunea esantioanelor normative ale testelor

    Validare de construct, convergenta, criterion related, precum si estimarea fidelitatii

  • Levels of measurement & Levels of analysisEste CRITIC sa stabilim corect cadrele de masurare si de analiza

    Nivelul de masuraretipul de variabila unde se face masurarea

    Nivelul de analizatipul de variabila unde se face analiza datelor

    Cele 2 niveluri nu trebuie niciodata amestecate (cel putin nu pentru statisticile care ne sunt accesibile la acest moment)cand se amesteca: Multi-Level Modeling

  • Exemple de Multi-Level DesignsResearch question 1:In ce masura numarul de angajati dintr-o companie influenteaza sprijinul social perceput de angajati

    Research question 2:In ce masura Well-being-ul profesorilor influenteaza achizitiile elevilor

    Research question 3:In ce masura satisfactia muncii influenteaza productivitatea organizatiilor

  • Watch me!http://www.youtube.com/watch?v=e8i6YQ9-y5E