05 Masurarea in Psihologie

Msurarea n psihologie

Aspecte cheie

Definitie si Scop Evaluarea psihologica (psychological assessment) reprezinta o ramura a stiintelor

comportamentale

Scop:

identificarea asemanarilor si deosebirilor dintre caracteristicile personale si capacitatileindivizilor (Weiner, Naglieri, 2004) diferentele individuale

clasificarea functionarii individuale

predictia comportamentala (Niolon, 2005)

Evaluarea Psihologica vs Testare Psihologica

Evaluarea proces general de colectare de informatii

Testele reprezinta o modalitate standardizata de adunare a informatiilor.

Alte metode de adunare a informatiilor interviul, observatii, istoric personal, date biografice

Metodele pot fi combinate, impreuna un aport informational mai consistent

Psihologia este o stiinta si de aceea, evaluarea psihologica ... ... trebuie tratata ca un proces stiintific

argumentele care se accepta pentru a argumenta daca un proces de evaluare se desfasoara corect, sunt argumente stiintifice:

si altii fac asta

toti specialistii de resurse umane fac asta

la noi asa se face

10.000 de clienti utilizeaza aceasta abordare

eu asa am invatat

am dovezi empirice ca asa functioneaza

Incisivitatea masurarii

calitativ vs. cantitativ

observatie & interviu vs. test/chestionar

peak performance measures vs. average performance measures

test vs. chestionar?

sarcina de rezolvat vs. raportare despre comportamentul propriu

Relatii intre variabile: ecuatia structurala (1: determinism)

CRITERIUPREDICTOR

Cauza Efect

Variabila independenta Variabila dependenta

Ex: Inteligenta (GMA) Ex: Performanta profesionala

Ex: Constiinciozitate Ex: Accidente de munca (-)

Ex: Extraversie Ex: Eficienta in vanzari

Despre teste psihologice

Un test reprezinta o colectie de mostre de comportament utilizate pentru a extrage inferente generale cu privire la comportamentul unui individ

mostre de comportament = Itemi = Intrebari = Am multi prieteni

Item1 + item2 + item3 +.itemx = o scala (Sociabilitate, Extraversie, Responsabilitate etc)

Despre teste psihologice

Raspunsurile la un test sunt de obicei colectate in tabele statistice care permit specialistului sa compare scorul obtinut de un individ cu cele obtinute de un anumit grup de referinta

obtinute de un anumit grup de referinta = etalonul sau normele

cea mai frecventa eroare in Romania Sisteme Normative Americane/ Internationale

Domenii de evaluare

Evaluarea personalitatii : NEO PI R, CPI, EPQ etc

Evaluarea functionarii intelectuale: SB, GAMA, WAIS, MAB, Woodcock-Johnson

Evaluarea intereselor: JVIS, HOLLAND

Evaluarea motivatiei: AMI

Evaluare stres, neuropsihologica etc

Metaanalize: Hunter & Hunter (1984); Schmidt & Hunter (1998)

Concepte de Baza

Scoruri Standardizate:

z,

T,

Centile,

IQ

Caracteristici Psihometrice:

Fidelitate;

Validitate.

Interpretarea Scorurilor

Scala de evaluare a responsabilitatii

A: - 80

B: - 38

Scorul maxim ce poate fi obtinut 100

Care dintre cei doi poate fi caracterizat ca fiind un individ, constiincios care isi finalizeaza sarcinile si care manifesta un comportament etic?

Norm reference

Un scor brut nu are o semnificatie individuala

Semnificatia acestuia este desprinsa prin raportarea la un anumit grup

De ex: In Romania media populatiei se afla la valoarea 80 pt scala de Responsabilitate

Prin raportarea scorului la media unui grup desprinderea interpretarilor - A manifesta un comportament etic in aceeasi masura ca majoritatea indivizilor din populatia generala

Evaluarea cu doua instrumente

Instrumentul x scorul maxim 50

Instrumentul y scorul maxim 100

2 persoane evaluate

A: obtine 37

B: obtine 60

Cum comparam cele doua scoruri ??

Scoruri Standardizate

Cel mai frecvent scoruri T (media 50 , ab st. 10)

Alte tipuri de scoruri:

Percentile

Stanine

Z Scores

IQ Scores

Scoruri T & Percentile

Scoruri IQ

Fidelitatea: Definitie n orice msurare a fidelitii, referirea se face la consistena i

reproductibilitatea unei observaii (cot, scor, not) sau set de observaii (distribuia scorurilor). Dac cu acelai instrument de msur se fac determinri n timpi succesivi i de fiecare dat se ajunge la aceleai valori, spunem c am obinut o msurare cu o fidelitate mare.

Prin fidelitate se nelege fineea cu care testul msoar constructele sale componente, respectiv gradul de exactitate i lipsa greelilor de msurare.

Fidelitatea indic utilizatorului gradul n care poate avea ncredere n rezultatele testului.

Fidelitatea este gradul n care scorurile testului sunt consistente sau repetabile, adic gradul n care ele nu sunt afectate de erorile de msur (APA Standards, 1985).

Fidelitatea: Problematica

Asadar, fidelitatea vorbeste despre

exactitate

lipsa de eroare

repetabilitate

...

In teoria clasica a testarii (CTT), rezultatul unei masurari psihologice este definit drept:

True score = Observed score + Error

Deci, cu cat eroarea este mai mica, cu atat scorul observat (masurat in mod efectiv) este mai corect, mai apropiat de realitate (scorul adevarat)

Fidelitatea: Masurare

Pentru determinarea fidelitii, sunt posibile mai multe proceduri i se pot folosi metode diferite de evaluare sau chiar de msurare ale acesteia.

masurare: (empirical correlational methods, multiple measurement)

test-retest

forme echivalente

estimare: (multivariate methods, single measurement: internal consistency)

split-half

Cronbachs alpha

Guttmans lambda

Kuder Richardsons KR-20 & KR-21

Fidelitatea: Test-retest metoda foarte puternica, de masurare a fidelitatii (nu estimare)

se administreaza acelasi test de 2 ori, la o oarecare distanta intre administrari

distanta este dependenta de tipicul testului (aptitudini generale, aptitudini specifice, personalitate etc.)

probleme:

esantioane mici, de obicei

esantioane necontrolate, de obicei (dropouts)

efectele invatarii (mai ales la distante de retest mici si la anumite tipuri de teste)

efectele dezvoltarii/evolutiei (mai ales la distante de retest mari)

se raporteaza:

rtt, coeficientul de corelatie intre seturile de date obtinute in test si retest

distanta de retest (2 saptamani, 5 zile etc.)

Fidelitatea: Forme echivalente

metoda foarte puternica, de masurare a fidelitatii (nu estimare)

probleme

este posibila doar la acele teste unde exista forme echivalente

efort foarte mare pentru autor sa genereze forme echivalente

echivalenta nu este niciodata perfecta

se raporteaza:

rab, coeficientul de corelatie intre seturile de date obtinute cu Forma A si Forma B

Exemplu:

TTCT, Torrance Tests for Creative Thinking, Verbal & Figural, Forms A and B

Fidelitatea: Split-half

metoda mai slaba, de estimare a fidelitatii (nu masurare)

metoda:

se imparte testul in 2 subteste, esantionand itemii sai

esantionarea poate fi facuta ori aleator, ori dupa o regula,

de obicei itemi pari vs. impari

se raporteaza

rxy, coeficientul de corelatie intre cele 2 subteste, de obicei rpar-impar

Fidelitatea: Consistenta interna metoda mai slaba, de estimare a fidelitatii (nu masurare)

cea mai populara metoda de raportare a fidelitatii

coeficientul Alpha, (Lee Cronbach)

coeficientii KR 20 si KR 21 (Kuder & Richardson)

coeficientii Lambda (1-6) ai lui Guttman, 3 este similar cu Alpha-Cronbach

metoda:

multivariata

se raporteaza media deviatiilor fiecarui item de la valoarea medie, la deviatia scorului total

NU UITATI SA INVERSATI ITEMII SCORATI INVERS!!!

se raporteaza

/ x /KR20/KR21=[0.00-1.00]

praguri (Bernstein & Nunnaly): .70 / .90

Fidelitatea: Wrap it up

In concluzie:

fidelitatea se poate masura sau estima

metodele de masurare sunt mai puternice decat cele de estimare

indicele de fidelitate e cuprins intre 0 si 1

operam cu praguri de .70 si de .90 pentru fidelitate, atunci cand o aplicam unor probleme de masurare

Insa fidelitate nu are un sens direct in masurare

daca ne intoarcem la ecuatia din CTT (Observed score = True score + Error), cum este relationata fidelitatea cu Error Term?

prin intermediul conceptului de Standard Error of Measurement

Cum variaza fidelitatea testelor?

De obicei fidelitatea unui test creste odata cu numarul de itemi

Spearman-Brown prophecy (demonstratia clasica: Guilford, 1954)

true variance increases more rapidly than error variance

rnn = n rtt / (1+ (n-1) rtt )

Fidelitatea unor metode de evaluare diferite

in aceasta evaluare de obicei metodele sunt impartite in calitative vs. cantitative

observatie

acord interevaluatori, de obicei pe acelasi behavioral sample

= .05 - .25

interviu

acord interevaluatori

= .05 - .50

test/chestionar

toate metodele discutate

= .50 - .90

SEM: Standard Error of Measurement Eroarea de msurare standard (se) se calculeaz potrivit Formulei (1), unde se = eroarea de

msurare standard, sx = abaterea standard, rtt = coeficientul de fidelitate.

se = sx (1- alpha)

Atunci cand in locul fidelitatii consistenta interna se foloseste fidelitatea test-retest, masura se numeste SEP: Standard Error of Prediction

Intervalul de confidenta de 90% (+ - SEM): intervalul in care pica scorul real al subiectului, cu o probabilitate de 90%

Exemplu:

Scala staninelor are o medie de 5 i o abatere standard de 1.96

Fidelitatea unui test este rtt= .70

se = 1.96 (1- .70) = 1.07

Scala QI are media de 100 si abaterea standard de 15

Fidelitatea unui teste este rtt= .95

se = 3.35

SEM: la ce ne foloseste?

Estimarea erorii de masurare

la fidelitati sub .70, se creste foarte mult si scala nu mai poate fi utilizata pentru decizii majore

la fidelitati de peste .90, se scade la un nivel la care putem spune ca se poate lucra coerent cu scala

Probleme de comparatie

comparatia scorului unui individ cu scorul altui individ

comparatia scorului unui individ cu un prag

Test de inteligenta: cu 90% confidence interval pentru rtt=.50, .70 si .95

Chestionar de personalitate: NPQ (Ce ar fi daca fidelitatile ar fi la .50)

Chestionar de personalitate (contd.)

Test de aptitudini (Performanta aritmetica): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.75 (cu gri)

Test de aptitudini (Vanzari): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.90 (cu verde)

Concluzie

A test cannot be valid if it is not reliable

Fidelitatea este considerata o conditie a validitatii

Exista mai multe tipuri de validitate:

Validitatea predictiva So/Devianta (Gough, 1996)

Validitatea de criteriu Cs/AHS

Validitatea convergenta (Interviu Do/ Scala Do)

Validitatea de construct

Validitatea

A. Validitatea predictiva singura pe baza careia se pot face predictii valide (verificate)

B. Validitatea de criteriu asigura ca metoda de evaluare face adecvat distinctia intre mai multe persoane raportat la un anumit criteriu

C. Validitatea convergenta metoda folosita masoara acelasi construct masurat si de alte metode

D. Valididtatea de Construct se va masura Dominanta, iar nu Sociabilitatea

De ce este relevanta ???

Face Validity & Distorsiune

Validitatea de Aspect sau de fatada

Relevanta in Distorsiune

Face Validity mare = mai usor de distorsionat

Validitatea: Definitie

Concepia actual despre validitate spune c aceasta reprezint un corpus complex i integrat de demonstraii i cunotine tiinifice care examineaz variabilele psihologice msurate de test (AERA, APA, NCME, 1999).

Aceste demonstraii ne parvin ntr-o varietate de forme, iar nelegerea validitii unui test necesit examinarea lor atent.

Validitatea este conceptul central pe care se bazeaz psihodiagnosticul, att n cazul aptitudinilor ct i al personalitii.

Ea ne permite formularea de aseriuni privind gradul de dezvoltare al unei caracteristici care ne intereseaz sau emiterea de predicii n ceea ce privete comportamentul viitor al persoanei evaluate.

Validitatea se definete prin intermediul metodelor utilizate n verificarea ei: validarea de criteriu i validarea de construct.

Validitatea: Tipuri de validitate

Validitate de continut (content validity):

construct validity (verificare a operationalizarii)

face validity

translation validity

validitate de criteriu (criterion-related validity)

validitate predictiva (predictive validity): prezice ce ar trebuie sa prezica

validitate concurenta (concurrent validity): distinge intre grupuri intre care ar trebui sa distinga

validitate convergenta (convergent validity): coreleaza cu alte operationalizari ale conceptului (sau masuri ale acestuia)

validitate discriminanta/divergenta (discriminant/divergent validity): operationalizarea diferentiaza fata de alte concepte similare

Validitatea: clarificari / exemple n linii generale, validitatea exprim gradul n care un test msoar ceea ce i

propune s msoare.

La aceast calitate se mai poate aduga i o alta, dac testul poate fi utilizat n luarea unor decizii corecte.

Cu alte cuvinte (exemplu), dac noi cunoatem performanele unei persoane la un test (predictor), ct de precis vom putea estima ce performane profesionale va obine?

Validitatea poate fi definit n termeni operaionali ca i corelaia dintre predictor i criteriu (de ex. performanele profesionale ale unui eantion de indivizi).

Rezultatul este cunoscut ca i coeficient de validitate.

Un test poate avea mai muli coeficieni de validitate, n funcie de numrul de dimensiuni profesionale (calitatea muncii, disciplina, categoria profesional etc.) care coreleaz cu el.

Validitatea de continut / construct pune probleme legate de gradul n care dimensiunile msurate sunt cu adevrat relevante

pentru conceptul pe care se concentreaz testul daca sunt prezente toate dimensiunile relevante (daca nu s-au pierdut unele care

trebuiau sa fie) daca nu sunt prezente dimensiuni nerelevante (care contribuie la eroare, dpdv al

constructului evaluat)

Exemple: Personalitate:

masuram sociabilitate si responsabilitate; este testul valid (de construct)? masuram extraversie si stabilitate emotionala; este testul valid (de construct)?

Sociabilitate: masuram fluenta verbala, numarul de glume pe care il poate face; este valid?

(include toti indicatorii relevanti) Usurinta aritmetica:

masuram capacitatea de a transpune o problema matematica in ecuatie, de a face calculele si de a explica verbal semnificatia rezultatului la care s-a ajuns; este valid? (surprinde constructul corect?)

Validitatea de construct (contd.) Care este perioada asociata cu filosoful Epicur?

a. 341-270 BC b. 331-232 BC c. 280-207 BC d. Nici una din aceste optiuni

Cand s-a nascut fondatorul Microsoft, William Gates? a. 1949 b. 1953 c. 1957 d. Nici una din aceste optiuni

Care din urmatoarele enunturi sunt corecte cu referire la ANOVA? a. A fost inventata de Fisher in 1914 b. A fost inventata de Fisher in 1920 c. A fost inventata de Pearson in 1920 d. Nici una din aceste optiuni

Completitudinea dimensiunilor, Ex.: High Impact Leadership Cum construim un test care sa masoare capacitatea unui individ

de a fi un lider de mare impact?

Ce face un leader de succes?

actiuni:

deleaga

monitorizeaza

controleaza

etc intr-un cuvant: face tranzactii eficiente

Validitatea de criteriu: explicatie

un indicator al faptului ca testul poate fi utilizat ca predictor pentru un anumit comportament (criteriu)

ca urmare a existentei acestui tip de validitate putem spune, daca testul are un scor mare, ca X e probabil si cand testul are scor mic, ca X este improbabil (sau X e probabil)

validitatea de criteriu spune ce predictii sunt valide deci cum se interpreteaza scorurile testului

de principiu este corelaional la nivel comportamental, ns se admit i alte indicii, de exemplu experimentale sau de comparaie inter-grupuri

Validitatea de criteriu: Principii si metoda Principiu:

cat mai voluminos corpus de cunostinte despre felul in care se comporta o anumita scala sau test: in relatie cu anumite criterii in anumite situatii (ar putea fi generalizabil, in functie de explicatia teoretica oferita)

de ex. experimentul Sy vs. Do in CPI, explicatia e coerenta, deci e probabil generalizabila pe anumite esantioane (ar putea fi generalizabil, in functie de explicatia teoretica oferita)

de ex. legatura dintre Re si ceasornicari, explicatia e coerenta, deci generalizabila de ex. scorurile la STAI-Y pentru adulti in SUA vs. Romania (desi coerent si aparent

generalizabil, s-a infirmat)

Metoda: date continue: corelatie intre criteriu si predictor (validitate predictiva)

se raporteaza drept coeficient de validitate r grupuri contrastante sau puternic contrastante (validitate concurenta)

high vs low scorers pe predictor coincid cu high vs. low scorers pe criteriu se raporteaza testul T, al semnificatiei diferentei intre doua medii (p

Exemplu validare de criteriu: Scala Do din CPI (1)

Obiectivele scalei

Scala Dominan (Do, Dominance) a fost dezvoltat iniial n cadrul unui proiect de studiu al participrii politice (Gough, McClosky & Meehl, 1951) cu scopul explicit de a identifica indivizii puternici, dominani, influeni, cu ascendent asupra celorlali i care preiau conducerea i i exercit autoritatea (Megargee, 1972).

Exemplu validare de criteriu: Scala Do din CPI (2)Constructia scalei

Scala Do a fost construit prin compararea empiric a conceptului de dominan cu scorurile obinute de ctre un numr de subieci pe baza unui set de itemi, construit special n acest scop.

Gough, McClosky & Meehl (1951) au construit un set de itemi care putea descrie o persoan dominant i au selectat din acesta, pe baza unui procedeu experimental-comparativ itemii cu puterea cea mai mare de discriminare.

Procedeul este numit peer nomination i const, n forma sa clasic, din aceea c, ntr-un eantion de subieci care sunt familiarizai unul cu altul (de exemplu o clas de elevi, un grup de munc), persoanele care compun eantionul sunt rugate s-i numeasc pe aceia dintre ei care se potrivesc cel mai bine cu un anumit criteriu.

Ulterior, acestor persoane selectate li se aplic un set de itemi sau un chestionar i pe baza analizei statistice sunt reinui itemii care au putere de discriminare.


Cateva studii importante sunt:

Gough (1969b): comparatie de peer-nominated cu normele nationale

Gough (1969b): comparatie de high si low nominated intre ei

Hase & Goldberg (1967): comparatie auto-evaluare globala si auto-evaluare cu CPI

Megargee, Bogart & Anderson (1966): validare predictiva

Gough (2003): studiu longitudinal peste 40 de ani, cadeti din West Point

Dicken (1960): studiu cu Gi vs. Do (arata semnificatia prosociala a Do)

Gough (1954); studiu cu Sy si Do (militari marsaluind)

Exemplu validare de criteriu: Scala Do din CPI (4) 4 factori in interpretare

Primul factor este compus n principal din itemi care descriu persoana evaluat drept un leader, cruia i place s conduc, s vorbeasc n faa altor oameni i care are talent pentru organizarea i controlarea celorlali. Exemple de astfel de itemi sunt Am un talent nnscut de a influena oamenii (adevrat), Cred c mi-ar plcea s am putere asupra altora (adevrat).

Al doilea factor este descriptiv pentru un puternic sentiment al auto-controlului, fiind compus din itemi precum mi este greu s m concentrez pe activitatea pe care trebuie s o fac (fals), Renun cu uurin atunci cnd lucrurile devin dificile (fals) i Am greuti mai mari dect ceilali oameni cu concentrarea (fals).

Al treilea factor ine de controlul i dirijarea celorlali, coninnd itemi precum mi place s dau ordine i s pun lucrurile la punct, Mi-ar plcea s am autoritate asupra altor oameni i mi place s planific lucrurile i s stabilesc ce are fiecare persoan de fcut.

Al patrulea factor poate fi descris drept factorul normei sociale; conine doar doi itemi, ns ambii afirm obligativitatea fiecrei persoane de a participa la activitile grupului sau naiunii sale i de a se supune consensului comun.


Adjective asociate

Exemplu validare de criteriu: Scala Do din CPI (6) Comportamente asociate

i-a asumat controlul grupului (.33);

A vorbit mult la ntlnire (.33);

A avut mai multe de spus dect oricine altcineva (.32);

A acordat sprijin celui care a avut o idee bun (.32);

A nvat numele tuturor celorlali din grup (.29);

A vorbit doar dac i s-a adresat altcineva nti (-29);

Nu a intrat n conversaie pn nu i s-a pus o ntrebare (-.19);

A dat doar rspunsuri monosilabice la ntrebri personale (-.19);

A ateaptat ca cealalt persoan s aleag tema conversaiei (-.18);

A devenit tcut atunci cnd au intrat oameni noi n ncpere (-.17);


Descrieri din anamneza

Neobinuit de sigur pe sine, se simte n stare s fac fa aproape oricrei situaii. (.27, .24);

Las o impresie bun, are tehnici interpersonale eficiente. (.24, .20);

Folosete un vocabular vast i variat. (.14, .23);

Plin de haz i de via, face o conversaie interesant. (.16, .26);

Este nesigur pe sine, are ndoieli privind propriile abiliti. (-.22, -.24);

Are multe griji i probleme. (-.18, -.20);

Este reticent i taciturn. (-.19, -.14);

Are dificulti n a-i exprima ideile. (-.16, -.20);

Exemplu validare de criteriu: Scala Do din CPI (8) Concluzii

Pentru a concluziona asupra scalei de dominan din CPI, putem spune c indivizii cu scoruri mari la Do sunt ncreztori n propriile fore, ambiioi, asertivi, vorbrei, centrai pe sarcin, ntreprinztori i persuasivi. Dominana lor este n primul i primul rnd prosocial, prin faptul c i exercit influena asupra celorlali, urmrind scopuri demne de a fi urmate, consensuale i acceptate social, i nu doar de dragul mplinirii propriilor ambiii. Ceilali le recunosc abilitile de leadership i sunt dispui s accepte sfaturile i chiar controlul lor.

Spre deosebire de persoanele care au scoruri mari la Do, persoanele cu scoruri mici sunt reticente, lipsite de ncredere n propriile fore, submisive, neambiioase, lipsite de aptitudini sociale, defetiste, se ruineaz uor, sunt retrase n cadre sociale, ngrijorate i cu probleme.

Pentru persoanele cu scoruri foarte mari la Do, este posibil adoptarea unor comportamente excesiv de dominante i axate spre controlul extrem al celorlali, ceea ce echivaleaz cu un abuz al capacitilor lor de persuadare a celor din jur. Aceast posibilitate de uz antisocial a caracteristicii de dominan crete progresiv n condiiile n care persoana respectiv cupleaz scorul foarte mare la Do, cu scoruri mici la scale precum Re sau To. Studii de caz ilustrative din acest punct de vedere pot fi gsite n Meyer & Davis (1992) i McAllister (1996).

Validitatea de criteriu: Exemple (1) Responsabilitatea (CPI)

Este o persoan responsabil i serioas (.23, .30); Este productiv, i atinge obiectivele, rezolv lucrurile (.16, .30); Valorizeaz aspectele intelectuale i cognitive (.26, .33); Are un nivel nalt de aspiraie pentru sine (.27, .18); ... Este neprevizibil i schimbtor n comportamente i atitudini (-.15, -.27); Diverse nevoi ale sale tind s fie exprimate ntr-o manier relativ direct i necontrolat, nu

poate amna gratificaiile (-.20, -.31); mpinge i testeaz limitele, ncearc sp stabileasc n continuu ce anume i poate

permite i ce nu (-.31, -.22); Este indulgent cu sine (-.25, -.30);

Perseverenta (AMI) caracterizat drept luptator (.62), tenace (.51), competitiv (.44), fricos (-.23), timid (-.50),

cedeaza usor (-.59) Lucreaza energic la sarcinile pe care le are (.36) Nu se lasa intimidat de obstacole (.32) Trece de obstacole prin depunerea unui efort mai mare (.29) Nu renunta la sarcini, nici chiar cand sunt indemnati (.27)

Validitatea de criteriu: Exemple (2)

dovezi experimentale:

experiment pentru Sy

comparatii intergrupuri:

AMI; motivatie pentru performanta pe esantioane de sportivi, artisti, someri

CPI, To; toleranta comparata pe esantioane de hipioti, neonazisti, calugari

SWS, TABP comparat pe esantioane de bolnavi

uneori aceasta abordare iti documenteaza scala (adica aduce la lumina noi utilizari sau semnificatii):

CPI, Re: ceasornicari, slefuitori de diamante, controlori de zbor etc.

Validitatea de criteriu: Exercitiu avem de ales intre doua scale de dominanta, fiecare cu urmatoarele corelatii, care e mai valida?

1 Propensiunea spre comportamente expresive spontane (.38); Manifesta aceste comportamente chiar n situaiile n care acestea nu se impun (.33); Manifesta furie si comportamente agresive fizic, fa de persoane sau obiecte (.26); Tendina de a rzbuna nedreptile suferite de sine sau de prieteni (.30); Ruminare privind pedepsele cuvenite inamicilor (.29); Tendina de a avea comportamente agresive din punct de vedere verbal, atunci cnd se crede

ndreptit (.42); Competitiv n a demonstra c propriul punct de vedere este cel corect (.36).

2 i-a asumat controlul grupului (.33); A vorbit mult la ntlnire (.33); A avut mai multe de spus dect oricine altcineva (.32); A acordat sprijin celui care a avut o idee bun (.32); A nvat numele tuturor celorlali din grup (.29); Se comport ntr-o manier asertiv. (.42); Are prezen social, este n largul su n situaii sociale. (.36); Este un individ vorbre. (.32); Tinde s i ofere sfatul. (.34);

Validitatea predictiva

cea mai puternica, dar si cea mai rara

se bazeaza pe studii longitudinale, care prezic evolutii sau comportamente pentru populatii largi, pe perioade de timp relativ lungi

Exemple:

CPI, modelul cuboid, ca predictor al succesului militar: absolventi de West Point, promotiile anilor 60 si 70

EPQ: studiu longitudinal pe probabilitatea de recidiva a detinutilor

STAXI: studiu longitudinal pe probabilitatea de a avea un accident auto, studiu pe accidente de munca

SWS: studiu longitudinal pe probabilitatea de a avea un infarct miocardic

Raven: prezice succesul scolar

Validitatea divergenta

Este importanta mai ales in acele conditii in care conceptul-tinta este foarte aporpiat de alte concepte

Exemplu:

test de depresie

exista comorbiditate intre depresie si anxietate

ar trebui sa demonstram

nu doar ca testul nostru diferentiaza depresivi de nondepresivi

ci si ca nu coreleaza cu teste de anxietate

si ca diferentiaza mai bine intre high si low scorers de depresie decat intre high si low scorers de anxietate

Validitatea de aspect o modalitate (gresita) de a infera validitatea de criteriu (sau validitate in general) este bazata pe itemii scalei sau pe natura problemei

personalitate: 27. Cnd m contrazic cu cineva am tendina s vorbesc mai tare dect de obicei. 86. Clocotete sngele n mine cnd sunt luat de prost. 105. Deseori nu mi pot stpni suprarea i furia. 113. Am deseori tendina s fiu grbit i repezit, chiar i atunci cnd nu e cazul. 115. Se ntmpl des s m enervez prea repede pe cineva. 135. Pot fi uor scos din srite dac sunt agresat. -30. Dac ceva mi merge ru, nu m enervez pentru mult timp. -52. Chiar i atunci cnd sunt prea multe lucruri de fcut, prefer s le fac n ritmul meu. -60. Chiar dac ceva m scoate din srite, de cele mai multe ori m calmez repede. -93. Nu sunt multe lucrurile care reuesc s m irite sau s m enerveze. -102. n general sunt o persoan linitit i greu de enervat. -108. Exist o mulime de mici neplceri ale vieii pe care nu le las s m tulbure.

aptitudini mentale: mai usor de hotarat, caci sarcina descrie constructul exemplu:

cerem subiectilor sa si aminteasca spontan sau sa recunoasca informatie verbala, vizuala sau numerica; subiectilor li se prezinta, de exemplu, informatie grupata n anumite categorii si li se cere apoi sa reproduca respectivele categorii.

ce test e?

uneori insa e complicat: test cu final deschis, care cere subiectilor sa genereze un numar ct mai mare de cuvinte sau de idei asupra unei teme date, ntr-o

perioada specificata de timp; se masoara numarul ideilor este acest test valid ca test de originalitate?

Validitatea trebuie judecata atat general cat si situational general:

un test care nu a fost validat nu ar trebui utilizat

poate nu au fost culese date de validare exact in situatia care ma intereseaza, dar faptul ca ele exista, ma face sa am mai multa incredere

exemplu:

un test de persuasiune a fost validat in contextul unui studiu experimental (elevi care trebuiau sa convinga clasa sa actioneze intr-un anumit fel) poate fi utilizat pentru a evalua agenti de vanzari?

situational

daca a fost validat pe situatii similare cu cea la care e folosit

daca e UTIL (uneori e evident)

trebuie sa selectez dintr-o clasa de copii pe cei care sunt susceptibili sa faca sport de performanta, am la dispozitie un test care masoara Extraversie, Nevrotismul si Psihotismul e valid?

Validitatea metodelor Evident, validitatea se refera mai degraba la masuratori specifice (de ex. teste specifice)

mai specific chiar, vorbim de validitatea scorurilor (adica a informatiilor obtinute)

Totusi se vorbeste despre faptul ca unele metode sunt mai valide decat sunt altele Cum se poate evalua validitatea unei metode?

evident, prin prisma potentialului sau de a genera informatie valida

De principiu, metodele sunt diferite din acest punct de vedere:

Assessment Center (multiple measures) .65 Interviu comportamental .40-.60 Teste de performanta directa (work sample) .54 Teste de abilitate .53 Teste de integritate .51 Chestionare de personalitate .39 Date biografice .38 Referinte .23 Interviu traditional (nestructurat / semistructurat) .05-.19

ionut.ionescuHighlight

ionut.ionescuHighlight

Validitatea metodelor ca functie a intinderii numarul de itemi (de instante comportamentale care sunt esantionate) determina validitatea,

nu doar fidelitatea testului; de aceea un test mai lung (sau interviu mai lung) este mai valid (presupunand ca este bine construit)

tinand orice alta variabila constanta, testele mai lungi sunt mai valide

pentru GAMA (test de abilitati cognitive), validitatea creste daca este administrat pentru perioada intreaga (N=270, criteriul performanta academica la scolari din an terminal al liceului):

1 minut .21

2 minute .30

3 minute .36

5 minute .39

10 minute .41

15 minute .45

20 minute .48

25 minute .51

05 Masurarea in Psihologie

Documents

Transcript of 05 Masurarea in Psihologie