curs-4

9
Evaluare psihologică – metode psihometrice curs 4 1 Validitatea instrumentelor 1. Definire. Validitate şi fidelitate Validitatea se referă la gradul în care instrumentul măsoară ceea ce şi-a propus să măsoare. Ea depăşeşte sfera fidelităţii, în sensul că ea vizează măsura în care scorul obţinut de subiect (scorul observat) este determinat nu doar de un aspect psihologic real în general, ci chiar de cel pe care ar trebui să îl evalueze instrumentul. În timp ce fidelitatea are în vedere precizia măsurării, deci capacitatea instrumentului de a reflecta cât mai acurat realitatea psihologică a individului (astfel încât scorul lui să fie cât mai puţin afectat de surse exterioare, ce nu au legătură cu aceasta), validitatea se referă la calitatea măsurării. În psihometrie, o măsurare de calitate implică, în plus faţă de una precisă, evidenţierea chiar a dimensiunii psihologice vizate de instrument, şi evitarea contaminării scorului observat cu alte caracteristici psihologice ale individului. În termenii mai tehnici ai varianţei, fidelitatea este definită ca proporţia varianţei adevărate din cea observată, scopul analizelor centrate pe creşterea ei fiind minimizarea varianţei eroare. Definirea validităţii pleacă de la segmentarea varianţei adevărate în două componente: cea pertinentă - care provine din diferenţele între subiecţi pe trăsătura vizată de instrument - şi cea non-pertinentă, care provine din diferenţele pe alte caracteristici psihologice decât cea vizată de instrument. Acestea sunt considerate erori în estimarea validităţii, chiar dacă reflectă caracteristici reale; deoarece ele influenţează răspunsul subiectului de fiecare dată când el completează acel instrument, se numesc „erori sistematice”. Validitatea este definită ca proporţia varianţei pertinente din cea observată; de aceea, faptul că diferenţele dintre scorurile observate sunt determinate de diferenţe psihologice reale între subiecţi nu mai este suficient. Ea solicită ca aceste diferenţe reale să fie „pertinente”, adică să fie nu în privinţa oricărei caracteristici psihologice, ci doar a celei pe care îşi propune să o evalueze instrumentul. Deci, scopul analizelor centrate pe validitate este minimizarea varianţei non-pertinente; dacă diferenţele dintre scorurile observate la intrument provin în cea mai mare măsură din diferenţe psihologice reale dintre subiecţi, însă care nu au legătură cu dimensiunea psihologică vizată de el, atunci instrumentul este unul fidel, dar nu este valid. El evaluează precis oamenii, îi localizează la niveluri de intensitate psihologică ce corespund realităţii lor mentale, ierarhiei lor adevărate, însă nu se ştie care sunt aceste dimensiuni psihologice; în orice caz, ele sunt altele decât cele pe care ar trebui să le evalueze instrumentul. Cu alte cuvinte, am avea un instrument care evaluează corect oamenii, numai că nu am şti ce anume evaluăm cu adevărat la ei. Dat fiind faptul că validitatea ţine de proporţia varianţei pertinente din cea observată, iar aceasta este considerată a fi compusă, în acest caz, din trei tipuri de varianţă (pertinentă, non- pertinentă şi eroare), ea este condiţionată nu doar de amploarea varianţei non-pertinente (comentată mai sus), ci şi de cea a varianţei eroare, care este luată în calcul şi în estimarea fidelităţii. De aceea, calculele de estimare a fidelităţii le preced pe cele vizând validitatea; instrumentul trebuie să fie în cât mai mică măsură afectat de surse de eroare externe în raport cu

description

55

Transcript of curs-4

  • Evaluare psihologic metode psihometrice curs 4

    1

    Validitatea instrumentelor 1. Definire. Validitate i fidelitate

    Validitatea se refer la gradul n care instrumentul msoar ceea ce i-a propus s msoare. Ea depete sfera fidelitii, n sensul c ea vizeaz msura n care scorul obinut de subiect (scorul observat) este determinat nu doar de un aspect psihologic real n general, ci chiar de cel pe care ar trebui s l evalueze instrumentul. n timp ce fidelitatea are n vedere precizia msurrii, deci capacitatea instrumentului de a reflecta ct mai acurat realitatea psihologic a individului (astfel nct scorul lui s fie ct mai puin afectat de surse exterioare, ce nu au legtur cu aceasta), validitatea se refer la calitatea msurrii. n psihometrie, o msurare de calitate implic, n plus fa de una precis, evidenierea chiar a dimensiunii psihologice vizate de instrument, i evitarea contaminrii scorului observat cu alte caracteristici psihologice ale individului. n termenii mai tehnici ai varianei, fidelitatea este definit ca proporia varianei adevrate din cea observat, scopul analizelor centrate pe creterea ei fiind minimizarea varianei eroare. Definirea validitii pleac de la segmentarea varianei adevrate n dou componente: cea pertinent - care provine din diferenele ntre subieci pe trstura vizat de instrument - i cea non-pertinent, care provine din diferenele pe alte caracteristici psihologice dect cea vizat de instrument. Acestea sunt considerate erori n estimarea validitii, chiar dac reflect caracteristici reale; deoarece ele influeneaz rspunsul subiectului de fiecare dat cnd el completeaz acel instrument, se numesc erori sistematice.

    Validitatea este definit ca proporia varianei pertinente din cea observat; de aceea, faptul c diferenele dintre scorurile observate sunt determinate de diferene psihologice reale ntre subieci nu mai este suficient. Ea solicit ca aceste diferene reale s fie pertinente, adic s fie nu n privina oricrei caracteristici psihologice, ci doar a celei pe care i propune s o evalueze instrumentul. Deci, scopul analizelor centrate pe validitate este minimizarea varianei non-pertinente; dac diferenele dintre scorurile observate la intrument provin n cea mai mare msur din diferene psihologice reale dintre subieci, ns care nu au legtur cu dimensiunea psihologic vizat de el, atunci instrumentul este unul fidel, dar nu este valid. El evalueaz precis oamenii, i localizeaz la niveluri de intensitate psihologic ce corespund realitii lor mentale, ierarhiei lor adevrate, ns nu se tie care sunt aceste dimensiuni psihologice; n orice caz, ele sunt altele dect cele pe care ar trebui s le evalueze instrumentul. Cu alte cuvinte, am avea un instrument care evalueaz corect oamenii, numai c nu am ti ce anume evalum cu adevrat la ei. Dat fiind faptul c validitatea ine de proporia varianei pertinente din cea observat, iar aceasta este considerat a fi compus, n acest caz, din trei tipuri de varian (pertinent, non-pertinent i eroare), ea este condiionat nu doar de amploarea varianei non-pertinente (comentat mai sus), ci i de cea a varianei eroare, care este luat n calcul i n estimarea fidelitii. De aceea, calculele de estimare a fidelitii le preced pe cele viznd validitatea; instrumentul trebuie s fie n ct mai mic msur afectat de surse de eroare externe n raport cu

  • Evaluare psihologic metode psihometrice curs 4

    2

    dimensiunile psihologice ale individului (denumite erori aleatorii), nainte de a se pune problema varianei pertinente i non-pertinente. ns asigurarea unui nivel satisfctor de fidelitate nu este dect primul pas pentru evaluarea validitii, deoarece variana adevrat mare (ca proporie din cea total, observat) ar putea proveni n cea mai mare msur din alte dimensiuni psihologice dect cele care ar trebui s conteze, deci ea ar putea fi n cea mai mare parte varian non-pertinent. Cu alte cuvinte, validitatea este limitat de fidelitate (dac variana eroare este mare, cea pertinent nu poate fi suficient), dar fidelitatea este o condiie necesar, nu i suficient pentru validitate. De aceea, un test valid este i fidel (variana non-pertinent mare implicnd o varian adevrat mare), ns un test fidel nu este n mod necesar i valid. 2. Tipuri de validitate

    Ca i n cazul fidelitii, validitatea reprezint o calitate psihometric abstract; evaluarea ei nu se poate face dect prin intermediul unor faete particulare. Totui, spre deosebire de fidelitate, unde fiecare astfel de faet este susinut de o perspectiv distinct i auto-suficient (n sensul c de multe ori estimarea fidelitii se realizeaz printr-o singur abordare din cele trei posibile), estimarea validitii necesit toate abordrile enumerate mai jos (primele trei fiind cele tradiionale n aceast arie, iar tehnicile care se refer la ultimul tip reprezentnd preocupri mai recente n psihodiagnostic). Deci, susinerea validitii unui instrument se bazez pe dovezi ce se refer la toate aceste tipuri; ele nu sunt abordri echivalente ntre ele, ci planuri diferite de analiz ce compun mpreun validitatea instrumentului.

    Principalele tipuri de validitate a instrumentelor din evaluarea psihometric sunt urmtoarele:

    De coninut De criteriu De construct Incremental

    2.1. Validitatea de coninut Acest tip de validitate are n atenie msura n care itemii scalei acoper satisfctor

    coninutul conceptului evaluat de acel instrument. Se presupune c orice concept psihologic poate fi vizat de o populaie infinit de itemi posibili; instrumentul are validitate de coninut dac itemii si compun un eantion reprezentativ din aceast populaie. Aceast problem are dou componente, corespunztoare celor dou forme ale validitii de coninut, ambele focalizate pe coninutul itemilor i a conceptului psihologic evaluat de instrument, i anume:

    a. Validitatea aparent se refer la gradul n care fiecare item din instrument se ncadreaz n aria psihologic a conceptului vizat. Evaluarea ei se face prin raionament (aa-numita metod a experilor), judecndu-se potrivirea dintre fiecare item i constructul pe care l evalueaz instrumentul.

  • Evaluare psihologic metode psihometrice curs 4

    3

    b. Validitatea logic se refer la msura n care ansamblul de itemi acoper toate faetele conceptului vizat; ea presupune tot o evaluare subiectiv, prin analiza psihologic a conceptului, identificarea tuturor nuanelor sale i judecarea gradului n care fiecare dintre acestea se regsete n coninutul itemilor.

    n ambele cazuri, un nivel satisfctor de validitate de coninut necesit nu doar ca dimensiunea psihologic vizat s fie acoperit corespunztor (aspect important pentru creterea varianei pertinente a instrumentului), ci i ca itemii s nu invoce alte dimensiuni (crescnd astfel variana non-pertinent), adic s duc la rspunsuri generate de alte caracteristici psihologice ale subiecilor care l completeaz. Acest aspect este investigat prin intermediul conceptului de erori de rspuns.

    2.1.1. Erorile de rspuns Validitatea de coninut poate fi afectat de diverse distorsiuni ale rspunsului, induse de

    obicei de formularea itemilor. Ele scad validitatea rspunsurilor deoarece reflect alte dimensiuni psihologice dect cele vizate de instrument, scorurile la instrument fiind astfel contaminate cu caracteristici irelevante ce cresc variana non-pertinent.

    n general, aceste caracteristici irelevante vizate de itemi pot fi: - dimensiuni cognitive mai ales n cazul itemilor cu formulri complexe; rspunsurile la

    astfel de itemi reflect nu doar dimensiunea psihologic vizat de instrument, ci i gradul de atenie i inteligen al subiectului. - dimensiuni de personalitate n acest caz, itemii conin nuane semantice care activeaz astfel de caracteristici suplimentare fa de cea care ar trebui evaluat. Una dintre trsturile psihologice ce poate contamina uor itemii instrumentelor ce evalueaz alte caracteristici este nevrozismul, deoarece ea constituie o dimensiune larg de personalitate, ce influeneaz reaciile umane ntr-o mare varietate de situaii; de aceea, exist pericolul ca itemul s conin nuane referitoare la situaii n care comportamentul subiectului s fie determinat i de gradul su de nevrozism. Aceast caracteristic influeneaz cu precdere rspunsurile la itemi ce conin formulri n termeni de emoii negative (de exemplu m ngrijorez..., m enerveaz...), chiar dac ei vizeaz alte trsturi specifice. a. Dezirabilitatea social Cea mai frecvent surs de contaminare a instrumentelor psihologice este dezirabilitatea social, definit de obicei ca tendina de a proiecta o imagine pozitiv n exterior. Itemii multor instrumente permit contaminarea rspunsurilor cu aceast caracteristic, deoarece ei plaseaz subiectul n situaii n care el devine motivat s ofere un rspuns care s implice faptul c posed trsturi pozitive i, de asemenea, pentru c ei permit subiectului s dea un rspuns dezirabil social (anumite instrumente nu ofer subiectului aceast posibilitate; de exemplu, tehnicile implicite de evaluare psihologic scad capacitatea lui de a-i controla rspunsurile, evitndu-se aproape complet aceast problem a dezirabilitii sociale).

  • Evaluare psihologic metode psihometrice curs 4

    4

    Dat fiind frecvena contaminrii cu aceast dimensiune la majoritatea instrumentelor, au fost propuse diverse metode de control post-hoc, care presupun corecia scorurilor subiecilor la instrumentul respectiv prin eliminarea influenei pe care a exercitat-o dezirabilitatea social asupra rspunsurilor. Una dintre metodele cele mai utilizate de control este utilizarea unor instrumente suplimentare care evalueaz nivelul de dezirabilitate social a comportamentului fiecrui subiect n general. Premisa acestei metode este aceea c subiectul a rspuns la instrumentul care ne intereseaz ntr-o manier echivalent ca tendin de dezirabilitate social cu cea care i caracterizeaz comportamentul su obinuit. Cea mai cunoscut scal e dezirabilitate social este Marlowe-Crowne, cu 33 de itemi; o alternativ mai analitic este instrumentul Balanced Inventory of Desirable Responding, ce conine 40 itemi repartizai pe 2 dimensiuni, i anume: - Managementul impresiei latura public i intenionat a dezirabilitii sociale, echivalent cu definiia general a acestei trsturi. - Iluziile despre propria persoan - latura privat i incontient, dar foarte important pentru felul n care individul proceseaz informaiile din exterior despre propria persoan i, n consecin, ajunge s i evalueze propriile trsturi. Majoritatea oamenilor au mecanisme cognitive (coninute n acest factor de personalitate) care le permit s i pstreze o imagine de sine pozitiv chiar i n condiiile n care comportamentul lor obiectiv nu ar justifica o astfel de evaluare. Aceste mecanisme funcioneaz practic prin introducerea de distorsiuni ale informaiilor despre propria persoan, analizate n psihologie sub eticheta de erori cognitive, euristici infereniale, etc. Indiferent de instrumentul de dezirabilitate social ales, aceast metod presupune corecia statistic a scorurilor la instrumentul de interes prin eliminarea efectului dezirabilitii sociale, adic prin ponderarea scorului la acest instrument cu cel de la scala de dezirabilitate social. O variant mai analitic, ce ine cont de semnificaia fiecrui item n parte, presupune utilizarea unor metode statistice de corecie a dezirabilitii sociale a itemilor acelui instrument. Acest lucru este posibil, n principal, prin evalurile prealabile ale dezirabilitii sociale ale fiecrui item de ctre experi. Dup aplicarea instrumentului, scorul la fiecare item este ponderat cu evaluarea primit de el n privina dezirabilitii; cu ct impactul acesteia este mai mare, cu att diferena dintre scorul rezultat din rspunsul subiectului la item i scorul final, ce va fi luat n calcul n evaluarea individului, va fi mai mare. b. Tendina de achiesare Aceasta reprezint un alt factor ce poate induce distorsiuni ale rspunsurilor; de data aceasta, el ine cu precdere de caracteristicile psihologice ale individului cruia i este administrat instrumentul, ns prin cunoaterea acestei surse de eroare pot fi luate msuri n construcia formatului acestuia astfel nct influena ei s fie minimizat. Ea presupune tendina de a aproba toi itemii, i are dou forme, fiecare dintre ele putnd fi specifice unui individ:

  • Evaluare psihologic metode psihometrice curs 4

    5

    b1. achiesarea de acord presupune tendina de a acorda rspunsuri afirmative la toi itemii; un subiect cu o astfel de tendin ar rspunde, de exemplu, da i la un item de tipul n general sunt curajos, i la altul opus semantic: n general sunt temtor. Unul dintre instrumentele despre care s-a constatat faptul c este semnificativ afectat de achiesarea de acord (n sensul c formularea itemilor determin subiecii s aprobe majoritatea itemilor indiferent de nivelul real n care ei posed trstura pe care o vizeaz ei) este inventarul de temperament EPI. O ilustrare a erorilor de evaluare psihologic la care poate duce aceast tendin este aceea c la acest instrument s-a observat faptul c apar corelaii mai mari ntre factorul N (nevrozism) i E (extraversiune) n versiunile n care ambii au itemi cu formulri afirmative (deci, sunt congruente) dect cnd sunt incongruente. Prin urmare, profilul psihologic rezultat n privina unui subiect va depinde de versiunea de instrument pe care a completat-o. Soluia cea mai des utilizat n construcia instrumentelor pentru a diminua tendina de achiesare este contrabalansarea itemilor, adic formularea a jumtate dintre ei cu semnificaie negativ. Totui, aceast metod poate introduce ea nsi probleme suplimentare, ce in n special de faptul c itemii cu formulri negative sunt receptai psihologic ntr-o manier complet opus dect cei cu formulri pozitive. Aceasta face ca n multe cazuri, analizele factoriale asupra scorurilor din pretestarea acestor instrumente s indice gruparea itemilor n doi factori, fiecare coninnd itemii cu un anumit tip de formulare (negativ sau pozitiv), chiar dac nu acesta este criteriul de segmentare psihologic relevant pentru teoria ce susine instrumentul. Deci, acest criteriu de clasificare a nuanelor psihologice ale conceptului evaluat (de exemplu tipul de auto-reglare: cognitiv i emoional) devine mascat, nesemnificativ n comparaie cu cel al formulrii itemilor (care ar trebui s fie, n realitate, unul superficial). Studiile pe aceast tem au constatat faptul c efectul formulrii negative este mai mare la itemii ce conin negaia explicit nu (de exemplu Nu sunt fericit) dect la cei cu prefix negativ (de exemplu Sunt nefericit) sau cu frecven negativ (de exemplu rareori sunt fericit). De asemenea, o soluie alternativ formulrii negative a itemilor este folosirea antonimelor pentru caracteristicile vizate (de exemplu trist). Totui, nici aceast opiune nu rezolv neaprat problema tendinei de achiesare, pentru c ea poate face loc celei de-a doua forme a acesteia. b2. achiesarea de acceptare presupune auto-atribuirea tuturor caracteristicilor prezente n itemi, indiferent de formularea lor; de exemplu, rspunsul da la itemul n general sunt curajos, respectiv nu la n general nu sunt temtor, subiectul atribuindu-i ambele caracteristici (curajos i temtor), chiar dac ele sunt opuse semantic. c. Interpretarea subiectiv (personal) a itemilor Acest factor se refer la stilul n care fiecare individ se raporteaz la coninutul itemilor; el introduce o surs de eroare n variana itemilor, pentru c diferene ntre scorurile obinute de subieci care nu provin din trstura msurat, ci din interpretrile diferite ale itemilor. n aceast privin, o serie de studii au ncercat s clasifice diversele maniere n care oamenii decid asupra

  • Evaluare psihologic metode psihometrice curs 4

    6

    rspunsului pe care l ofer la itemii instrumentelor psihologice, n funcie i de coninutul acestora. Cunoaterea acestor maniere pleac de la analiza proceselor mentale implicate n rspunsul la item; un exemplu de astfel de abordare este studiul lui Angleitner et al. (1986), ale crui concluzii susin existena a trei etape ale rspunsului la itemi, i anume: 1. Reprezentarea mental a itemului decodificarea semnificaiei sale; 2. Compararea cu sine comparaia dintre semnificaia itemului i informaiile din memorie, apoi decizia cu privire la gradul de acord cu itemul; 3. Controlul utilitii evaluarea deciziei din punctul de vedere al normelor sociale. n etapa a doua, alegerea rspunsului depinde de modalitatea de procesare a itemului i cea n care subiectul se auto-evalueaz prin raportare la semnificaia lui. n aceast arie, studiile au pus n eviden mai multe strategii poteniale de rspuns, care depind n mare msur de formularea itemilor. Concluzia general a acestor cercetri este aceea c modul de formulare al itemului poate afecta n grade diferite validitatea rspunsurilor, pentru c el pune n funciune o anumit strategie de construcie a rspunsului la el. Tema poate fi ilustrat printr-o clasificare a validat de mai multe studii (de exemplu Gordon & Holden, 1996), conform creia cele mai frecvente strategii de rspuns la item sunt urmtoarele: 1. Referina la un singur comportament sau experien; un exemplu de item ce declaneaz aceast strategie este: La alegeri votez candidai despre care tiu foarte puine lucruri. 2. Referina la mai multe comportamente sau experiene, de exemplu: n copilrie le puteam spune uor prinilor problemele mele. 3. Referina la o singur caracteristic sau trstur, de exemplu: A fi dispus s dau bani pentru a repara o nedreptate, chiar dac nu a fost vina mea. 4. Referina la mai multe caracteristici sau trsturi, de exemplu: Dac a avea prilejul, a fi un bun lider. 5. Referina la o comparaie cu o alt persoan, de exemplu: Admir oamenii liberi i spontani. 6. Referina la o comparaie cu mai multe persoane, de exemplu: Am mai multe probleme de concentrare dect par a avea alii. 7. Referina la o descriere fcut subiectului de o alt persoan, de exemplu: M-a descrie ca avnd o personalitate destul de puternic. 8. Referina la o descriere fcut subiectului de alte persoane, de exemplu: Majoritatea cunoscuilor cred c reacionez spontan. Scorurile generate de itemii relevani pentru fiecare dintre aceste strategii au fost evaluate dup diverse criterii ce in de validitate, constatndu-se c itemii cu validitate sczut sunt, n general, cei care evoc experiene sau comportamente specifice. Pe de alt pare, itemii cu validitate ridicat sunt cei care se refer la mai multe trsturi sau caracteristici, respectiv cei care se refer la descrieri fcute subiectului de alte persoane. Problema este c aceste tipuri de itemi sunt aplicabili la puine dimensiuni de personalitate, n sensul c este dificil de formulat

  • Evaluare psihologic metode psihometrice curs 4

    7

    itemi care s genereze la rspunsuri construite de subiect prin intermediul acestor strategii cu nivel ridicat de validitate. 2.2. Validitatea de criteriu Dac validitatea de coninut se refer la interiorul instrumentului, la formularea i semnificaiile itemilor si, cea de criteriu are n vedere legturile dintre dintre scorurile obinute de subieci la instrument i un criteriu exterior. n acest caz, un instrument este considerat a fi valid dac el ne poate ajuta s cunoatem comportamentele i deciziile din viaa real a individului care sunt determinate de trstura evaluat. Cu alte cuvinte, validitatea de criteriu se refer la utilitatea practic a scalei, msura n care el poate ajuta psihologul s realizeze prognoze i decizii corecte. De exemplu, un instrument care evalueaz anxietatea social are validitate de criteriu dac oamenii care obin scoruri ridicate la el sunt cei care evit s intre n situaii n care ar putea interaciona cu ali oameni, n timp ce subiecii cei care obin scoruri reduse pot face acest lucru cu uurin. Asocierea dintre instrument i comportamentele reale este evaluat, n mod tradiional, prin intermediul metodei statistice a regresiei, care are dou forme generale n funcie de tipul de scal psihometric pe care este msurat criteriul. Cnd el este msurat pe scal de interval (n exemplul anxietii sociale, numrul de prieteni apropiai pe care i are un individ) se utilizeaz metoda regresiei cantitative; cnd el este msurat pe scal categorial (de exemplu, modul n care alege s i petreac seara n mod obinuit, cu dou posibiliti: singur sau mpreun cu ali oameni) se folosete regresia logistic. n termenii abordrii regresiei, instrumentul este etichetat ca predictor, iar comportamentele exterioare criteriu. Validitatea de criteriu a instrumentului este estimat prin intermediul unui parametru statistic care arat puterea legturii dintre cele dou, i anume ptratul corelaiei dintre ele, ce indic procentul de varian a criteriului explicat de variana scalei de evaluare. Astfel, dac acest procent ar fi, de exemplu, 60% n cazul asocierii dintre instrumentul de anxietate social i evitarea comportamental a situaiilor sociale, acest lucru indic faptul c diferena dintre doi oameni pe criteriu unul evitnd n mai mare msur dect cellalt situaiile sociale este determinat ntr-o proporie de 60% de diferenele dintre scorurile lor la instrumentul respectiv. 2.2.1. Tipuri de validitate de criteriu: a) Validitatea predictiv vizeaz asocierea scorurilor instrumentului cu un eveniment ce ar putea avea loc n viitor; un exemplu este cel al scalelor MMPI (i al multor alte scale clinice), ce prezic probabilitatea ca subiectul s dezvolte n viitor tulburri mentale. Deci, ele vizeaz evoluia psihologic viitoare a subiectului.

  • Evaluare psihologic metode psihometrice curs 4

    8

    b) Validitatea concurent vizeaz cunoaterea situaiei psihologice i a comportamentelor subiectului din prezent. n acest caz, criteriul este reprezentat de un eveniment msurat n acelai timp. c) Validitatea discriminativ (de difereniere a grupurilor cunoscute) se refer la capacitatea instrumentului de a separa corect oamenii din cele dou tipuri extreme dup criteriul trsturii msurate (de exemplu, validitatea discriminativ a unui instrument care evalueaz temperamentul presupune diferenierea ntre oamenii extravertii i cei introvertii). Problema n acest caz este cea a posibilei subiectiviti ce poate interveni n mprirea oamenilor n cele dou grupuri. De aceea, aceast metod este utilizat cu precdere atunci cnd pot fi identificate criterii precise, ct mai obiective de stabilire a componenei celor dou grupuri; acest lucru este mai dificil pentru unele instrumente dect pentru altele. De exemplu, un instrument care evalueaz persistena motivaional poate fi pus n legtur cu persistena individului n anumite comportamente reale (cum ar fi numrul de zile n care poate ine diet atunci cnd i propune acest lucru, numrul de recidive n cazul tentativelor de a se lsa de fumat, etc.). Tehnic, validitatea discriminativ poate fi estimat n mai multe feluri; cel mai simplu este cel al calculrii diferenelor ntre media scorurilor la instrument a grupului care posed acea trstur i a celui care nu o posed. De asemenea, ea poate fi estimat (mai precis) i prin tehnica ROC, (ce urmeaz a fi prezentat ntr-un alt curs). 2.2.2. Eroarea standard de estimare Aa cum n calculele fidelitii prin abordarea consistenei interne se poate utiliza eroarea standard specific ei cea de msurare pentru a afla intervalul n care se situeaz scorurile adevrate ale unui subiect, i n calculele validitii de criteriu (mai precis a validitii de criteriu predictive) exist un indicator util cel al erorii standard de estimare (SEst). El este folosit pentru a calcula marja de eroare a modelului de predicie construit (prin metoda statistic a regresiei) pentru a estima criteriul pe baza scorului subiectului la instrument. Mai precis, folosind acest parametru se poate calcula intervalul n care se va afla scorul real al subiectului la criteriu (de exemplu, numrul de zile de diet n cazul instrumentului de persisten motivaional) n jurul scorului calculat prin ecuaia de regresie (plecnd de la scorul la predictor, deci la instrument). Axioma pe care se bazeaz estimarea acestui interval este tot cea a normalitii distribuiei scorurilor reale n jurul celui pe care l cunoatem (n acest caz, a celui calculat prin ecuaia de regresie), n sensul c 68% dintre scorurile la criteriu se afl la o eroare standard de estimare de scorul calculat prin ecuaie, 95% la 2 SEst, 99% la 3 SEst. Astfel se poate estima intervalul n care se vor afla scorurile reale ale subiectului la criteriu, cu probabiliti de 68%, 95%, 99%. Bibliografie Aiken, L.R. (2000). Psychological testing and assessment, (10th edition), Allyn and Bacon Bohrnstedt G. (1983). Measurement. n Rossi PH, Wright JD, Anderson AB (Eds.) Handbook of Survey Research. Orlando , FL : Academic Press

  • Evaluare psihologic metode psihometrice curs 4

    9

    Clark, L. A., & Watson, D. (1995). Constructing validity: Basic issues in scale development. Psychological Assessment, 7, 309-319. Cohen, R., Swerdlik, M., & Smith, D. (2009). Psychological testing and assessment: An introduction to tests and measurements (7th ed.). New York: McGraw-Hill Crowne, D. P., & Marlowe, D. (1960). A new scale of social desirability independent of psychopathology. Journal of Consulting Psychology, 24, 349354. Fischer J., Corcoran K. (2007). Measures for clinical practice: A sourcebook. 4nd Ed., New York: Oxford University Gordon, E., Holden, R. (1996). Use of item ratings to examine personality test item cognitive response processes. Personality and Individual Differences Vol. 21, No. 6, pp. 897-905. Havrneanu, C. (2000). Cunoaterea psihologic a persoanei, Iai, Polirom Kerlinger, F.N. (1986). Foundations of behavioral research (3rd ed.) New York: Holt, Rinehart and Winston. Konstabel, K., Aavik, T., Allik, J. (2006). Social Desirability and Consensual Validity of Personality Traits, European Journal of Personality 20: 549566 Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons' responses and performances as scientific inquiry into score meaning. American Psychologist, Vol 50(9), 741-749. Nunnally, J., Bernstein, I. (1994) Psychometric Theory. New York: McGraw Hill, 3rd ed. Switzer, G., et al. (2000). Measurement issues in intervention research. n R. Schulz (Ed.), Handbook on dementia caregiving: Evidence-based interventions for family caregivers. New York: Springer Urbina. S. (2004). Essentials of Psychological Testing, John Wiley & Sons, Inc.