05 Masurarea in Psihologie

download 05 Masurarea in Psihologie

of 65

description

masurarea in psihologie

Transcript of 05 Masurarea in Psihologie

  • Msurarea n psihologie

    Aspecte cheie

  • Definitie si Scop Evaluarea psihologica (psychological assessment) reprezinta o ramura a stiintelor

    comportamentale

    Scop:

    identificarea asemanarilor si deosebirilor dintre caracteristicile personale si capacitatileindivizilor (Weiner, Naglieri, 2004) diferentele individuale

    clasificarea functionarii individuale

    predictia comportamentala (Niolon, 2005)

  • Evaluarea Psihologica vs Testare Psihologica

    Evaluarea proces general de colectare de informatii

    Testele reprezinta o modalitate standardizata de adunare a informatiilor.

    Alte metode de adunare a informatiilor interviul, observatii, istoric personal, date biografice

    Metodele pot fi combinate, impreuna un aport informational mai consistent

  • Psihologia este o stiinta si de aceea, evaluarea psihologica ... ... trebuie tratata ca un proces stiintific

    argumentele care se accepta pentru a argumenta daca un proces de evaluare se desfasoara corect, sunt argumente stiintifice:

    si altii fac asta

    toti specialistii de resurse umane fac asta

    la noi asa se face

    10.000 de clienti utilizeaza aceasta abordare

    eu asa am invatat

    am dovezi empirice ca asa functioneaza

  • Incisivitatea masurarii

    calitativ vs. cantitativ

    observatie & interviu vs. test/chestionar

    peak performance measures vs. average performance measures

    test vs. chestionar?

    sarcina de rezolvat vs. raportare despre comportamentul propriu

  • Relatii intre variabile: ecuatia structurala (1: determinism)

    CRITERIUPREDICTOR

    Cauza Efect

    Variabila independenta Variabila dependenta

    Ex: Inteligenta (GMA) Ex: Performanta profesionala

    Ex: Constiinciozitate Ex: Accidente de munca (-)

    Ex: Extraversie Ex: Eficienta in vanzari

  • Despre teste psihologice

    Un test reprezinta o colectie de mostre de comportament utilizate pentru a extrage inferente generale cu privire la comportamentul unui individ

    mostre de comportament = Itemi = Intrebari = Am multi prieteni

    Item1 + item2 + item3 +.itemx = o scala (Sociabilitate, Extraversie, Responsabilitate etc)

  • Despre teste psihologice

    Raspunsurile la un test sunt de obicei colectate in tabele statistice care permit specialistului sa compare scorul obtinut de un individ cu cele obtinute de un anumit grup de referinta

    obtinute de un anumit grup de referinta = etalonul sau normele

    cea mai frecventa eroare in Romania Sisteme Normative Americane/ Internationale

  • Domenii de evaluare

    Evaluarea personalitatii : NEO PI R, CPI, EPQ etc

    Evaluarea functionarii intelectuale: SB, GAMA, WAIS, MAB, Woodcock-Johnson

    Evaluarea intereselor: JVIS, HOLLAND

    Evaluarea motivatiei: AMI

    Evaluare stres, neuropsihologica etc

  • Metaanalize: Hunter & Hunter (1984); Schmidt & Hunter (1998)

  • Concepte de Baza

    Scoruri Standardizate:

    z,

    T,

    Centile,

    IQ

    Caracteristici Psihometrice:

    Fidelitate;

    Validitate.

  • Interpretarea Scorurilor

    Scala de evaluare a responsabilitatii

    A: - 80

    B: - 38

    Scorul maxim ce poate fi obtinut 100

    Care dintre cei doi poate fi caracterizat ca fiind un individ, constiincios care isi finalizeaza sarcinile si care manifesta un comportament etic?

  • Norm reference

    Un scor brut nu are o semnificatie individuala

    Semnificatia acestuia este desprinsa prin raportarea la un anumit grup

    De ex: In Romania media populatiei se afla la valoarea 80 pt scala de Responsabilitate

    Prin raportarea scorului la media unui grup desprinderea interpretarilor - A manifesta un comportament etic in aceeasi masura ca majoritatea indivizilor din populatia generala

  • Evaluarea cu doua instrumente

    Instrumentul x scorul maxim 50

    Instrumentul y scorul maxim 100

    2 persoane evaluate

    A: obtine 37

    B: obtine 60

    Cum comparam cele doua scoruri ??

  • Scoruri Standardizate

    Cel mai frecvent scoruri T (media 50 , ab st. 10)

    Alte tipuri de scoruri:

    Percentile

    Stanine

    Z Scores

    IQ Scores

  • Scoruri T & Percentile

  • Scoruri IQ

  • Fidelitatea: Definitie n orice msurare a fidelitii, referirea se face la consistena i

    reproductibilitatea unei observaii (cot, scor, not) sau set de observaii (distribuia scorurilor). Dac cu acelai instrument de msur se fac determinri n timpi succesivi i de fiecare dat se ajunge la aceleai valori, spunem c am obinut o msurare cu o fidelitate mare.

    Prin fidelitate se nelege fineea cu care testul msoar constructele sale componente, respectiv gradul de exactitate i lipsa greelilor de msurare.

    Fidelitatea indic utilizatorului gradul n care poate avea ncredere n rezultatele testului.

    Fidelitatea este gradul n care scorurile testului sunt consistente sau repetabile, adic gradul n care ele nu sunt afectate de erorile de msur (APA Standards, 1985).

  • Fidelitatea: Problematica

    Asadar, fidelitatea vorbeste despre

    exactitate

    lipsa de eroare

    repetabilitate

    ...

    In teoria clasica a testarii (CTT), rezultatul unei masurari psihologice este definit drept:

    True score = Observed score + Error

    Deci, cu cat eroarea este mai mica, cu atat scorul observat (masurat in mod efectiv) este mai corect, mai apropiat de realitate (scorul adevarat)

  • Fidelitatea: Masurare

    Pentru determinarea fidelitii, sunt posibile mai multe proceduri i se pot folosi metode diferite de evaluare sau chiar de msurare ale acesteia.

    masurare: (empirical correlational methods, multiple measurement)

    test-retest

    forme echivalente

    estimare: (multivariate methods, single measurement: internal consistency)

    split-half

    Cronbachs alpha

    Guttmans lambda

    Kuder Richardsons KR-20 & KR-21

  • Fidelitatea: Test-retest metoda foarte puternica, de masurare a fidelitatii (nu estimare)

    se administreaza acelasi test de 2 ori, la o oarecare distanta intre administrari

    distanta este dependenta de tipicul testului (aptitudini generale, aptitudini specifice, personalitate etc.)

    probleme:

    esantioane mici, de obicei

    esantioane necontrolate, de obicei (dropouts)

    efectele invatarii (mai ales la distante de retest mici si la anumite tipuri de teste)

    efectele dezvoltarii/evolutiei (mai ales la distante de retest mari)

    se raporteaza:

    rtt, coeficientul de corelatie intre seturile de date obtinute in test si retest

    distanta de retest (2 saptamani, 5 zile etc.)

  • Fidelitatea: Forme echivalente

    metoda foarte puternica, de masurare a fidelitatii (nu estimare)

    probleme

    este posibila doar la acele teste unde exista forme echivalente

    efort foarte mare pentru autor sa genereze forme echivalente

    echivalenta nu este niciodata perfecta

    se raporteaza:

    rab, coeficientul de corelatie intre seturile de date obtinute cu Forma A si Forma B

    Exemplu:

    TTCT, Torrance Tests for Creative Thinking, Verbal & Figural, Forms A and B

  • Fidelitatea: Split-half

    metoda mai slaba, de estimare a fidelitatii (nu masurare)

    metoda:

    se imparte testul in 2 subteste, esantionand itemii sai

    esantionarea poate fi facuta ori aleator, ori dupa o regula,

    de obicei itemi pari vs. impari

    se raporteaza

    rxy, coeficientul de corelatie intre cele 2 subteste, de obicei rpar-impar

  • Fidelitatea: Consistenta interna metoda mai slaba, de estimare a fidelitatii (nu masurare)

    cea mai populara metoda de raportare a fidelitatii

    coeficientul Alpha, (Lee Cronbach)

    coeficientii KR 20 si KR 21 (Kuder & Richardson)

    coeficientii Lambda (1-6) ai lui Guttman, 3 este similar cu Alpha-Cronbach

    metoda:

    multivariata

    se raporteaza media deviatiilor fiecarui item de la valoarea medie, la deviatia scorului total

    NU UITATI SA INVERSATI ITEMII SCORATI INVERS!!!

    se raporteaza

    / x /KR20/KR21=[0.00-1.00]

    praguri (Bernstein & Nunnaly): .70 / .90

  • Fidelitatea: Wrap it up

    In concluzie:

    fidelitatea se poate masura sau estima

    metodele de masurare sunt mai puternice decat cele de estimare

    indicele de fidelitate e cuprins intre 0 si 1

    operam cu praguri de .70 si de .90 pentru fidelitate, atunci cand o aplicam unor probleme de masurare

    Insa fidelitate nu are un sens direct in masurare

    daca ne intoarcem la ecuatia din CTT (Observed score = True score + Error), cum este relationata fidelitatea cu Error Term?

    prin intermediul conceptului de Standard Error of Measurement

  • Cum variaza fidelitatea testelor?

    De obicei fidelitatea unui test creste odata cu numarul de itemi

    Spearman-Brown prophecy (demonstratia clasica: Guilford, 1954)

    true variance increases more rapidly than error variance

    rnn = n rtt / (1+ (n-1) rtt )

  • Fidelitatea unor metode de evaluare diferite

    in aceasta evaluare de obicei metodele sunt impartite in calitative vs. cantitative

    observatie

    acord interevaluatori, de obicei pe acelasi behavioral sample

    = .05 - .25

    interviu

    acord interevaluatori

    = .05 - .50

    test/chestionar

    toate metodele discutate

    = .50 - .90

  • SEM: Standard Error of Measurement Eroarea de msurare standard (se) se calculeaz potrivit Formulei (1), unde se = eroarea de

    msurare standard, sx = abaterea standard, rtt = coeficientul de fidelitate.

    se = sx (1- alpha)

    Atunci cand in locul fidelitatii consistenta interna se foloseste fidelitatea test-retest, masura se numeste SEP: Standard Error of Prediction

    Intervalul de confidenta de 90% (+ - SEM): intervalul in care pica scorul real al subiectului, cu o probabilitate de 90%

    Exemplu:

    Scala staninelor are o medie de 5 i o abatere standard de 1.96

    Fidelitatea unui test este rtt= .70

    se = 1.96 (1- .70) = 1.07

    Scala QI are media de 100 si abaterea standard de 15

    Fidelitatea unui teste este rtt= .95

    se = 3.35

  • SEM: la ce ne foloseste?

    Estimarea erorii de masurare

    la fidelitati sub .70, se creste foarte mult si scala nu mai poate fi utilizata pentru decizii majore

    la fidelitati de peste .90, se scade la un nivel la care putem spune ca se poate lucra coerent cu scala

    Probleme de comparatie

    comparatia scorului unui individ cu scorul altui individ

    comparatia scorului unui individ cu un prag

  • Test de inteligenta: cu 90% confidence interval pentru rtt=.50, .70 si .95

  • Chestionar de personalitate: NPQ (Ce ar fi daca fidelitatile ar fi la .50)

  • Chestionar de personalitate (contd.)

  • Chestionar de personalitate (contd.)

  • Chestionar de personalitate (contd.)

  • Test de aptitudini (Performanta aritmetica): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.75 (cu gri)

  • Test de aptitudini (Vanzari): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.90 (cu verde)

  • Concluzie

    A test cannot be valid if it is not reliable

    Fidelitatea este considerata o conditie a validitatii

  • Exista mai multe tipuri de validitate:

    Validitatea predictiva So/Devianta (Gough, 1996)

    Validitatea de criteriu Cs/AHS

    Validitatea convergenta (Interviu Do/ Scala Do)

    Validitatea de construct

    Validitatea

  • A. Validitatea predictiva singura pe baza careia se pot face predictii valide (verificate)

    B. Validitatea de criteriu asigura ca metoda de evaluare face adecvat distinctia intre mai multe persoane raportat la un anumit criteriu

    C. Validitatea convergenta metoda folosita masoara acelasi construct masurat si de alte metode

    D. Valididtatea de Construct se va masura Dominanta, iar nu Sociabilitatea

    De ce este relevanta ???

  • Face Validity & Distorsiune

    Validitatea de Aspect sau de fatada

    Relevanta in Distorsiune

    Face Validity mare = mai usor de distorsionat

  • Validitatea: Definitie

    Concepia actual despre validitate spune c aceasta reprezint un corpus complex i integrat de demonstraii i cunotine tiinifice care examineaz variabilele psihologice msurate de test (AERA, APA, NCME, 1999).

    Aceste demonstraii ne parvin ntr-o varietate de forme, iar nelegerea validitii unui test necesit examinarea lor atent.

    Validitatea este conceptul central pe care se bazeaz psihodiagnosticul, att n cazul aptitudinilor ct i al personalitii.

    Ea ne permite formularea de aseriuni privind gradul de dezvoltare al unei caracteristici care ne intereseaz sau emiterea de predicii n ceea ce privete comportamentul viitor al persoanei evaluate.

    Validitatea se definete prin intermediul metodelor utilizate n verificarea ei: validarea de criteriu i validarea de construct.

  • Validitatea: Tipuri de validitate

    Validitate de continut (content validity):

    construct validity (verificare a operationalizarii)

    face validity

    translation validity

    validitate de criteriu (criterion-related validity)

    validitate predictiva (predictive validity): prezice ce ar trebuie sa prezica

    validitate concurenta (concurrent validity): distinge intre grupuri intre care ar trebui sa distinga

    validitate convergenta (convergent validity): coreleaza cu alte operationalizari ale conceptului (sau masuri ale acestuia)

    validitate discriminanta/divergenta (discriminant/divergent validity): operationalizarea diferentiaza fata de alte concepte similare

  • Validitatea: clarificari / exemple n linii generale, validitatea exprim gradul n care un test msoar ceea ce i

    propune s msoare.

    La aceast calitate se mai poate aduga i o alta, dac testul poate fi utilizat n luarea unor decizii corecte.

    Cu alte cuvinte (exemplu), dac noi cunoatem performanele unei persoane la un test (predictor), ct de precis vom putea estima ce performane profesionale va obine?

    Validitatea poate fi definit n termeni operaionali ca i corelaia dintre predictor i criteriu (de ex. performanele profesionale ale unui eantion de indivizi).

    Rezultatul este cunoscut ca i coeficient de validitate.

    Un test poate avea mai muli coeficieni de validitate, n funcie de numrul de dimensiuni profesionale (calitatea muncii, disciplina, categoria profesional etc.) care coreleaz cu el.

  • Validitatea de continut / construct pune probleme legate de gradul n care dimensiunile msurate sunt cu adevrat relevante

    pentru conceptul pe care se concentreaz testul daca sunt prezente toate dimensiunile relevante (daca nu s-au pierdut unele care

    trebuiau sa fie) daca nu sunt prezente dimensiuni nerelevante (care contribuie la eroare, dpdv al

    constructului evaluat)

    Exemple: Personalitate:

    masuram sociabilitate si responsabilitate; este testul valid (de construct)? masuram extraversie si stabilitate emotionala; este testul valid (de construct)?

    Sociabilitate: masuram fluenta verbala, numarul de glume pe care il poate face; este valid?

    (include toti indicatorii relevanti) Usurinta aritmetica:

    masuram capacitatea de a transpune o problema matematica in ecuatie, de a face calculele si de a explica verbal semnificatia rezultatului la care s-a ajuns; este valid? (surprinde constructul corect?)

  • Validitatea de construct (contd.) Care este perioada asociata cu filosoful Epicur?

    a. 341-270 BC b. 331-232 BC c. 280-207 BC d. Nici una din aceste optiuni

    Cand s-a nascut fondatorul Microsoft, William Gates? a. 1949 b. 1953 c. 1957 d. Nici una din aceste optiuni

    Care din urmatoarele enunturi sunt corecte cu referire la ANOVA? a. A fost inventata de Fisher in 1914 b. A fost inventata de Fisher in 1920 c. A fost inventata de Pearson in 1920 d. Nici una din aceste optiuni

  • Completitudinea dimensiunilor, Ex.: High Impact Leadership Cum construim un test care sa masoare capacitatea unui individ

    de a fi un lider de mare impact?

    Ce face un leader de succes?

    actiuni:

    deleaga

    monitorizeaza

    controleaza

    etc intr-un cuvant: face tranzactii eficiente

  • Validitatea de criteriu: explicatie

    un indicator al faptului ca testul poate fi utilizat ca predictor pentru un anumit comportament (criteriu)

    ca urmare a existentei acestui tip de validitate putem spune, daca testul are un scor mare, ca X e probabil si cand testul are scor mic, ca X este improbabil (sau X e probabil)

    validitatea de criteriu spune ce predictii sunt valide deci cum se interpreteaza scorurile testului

    de principiu este corelaional la nivel comportamental, ns se admit i alte indicii, de exemplu experimentale sau de comparaie inter-grupuri

  • Validitatea de criteriu: Principii si metoda Principiu:

    cat mai voluminos corpus de cunostinte despre felul in care se comporta o anumita scala sau test: in relatie cu anumite criterii in anumite situatii (ar putea fi generalizabil, in functie de explicatia teoretica oferita)

    de ex. experimentul Sy vs. Do in CPI, explicatia e coerenta, deci e probabil generalizabila pe anumite esantioane (ar putea fi generalizabil, in functie de explicatia teoretica oferita)

    de ex. legatura dintre Re si ceasornicari, explicatia e coerenta, deci generalizabila de ex. scorurile la STAI-Y pentru adulti in SUA vs. Romania (desi coerent si aparent

    generalizabil, s-a infirmat)

    Metoda: date continue: corelatie intre criteriu si predictor (validitate predictiva)

    se raporteaza drept coeficient de validitate r grupuri contrastante sau puternic contrastante (validitate concurenta)

    high vs low scorers pe predictor coincid cu high vs. low scorers pe criteriu se raporteaza testul T, al semnificatiei diferentei intre doua medii (p

  • Exemplu validare de criteriu: Scala Do din CPI (1)

    Obiectivele scalei

    Scala Dominan (Do, Dominance) a fost dezvoltat iniial n cadrul unui proiect de studiu al participrii politice (Gough, McClosky & Meehl, 1951) cu scopul explicit de a identifica indivizii puternici, dominani, influeni, cu ascendent asupra celorlali i care preiau conducerea i i exercit autoritatea (Megargee, 1972).

  • Exemplu validare de criteriu: Scala Do din CPI (2)Constructia scalei

    Scala Do a fost construit prin compararea empiric a conceptului de dominan cu scorurile obinute de ctre un numr de subieci pe baza unui set de itemi, construit special n acest scop.

    Gough, McClosky & Meehl (1951) au construit un set de itemi care putea descrie o persoan dominant i au selectat din acesta, pe baza unui procedeu experimental-comparativ itemii cu puterea cea mai mare de discriminare.

    Procedeul este numit peer nomination i const, n forma sa clasic, din aceea c, ntr-un eantion de subieci care sunt familiarizai unul cu altul (de exemplu o clas de elevi, un grup de munc), persoanele care compun eantionul sunt rugate s-i numeasc pe aceia dintre ei care se potrivesc cel mai bine cu un anumit criteriu.

    Ulterior, acestor persoane selectate li se aplic un set de itemi sau un chestionar i pe baza analizei statistice sunt reinui itemii care au putere de discriminare.

  • Exemplu validare de criteriu: Scala Do din CPI (3)

    Cateva studii importante sunt:

    Gough (1969b): comparatie de peer-nominated cu normele nationale

    Gough (1969b): comparatie de high si low nominated intre ei

    Hase & Goldberg (1967): comparatie auto-evaluare globala si auto-evaluare cu CPI

    Megargee, Bogart & Anderson (1966): validare predictiva

    Gough (2003): studiu longitudinal peste 40 de ani, cadeti din West Point

    Dicken (1960): studiu cu Gi vs. Do (arata semnificatia prosociala a Do)

    Gough (1954); studiu cu Sy si Do (militari marsaluind)

  • Exemplu validare de criteriu: Scala Do din CPI (4) 4 factori in interpretare

    Primul factor este compus n principal din itemi care descriu persoana evaluat drept un leader, cruia i place s conduc, s vorbeasc n faa altor oameni i care are talent pentru organizarea i controlarea celorlali. Exemple de astfel de itemi sunt Am un talent nnscut de a influena oamenii (adevrat), Cred c mi-ar plcea s am putere asupra altora (adevrat).

    Al doilea factor este descriptiv pentru un puternic sentiment al auto-controlului, fiind compus din itemi precum mi este greu s m concentrez pe activitatea pe care trebuie s o fac (fals), Renun cu uurin atunci cnd lucrurile devin dificile (fals) i Am greuti mai mari dect ceilali oameni cu concentrarea (fals).

    Al treilea factor ine de controlul i dirijarea celorlali, coninnd itemi precum mi place s dau ordine i s pun lucrurile la punct, Mi-ar plcea s am autoritate asupra altor oameni i mi place s planific lucrurile i s stabilesc ce are fiecare persoan de fcut.

    Al patrulea factor poate fi descris drept factorul normei sociale; conine doar doi itemi, ns ambii afirm obligativitatea fiecrei persoane de a participa la activitile grupului sau naiunii sale i de a se supune consensului comun.

  • Exemplu validare de criteriu: Scala Do din CPI (5)

    Adjective asociate

  • Exemplu validare de criteriu: Scala Do din CPI (6) Comportamente asociate

    i-a asumat controlul grupului (.33);

    A vorbit mult la ntlnire (.33);

    A avut mai multe de spus dect oricine altcineva (.32);

    A acordat sprijin celui care a avut o idee bun (.32);

    A nvat numele tuturor celorlali din grup (.29);

    A vorbit doar dac i s-a adresat altcineva nti (-29);

    Nu a intrat n conversaie pn nu i s-a pus o ntrebare (-.19);

    A dat doar rspunsuri monosilabice la ntrebri personale (-.19);

    A ateaptat ca cealalt persoan s aleag tema conversaiei (-.18);

    A devenit tcut atunci cnd au intrat oameni noi n ncpere (-.17);

  • Exemplu validare de criteriu: Scala Do din CPI (7)

    Descrieri din anamneza

    Neobinuit de sigur pe sine, se simte n stare s fac fa aproape oricrei situaii. (.27, .24);

    Las o impresie bun, are tehnici interpersonale eficiente. (.24, .20);

    Folosete un vocabular vast i variat. (.14, .23);

    Plin de haz i de via, face o conversaie interesant. (.16, .26);

    Este nesigur pe sine, are ndoieli privind propriile abiliti. (-.22, -.24);

    Are multe griji i probleme. (-.18, -.20);

    Este reticent i taciturn. (-.19, -.14);

    Are dificulti n a-i exprima ideile. (-.16, -.20);

  • Exemplu validare de criteriu: Scala Do din CPI (8) Concluzii

    Pentru a concluziona asupra scalei de dominan din CPI, putem spune c indivizii cu scoruri mari la Do sunt ncreztori n propriile fore, ambiioi, asertivi, vorbrei, centrai pe sarcin, ntreprinztori i persuasivi. Dominana lor este n primul i primul rnd prosocial, prin faptul c i exercit influena asupra celorlali, urmrind scopuri demne de a fi urmate, consensuale i acceptate social, i nu doar de dragul mplinirii propriilor ambiii. Ceilali le recunosc abilitile de leadership i sunt dispui s accepte sfaturile i chiar controlul lor.

    Spre deosebire de persoanele care au scoruri mari la Do, persoanele cu scoruri mici sunt reticente, lipsite de ncredere n propriile fore, submisive, neambiioase, lipsite de aptitudini sociale, defetiste, se ruineaz uor, sunt retrase n cadre sociale, ngrijorate i cu probleme.

    Pentru persoanele cu scoruri foarte mari la Do, este posibil adoptarea unor comportamente excesiv de dominante i axate spre controlul extrem al celorlali, ceea ce echivaleaz cu un abuz al capacitilor lor de persuadare a celor din jur. Aceast posibilitate de uz antisocial a caracteristicii de dominan crete progresiv n condiiile n care persoana respectiv cupleaz scorul foarte mare la Do, cu scoruri mici la scale precum Re sau To. Studii de caz ilustrative din acest punct de vedere pot fi gsite n Meyer & Davis (1992) i McAllister (1996).

  • Validitatea de criteriu: Exemple (1) Responsabilitatea (CPI)

    Este o persoan responsabil i serioas (.23, .30); Este productiv, i atinge obiectivele, rezolv lucrurile (.16, .30); Valorizeaz aspectele intelectuale i cognitive (.26, .33); Are un nivel nalt de aspiraie pentru sine (.27, .18); ... Este neprevizibil i schimbtor n comportamente i atitudini (-.15, -.27); Diverse nevoi ale sale tind s fie exprimate ntr-o manier relativ direct i necontrolat, nu

    poate amna gratificaiile (-.20, -.31); mpinge i testeaz limitele, ncearc sp stabileasc n continuu ce anume i poate

    permite i ce nu (-.31, -.22); Este indulgent cu sine (-.25, -.30);

    Perseverenta (AMI) caracterizat drept luptator (.62), tenace (.51), competitiv (.44), fricos (-.23), timid (-.50),

    cedeaza usor (-.59) Lucreaza energic la sarcinile pe care le are (.36) Nu se lasa intimidat de obstacole (.32) Trece de obstacole prin depunerea unui efort mai mare (.29) Nu renunta la sarcini, nici chiar cand sunt indemnati (.27)

  • Validitatea de criteriu: Exemple (2)

    dovezi experimentale:

    experiment pentru Sy

    comparatii intergrupuri:

    AMI; motivatie pentru performanta pe esantioane de sportivi, artisti, someri

    CPI, To; toleranta comparata pe esantioane de hipioti, neonazisti, calugari

    SWS, TABP comparat pe esantioane de bolnavi

    uneori aceasta abordare iti documenteaza scala (adica aduce la lumina noi utilizari sau semnificatii):

    CPI, Re: ceasornicari, slefuitori de diamante, controlori de zbor etc.

  • Validitatea de criteriu: Exercitiu avem de ales intre doua scale de dominanta, fiecare cu urmatoarele corelatii, care e mai valida?

    1 Propensiunea spre comportamente expresive spontane (.38); Manifesta aceste comportamente chiar n situaiile n care acestea nu se impun (.33); Manifesta furie si comportamente agresive fizic, fa de persoane sau obiecte (.26); Tendina de a rzbuna nedreptile suferite de sine sau de prieteni (.30); Ruminare privind pedepsele cuvenite inamicilor (.29); Tendina de a avea comportamente agresive din punct de vedere verbal, atunci cnd se crede

    ndreptit (.42); Competitiv n a demonstra c propriul punct de vedere este cel corect (.36).

    2 i-a asumat controlul grupului (.33); A vorbit mult la ntlnire (.33); A avut mai multe de spus dect oricine altcineva (.32); A acordat sprijin celui care a avut o idee bun (.32); A nvat numele tuturor celorlali din grup (.29); Se comport ntr-o manier asertiv. (.42); Are prezen social, este n largul su n situaii sociale. (.36); Este un individ vorbre. (.32); Tinde s i ofere sfatul. (.34);

  • Validitatea predictiva

    cea mai puternica, dar si cea mai rara

    se bazeaza pe studii longitudinale, care prezic evolutii sau comportamente pentru populatii largi, pe perioade de timp relativ lungi

    Exemple:

    CPI, modelul cuboid, ca predictor al succesului militar: absolventi de West Point, promotiile anilor 60 si 70

    EPQ: studiu longitudinal pe probabilitatea de recidiva a detinutilor

    STAXI: studiu longitudinal pe probabilitatea de a avea un accident auto, studiu pe accidente de munca

    SWS: studiu longitudinal pe probabilitatea de a avea un infarct miocardic

    Raven: prezice succesul scolar

  • Validitatea divergenta

    Este importanta mai ales in acele conditii in care conceptul-tinta este foarte aporpiat de alte concepte

    Exemplu:

    test de depresie

    exista comorbiditate intre depresie si anxietate

    ar trebui sa demonstram

    nu doar ca testul nostru diferentiaza depresivi de nondepresivi

    ci si ca nu coreleaza cu teste de anxietate

    si ca diferentiaza mai bine intre high si low scorers de depresie decat intre high si low scorers de anxietate

  • Validitatea de aspect o modalitate (gresita) de a infera validitatea de criteriu (sau validitate in general) este bazata pe itemii scalei sau pe natura problemei

    personalitate: 27. Cnd m contrazic cu cineva am tendina s vorbesc mai tare dect de obicei. 86. Clocotete sngele n mine cnd sunt luat de prost. 105. Deseori nu mi pot stpni suprarea i furia. 113. Am deseori tendina s fiu grbit i repezit, chiar i atunci cnd nu e cazul. 115. Se ntmpl des s m enervez prea repede pe cineva. 135. Pot fi uor scos din srite dac sunt agresat. -30. Dac ceva mi merge ru, nu m enervez pentru mult timp. -52. Chiar i atunci cnd sunt prea multe lucruri de fcut, prefer s le fac n ritmul meu. -60. Chiar dac ceva m scoate din srite, de cele mai multe ori m calmez repede. -93. Nu sunt multe lucrurile care reuesc s m irite sau s m enerveze. -102. n general sunt o persoan linitit i greu de enervat. -108. Exist o mulime de mici neplceri ale vieii pe care nu le las s m tulbure.

    aptitudini mentale: mai usor de hotarat, caci sarcina descrie constructul exemplu:

    cerem subiectilor sa si aminteasca spontan sau sa recunoasca informatie verbala, vizuala sau numerica; subiectilor li se prezinta, de exemplu, informatie grupata n anumite categorii si li se cere apoi sa reproduca respectivele categorii.

    ce test e?

    uneori insa e complicat: test cu final deschis, care cere subiectilor sa genereze un numar ct mai mare de cuvinte sau de idei asupra unei teme date, ntr-o

    perioada specificata de timp; se masoara numarul ideilor este acest test valid ca test de originalitate?

  • Validitatea trebuie judecata atat general cat si situational general:

    un test care nu a fost validat nu ar trebui utilizat

    poate nu au fost culese date de validare exact in situatia care ma intereseaza, dar faptul ca ele exista, ma face sa am mai multa incredere

    exemplu:

    un test de persuasiune a fost validat in contextul unui studiu experimental (elevi care trebuiau sa convinga clasa sa actioneze intr-un anumit fel) poate fi utilizat pentru a evalua agenti de vanzari?

    situational

    daca a fost validat pe situatii similare cu cea la care e folosit

    daca e UTIL (uneori e evident)

    trebuie sa selectez dintr-o clasa de copii pe cei care sunt susceptibili sa faca sport de performanta, am la dispozitie un test care masoara Extraversie, Nevrotismul si Psihotismul e valid?

  • Validitatea metodelor Evident, validitatea se refera mai degraba la masuratori specifice (de ex. teste specifice)

    mai specific chiar, vorbim de validitatea scorurilor (adica a informatiilor obtinute)

    Totusi se vorbeste despre faptul ca unele metode sunt mai valide decat sunt altele Cum se poate evalua validitatea unei metode?

    evident, prin prisma potentialului sau de a genera informatie valida

    De principiu, metodele sunt diferite din acest punct de vedere:

    Assessment Center (multiple measures) .65 Interviu comportamental .40-.60 Teste de performanta directa (work sample) .54 Teste de abilitate .53 Teste de integritate .51 Chestionare de personalitate .39 Date biografice .38 Referinte .23 Interviu traditional (nestructurat / semistructurat) .05-.19

    ionut.ionescuHighlight

    ionut.ionescuHighlight

  • Validitatea metodelor ca functie a intinderii numarul de itemi (de instante comportamentale care sunt esantionate) determina validitatea,

    nu doar fidelitatea testului; de aceea un test mai lung (sau interviu mai lung) este mai valid (presupunand ca este bine construit)

    tinand orice alta variabila constanta, testele mai lungi sunt mai valide

    pentru GAMA (test de abilitati cognitive), validitatea creste daca este administrat pentru perioada intreaga (N=270, criteriul performanta academica la scolari din an terminal al liceului):

    1 minut .21

    2 minute .30

    3 minute .36

    5 minute .39

    10 minute .41

    15 minute .45

    20 minute .48

    25 minute .51