St1 01 Curs Introductiv

Post on 22-Oct-2015

75 views 3 download

description

bkjnmn

Transcript of St1 01 Curs Introductiv

STATISTICA PSIHOLOGICĂ

ŞI PRELUCRAREA

INFORMATIZATĂ A DATELOR

Titular de curs: Conf. univ. dr. Marian Popa

popamarian@gmail.com

www.mpopa.ro

Seminarii: Lect. univ. dr. Alina Vasile; Drd. Gorbănescu Adrian; Prof. asoc. dr. Traian Manea

„...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean eficient, la fel ca şi abilitatea de a citi şi a scrie”.

H.G. Wells (1866-1946)

2

Curs introductiv

Organizarea cursului

Definiţia statisticii

Statistica, instrument al metodei ştiinţifice în psihologie

Scurt istoric al statisticii în psihologie

Utilitatea statisticii în activitatea curentă a psihologilor

Dificultăţi şi riscuri în însuşirea metodelor statistice

Concepte statistice fundamentale

Măsurare în psihologie

3

1. Organizare

Statutul cursului

Disciplină fundamentală

de suport interdisciplinar

Durata studiilor

2 semestre

Număr de credite

5+2

4

Tipuri de activităţi didactice:

• Sem. I: 2hC+2hS (56 ore)

• Sem. II: 1hC+2hL (42 ore)

• teme pentru acasă

• se găsesc pe site

• vor fi predate sub formă scrisă, la fiecare seminar

• nu se admite prezentarea ulterioară!

5

Sistemul de evaluare

(sem I)

• 3 pe semestru – anunţate

• teste de cunoştinţe cu întrebări deschise

evaluări periodice (2p)

• prezenţa (o absenţă= -0.2p)

• calitatea temelor (copierea=absență)

• Activism (la aprecierea prof.)

evaluare de seminar (4p)

• semestrialExamen (4p)

6

Suport de curs

Manual de bază:

• Statistică pentru psihologie. Teorie și aplicații SPSS, M. Popa, Editura Polirom, 2008– Prezentări de curs - pagina web:

www.mpopa.ro

Bibliografie suplimentară (facultativă):

• Orice manual introductiv în statistică

• Referințele bibliografice ale cursului

• Adrese web recomandate pe site

7

Cerinţe

Calculator de buzunar cu funcţii elementare

Fixarea stabilă într-o grupă de studiu

Conduita în sala de curs…

Evitaţi să deveniţi “excepţii de la regulă”

8

Dificultăţi specifice

Volum mare de concepte noi

mai ales la primele cursuri!

Informaţii interdependente

chiar şi o absenţă poate însemna mult!

Precizie şi rigoare în exprimare

limbaj specializat

care nu admite ambiguităţi

Evaluări frecvente

obligatorii pentru fixarea cunoştinţelor

statisticofobia

naivitatea statistică

epatare statistică

RISCURI

9

Recomandări

• Prezenţa constantă la curs şi seminar

• Realizarea independentă a temelor– cooperarea este un lucru bun… dar nu prin copiere

• Participarea la evaluările parţiale

• Teamă de statistică?– concentraţi-vă mai ales pe raţionament şi nu pe numere sau

calcule

– calculele nu vor depăşi nivelul aritmeticii elementare

– nu va trebui sa reţineţi formule

– în spatele cifrelor se află întotdeauna realităţi intuitive

Echivalarea cursului?

• Condiţii:

– programa analitică a cursului urmat anterior să

fie echivalentă cu cea a cursului nostru;

– o evaluare generală a cunoştinţelor

• întrebări referitoare la cunoştinţe statistice de bază;

– poate fi cerută numai în primele două

saptamâni ale semestrului

11

2. Definiţii

• Statistica– domeniu al matematicii cu ramuri aplicative (statistica psihologică)

– „Ştiinţa care ne învaţă care este organizarea politică a tuturor statelor

moderne ale lumii”

• 1770, Londra, baronul Bielfeld „The Elements of Universal Erudition”

(capitol de „statistică”)

– recoltarea, descrierea şi analizarea datelor în vederea extragerii unor

concluzii (inferenţe) pe baza acestora

– operează cu date numerice care descriu realitatea din jurul nostru

• Datele– informaţii obţinute prin categorializare, numărare sau măsurare, pe

baza utilizării unor metode adecvate

12

3. Metoda științifică în psihologie

căută reguli cu un anumit nivel de generalitate, care depășesc nivelul particular sau individual;

colectează dovezi obiective, de natură empiric-inductivă;

operează cu afirmaţii controlabile pe care le testează cu proceduri acceptate de comunitatea cercetătorilor;

atitudine sceptică faţă de rezultate și față de cunoştinţele acumulate;

atitudine deschisă faţă de orice informaţii noi;

creativitate şi transparenţă.

13

Pământenii se împart în trei

categorii (Huck, 2004)

• Aproape orice psiholog face din această categorie

cei care fac cercetare ştiinţifică

• Orice psiholog face parte din această categorie

cei care nu fac cercetare, dar se

confruntă cu rezultatele altora

• Nu te poţi numi psiholog dacă faci faci parte din această categorie

cei care nici nu fac şi nici nu se întâlnesc

cu rezultatele cercetărilor

Statistica nu se confundă cu metoda științifică, ci este doar un instrument al acesteia

• Statistica este incercarea de a răspunde cu ajutorul

numerelor la întrebările pe care ni le punem

• Punctul central al statisticii este problema (raționamentul),

nu numerele!

– Ne punem o problemă

• Este eficientă utilizarea unei metode de terapie anxiolitică?

– Construim un model de cercetare

• Același grup înainte/după; Două grupuri (terapie/non-terapie)

– Măsurăm (cuantificăm)

• Chestionar…

– Analizăm

• Proceduri statistice (descriptive, test de semnificație a diferenței ș.a.)

– Tragem concluzii…

• Acceptăm existența unui efect? Cât de mare este? Câtă încredere putem avea?

16

un exemplu...

Observaţie

Definirea

problemei

Ipoteză

Date

Testarea ipotezei

acceptarerespingere

Teorie

Publicare

Terapeutul –DA; Cercetătorul - ?

Se măsoară anxietatea pe două grupe

Procedură de comparare a mediilor

Este diferenţa semnificativă?

Se publică, într-un anumit format

O nouă metodă de terapie a anxietăţii

Este eficientă?

• Formarea psihologilor trebuie să cuprindă obligatoriu:

• cunoştinţe teoretice

• abilităţi şi competenţe practice

• capacităţi de cercetare ştiinţifică

EFPA (European

Federation of PsychologistsAssociations)

19

20

4. Scurt istoric al statisticii

în psihologie

• ideea unui domeniu matematic al psihologiei (“psihometrie”)Christian von . Wolf, 1732

• iniţiatorul şcolii psihometrice englezeFrancis Galton (1882-

1911)

• antropolog şi psiholog (analiza de corelaţie)Karl Pearson (1857-1936)

• Elev al lui Wundt, iniţiază analiza bifactorială a inteligenţeiCharles E. Spearman

(1863-1945)

• statistica aplicată în psihofiziologieE.H. Weber (1795-1878) şi G.T. Fechner (1801-1887)

• teoria factorială a personalităţii (16PF)Raymond B. Cattel (1905-

1988)

• un geniu al statisticii (analiza de varianţă)Ronald A. Fisher (1890-

1962)

21

în evaluare

• construirea instrumentelor (teste, chestionare, scale)

• utilizarea instrumentelor (etalonare, diagnostic)

• selecţia psihologică (validare, prognoză)

în psihoterapie

• probarea eficienţei

• construirea modelelor terapeutice (durată, context etc.)

• relația dintre genul tipul terapeutului și eficiența terapiei

în instruire

• evaluarea performanţei

5. Utilitatea statisticii în practica psihologică

22

23

6. Concepte fundamentale

noţiunea de variabilă statistică

v. dependente / v. independente

v. continue / v. discrete

populaţie şi eşantion

statistica descriptivă / inferenţială

Cercetări experimentale / corelaţionale

24

Noţiunea de variabilă statistică

Definiţiecaracteristică a realităţii care

poate lua valori diferite

vârsta, inteligenţa,

satisfacţia etc.

distribuţia variabilei

valorile şi frecvenţa de

apariţie a fiecărei valori

2, 9, 11, 5, 8, 10, 15, 3, 7, 2, 11, 5

variabilitatea

măsura în care o distribuţie este

compusă din valori mai asemănătoare sau mai diferite una

de alta

caracteristica cea mai

importantă a variabilei

25

• ce sunt…• genul ............

• culoarea ochilor ...

• temperamentul

• lateralitatea .....

• religia ..............

• dar...– m, f

– căprui, albaștri, negri…

– flegmatic, sanguin, coleric...

– dreptaci, stângaci

– ortodox, musulman...

26

v. dependente/v. independente

distincţia se face în context de cercetare

o cercetare vizează

relaţia între variabile

v.

dependentă

suportă un efect, variază în funcţie de

ceva

face obiectul central

cercetării

v. independentă

determină un efect, induce variaţia VD

reprezintă contextul în

care se manifestă VD

27

• exemplu: o cercetare care vizează

numărul orelor de somn la studenţi, în

timpul semestrului, comparativ cu

perioada de sesiune

– orele de somn= v. dependentă

– perioada din semestru= v. independentă

Ce valori iau fiecare din cele două variabile?

28

• alegerea procedurii de testare a ipotezei

de ce este important să

distingem

VD și VI?

• le plasăm într-un raţionament de tip cauzal

• variabila “cauză”=v. independentă

• variabila “efect”=v. dependentă

• atenţie, concluziile cercetării nu vor fi neapărat de tip cauzal!

cum le distingem?

• relaţia dintre ereditate şi inteligenţă

• relaţia dintre eficienţa învăţării şi

temperatura ambiantă

• relaţia dintre nota la bacalaureat şi

nota la examenul de admitere

identificaţi VD şi VI:

30

v. continue/v. discrete

• exemple: greutatea, înălţimea, timpul de reacţie

v „continuă”→ poate lua un număr

teoretic infinit de niveluri ale valorilor (suportă zecimale)

• exemple: numărul persoanelor dintr-o familie, numărul de ţigarete fumate zilnic, scorul la un test

v. „discretă” → poate lua un număr

finit de valori (nu suportă zecimale)

31

populaţie şi eşantion

• Populația– cercetării: totalitatea „unităţilor de

informaţie” care constituie obiectivul de

interes al unei investigaţii (de regulă,

persoane)

– statistică: valorile care descriu

populația cercetării

• Eşantionul– Cercetării: toate persoanele care fac

obiectul studiului

– Statistic: toate valorile unei variabile,

măsurate pe eşantionul cercetării

Populatie

eșantion

exemple

• studiu asupra relației dintre accesul la

internet și comportamentul elevilor de liceu

– populaţia = elevii de liceu

– eşantionul = elevii selecţionaţi pentru investigaţie,

• studiu care vizează relația dintre inteligenţă și

performanţa în instruirea de zbor

– populaţia = toţi piloţii

– Eşantionul = subiecţii incluşi în studiu.

Reprezentativitatea eșantionului

• caracteristica unui eșantion de a descrie

în mod adecvat proprietățile populației din

care a fost extras

– are un caracter relativ (nu există eșantion

absolut reprezentativ)

– diferența dintre eșantion și populație se

numește eroare de eșantionare

• cu cât eroare este mai mică, cu atât concluzia

cercetării este mai sigură

”Bias”

• Eroare sistematică în constituirea

eșantionului– studiu asupra atitudinii faţă de utilizarea computerelor

în educaţie… sursă de BIAS:• eşantionul este constituit numai din elevi care utilizează frecvent

calculatorul

– Sondaj cu privire la intenţiile de vot bazat pe interviul

telefonic… surse de BIAS:

• starea socială a respondenţilor (îşi permit montarea unui

telefon)

• ora apelului (în orele dimineţii sunt acasă, să zicem, mai multe

femei casnice).

35

Statistica descriptivă/Statistica inferenţială

• S. descriptivă

– descrie datele, aşa cum sunt (numeric, grafic)

• S. inferenţială

– susţine concluzii (inferenţe) cu privire la o

populaţie, pe baza datelor unui eşantion extras din

acea populaţie• Parametrică

• Neparametrică

Măsurarea în psihologie

36

• ”Tot ceea ce există în

realitate, există într-o

anumită cantitate. Pentru a

cunoaște realitatea, trebuie

să o abordăm în egală

măsură sub aspect cantitativ,

dar și calitativ” (Thorndike, E. L., 1918, The nature, purposes, and

general methods of measurement of educational

products, p. 16)

Thorndike, Edward Lee

1874-1949

Ce este măsurarea?

- Concurs de manechine- Înălțime: 180 cm (poate fi exprimată și

în ”inch” sau ”picioare”)

- Bust: 90 cm

- Talie: 60 cm

- Șolduri: 90 cm

- Culoarea ochilor: - căprui (1), verzi (2), albaștri (3) (”c”, ”v”,

”a”)

- Inteligența (unități QI, stanine, nr. răspunsuri corecte)

- Frumusețea: - (1) urâțele

- (2) drăguțe

- (3) frumușele

- (4) frumoase de pică 38

- S.S. Stevens (1946) „On the theory of scale of

measurement”

- a măsura înseamnă ”a atribui valori numerice obiectelor și

fenomenelor, în conformitate cu anumite reguli”

- Limite ale definiției anterioare (Judd și McClelland, 1998)

- nu toate măsurările au un caracter numeric

- caracteristica de gen poate fi simbolizată cu caracterele ”m” și

”f”

- o regulă de atribuire a numerelor are caracter de măsurare

numai dacă ea instituie o anumită semnificație cu privire la

caracteristica măsurată

- Descrierea realității sub formă numerică sau

simbolică39

1906-1973

Caracteristici măsurabile în

psihologie

- de natură fizică (timpul de reacție, vârsta, diverși indicatori fiziologici)

- constructe psihice ”sociabilitatea”, ”motivația”, ”atitudinea față de risc”, ”depresia” …- ”modele” ale realității psihice a căror existență și nivel trebuie

probate

- nu pot fi măsurate direct, ci numai prin manifestările lor particulare

- Sociabilitatea (disponibilitatea de a comunica)- numărul prietenilor

- disconfortul resimțit în situații de izolare socială

- Constructul=variabilă latentă

- Indicatorii=variabile observate- distincție importantă pentru analiza de itemi, SEM

40

De ce este important să analizăm

procesul de măsurare?

- Cunoaşterea tipurilor de transformări la care

putem spune în mod legitim valorile rezultate

prin măsurare

- Evitarea concluziilor lipsite de sens

- Alegerea procedurilor statistice adecvate

datelor numerice şi scopurilor pe care ni le

propunem

41

Niveluri (scale) de măsurare

- Numerele diferă între ele prin semnificația și proprietățile lor

- niveluri (scale) de măsurare:- Nivelul nominal

- Nivelul ordinal

- Nivelul de interval

- Nivelul de raport

- Acestea sunt ordonate ierarhic- scalele superioare includ proprietățile celor

inferioare

42

a. Nivelul nominal

- Valorile indică categoria din care face parte cazul evaluat

- Exemple:- Genul: masculin/feminin (m/f; 1-2 …)

- Tipurile temperamentale (coleric, sanguinic, flegmatic, melancolic)

- Tipuri- De identificare (CNP, alte coduri arbitrare)

- Categoriale (m/f …)

- Caracteristici:- cel mai redus nivel de măsurare

- codurile valorilor sunt arbitrare

- valorile au doar o semnificaţie calitativă

- nu suportă operaţii aritmetice, în afară de însumare

- Pot fi grupate sau rafinate- Extravert (coleric, sanguinic); introvert (flegmatic, melancolic)

43

b. Nivelul ordinal

- Valorile au o semnificație cantitativă limitată la raportul de mărime

- Exemple:

- poziţia pe lista de admitere, în funcţie de notă

- evaluarea satisfacţiei pe o scală de la 1 la 10

- anul de studiu (1, 2, 3)

44

b. Nivelul ordinal

- Caracteristici:

- valorile au o semnificaţie cantitativă (mai mare/mai mic; mai mult/mai puţin), dar…

- precizează doar raportul de mărime dintre valori

- intervalele dintre valori sunt neprecizate- cit înseamnă “mai mare”?, cit înseamnă “mai

mic?”

- primul admis=9.90; al doilea=9.70; al treilea=8.15 !

- codurile valorilor pot fi acordate si arbitrar, dar ele trebuie sa exprime ideea de ordine

45

c. Nivelul de interval

- Valorile au un caracter cantitativ,

exprimat numeric

- Intervalele dintre valori sunt egale

- Exemple:

- temperatura, în grade Celsius (5°,6°,7°...)

- coeficientul de inteligenţă - numărul de

răspunsuri corecte la un test (14, 15, 25

...)

- scoruri la testele de personalitate (20, 19

...) 46

c. Nivelul de interval

- Caracteristici:

- intervalele sunt egale, dar lipseşte zero absolut

- 0°C nu înseamnă absenţa temperaturii (0°K)

- 10°C faţă de 5°C este “mai mare cu 5°”

- ... dar nu şi “de două ori mai cald”!

- suportă toate transformările matematice posibile

47

d. Nivelul de raport

- valori cantitative, exprimate numeric

- intervale egale plus... zero absolut!

- Exemple:

- gradele Kelvin, pentru temperatura (0°K

este temperatura minimă absolută)

- timpul, greutatea, înălţimea

48

d. Nivelul de raport

- caracteristici:- cel mai înalt nivel de măsurare (valorile au mai multă

informaţie)

- suportă toate transformările matematice posibile

- controverse în psihologie:- există valori de acest tip?

- inteligenţa=0, anxietate=0, etc., nu sunt posibile la fiinţele vii

- în practică, distincţia dintre variabilele de interval (I) şi de raport (R) nu este relevantă, ambele suportând aceleaşi proceduri statistice (I/R)

49

controversă în psihologie

- Sunt posibile măsurări cantitative ale caracteristicilor subiective?- variabilele psihologice sunt expresia unor

evaluări subiective

- Este greu de demonstrat egalitatea intervalelor dintre valori consecutive, chiar şi la evaluări obiective, precise:

- ”măsurarea “iubirii” prin “durata ţinerii de mână” a cuplurilor!

50

Pe ce scală sunt exprimate următoarele variabile:

- genurile muzicale (rap, house, rock, disco)

- latenţa reacţiei la un stimul auditiv, măsurată în sutimi de secundă

- atitudinea faţă de statistică măsurată pe o scală continuă de la 1 (absolut antipatică) la 10 (absolut simpatică)

- scalele de măsurare (nominal, ordinal, interval, raport)

51

52

Variabile categoriale

- O variabilă se numește categorială atunci când valorile acesteia descriu categorii- În mod obișnuit, variabilele măsurate pe scală nominală

sunt categoriale

- Variabilele ordinale pot fi și ele categoriale- Categoriile de vârstă:

- 1 (21-30 ani)

- 2 (31-40 ani)

- 3 (41-50 ani)

- Variabilele cantitative (I/R) pot fi și ele categoriale:- Categoriile de motoare: 1100 cmc; 1400cmc; 1600 cmc …

- Există proceduri statistice speciale pentru variabile categoriale, motiv pentru care trebuie reținute!

53

Statistica parametrică/neparametrică

- s. parametrică- proceduri inferenţiale pe v. măsurate pe scale

cantitative (Interval sau Raport)

- se bazează pe estimarea prin eşantionare a parametrilor populaţiei (medie, ab. std.)

- s. neparametrică- proceduri inferenţiale pe v. măsurate pe scală

calitative (nominale şi ordinale)

- nu se bazează pe estimarea parametrilor populației

54

Scale de măsurare şi

variabile

- variabila=caracteristica supusă măsurării

- scala de măsurare=tipul de valori pe care

le ia variabila- ”variabilă nominală”= ”variabilă măsurată pe scală

nominală”

- ”variabilă ordinală”=”variabilă măsurată pe scală

ordinală”

- ”variabilă interval”=”variabilă măsurată pe scală

interval”

55

scor

1 14

2 19

3 19

4 14

5 19

6 19

7 19

8 17

9 19

10 13

Exemplu: măsurăm aptitudinea numerică

Cazul 1:

10 măsurări repetate ale lui Gigel

Care este nivelul adevărat al aptitudinii numerice al

lui Gigel?• ar putea fi oricare valoare… sau nici una

• o soluție: media măsurărilor (17.2), dar…

• … dacă nici una din valori nu este adevărată, atunci

nici media nu este adevărată

• Deci (orice) medie are o eroare

• … vom vorbi cu alt prilej despre modul în care o

calculăm

Erori de măsurare

Cazul 2:

O singură măsurare pe un eșantion

de 10 subiecți

Care este nivelul adevărat al aptitudinii numerice al

populației din care a fost extras eșantionul?• ar putea fi oricare valoare… sau nici una

• Și în acest caz media eșantionului conține o eroare,

în raport cu media adevărată a populației

scor

Elena 14

Ion 19

Dan 19

Toni 14

Dana 19

Mihai 19

Adrian 19

Cornel 17

Alex 19

Cornelia 13

Populatie

eșantion

X

Scor=

TScor adevărat

+ EEroare

Eroarea

trăsăturii

Eroare

de metodă

Fidelitatea

măsurării=

Scor adevărat

Scor adevărat + Eroare

Oboseală

Motivație

Emoție

Instructaj ambiguu

Prea cald în sală

Greșeli în text

Teoria clasică a măsurării

Validitatea

măsurării

De construct(Măsoară ”aptitudinea numerică” și nu altceva)

De criteriu(Valorile aptitudinii numerice sunt predictive pentru notele la

statistică)

Tipuri de erori

- erori aleatoare (eA)- produse de surse care ar putea afecta oricare dintre

valorile rezultate din măsurare, fără să știm dacă și în

ce măsură acest lucru se întâmplă

- pot fi în orice sens (mai mari sau mai mici decât scorul

adevărat)

- caracterul aleatoriu face ca abaterile în plus și cele în

minus față de scorul adevărat să se anihileze

- erorile aleatoare afectează valorile individuale, dar nu

și media eșantionului

- mai sunt denumite și ”zgomot de măsurare”59

Tipuri de erori

- erori sistematice (eS)

- Se manifestă într-un anume sens față de valoarea adevărată

• X=T+(eA+ eS)

- afectează în mod necesar un anumit număr, mai mare sau mai mic, din valorile măsurate

- Exemplu:- Zgomot în sala de testare

- O eroare în grila de corecție a rezultatelor

- sunt numite și ”bias”60

mică mare

mică mare

aleatoare

sistematică

Eroarea de măsurare

61

Fidelitatea și Validitatea

• Fidelitatea: Cât de ”sigură” este o măsurare?• valori similare la măsurări diferite

• valori similare la evaluatori diferiți

• Validitatea: Cât de bine reflectă (”țintesc”) valorile caracteristica supusă măsurării

Fidel/Valid Fidel/Ne-valid Nefidel/Ne-valid

Validitatea presupune fidelitatea, dar fidelitatea nu este singura condiție a validității…

X=T+(EA+ ES)

- Modelul scorului adevărat este un construct teoretic

- Nu există posibilitatea cuantificării erorilor

”numai Dumnezeu știe câtă eroare este în rezultatul unei măsurări!”

- Totuși modelul erorii este important:- pentru fundamentarea teoriei fidelității măsurării

- pentru optimizarea practicii măsurării

- pentru interpretarea rezultatelor măsurării 63

64

Scale de măsurare şi statistici adecvate

ScaleProceduri statistice

adecvate

CALITATIVE

NOMINALEIDENTITATE

NON

PARAMETRICE

CATEGORIALE

ORDINALE

CANTITATIVE

INTERVAL PARAMETRICE

(dacă sunt

respectate anumite

condiţii)RAPORT

65