AIC 3 Statistica Aplicata ID
Click here to load reader
-
Upload
medeeanica -
Category
Documents
-
view
72 -
download
18
description
Transcript of AIC 3 Statistica Aplicata ID
-
1
UNIVERSITATEA TRANSILVANIA DIN BRAOV
FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI
CENTRUL PENTRU NVMNT LA DISTAN I NVMNT
CU FRECVEN REDUS
AUREL ION CLINCIU
S T A T I S T I C A P L I C A T N P S I H O L O G I E
Editura Universitii Transilvania din Braov
2014
-
2
EDITURA UNIVERSITII TRANSILVANIA DIN BRAOV
Adresa: 500091 Braov, B-dul Iuliu Maniu 41A Tel:0268 476050
Fax: 0268 476051 E-mail : [email protected]
Tiprit la:
Tipografia Universitii Transilvania din Braov B-dul Iuliu Maniu 41A Tel: 0268 476050
Copyright Autorul, 2013 Editur acreditat de CNCSIS
Adresa nr.1615 din 29 mai 2002
Descrierea CIP a Bibliotecii Naionale a Romniei Clinciu, Aurel Ion Statistic aplicat n psihologie / Aurel Ion Clinciu. Braov : Editura Universitii "Transilvania", 2013 Bibliogr. ISBN 978-606-19-0239-2 311:159.9
-
3
C u p r i n s
Cuvnt nainte ................................................................................................................. 7
Capitolul 1. Introducere
1.1. Scurt istoric al statisticii .................................................................................... 10
1.2. Obiectivele statisticii . 12
1.3. Cteva concepte cheie ale demersului statistic ................................................. 13
1.4. Exerciii i aplicaii practice .............................................................................. 17
Capitolul 2. Msurarea. Organizarea coleciei de date
2.1. Msurarea n tiinele socio-umane ................................................................... 19
2.2. Proprieti ale scalelor ....................................................................................... 20
2.2.1. Magnitudinea ........................................................................................ 20
2.2.2. Intervale egale ....................................................................................... 20
2.2.3. Zero absolut ........................................................................................... 21
2.3. Tipuri de scale ................................................................................................... 21
2.3.1. Scalele nominale ................................................................................... 21
2.3.2. Scalele ordinale ..................................................................................... 22
2.3.3. Scalele de interval ................................................................................. 23
2.3.4. Scalele de raport ................................................................................... 24
2.4. Organizarea datelor brute .................................................................................. 25
2.5. Exerciii i aplicaii practice .............................................................................. 26
2.6. Quiz ................................................................................................................... 27
Capitolul 3. Distribuii i frecvene
3.1. Ordonarea i gruparea datelor ........................................................................... 28
3.1.1. Limitele de grupare ............................................................................... 31
3.1.2. Centrele intervalelor ............................................................................. 31
3.2. Histograma i poligonul frecvenelor ................................................................ 31
3.3. Frecvenele cumulate ......................................................................................... 34
3.4. Histograma i poligonul frecvenelor cumulate ................................................ 35
3.5. Criterii de evaluare vizual a formei distribuiilor ............................................ 37
3.6. Exerciii i aplicaii practice .............................................................................. 39
-
4
Capitolul 4. Indicatori ai tendinei centrale
4.1. Media aritmetic ................................................................................................ 40
4.2. Mediana ............................................................................................................. 44
4.3. Modul ................................................................................................................ 47
4.4. Comparaie ntre medie, median i mod n funcie de distribuie .................... 48
4.5. Cteva concluzii relative la indicatorii distribuiei univariate .......................... 50
4.6. Exerciii i aplicaii practice .............................................................................. 51
4.7. Quiz ................................................................................................................... 52
Capitolul 5. Msuri ale variabilitii
5.1. Amplitudinea mprtierii ................................................................................. 56
5.2. Abaterea intercuartilic ..................................................................................... 57
5.3. Abaterea medie absolut ................................................................................... 59
5.4. Abaterea standard i variana (dispersia) .......................................................... 60
5.4.1. Semnificaia abaterii standard .............................................................. 63
5.5. Coeficientul de variaie ..................................................................................... 64
5.6. Indicatori ai formei distribuiei ......................................................................... 65
5.6.1. Coeficientul de simetrie (skewness) i boltirea (kurtosis) ..................... 65
5.7. Exerciii i aplicaii practice .............................................................................. 66
Capitolul 6. Inferena statistic
6.1. Introducere ........................................................................................................ 68
6.2. nelesul conceptului de semnificaie statistic ................................................. 69
6.3. Eroarea standard a unei medii de selecie i semnificaia ei ............................. 70
6.4. Eroarea standard a unui cuantum procentual i semnificaia ei ........................ 71
6.5. Sarcini i probleme de comparaie .................................................................... 71
6.6. Eantioane necorelate de volum mare. Ipoteza de nul ...................................... 72
6.7. Eantioane de volumm mare, corelate ............................................................... 75
6.8. Semnificaia diferenei dintre dou cuantumuri procentuale ............................ 76
6.9. Tabelele t i z pentru testele de semnificaie ..................................................... 76
6.10. Semnificaia diferenei mediilor a dou eantioane de volum mic corelate .... 77
6.11. Semnificaia diferenei mediilor a dou eantioane de volum mic necorelate 80
6.12. Exerciii i aplicaii practice ............................................................................ 82
-
5
Capitolul 7. Studiul asocierii dintre variabile prin corelaie
7.1. Introducere ........................................................................................................ 86
7.2. Calculul coeficientului de corelaie ................................................................... 89
7.2.1. Interpretarea orientativ a coeficientului de corelaie ......................... 91
7.3. Coeficientul de corelaie a rangurilor ................................................................ 93
7.4. Limitele de ncredere ale unui coeficient de corelaie ....................................... 96
7.5. Interpretarea unui coeficient de corelaie .......................................................... 96
7.6. Interpretarea varianei unui coeficient de corelaie prin coeficientul de
determinare ...............................................................................................................
97
7.7. Ali coeficieni de corelaie ............................................................................... 99
7.7.1. Coeficienii de corelaie biseriali i triseriali ....................................... 99
7.7.2. Ali coeficieni de corelaie ................................................................... 100
7.8. Utilizrile coeficientului de corelaie ................................................................ 101
7.9. Exerciii i aplicaii practice .............................................................................. 102
7.10. Quiz ................................................................................................................. 105
Capitolul 8. Utilizarea predictiv a asocierii dintre variabile
Regresia liniar simpl i multipl
8.1. Introducere ........................................................................................................ 106
8.2. Predicia determinist i probabilist ................................................................ 108
8.3. Regresia bivariat .............................................................................................. 109
8.3.1. Regresie versus corelaie ...................................................................... 114
8.4. Regresia liniar multipl (multivariat) ............................................................ 114
8.4.1. Probleme speciale implicate n regresie ............................................... 116
8.4.2. Validarea modelului regresiv ............................................................... 118
8.4.3. Glosar de termeni cheie ai regresiei liniare ......................................... 118
8.5. Exerciii i aplicaii practice .............................................................................. 119
Capitolul 9. Testare ipotezelor prin tehnica chi-ptrat
9.1. Teste neparametrice, distribuii binomiale i multinomiale .............................. 121
9.2. Termeni cheie i definiii implicate n testul chi-ptrat ..................................... 122
9.3. Condiii i restricii pentru efectuarea lui chi-ptrat .......................................... 124
9.4. Utiliarea practic a testului chi-ptrat ............................................................... 124
-
6
9.5. Exemple de aplicare practic a testului chi-ptrat de potrivire i de asociere ... 126
9.6. Mrimea efectului pentru testul chi-ptrat al asocierii dintre variabile ............. 133
9.7. Exerciii i aplicaii practice .............................................................................. 133
Capitolul 10. Metode nonparametrice de testare a ipotezelor statistice.
10.1. Teste de semnificaie parametrice i neparametrice ......................................... 135
10.2. Testul U Mann-Whitney pentru eantioane independente .............................. 136
10.3. Exerciii i aplicaii practice ............................................................................ 139
10.4. Testul semnului T al lui Wilcoxon pentru eantioane corelate ... 140
10.5. Exerciii i aplicaii practice ............................................................................ 143
10.6. ANOVA pe o cale prin testul Kruskal-Wallis ................................................. 143
10.7. Exerciii i aplicaii practice ............................................................................ 147
10.8. Testul rsngurilor Friedman pentru msurtori repetate ................................... 148
10.9. Exerciii i aplicaii practice ............................................................................ 150
Test pentru verificarea de sintez .
151
Bibliografie ................................................................................................................. 154
Anexe cu utiliti statistice .... 157
Glosar de simboluri i formule de calcul ..................................................................... 177
Rspunsuri la exerciiile i aplicaiile practice propuse . 184
-
7
Cuvnt nainte
Prezena Statisticii ca materie obligatorie la tiinele socio-umane, n spe la
specializarea Psihologie, este justificat printre altele de faptul c eafodarea acesteia ca
tiin a depins n mod esenial de ncorporarea experimentului - i implicit a msurtorii - ca
metod de baz n constituirea corpului su de cunotine i legi. Pe de alt parte, naterea
psihologiei aplicate i extinderea sa pervaziv spre toate domeniile socialului nu ar fi fost
posibil fr apelul la cuantificare, msurtoare i cifr. Deci, att psihologul practician, care
colecteaz, stocheaz i prelucreaz n mod constant date cantitative, ct i cel din spaiul
academic, care trebuie s fie la zi cu cercetarea tiinific din domeniul su, ca i din cele
conexe (medicin, biologie, sociologie au tiinele educaiei), trebuie s aib cel puin o
iniiere, dac nu chiar o formare solid n domeniul Statisticii, fr de care nu se poate pstra
contactul cu progresele tiinei.
Apare astfel ca inexplicabil rezistena activ i rezerva aproape ostil a studentului de
la tiinele socio-umane fa de Statistic, care vede adesea n acest obiect de studiu ceva ce ar
contraveni chiar dimensiunii umaniste a tiinei n care el se iniiaz. Exist multe explicaii
posibile pentru faptul semnalat. Una dintre cele mai plauzibile ar fi aceea c studenii de la
Psihologie, Pedagogie, Sociologie sau Asisten social au o formaie iniial umanist, cu un
grad de elaborare i consolidare mai sczute a conceptelor i deprinderilor intelectuale de tip
matematic. Acest fapt poate produce din start o rezerv fa de abordrile de tip cantitativ. Pe
de alt parte, progresele incredibile din ultimele decenii n domeniile metodologiei i al
prelucrrii datelor fac ca centrarea pe metodele statistice elementare s nu mai fie deloc
suficient pentru a ine pasul cu evoluiile din domeniu, ceea ce transform n mod obligatoriu
Statistica ntr-un obiect de studiu al nvrii permanente.
n cel de al treilea rnd extinderea progresiv, uneori exploziv, a arsenalului de
metode statistice genereaz tot mai mari dificulti de mai pstra unitatea intern i
perspectiva coerent asupra corpului de cunotine al acestui domeniu. n cazul n care se
nzuiete spre acest lucru, alocarea permanent de resurs cognitiv pentru a menine n
priz domeniul statistic devine o condiie intrinsec a progresului i evoluiei n carier.
Tendina la entropie a informaiei ce intr n sistemul cognitiv uman, adic la uniformizare i
la tergere a diferenelor specifice, ca urmare a marii varieti de tehnici i procedee ce apar
fr ncetare n cadrul acestei tiine att de dinamice i evolutive, poate genera sentimentul c
Statistica este unul dintre principalii contributori la imperialismul metodologic din tiin.
-
8
Dincolo de cauzele enumerate exist cu siguran i elemente contextuale sau
conjuncturale care pot explica rezistena activ a studentului de la tiinele sociale fa de
Statistic, explicabil i prin stilul sau maniera de predare, prin calitatea cursurilor editate i a
aplicaiilor propuse, prin gradul de utilizare a metodelor i tehnicilor moderne de predare-
nvare-evaluare, prin numrul de ore de studiu alocate acesteia de programa universitar etc.
Pe de alt parte, exist o mulime de semnale care indic faptul c starea de fapt
analizat anterior poate fi depit cu bine de majoritatea studenilor. Astfel, n Romnia
ultimului deceniu au aprut cel puin cinci lucrri de referin n domeniul Statisticii tiinelor
sociale (pentru a face referin doar la Rotariu i colaboratorii, la Clocotici i Stan, la Sava,
Labr i Popa), la care se adaug multitudinea de lucrri de iniiere n SPSS din literatura
romna i din cea strin. Extinderea progresiv a numrului de aplicaii incluse n pachetele
de programe computerizare pentru tratarea datelor (SPSS, SAS, NCSS etc.) a fcut ca
accesarea i derularea unor foarte complicate i avansate tehnici statistice s depind efectiv
doar de o apsare de buton. Aceast facilitate i accesibilitate extraordinar nu elimin ns n
nici un fel problema crerii infrastructurii conceptuale i a deprinderilor matematice, fr de
care tehnica rmne mut n faa neiniiatului.
Lucrarea de fa este n fapt un curs de iniiere n Statistica psihologic. Prin
elaborarea sa ne-am propus s prezentm conceptele i procedeele de baz ale statisticii
descriptive i infereniale, univariate i bivariate, ntr-o manier prietenoas, inteligibil i cu
bune valene formative. Preocuparea noastr de baz a constat n selectarea informaiei utile,
lsnd n plan secundar prezentarea ntemeierii matematice a tehnicilor statistice prezentate.
De asemenea, legtura cu programele computerizate de prelucrare a datelor, acolo unde s-a
produs o revoluie nevzut la care suntem cu toii martori, este doar vag i inconstant
sugerat. Aceasta deoarece considerm c prelucrarea informatizat a datelor trebuie s se
fac ulterior n mod distinct, dup ce s-a construit eafodajul minimal de concepte i tehnici
necesare utilizrii programelor computerizate.
Cartea de fa nu este una extins ca volum, cele 10 capitole care o compun putnd fi
ntlnite, cu mici variaiuni, n toate lucrrile actuale de iniiere n Statistic. Astfel, dup
primele trei capitole introductive, relative la istoricul, obiectivele i conceptele de baz ale
domeniului statistic, despre msurare, tipuri de scale, distribuii i frecvene, sunt prezentai
indicatorii tendinei centrale, determinarea indicilor de mprtiere a datelor i ai celor relativi
la forma distribuiei. Capitolul al aptelea trateaz inferena statistic i testarea ipotezelor
bazate pe diferene ale mediilor, el continundu-se n mod firesc cu un capitol care prezint
testarea ipotezelor relative la asocierea variabilelor prin corelaie i cu un altul despre regresia
-
9
bivariat. Acest capitol face doar trimiteri la regresia multivariat, rmnnd cantonat
preponderent n zona regresiei simple, deoarece regresia multipl depete nivelul iniierii
statistice, fiind greu de prezentat fr cunotine avansate i fr apelul la programe puternice
de tratare a datelor. Ultimele dou capitole trimit la testarea ipotezelor statistice prin teste
neparametrice, aplicabile datelor nominale i categoriale, cum sunt testele chi-ptrat, Man-
Whitney, Wilcoxon, Kruskal-Wallis sau Friedman. Aa cum se poate observa cu uurin,
lucrarea a acordat un spaiu amplu testrii ipotezelor statistice, fiind prezentat aproape toat
gama procedeelor tehnice destinate acestui scop. Nu am inclus aici i tehnicile analizei de
varian ANOVA care, prin multitudine i complexitate, fac obligatoriu apel la un program
automat de prelucrare computerizat a datelor, fiind mai potrivit s fie incluse n volumul
destinat statisticilor multivariate. Menionm, de asemenea, c am preferat s prezentm toate
metodele de testare a ipotezelor incluse n acest volum fr a face n nici un fel apel la
resursele SPSS, cci acest lucru face obiectul unui curs special elaborat cu aceast misiune.
Fiind destinat nceptorului, lucrarea de fa a ncercat s in cont maximal de
principiul accesibilitii, prin simplificarea discursului teoretic i prin reliefarea constant mai
ales a informaiei utile. Pe de alt parte, o lege a nvrii leag temeinicia i calitatea acesteia
de calitatea i profunzimea interaciunii cu materialul de nvat. Pentru a facilita centrarea pe
aspectele aplicative, toate capitolele, inclusiv cel introductiv, sunt nsoite de exerciii i
aplicaii practice, de teste rapide de verificare a cunotinelor (quiz, pstrnd terminologia
englez) i de testul final de sintez i evaluare de ansamblu, destinat autoverificrii stadiului
atins n nvarea statisticilor introductive. Pentru majoritatea acestor aplicaii practice s-au
oferit soluiile problemelor propuse, nsoite deseori de explicaii adiionale care s contribuie
la mai buna lor nelegere. Astfel, o seciune final a lucrrii ofer soluia rezolvrii corecte a
majoritii problemelor prezentate cu scop de autoevaluare la sfritul fiecrei uniti de curs.
Lucrarea de fa i are continuarea ntr-un al doilea volum, destinat deprinderii i
perfecionrii n utilizarea procedurilor computerizate de prelucrare a datelor cu SPSS, dar i
de un al treilea volum, destinat prezentrii statisticilor avansate (Statistici multivariate pentru
psihologie). Ordinea apariiei lor editoriale nu este cea din secvena prezentat anterior, acest
volum introductiv fiind eleaborat ultimul, complexitatea i mai ales miza lui pedagogic
deosebit genernd cele mai mari probleme de elaborare i editare. n felul acesta se poate
vorbi de o trilogie statistic, ce se constituie ntr-un ghid complex de monitorizare a
formrii i perfecionrii n domeniul abordrilor de tip cantitativ. Feedback-ul primit din
partea principalilor si utilizatori, studenii, va contribui la mbuntirea calitii acestui
volum, motiv pentru care sugestiile acestora sunt ateptate cu real i legitim interes.
-
10
CAPITOLUL 1
INTRODUCERE
1.1. Scurt istoric al statisticii
Statistica nu s-a nscut n cmpul psihologiei tiinifice, aceasta prelund i
ncorpornd procedeele ei pentru a putea depi posibilitile limitate oferite de cea mai
rspndit dintre metodele sale, observaia, ... care plaseaz psihologul () n domeniul
relativului empiric, adic n lumea fenomenelor, a caracteristicilor i a proprietilor care sunt
vag conturate i neasamblate n sisteme de cunotine riguros nchegate (Clocotici i Stan,
2000, p. 11).
Destinul nsui al tiinei nou aprute, psihologia, a depins de ruperea acesteia din
cmpul filosofiei i translarea spre tiinele pozitive, care i-au ncorporat experimentul ca
metod predilect de cercetare a relaiei cauz efect. Intrarea ei n laborator, separarea
variabilelor independente i dependente presupunea cu necesitate metode i tehnici statistice
de prelucrare a datelor obinute prin msurtoare.
Impactul acestei apropieri reciproce avea s fie benefic reciproc, o serie de mari
psihologi (Galton, Spearman, Pearson, Guilford sau Cattell) avnd contribuii remarcabile,
care au schimbat faa statisticii. Aceasta deoarece domeniul faptelor psihice este mai complex
dect fizica cuantic, biologia celular sau astronomia, prin aceea c el este marcat de
multicauzalitate, cauzalitate retroactiv sau de alte aspecte caracteristice ale cauzalitii.
Muli autori leag apariia statisticii de probleme pragmatice, preponderent economice
sau administrative, cum ar fi aa-numitele tabele de mortalitate ale lui Graunt (1661), prin
care ptura negustoreasc din Anglia ncerca s pun bazele unui sistem de asigurri pe via.
Graunt este considerat a fi i printele demografiei, pe care a fundamentat-o prin aa-numita
aritmetic politic, nscut n 1662 (termenul aparine lui Petty). Analiza datelor despre
evenimentele demografice, n spe despre decese, arta o neateptat constan i
regularitate, ceea ce sugereaz posibilitatea gsirii unor legi n domeniul vieii sociale, de
consisten apropiat celor din tiinele naturii (Rotariu, 1999, p. 16).
Curiozitatea tiinific produs de o asemenea descoperire remarcabil va fi
generatoarea unei activiti sistematice de culegere, stocare, prelucrare i interpretare a unor
informaii numerice despre importante domenii ale statului, corespondentul centrelor
-
11
naionale de statistic din timpurile moderne. De altfel, chiar i etimologic statistic pleac de
la status, care poate fi interpretat att ca stare de fapt, ct i ca stat, deci statistica ar putea fi
considerat o tiin de stat. Aceasta corespunde i etimologiei propuse de cel considerat a fi
introdus termenul de statistic, Achenwall.
Corespondena susinut dintre Pascal i Fermat (1654) a stat la baza fundamentrii
unei teorii matematice asupra verosimilitii, n timp ce cooperarea mai tardiv dintre Gauss i
Laplace (1809-1812) s-a concretizat n conceptul de distribuie normal (clopotul lui Gauss).
Dei problemele demografice i economice au fost primordiale n conturarea
obiectului statisticii, contactul psihologiei cu aceast tiin avea s fie fundamental pentru
destinul ei. Iat cteva aspecte mai semnificative:
Cel care a introdus psihologia n registrele de stare civil, dup inspirata expresie a
lui Pavelcu, n anii 1730 i 1732, Christian Wolff (prin lucrrile Psihologia empirica
i Psihologia rationalis) anticipa chiar de atunci necesitatea existenei unei subramuri
matematice a acesteia, pe care el a numit-o, inspirat, psihometrie. Dei termenul va
cpta o cu totul alt semnificaie la cei care au studiat fenomenele paranormale n
Anglia secolului al XIX-lea (care au i creat o Societate Regal de Psihometrie),
sensul iniial va fi cel care se va impune, prin ncercrile lui Galton i Binet de a
dezvolta domeniile aplicative ale psihologiei, indestructibil legate de un aparat
matematic de tip statistic.
Este meritul unui astronom belgian, Qutelet (1796-1874) de a fi extins aplicarea unor
legi ale statisticii, cum ar fi legea distribuiei normale sau binomial, derivat din
luarea n considerare a distribuiilor probabiliste, spre alte domenii dect cele sociale,
aici incluzndu-se i cele psihologice.
Galton, iniiatorul colii psihometrice engleze (al crei punct forte va fi chiar ideea de
msurtoare i cuantificare a faptului psihic) a creat metode statistice de abordare a
legilor ereditii (metoda gemenilor i a genealogiilor, de exemplu), avndu-i ca
succesori pe Pearson, teoreticianul metodei corelaiei prin metoda produselor (1896),
pe Spearman, creatorul metodei corelaiei prin metoda rangurilor i ntemeietorul
analizei factoriale (1904). Continuatorii acestora (Fisher, Burt i Vernon) vor merge
mai departe pe liniile de for ale colii engleze de statistic, considerat principala
contributoare n conturarea domeniului acesteia. n domeniul personalitii, H. J.
Eysenck i R. B. Cattell (ultimul a imigrat n America dup perioada de formare n
Anglia) vor fi exponeni strlucii ai metodelor statistice i cu precdere ai analizei
factoriale.
-
12
Al doilea mare contributor a fost coala german, prin Conring (1606-1682),
Achenwall (1719-1772) i, bineneles, Gauss (1777-1785).
n America muli matematicieni i psihologi au continuat n mod natural coala
englez, prin Thurstone, Hotelling, Guilford, Lord, Novick, Fruchter sau Cronbach.
n psihologie, statistica a evideniat o evoluie de la distribuii spre corelaie, analiza
factorial i de cluster, teoria rspunsurilor la itemi sau a generalizabilitii, pe lng
analiza varianei simple aprnd tehnici de analiz multivariat (ANOVA, MANOVA.
ANCOVA, MANCOVA), n timp ce pentru psihologia social i sociologie, pe lng
problema analizei relaiilor dintre variabile, s-au impus tot mai mult problemele legate
de selecie, eantionare i reprezentativitate (statistica inferenial).
1.2. Obiectivele statisticii
De la o tiin global a statului (vezi Rotariu et al., 1999, pp. 15-22), care i
propunea s ofere conductorilor instrumente de aciune eficace, rezultate din investigarea
principalelor aspecte ce puteau fi nregistrate, pstrate, prelucrate i interpretate, statistica s-a
extins spre planurile psihologic, biologic, fizic, chimic, economic, politic, agricultur,
devenind un mod de gndire al viitorului (Vod, 1977). S-au nscut o multitudine de ramuri
i de abordri speciale, bazate pe proceduri ce se adapteaz la specificul domeniului
investigat, desprinse toate din trunchiul aceleiai tiine, statistica general.
Aceast tiin cuprinde un corp sistematic de cunotine i de metode statistice, care
au ca obiect colectarea, prelucrarea i interpretarea rezultatelor care provin de la populaii i
indivizi statistici. Acetia pot fi oameni, nsuiri, plante, gene, porumbei, maimue, peti,
culturi, chiar i atomi sau electroni, pentru toate legile statisticii opernd ntr-o manier
similar.
Datele statisticii provin fie de la aceleai populaii, care se comport diferit ca urmare
a faptului c asupra lor acioneaz o multitudine de cauze, fie de la acelai individ, entitate,
de-a lungul diferitelor sale manifestri pe scara timpului. Dei nu este o ramur a matematicii
(nu pleac de la axiome, pentru a deriva prin demonstraii sau teoreme enunuri sistematice),
statistica ofer un larg cmp de aplicaii matematicii, n primul rnd datorit faptului c
ambele lucreaz cu numere i reguli de calcul i, de la un anumit nivel, relaiilor dintre
entitile statistice li se substituie raporturi matematice abstracte, tipice entitilor ideale.
Aceasta face foarte dificil trasarea unei linii de demarcaie ntre matematic i statistic. Dei
nu are un referenial empiric anume (ea propundu-i s stabileasc regula general aplicabil,
indiferent de domeniul realitii de care se ocup) statistica coboar totui din planul general
-
13
abstract (matematica rmnnd cantonat n turnul de filde al propriilor sale abstracii),
avnd un caracter aplicativ mult mai explicit, deoarece i propune s rezolve probleme
concrete.
Mai mult, demersul statistic nu este posibil fr materia prim a datelor colectate
anterior, ntr-o direcie n care prelucrarea i interpretarea datelor este doar o parte a secvenei,
adic cea mai tehnic i mai specializat. S nu uitm totui c momentul creator al cercetrii
tiinifice, scnteia sau impulsul iniial sunt date de conturarea ipotezei specifice. Apoi,
sesizarea semnificaiei datelor prelucrate nu este posibil fr o solid cultur a domeniului n
care sunt aplicate metodele statistice. Psihologul, pedagogul, sociologul sau economistul sunt
cei care valorific rezultatele tehnice pe care le ofer statistica sau statisticienii.
1.3. Cteva concepte cheie ale demersului statistic
Termenul de populaie statistic, alctuit din indivizi statistici, care pot fi persoane,
fapte, entiti fizice etc. a fost deja definit anterior. El nu este sinonim cu cel de populaie din
limbajul comun.
Cum tot ceea ce exist, n plan fizic sau ideal, are o mulime de determinri i de
atribute ce nu pot fi cuprinse i analizate simultan, separat sau exhaustiv, sunt selectate doar o
parte dintre aceste determinri, limitarea fiind impus i de mijloacele de care dispunem la un
moment dat. Asfel, indivizii umani se pot diferenia n funcie de vrst, apartenen de gen,
mediu de provenien, nivel propriu de instrucie (proprie sau a prinilor), status cultural,
nivel economic, religie, ras, etnie etc. Fiecare dintre aceste criterii care opereaz diferene se
numete variabil, deoarece n absena lor oamenii ar fi identici.
Unele variabile sunt discontinue (discrete), cum ar fi sexul (masculin, feminin),
mediul (urban, suburban, rural); altele sunt continue (nlimea, greutatea, vrsta). Mulimea
valorilor pe care le poate lua o caracteristic particular constituie distribuia variabilei
respective. Fiecare populaie are propria sa distribuie pentru fiecare variabil. De exemplu se
tie c la natere raportul dintre biei i fete este de aproximativ de 52 la 48 de procente,
pentru ca acesta s se inverseze dup primii ani de via din cauza vulnerabilitii infantile, i
implicit a mortalitii mai mari n rndul sexului masculin. La vrsta a treia acest raport se
dezechilibreaz i mai mult, femeile avnd o speran de via cu aproape 10 ani mai mare
dect brbaii. Deci aceeai populaie are, n trei momente diferite ale existenei sale, trei
distribuii diferite, n funcie de aceeai caracteristic, apartenena de gen.
Parametrii sunt valorile fixe ce exist la un moment dat pentru o populaie, luat n
ansamblul ei, n raport cu o variabil. Ideea de variabil este strns asociat cu aceea de
-
14
cuantificare, msurtoare, ca mijloc de determinare a variabilitii. Orice msurtoare
presupune, la rndul ei, o scal de msurare. Toate aceste elemente: individ, populaie
statistic, variabil, distribuie definesc domeniul statisticii descriptive, alctuit din corpul
de metode prin care pot fi caracterizate faptele i fenomenele studiate.
Dar statistica a tins de la nceputuri spre numerele mari, spre populaiile extinse, a
cror cuprindere i descriere detaliate sunt adesea imposibile sau extrem de dificile, din cauza
costurilor pe care le-ar antrena. Chiar i atunci cnd acest lucru ar fi tehnic posibil,
investigaiile i prelucrrile ar presupune perioade mari de timp, care este el nsui o mare
surs de variabilitate, antrennd modificri nsemnate ale multor variabile, sau chiar moartea
experimental. Soluia gsit acestei probleme este statistica inferenial, un ansamblu de
tehnici i de metode (de eantionare, de selecie etc.), prin care determinrile fcute asupra
unui numr mai mic de entiti ce compun populaia de ansamblu sunt extrapolate ca estimri
asupra acestei populaii, n limite de ncredere rezonabile. Acest domeniu al statisticii este
extrem de utilizat de sociologie, metoda anchetei pe baz de chestionar sau a sondajelor de
opinie fiind doar dou exemple. Dac vom lua n considerare faptul c instrumentul de baz al
psihodiagnozei, testul psihologic, este etalonat pe populaii reprezentative zonal sau naional,
vom vedea c statistica inferenial are importante utilizri i n psihologie.
Statistica inferenial presupune alte cteva concepte care o circumscriu. Eantionul
este o parte, redus ca numr, din populaia statistic de baz care, atunci cnd este extras
corect, permite estimaia parametrilor acestei populaii, adic o aproximare a valorii reale a
acestora n limite de ncredere ce pot fi determinate. O ndelung practic social a dus la
dezvoltarea puternic a statisticii infereniale, i aceasta din mai multe motive:
Costurile incomparabil mai mici (s comparm costurile unui referendum naional cu
ale unui sondaj de opinie desfurat pe un eantion reprezentativ naional).
Utilizarea ei extensiv, pentru un numr tot mai mare de beneficiari: ageni economici,
organizaii, partide, guverne etc., n scopuri diagnostice, dar i prognostice, care
fundamenteaz decizii de o mare importan social.
Rafinarea progresiv a tehnicilor de eantionare, ceea ce a fcut ca marja de eroare s
fie tot mai mic, astfel nct predicia pe eantioane mici s poat fi extrapolat la
populaii statistice foarte mari.
Statistica din tiinele socio-umane are ca i concept primar pe acela de variabilitate a
datelor, care poate fi interindividual (cel mai adesea), dar i intraindividual. Acesta
angajeaz alte concepte, cum ar fi cel de surs de variaie (previzibil sau imprevizibil,
sistematic sau aleatoare, determinabil sau nedeterminabil), sau cel de msurare. Dac
-
15
sursele previzibile de variaie sunt dinainte tiute i circumscrise din start de investigaia n
cauz (a se vedea controlul variabilelor de la metoda experimental, variabilele test, subiect i
examinator, la metoda testului), exist i o multitudine de surse fortuite de variaie (variabilele
externe necontrolate, n primul exemplu, i variabila situaional, n cel de al doilea). Analiza
statistic ncearc s deceleze ponderea fiecrei surse de variaie n efectul final. Deoarece
datele numerice de natur statistic reprezint rezultatul amalgamrii unui mare numr de
cauze, este posibil ca statistica s fie continuarea fireasc a experimentului, pe care tinde s l
nlocuiasc (Yule i Kendall, 1969, p. 16), ntruct ea ... va determina care sunt cauzele cele
mai importante i care sunt rezultatele observrii ce pot fi atribuite fiecrei categorii de
cauze.
Msurarea este operaia prin care se atribuie numere unor aspecte ale obiectelor sau
evenimentelor, potrivit unei reguli (Smith, 1974). Dup cum arta i Piaget, problema metriei
este una fundamental n psihologie, deoarece puine din domeniile sau fenomenele sale se
preteaz, n sens strict, la cuantificare. Aceasta poate fi chiar una dintre cauzele (dac nu
cumva i cea mai important) pentru care psihologia are un trecut lung, dar o istorie scurt ca
tiin (Ebbinghaus). Msurarea aduce cu sine problema scalei de msur, care trebuie s fie
corect, constant (produce date identice pentru fenomene identice, n condiii de msurare
identice), exhaustiv (ea poate msura toate entitile crora le este destinat) i reciproc
exclusiv (n urma msurtorii, fiecare entitate capt o valoare i numai una). Principalele
tipuri de scale cunoscute (nominal, ordinal, de interval i de raport) evideniaz proprieti
care dau conotaii i aplicaii specifice msurtorilor ce rezult din fiecare tip, astfel nct cele
mai complexe nglobeaz caracteristicile celor mai simple, dar aducnd aducnd suplimentar
elemente i posibuiliti noi, difereniatoare.
Caracteristicile variabilei pot fi calitative i cantitative, continue i discontinue.
Distribuiile obinute aduc n discuie problema frecvenelor (absolute i relative, simple sau
cumulate), dar i a modalitilor de a le reprezenta grafic: poligon al frecvenelor, histograme,
curbe, grafice, scatter etc.
O bun parte a statisticii descriptive urmrete definirea celor mai importante tendine
centrale, adic media, mediana i modul, dar i a tendinelor extreme, cum ar fi amplitudinea
mprtierii, abaterea medie, abaterea semiinterquartil, abaterea standard sau dispersia,
variana. Distribuia n sine poate fi judecat din punctul de vedere al formei (simetrie sau
boltire, adic skewness i kurtosis, n englez). Toate aceste noiuni, unele dintre ele derivate
din teoria probabilitilor, prin care sunt fundamentate matematic valorile tipice ale
-
16
variabileleor, dar i repartiiile de diverse tipuri, contureaz mai exact domeniul statisticii
descriptive.
Statistica inferenial, pe lng conceptele deja amintite (populaie, eantion
eantionare, estimare), include i testarea ipotezelor statistice. n capitole distincte, statistica
trateaz corelaia, asocierea datelor cantitative i calitative, analiza dispersional, unifactorial
sau bifactorial, analiza factorial i analiza de cluster. Cursul de fa este unul de iniiere, n
consecin el va acoperi doar o parte dintre problemele enunate, adic elementele care
fundamenteaz cunoaterea statistic n scopul aplicrii ei la situaii uzuale, comune.
Pentru atingerea acestui obiectiv avem n vedere dou aspecte importante:
comprimarea la minimum a prii de ntemeiere matematic a subiectelor tratate, problem
care rmne n grija teoreticienilor statisticii, adic a celor ce contureaz dimensiunea
savant, tiinific a domeniului; permanenta preocupare de a oferi exemple sau aplicaii
concrete, pentru a evidenia puterea real a procedeelor de lucru prezentate. n fond, acest curs
se adreseaz n principal studenilor de la psihologie i pedagogie, cel mai adesea avnd o
dominant umanist a formaiei i pregtirii lor. Intenia noastr a fost aceea de a nu-i inhiba
cu demonstraii abstracte, de factur matematic, ci de a-i familiariza cu cele mai des ntlnite
aplicaii statistice, prin care s fie capabili s-i valorifice cercetrile proprii. Cursul are de
asemenea n vedere practicianul din aceste domenii, cel care, dup ce acumuleaz o cantitate
de date brute prin metoda testlor sau a chestionarelor, tinde s le valorifice sau s le
gestioneze mai bine.
Aplicaiile speciale sau savante ale statisticii presupun, pe lng aceast iniiere,
stagii de pregtire mai avansate, susinute de programe computerizate (SPSS, SAS sau
NCSS). Extraordinara lor putere de lucru, precizia, elegana, multitudinea opiunilor i alte
faciliti de acerst gen par a transforma o ntreag evoluie a domeniului (i procedee de lucru
altdat extensiv utilizate) n istorie. Susinem ns opinia potrivit creia sensul acestor
aplicaii computerizate nu poate fi dedus fr o cultur a domeniului, fr un stagiu prealabil
de iniiere dup procedeele i cu mijloacele clasice (creion, caiet de matematic, rigl,
minicalculator cu panou de lucru statistic), prin care vom deslui cele mai importante aplicaii
statistice n situaiile curente. Saltul spre puternicele programe computerizate va fi astfel mult
facilitat, deoarece vom ti ce s cerem computerului, la ce tip de prelucrri s facem apel i ce
relevan vor avea datele pe care acesta ni le ofer cu generozitate.
-
17
1.4. Exerciii i aplicaii practice
1. V intereseaz problema abandonului colar la ciclul gimnazial din Romnia de azi. Precizai care este populaia studiului i care eantionul. Identificai cteva dintre variabilele de interes pentru studiul desfurat. Evideniai cteva dintre variabilele categoriale i real numerice implicate n acest studiu. 2. Sugerai cum s-ar putea obine obine un eantion complet randomizat (sau aproape
complet randomizat) din populaia unui micu orel (5 000 de locuitori). 3. Dac ai folosi cartea de telefon ai putea obine un eantion randomizat pentru acest ora? 4. De ci cai ai avea nevoie pentru a determina cu exactitate cte picioare are un cal? Dar
de ci cai ai avea nevoie pentru a determina precis care este greutatea medie a unui cal? Explicai unde avem de-a face cu o variabil i unde cu o constant i care dintre cele dou categorii este mai informativ.
5. Cineva ar putea obiecta c a doua ntrebare de mai sus conine o capcan: caii de vrste
foarte mici (sub un an, adic mnjii) aparin i ei speciei cabaline, dar dac i-am include n eantion ei ar putea contribui la scderea semnificativ a mediei greutii cailor ca specie. Apoi, greutatea medie poate diferi de la ras la ras i de aceea determinarea greutii medii a speciei cabaline s-ar putea s nu aib sens. Mai mult, ca i la oameni, caii au oasele mai grele dect iepele i n consecin un indicator sintetic al greutii comune ntregii specii cabaline ar fi irelevant.
Identificai n exemplul de mai sus variabilele implicate. Identificai care sunt datele categoriale i cele real numerice (de msurtoare). Precizai i alte variabile de interes pentru greutatea medie a cailor, indicnd tipul acestora. Identificai care sunt cazul, variabilele i valorile implicate n exemplul analizat. 6. Dai cte trei exemple n care interesul de cercetare este:
6.1. De a determina diferena dintre dou sau mai multe grupuri. 6.2. De a determina realaiile sau gradul de asociere dintre aceste variabile. 6.3. De a exemplifica cu cteva date categoriale. 6.4. De a exemplifica cu cteva date de msurtoare.
7. Precizai care este diferena dintre: 7.1. Eantion i populaie. 7.2. Statistici i parametri. 7.3. Eantioane randomizate i eantioane de convenien. 8. Explicai urmtoarele: 8.1. De ce variabilitatea este conceptul de baz al statisticii? 8.2. Ce nelegei prin faptul c genul masculin prezint mai mult variabilitate dect
cel feminin n ceea ce privete nlimea, greutatea sau inteligena? 8.3. Din ntrebarea de mai sus rezult c brbaii ca grup sunt neaprat mai nali, mai
grei sau mai inteligeni dect femeile? Pe ce v bazai afirmaia?
-
18
9. Explicai diferenele existente ntre statistica descriptiv i cea inferenial. 10. Facei parte din echipa care studiaz pattern-urile de dezvoltare fizic a populaiei infantile i tinere (0 - 20 de ani) a Romniei de azi. n planificarea studiului dvs. utilizai ct mai multe concepte, termeni (populaie, eantion, variabile etc.) i metode (eantionare) prezentate n capitolul de fa. 11. Definii pe scurt termenii de: date, variabil, eantionare, populaie i inferen statistic. 12. Vom lua n considerare toi studenii de anul nti de la specializarea Psihologie a Facultii de Psihologie i tiinele Educaiei. Dai cteva exemple din care s rezulte c: 12.1. Acetia reprezint populaia. 12.2. Acetia reprezint doar un eantion dintr-o populaie. 12.3. Cnd l considerm eantion, acesta este unul randomizat sau nealeator?
(Explicai opiunea fcut). 13. Rectorul universitii noastre este interesat de repartiia pe judee, pe sexe, pe grupuri etnice i pe categorii de vrst a studenilor admii la aceast universitate, ca i de evoluia lor ca rezultate academice n ultimii 10 ani.
13.1. Care este populaia studiat? 13.2. Care sunt variabilele implicate n acest studiu? 13.3. Avem de-a face cu eantioane aleatorii sau cu unele de convenien? 13.4. Identificai variabilele categoriale i pe cele real numerice prezente n studiul invocat.
14. La un meci de fotbal sunt prezentate la final de partid urmtoarele statistici: - uturi pe poart; - uturi pe spaiul porii; - goluri marcate; - pase de gol; - cartonae galbene i roii primite de fiecare echip; - posesia mingii exprimat n procente pentru fiecare echip; - numrul mediu de kilometri alergat de fiecare juctor pe parcursul perioadei jucate. 14.1. Care dintre aceste date sunt tipice statisticii descriptive i care celei infereniale? 14.2. Care dintre datele de mai sus sunt real numerice i care categoriale? 14.3. Argumentai care dintre datele de mai sus prezint cea mai mare variabilitate. 14.4. Care dintre aceste date provin de la variabile continue i care de la variabile
discontinue? 14.5. Ierarhizai i explicai care dintre primele patru variabile prezint mai mult
variabilitate.
-
19
CAPITOLUL 2
MSURAREA
ORGANIZAREA COLECIEI DE DATE
2.1. Msurarea n tiinele socioumane
Cele mai multe aspecte pe care dorim s le msurm n tiinele socioumane
(psihologie, pedagogie, sociologie) se prezint adesea sub form numeric, sau sunt aduse
ntr-o asemenea form printr-o operaie de codare. Psihologul msoar adesea date fizice
(stimuli vizuali, auditivi, tactili, kinestezici etc.), prin manifestrile lor caracteristice
(intensitate, durat, frecven, greutate), culese de aparate special elaborate, ce dispun de
propriile uniti metrice. El msoar n egal msur efectul stimulilor asupra fiinei vii i
atunci determin timpul de reacie, numrul rspunsurilor corecte, erorile. Msura poate
ajunge la niveluri de rafinare i complexitate foarte ridicate: msurm inteligena prin
componentele acesteia, determinate prin intermediul unei teorii; msurm memoria prin
parametri de volum, fidelitate, numr de repetiii necesare ntipririi; msurm factorii de
personalitate de ordin primar sau secundar, dedui din complexe construcii teoretice;
msurm atitudini sau reacii interpersonale (simpatie-antipatie, atracie-respingere).
Unele caracteristici sunt foarte uor de degajat (msurtorile fizice), altele sunt
deductibile doar prin construcii sau montaje experimentale ingenioase, iar altele se
fundamenteaz pe soluii reieite din teorii tiinifice. De multe ori datele calitative culese prin
observaie sau experiment sunt transformate n date cantitative printr-o gril de observaie,
care ofer cadrul de referin n clasificarea datelor. Acest instrument n care faptele sunt
clasificate pentru a putea fi urmrite sub raportul intensitii i al frecvenei se cheam
protocol i este alctuit dintr-un tabel ce descrie faptele observate pe linii i frecvena de
apariie a acestora pe coloane.
Msurarea n psihologie trebuie luat n sensul ei cel mai larg, acela de atribuire de
numere datelor continue sau discontinue (discrete), pentru c psihologia nu i-a conturat
uniti metrice la fel de tari matematic ca cele din tiinele fizice. i totui, ea aspir s fac
prin operaiile de msurare mai mult dect o operaie de codare, cum este de exemplu aceea
de atribuire a notelor colare (operaie care nu poate exclude subiectivitatea).
-
20
Din punct de vedere matematic msurarea este o operaie prin care fiecrui element
din mulimea de obiecte (domeniul de definiie al variabilei) i se ataeaz un numr i numai
unul din mulimea n care aceasta ia valori (domeniul variabilei). Se stabilete astfel o relaie
de izomorfism ntre mulimea obiectelor i mulimea msurilor obiectelor, fiecare obiect fiind
definit de o singur msur.
Sistemul de reguli impus de teoria i practica din domeniu definete mai multe tipuri
de msurare n funcie de tipul de scal utilizat: nominal, ordinal, de interval i de raport.
Alegerea celui mai potrivit tip de scal este impus de numrul i mai ales de tipul de relaii
existente ntre elementele investigate. De remarcat un fapt esenial: toate caracteristicile unei
scale de rang inferior se regsesc la cele de ordin superior, care ns adaug posibiliti
suplimentare. Aadar fiecare scal permite doar anumite operaii i procedee matematice. Cu
ct este mai sus n aceast ierarhie, cu att ea este mai precis, permind prelucrri statistice
mai complexe i implicit concluzii mai fundamentate matematic.
2.2. Proprietile scalelor
Exist trei proprieti care fac ca scalele de msurare s difere ntre ele: magnitudinea
intervalele egale i zero absolut.
2.2.1. Magnitudinea
O scal are aceast proprietate atunci cnd se poate spune c o caracteristic a
atributului msurat reprezint mai mult, mai puin sau la fel (tot att, adic egal) o cantitate
sau nsuire, comparativ cu o alt stare a aceluiai atribut. n ceea ce privete talia, de
exemplu, putem afirma c George este mai nalt, mai scund sau la fel de nalt ca Horia, deci
scala nlimii are proprietatea magnitudinii. Numerele de pe tricourile fotbalitilor nu au n
schimb aceast nsuire, deoarece ele sunt atribuite ca nite etichete, servind doar la
identificarea juctorilor.
2.2.2. Intervalele egale
O scal are intervale egale dac diferena dintre dou puncte aflate pe oricare zon a
scalei are aceeai semnificaie, valoare, ca diferena dintre alte dou puncte care difer prin
acelai numr de uniti. De exemplu, diferena dintre anii 1200 i 1400 este egal cu
diferena dintre anii 1800 i 2000, n timp ce diferena dintre coeficienii de inteligen 50 i
100 nu are aceeai semnificaie ca diferena dintre coeficienii 100 i 150, dup cum nu putem
spune c cel cu QI de 100 este de dou ori mai inteligent dect cel cu QI de 50.
-
21
Psihometricienii au ncercat s ocoleasc aceste dificulti i, folosind tehnici matematice
sofisticate, au creat instrumente care se apropie de cerina unei scale de interval (adic avnd
intervale de scal egale).
2.2.3. Zero absolut
Acest proprietate este posibil de evideniat cnd variabila msurat are un nivel la
care ea nu mai exist deloc: zero ca distan nseamn absena oricrei distane, zero ca ritm
cardiac nseamn moartea, dar zero ca agresivitate, emoie, curaj, inteligen (caracteristici
umane) este extrem de greu, dac nu imposibil, de evideniat sau de definit.
Tabelul 2.1. Scalele de msurare i proprietile lor (dup Kaplan i Saccuzzo, 1993, p. 32).
P r o p r i e t i
Tip de scal Magnitudine Intervale egale Zero absolut
Nominal Nu Nu Nu
Ordinal Da Nu Nu
De interval Da Da Nu
De raport Da Da Da
2.3. Tipuri de scale
2.3.1. Scalele nominale
n sens strict, scala nominal nu este o scal, pentru c ea nu are nici una dintre cele
trei caracteristici enumerate anterior. Scopul ei este s numeasc obiectele, aa cum se
ntmpl cu numerele de pe tricourile fotbalitilor. Cu toate acestea este comod s atribuim
numerele 1, 2, 3 i 4 pentru a codifica etnia romn, maghiar, german i altele, 0 i 1 pentru
sexul masculin i feminin sau 1, 2 i 3 pentru mediul urban, suburban i rural, ntr-un studiu n
care apar astfel de variabile. Singura restricie este aceea ca numerele s fie atribuite tuturor
obiectelor care au aceleai caracteristici, i numai lor.
Fiind n fond vorba de o operaie de clasificare, singurul procedeu matematic admisibil
aici este determinarea frecvenelor de apariie, care se pot calcula fie n valori brute, fie n
valori relative, adic n procente. n acest din urm caz, dei ar fi normal ca eantionul s
depeasc 100 de cazuri (prin definiie pro-cent implic ideea de sut), se accept totui
exprimarea procentual i a numerelor de la 30 n sus, dar nu mai mici. Aceasta deoarece, prin
transformarea n procente, numerele mai mici de 100 se amplific i cu ele eroarea de
msurare, procedeu care ... n ciuda rigorii aparente, trdeaz superficialitatea metodologic
(Chelcea, 1982, p. 158).
-
22
n sintez, pot fi reinute cteva aspecte mai importante pentru acest tip de scal:
Scala nominal este mai degrab una calitativ, ea fiind de fapt o premsurare.
Ea se preteaz foarte bine pentru datele culese prin observaie, anchet, chestionar,
care vor fi repartizate n categorii distincte, astfel nct un element s se afle numai
ntr-o categorie (clas) i numai una.
Literele sau cifrele folosite ca etichet nu vor face obiectul calculelor statistice, ci
vor servi doar la reperarea claselor, la determinarea frecvenelor brute i a celor
relative. Fiecare element al unei clase (categorii) este considerat a fi echivalent cu
toate celelalte din aceeai clas.
Singurul procedeu matematic de verificare este aa-numitul test chi-ptrat (2).
2.3.2. Scalele ordinale
Dup Favrge acestea reprezint nivelul cel mai rspndit de msurare din psihologie
i pedagogie, deoarece n majoritatea lor valorile din aceste domenii sunt continue i simplu
ordonate. Aceasta permite ca elementele s fie aranjate fie cresctor, fie descresctor, existnd
i posibilitatea ca mai multe elemente s ocupe acelai loc. Se stabilete astfel o relaie de
ordine total ntre elemente, dat de formula Pxxy, care va fi interpretat ca x este superior,
preferat sau naintea lui y (Radu, 1993, p. 49). Deoarece relaiile formulate (A B C D)
permit stabilirea unei ierarhii, nseamn c importante caracteristici umane, fizice (nlime,
greutate, perimetre), dar i psihice (capaciti, aptitudini, preferine, interese, atitudini, valori)
pot beneficia de acest tip de scal.
Numerele asociate obiectelor i fenomenelor n msurarea de tip ordinal au doar
semnificaia unui rang, adic nu indic mrimi absolute. Pentru a atribui numerele n serie
cresctoare sau descresctoare, trebuie ca i caracteristica respectiv s aib valori care cresc
sau descresc. n scalele de tip Likert, de exemplu, se pot atribui numere de la 1 la 7, 4
exprimnd neutralitatea, numerele mici (3, 2 i 1) dezacordul sau insatisfacia tot mai
accentuate, n timp ce numerele mari (5, 6 i 7) acordul sau satisfacia tot mai intense.
Creterea regulat a numerelor nu trebuie s sugereze ns c i caracteristicile
respective cresc n aceeai proporie. Exemplul clasic este cel al militarilor dintr-un pluton,
aezai ntr-o ordine ierarhic, de la mic la mare: al distana dintre al cincilea i al aselea din
irul ordonat nu este aceeai ca distana dintre al doilea i al treilea, i aceasta deoarece scalele
ordinale nu au o unitate de msur care s indice i cantitatea diferenei dintre ranguri. Scala
metric a inteligenei, publicat de Binet n 1905, permitea un clasament ierarhic al unor
-
23
inteligene diferite care, pentru nevoile practice, echivala cu un clasament. n psihodiagnoz,
exemplul tipic pentru acest tip de msurare este procedeul centilrii i decilrii (ordonarea
ierarhic pe o scar cu 100, respectiv 10 trepte), iar n pedagogie nota colar, ca procedeu de
evaluare care n acelai timp i ierarhizeaz elevii.
n concluzie pot fi reinute urmtoarele aspecte:
Deoarece scala ordinal nu are o unitate de msur constant, ea nu permite adunarea
i scderea, adic nu are proprietatea aditivitii.
Este legitim ns calcularea frecvenelor brute i a celor relative (a procentelor) i
aplicarea procedurilor statistice neparametrice (adic exprimate calitativ sau prin
numere ce exprim categorii): coeficientul de corelaie al rangurilor al lui Spearman,
coeficientul de corelaie Kendall, testele de semnificaie Mann-Whitney, Wilcoxon,
Kruskal-Wallis etc.
Centilarea, decilarea - n psihodiagnoz, i nota colar - n pedagogie, sunt ilustrrile
cele mai frecvente ale utilizrii acestui tip de scal n domeniile amintite.
Cel mai important indicator al tendinei centrale este n cest caz mediana.
2.3.3. Scalele de interval
Scalele de interval nu reprezint nivelul curent de msurare n tiinele socioumane,
dei se tinde spre aceasta, deorece, pe lng ordinea i ierarhia nivelurilor anterioare, trebuie
s existe specificarea mrimii exacte a intervalelor sau a distanelor care separ elementele
aflate pe toate treptele succesive ale scalei. Aceasta presupune cu necesitate prezena unitii
constante i comune de msur. Exemplul cel mai concludent l dau calendarele, unde
existena unei uniti de msur precizat i constant, anul, face posibil echivalena a 200 de
ani de la nceputul mileniului cu 200 de ani de la sfritul lui. Mai mult, dac operm cu
calendare diferite (iulian, gregorian, evreiesc sau mahomedan), deoarece unitile de msur
nu sunt diferite, ... transpunerea dintr-un calendar n altul nu pune nici un fel de problem
(Richelle, 1995, p. 222).
Rezumm cteva dintre nsuirile de baz ale scalei de interval:
Specificul scalei de interval este proprietatea aditivitiii (intervalele - i nu valorile! -
pot fi adunate i sczute).
Neexistnd un punct zero (care s exprime absena caracteristicii msurate),
intervalele pot fi deplasate, extinse sau comprimate, dac prin aceasta ele devin mai
maniabile sau mai bine adaptate realitii msurate.
-
24
La acest nivel se pot aplica procedee statistice mai elaborate, cum ar fi corelaia r prin
produsul momentelor a lui Pearson, testele de semnificaie t i z ale lui Fisher, ca i
analiza de regresie.
Aceasta deoarece la nivelul scalei de interval se pot determina media aritmetic,
abaterea standard i variana.
2.3.4. Scalele de raport
Acestea au toate proprietile unei scale de msur: magnitudine, intervale egale i
zero absolut. Ele sunt caracteristice mrimilor fizice (nlime sau lungime, greutate, for),
ceea ce nu se ntmpl cu fenomenele sau faptele din psihologie, sociologie sau pedagogie,
deoarece neputnd fiina fr un minimum de inteligen, coeziune, atracie etc. acestor
fenomene nu li se poate stabili starea zero. Cu temperatura lucrurile stau altfel: deoarece
scalele Celsius i Fahrenheit au un punct zero convenional, n timp ce sistemele Kelvin sau
Rankine au un punct zero neconvenional (absena oricrei temperaturi), doar acestea din
urm sunt scri de raport.
Elementele eseniale ale scalelor de raport sunt deci urmtoarele:
Scalele de raport se cheam aa pentru c, pe lng toate caracteristicile scalelor de
sub ele, permit relaia de proporionalitate de tipul b/a = c/b = d/c.
Ele permit toate tipurile de statistici, parametrice i neparametrice, toate procedeele de
verificare i toi coeficienii de corelaie cunoscui.
Aceasta deoarece se permite calculul mediei geometrice i a coeficientului de variaie.
n afara unor situaii de excepie (mrimi fizice de intrare, puse n legtur cu timpul
de reacie, de exemplu), psihologii, pedagogii i sociologii nu sunt ndreptii s
foloseasc un asemenea tip de scal.
Corespunztor tipurilor de scal amintite, vom avea tipuri de variabile (nominale,
ordinale sau numerice), care sunt definite de domeniul de variaie, adic de registrul de valori
pe care acestea le pot lua. Cnd lum n considerare numrul indivizilor sau al cazurilor
susceptibile de a prezenta aceast modalitate, vorbim de domeniul de definiie. De exemplu, la
o prob de motricitate, tapping, numrul de puncte btute cu mn dreapt, adunat cu numrul
punctelor btute cu mna stng ia valori diferite n funcie de vrst, sex i de lateralizare
(dreptaci sau stngaci). De pild, la 6 ani acest numr poate s ia valori de la 10 la 60, acesta
fiind domeniul de variaie, n timp ce numrul subiecilor ce nregistreaz aceste valori, pentru
fiecare punctaj, d domeniul de definiie (al frecvenelor).
-
25
O atitudine, considerat ca o variabil codificat pe o scar Likert, are mai multe
modaliti de manifestare, dar i o populaie care prezint toate aceste modaliti. Deci
fiecrui individ din domeniul de definiie i se poate face s i corespund o modalitate i
numai una n domeniul de variaie. Noiunea de variabil este ns mai general pentru c ea
se poate referi fie la o mulime de date, fie la efective observate, fie la date prezumate,
ipotetice, virtuale. Scalele descrise anterior se refer la date efectiv observate.
Ion Radu (1993, p. 51) apreciaz c n prelucrarea datelor, n funcie de cerinele
studiului i pentru a ne nscrie ntr-o schem statistic, noi introducem astfel o metric, adic
tratm datele ca i cum s-ar situa la nivelul scalei de interval. (). Se comite astfel o eroare,
care practic este neglijabil. Deoarece prediciile fcute n felul acesta sunt valide,
transformarea respectiv este considerat ca fiind acceptabil.
2.4. Organizarea datelor brute
Pentru a fi posibile procedurile detaliate de tratare i de analiz statistic a datelor,
acestea trebuie culese i ordonate n tabele sau grafice. Datele brute efectiv rezultate din
anchet, testare sau evaluare nu au nici o semnificaie prin ele nsele, ci prin raportarea la un
sistem de referin. Cel mai adesea acesta rezult din comparaia scorurilor individuale cu
datele obinute de un eantion mai larg din populaia investigat, prin care se pune n eviden
poziia unui subiect n cadrul grupului mai larg. n calitatea lui de sistem de referin, grupul
ofer posibilitatea construciei unei tipologii ori a unui tabel de norme (barem sau etalon).
Acestea alctuiesc aa-numitele cote standard, ceea ce arat c investigaia individului i a
grupului sunt corelative i complementare. Extragerea informaiilor coninute de datele brute
i organizarea lor ntr-o colecie sau baz de date, presupune intrarea n funciune a unor
proceduri statistice elaborate (determinarea medianei, a mediei, a abaterii standard i a
varianei, aprecierea msurii n care cele descoperite pot fi generalizate i la ce nivel de
ncredere).
Dac prin organizarea primar a datelor (ordonare i grupare) se poate face o prim
inspecie vizual a acestora, cci ele se prezint ca histograme, poligoane ale frecvenelor,
scattere etc., prin calculul tendinelor aflate pe centrul distribuiei (media, mediana i modul),
ca i a celor aflate spre extreme (amplitudinea mprtierii, abaterea standard i dispersia) se
pot face inferene statistice valide, pentru ca prin corelaie, analiz factorial i de cluster s
avem o nelegere mai de adncime a relaiilor i a structurilor subiacente. Analiza de
varian, regresia simpl i multipl permit, dincolo de sesizarea structurii de adncime a
datelor studiate, predicia unor legiti, aa cum reies din analiza i modelarea lor matematic.
-
26
2.5. Exerciii i aplicaii practice 1. Dai cte unu-dou exemple de variabile ntlnite n psihologie care apeleaz la scale de msur nominale, ordinale, de interval i de raport.
2. Avei mai jos spectrul culorilor vizibile de ochiul uman, reprezentat pe dou tipuri de scal. Simbol R O G V A I V Nume Rou Oranj Galben Verde Albastru Indigo Violet Lungime de und
800-620 619-590 589-575 574-510 509-480 479-450 449-430
2.1. Precizai numele fiecrui tip de scal, indicnd avantajele i locul lor de utilizare. 2.2. Lumina este o variabil continu sau discontinu? (Argumentai).
3. Msurnd nlimea a 10 studente de la Psihologie s-au obinut urmtoarele valori: 165 160 168 170 156 158 163 180 155 162
Utiliznd pe X ca simbol al acestei variabile (nlimea): 3.1. Precizai care sunt X3, X5, X8 i X10. 3.2. Calculai X. 3.3. Scriei formula de nsumare de la punctul anterior ntr-o form mai complet.
4. Concomitent s-a determinat i greutatea pentru cele 10 studente, obinndu-se valorile de mai jos (n kilograme).
62 61 70 72 52 55 66 80 49 53 Utiliznd pe Y ca simbol al acestei noi variabile (greutatea): 4.1. Precizai care sunt Y2, Y4, Y7 i Y9. 4.2. Calculai X din exemplul anterior. 4.3. Calculai (X)2 i X2. Folosind semnele = i indicai care este relaia dintre cele
dou valori obinute. 4.4. Determinai X/N i Y/N, unde N (10) reprezint numrul de scoruri observate. 4.5. Cum numii valorile pe care tocmai le-ai calculat la punctul anterior? 4.6. n mod similar calculai pe (Y)2 i Y2. 4.7. Utiliznd valorile numerice deja obinute determinai valoarea formulei de mai jos
4.8. Extragei rdcin ptratic din valoarea numeric a expresiei de mai sus.
5. Utilizai datele de mai sus pentru a arta c: 5.1. (X+Y) = X + Y 5.2. XY XY 5.3. CX = CX, n care C este o constant. 5.4. X2 (X)2
5.5. (X+C) = X + NC, n care N este numrul de cazuri iar C are valoarea 3.
6. Poate o variabil ordinal s fie msurat cu o scal continu (de interval sau de raport)? Poate o variabil continu s fie msurat cu o scal ordinal? Argumentai folosind cte un exemplu adecvat.
7. Notele colare trecute n catalog sunt msurtori tipice unei scale ordinale sau uneia de interval? Dar mediile colare pentru fiecare obiect n parte (rotunjite)? Dar media general (nerotunjit)?
8. Media (nerotunjit) de la Matematic i cea de la Purtare sunt msurate pe acelai tip de scal? (Argumentai rspunsul).
( )
1
22
N
N
YY
-
27
2.6. Quiz: Da Nu
1. (Exemplu) Pentru scalele de interval suntem ndreptii s utilizm frecvenele absolute (count) i pe cele relative (procente). Rspuns: Adevrat, pentru c, dei tipice scalelor ordinale, procedeele respective sunt prezente i la scalele de interval i de raport, tiut fiind c scalele de rang superior ncorporeaz proprietile celor de rang inferior.
2. Magnitudinea unei scale este proprietatea matematic ce permite ierarhizarea populaiei de date de la mic la mare sau invers.
3. Deoarece distana (n cunotine sau deprinderi) dintre nota 8 i nota 9 este egal cu distana dintre nota 3 i nota 4, nseamn c sistemul de notare colar are proprietile scalei de interval.
4. Atunci cnd codificm genul masculin cu 1 i pe cel feminin cu 2 efectum o operaie de msurare.
5. Inteligena nu are uniti de msur tipice scalelor de interval.
6. Scala care msoar era noastr are un zero natural naterea lui Iisus fiind deci o scal de raport.
7. IQ-ul se msoar pe o scal ordinal deoarece distana de 10 puncte dintre IQ 50 i 60 are aceeai semnificaie psihologic ca i diatana dintre IQ 120 i 130.
8. Pentru datele de observaie, de anchet i de chestionar sunt utilizate scalele nominale, care fac de fapt o premsurare.
9. La un chestionar s-a utilizat o scal Likert n 5 trepte cu urmtoarea semnificaie: 1=Foarte rar 2=Uneori 3=Aa i aa 4=Deseori 5=Foarte des.
Se poate determina o valoare numeric medie a rspunsurilor pentru ntregul chestionar? Argumentai.
10. Pentru datele culese pe o scal ordinal putem face media deoarece aceasta are proprietatea aditivitii.
11. n tiinele socio-umane nivelul de msurtoare maximal este al scalelor de interval iar cel uzual al scalelor ordinale.
12. Scala de interval permite deplasarea punctului zero (adic a originii) spre stnga sau spre dreapta scalei i, de asemenea, permite comprimarea sau dilatarea acesteia.
13. Scalele de msurare a timpului (calendarele iulian, gregorian, iudaic, mahomedan, maya etc.) pot fi transpuse unul n altul i obinute valori echivalente deoarece au uniti de scal egale.
14. Scalele nominale i ordinale sunt categoriale, cele de interval i raport sunt real numerice.
15. n sistemul romnesc de notare colar domeniul de definiiei al variabilei l reprezint elevii iar domeniul ei de variaie intervalul de notare 1-10.
16. Notele colare i centilarea/decilarea nu fac dect s stabileasc ierarhii, adic s rangheze subiecii cresctor sau descresctor.
17. n principiu notele colare nu pot fi adunate pentru a se determina media pe materii deoarece scala de notare nu are proprietatea matematic a intervalelor egale.
18. Nu pot fi inventate uniti de msur valabile, tipice scalelor de interval, pentru iubire, fric, simpatie sau depresie.
19. Funciile cognitive senzaiile, gndirea, memoria se bucur de scale de msur mai tari dect funciile afective.
20. Numii tipul de scal de msurare reprezentat de categoriile de mai jos, alocnd cifrele 1, 2, 3 i 4 pentru scalele nominal, ordinal, de interval i de raport: scala Celsius, scala Kelvin, numrul de pe uile camerelor unui hotel, ordinea de sosire la maraton, scorul la acest test QUIZ,
presiunea sanguin, genul i greutatea. (Se acord punctul pentru minimum 5 rspunsuri corecte din cele 8 posibile).
-
28
CAPITOLUL 3
DISTRIBUII I FRECVENE
Pentru determinarea celor mai importani indicatori statistici este nevoie de frecvene.
n domeniul variabilei, fiecare mrime are un numr de reprezentani, numit efectiv. n
statistic efectivul se numete frecven sau frecven absolut. Cnd frecvena este
transformat n procente, ea se numete frecven relativ i este foarte util pentru
compararea, de exemplu, a dou colective diferite ca mrime, i aceasta pentru c
transformarea n procente pstreaz echivalena i proporia n ce privete distribuia i
caracteristicile ei.
3.1. Ordonarea i gruparea datelor
Cea mai mare parte a operaiilor i procedeelor de lucru care urmeaz s fie prezentate
mai jos sunt extrem de mult facilitate de programele de prelucrare computerizat a datelor, de
tip SPSS, NCSS sau SAS. Ele fac parte din abc-ul statisticii, fiind primele ordonri i
prelucrri ale datelor brute, la sfritul crora distribuiile respective i dezvluie o parte din
caracteristicile de suprafa, adic cele vizuale.
Le vom prezenta detaliat, pentru c ele reprezint moduri de lucru practice, uor de
executat ntr-o diversitate de situaii concrete, ca un preambul al unor prelucrri ulterioare mai
elaborate. Parcurgnd aceti pai vom putea sesiza fora pe care instrumentul statistic l poate
da muncii noastre, deoarece el ordoneaz, triaz, clasific datele, forndu-le s i dezvluie
semnificaiile. De aceea operaiile iniiale de ordonare i de grupare a datelor ar trebui s
devin operaii de rutin pentru oricine este interesat s dea muncii sale rigoare tiinific. Iat
scorurile brute la un test de vocabular (Recombinare Verbal) culese la biei i fete de 14 ani
din eantionul care a fost utilizat pentru etalonarea acestui test:
Biei Fete
57 56 48 36 24 23 28 23 33 26 16 57 56 45 35 36 43 26 34 46 24 25
53 34 22 34 34 42 34 25 24 29 18 53 55 55 48 43 48 35 36 27 27 26
60 33 51 40 47 36 36 29 26 22 14 60 62 44 57 70 36 38 35 28 31 19
52 34 60 61 56 34 22 28 30 23 34 52 53 56 49 46 37 48 33 27 19 29
51 64 37 33 36 28 35 19 18 15 51 58 44 51 38 48 26 36 22 25 15.
-
29
Avem nevoie de o foaie de hrtie cu liniatur matematic, format A4, de o rigl i un
creion, la care vom putea aduga ulterior un minicalculator cu panou statistic, ca instrumente
i materiale de lucru uzuale. Foaia de hrtie va fi mprit prin 3 linii orizontale, trasate pe
lungul ei, n 3 panouri (registre) de lucru, pentru biei, fete i total. Se observ c cea mai
mic valoare de scor (Xmin) este la biei 14 i la fete 15, iar cea mai mare (Xmax) 64 la biei i
70 la fete. Prin urmare fiecare ptric de pe linia de baz va fi numerotat de la 11 la 70,
avnd grij ca aceast numerotaie s fie identic pe toate cele trei registrele, pentru a le putea
nsuma ulterior pe vertical. Dup aceea se descarc primul tabel pe primul registru al foii,
sub care se va scrie Biei, al doilea tabel n al doilea registru, sub care se va scrie Fete,
fcnd un x s-au o bif n ptrica corespunznd scorurilor care se descarc, la valoarea
corespunztoare de pe linia de baz.
La sfritul operaiei se vor numra frecvenele corespunztoare fiecrui scor de la 11
la 70 iar numrul va fi trecut sub ptrica corespunztoare fiecrui scor, att la biei, ct i la
fete i total (care rezult din nsumarea pe vertical a frecvenelor pentru fiecare scor).
Inspecia vizual a datelor evideniaz urmtoarele aspecte:
- amplitudinea scorurilor (Xmax - Xmin) este uor diferit pentru cele dou categorii: 64 - 14 =
50, la biei i 70 - 15 = 55, la fete;
- aglomerarea datelor este mai accentuat n prima jumtate (spre stnga), cu o mai mare
densitate pe zona central (34, 36 i 37), la biei; o repartiie spre dreapta a datelor fetelor;
- bieii au o singur frecven maxim (la scorul 34 sunt 7 cazuri), n timp ce fetele au dou
(la scorurile 36 i 48 sunt cte 4 cazuri). Prima ntrebare care se pune este dac pentru
anumite tratamente statistice (alctuirea unui etalon) datele trebuie tratate separat sau
mpreun. Rspunsul poate fi aflat prin condensarea informaiei pentru a fi vizualizat, dup
ce datele vor fi grupate.
Pentru a determima mrimea intervalului de grupare reinem cteva reguli de lucru:
Vor fi preferate nu mai puin de 5 - 7 intervale i nu mai mult de 20. Pentru gruparea
datelor, uzual se folosesc ntre 9 i 15 clase.
Pentru determinarea mrimii intervalului, amplitudinea mprtierii se mparte la
cteva din mrimile dorite ale intervalului, pentru a vedea cte clase rezult i se alege
aceea care se apropie cel mai mult de numrul de clase considerat convenabil.
Ca mrime a intervalului este preferabil s folosim numere impare (3, 5 sau 7), pentru
a avea ca valori centrale de interval numere ntregi.
-
30
Este bine ca primul interval s nceap cu un multiplu al mrimii lui. De exemplu
intervalele de lungime 3 pot ncepe cu 3, 6 sau 9, cele de lungimea 5 pot ncepe cu 5,
10 sau 15 etc.
n cazul analizat, dac am dori s avem intervale din 3, atunci rezult 55/3 = 15
intervale, iar dac am dori intervale de 5, atunci ar rezulta 55/5 = 11 intervale. Pentru c avem
o distribuie relativ mic, optm pentru a doua variant. Delimitm prin linii verticale clasele
astfel obinute (10-14, 15-19, 20-24, , 70-74) i n dreptul fiecreia se vor trece n mijlocul
clasei i n partea ei de sus frecvenele clasei respective, rezultate prin nsumarea valorilor
individuale din interiorul fiecrui interval (1, 5, 8, 8, ..., 0, pentru biei; 0, 3, 2, 10, , 1,
pentru fete).
Trebuie inut cont c percepia noastr opereaz din ce n ce mai greu cu intervale care
depesc cifra 12, chiar dac mrimea populaiei i lungimea spectrului de variaie ar impune-
o. De aici recomandarea de a nu avea nici prea puine intervale (prin gruparea datelor se
pierde o parte din informaia primar, pentru c nu se mai cunoate exact valoarea msurat a
fiecrei observaii), i nici prea multe (intervalele rezultate sunt mai greu de manevrat i de
sesizat perceptiv), de unde regula deja enunat a celor 9 -15 clase de grupare a datelor.
Sturges (citat de Rotariu et al.,1999, p. 33) propune o formul de lucru pentru aceast
operaie prin care se determin numrul intervalelor de grupare, lund n calcul amplitudinea
variaiei i numrul de cazuri:
(3.1)
Utiliznd formula lui Sturges, se obine urmtorul tabel orientativ pentru stabilirea numrului
de interval (clase) de grupare n funcie de mrimea eantionului:
Tabel 3.1. Numrul de interval de grupare dup formula lui Sturges.
Nr. de observaii 15-24 25-44 45-89 90-179 180-359 360-719 720-1500
Nr. de clase 5 6 7 8 9 10 11
Aplicat n cazul nostru, pentru biei, i = (64-14)/(1+3,322 log54) = 50/6,755 = 7,40; pentru
fete vom avea i = (70-15)/(1+3,322 log55) = 55/7,77 = 7,21. Pentru numrul de cazuri ale
distribuiei noastre am avea teoretic nevoie de 8 intervale. S reinem i regula practic a celor
7 - 12 intervale, care realizeaz cel mai bun echilibru ntre nevoia de condensare a datelor i
aceea de a avea pierderi de informaie ct mai mici.
NXX
ilog222,31
minmax
+
=
-
31
3.1.1. Limitele de grupare
n cazul variabilelor continue, cel mai adesea raportm clasele la nite numere ntregi,
care constituie limitele de raportare a acestora. n cazul variabilei continue care este
nlimea, de exemplu, putem avea clasele 125-129, 130-134, 135-139 etc. Ce se ntmpl
ns cu nlimile de 129,54 sau 134,82, care par a cdea n golurile dintre clase? Deoarece
limitele de raportare nu acoper n ntregime domeniul variabilelor continue, trebuie s se
defineasc nite limite exacte, asfel nct, respectnd regula de rotunjire, valorile interclase s
fie uor de alocat la una dintre clase. Aceste limite au deci dou funcii: a) reconstituie
continuitatea variabilei, nemailsnd goluri i b) servesc drept baz de calcul pentru
determinarea unor puncte speciale de pe linia valorilor variabilei, numite quantile, cum ar fi
mediana, centilele, decilele sau oricare alt punct percentil.
n acest sens trebuie precizat c fiecare interval are o limit superioar (ls) i o limit
inferioar (li). De exemplu, intervalul 125-129 se exprim matematic astfel, n funcie de cele
dou limite: [125,5; 129,5], sau 125,5-129,5.
3.1.2 Centrele intervalelor
Centrul unui interval, notat cu Ci, este valoarea situat n mijlocul intervalului
respectiv i se determin astfel Ci = (li + ls)/2. Aplicnd aceast formul la exemplul nostru,
intervalul 124,5-129,5 are drept centru valoarea 127, ceea ce justific preferina pentru
intervalele de numr impar, care dau o valoare ntreag pentru centrele lor. Celelalte centre de
interval se pot determina extrem de uor ulterior, pentru c ele sunt multipli ai lungimii
intervalului, deci n cazul nostru vor fi: 127, 132, 137 etc. Aproximarea prin centrele
intervalului creeaz posibilitatea ca toate valorile care aparin unui interval s fie tratate n
calcule ca egale cu centrul acestuia, de unde posibilitatea erorii pe care gruparea datelor o
introduce, lucru de care am amintit anterior.
Se poate dovedi matematic c aceast grupare satisface criteriul matematic al celei mai
mici erori. Important de menionat este i faptul c, cu ct intervalul este mai mare, cu att
mrimea acestei erori rezultat prin gruparea datelor va crete.
3.2. Histograma i poligonul frecvenelor
Dup ce am prezentat modul practic de lucru pentru cele dou reprezentri grafice ale
frecvenelor vom avertiza asupra faptului c exist precauii speciale privind mrimea
diagramei rezultate n raport cu spaiul de lucru al foii (problem rezolvat corect cu ajutorul
computerului), cu localizarea punctului de mijloc sau cu trasarea figurilor.
-
32
O problem care merit atenie o reprezint raportul dintre nlimea i limea
diagramei, care de regul este de 60%. Vom recunoate n aceasta o problem real, deoarece
ea face posibil minciuna statistic, dup expresia lui Smith: manevrnd (intenionat sau nu)
acest raport, se poate accentua sau aplatiza o pant de cretere a unui indicator pentru a sugera
ceva ce realitatea nu confirm.
Histograma d o imagine n scar a distribuiei, fiind cea mai potrivit reprezentare
a datelor ordinale, discontinue, caz n care ntre bare trebuie s existe mici spaii pentru a
sugera discontinuitatea, caz n care se numete reprezentare cu bare. Histograma este la fel de
mult utilizat i pentru datele continue, de interval, caz n care barele verticale apar unite ntre
ele. Ca i poligonul frecvenelor, histograma este informativ n legtur cu forma distribuiei,
cu simetria ei, dar este mai puin adecvat s exprime boltirea (aplatizarea acesteia), deoarece
am vzut c raportul dintre unitile de msur de pe abscis i de pe ordonat poate fi
modificat n funcie de opiunea cercettoului.
Cea mai bun redare a datelor de interval, fie ele brute, fie cumulate, o constituie
poligonul frecvenelor. Diferena dintre dou tipuri de grafice este nu numai de form
(scalar - la histogram, linii drepte care unesc ntre ele puncte - la poligon), ci este dat de
chiar asumpia lor de baz. Astfel, la histogram toate valorile dintr-un interval sunt egale
ntre ele ca frecven, i egale cu valoarea centrului de interval, n timp ce la poligonul
frecvenelor datele tind s se grupeze de o parte i de alta a acestei valori centrale.
Histograma ofer o imagine mai clar a numrului de cazuri din fiecare interval, dar
d o imagine cu totul confuz cnd pe aceeai linie de baz se redau, pentru comparaie, dou
sau mai multe distribuii. n acest caz este evident c poligonul frecvenelor apare ca mult mai
indicat, comparaia putndu-se face fie n valori absolute (cnd nu exist diferene prea mari
numeric ntre cele dou distribuii), fie n frecvene relative (procentuale), caz n care
comparaia devine posibil, deoarece distribuiile sunt redate proporional.
De asemenea poligonul frecvenelor poate s se refere la frecvenele brute simple sau
cumulate, dar i la cazul frecvenelor relative simple sau cumulate, cnd se obine aa-numita
ogiv a lui Galton.
-
33
MF_Metoda+Fisa
175.0
165.0
155.0
145.0
135.0
125.0
115.0
105.0
95.085.0
75.065.0
55.045.0
Frequency
160
140
120
100
80
60
40
20
0
Std. Dev = 21.99
Mean = 132.2
N = 1408.00
Figura 3.1. Dou histograme ale frecveelor brute pentru o distribuie foarte mare i una mic.
Cnd numrul indivizilor din cele dou grupuri difer foarte mult apare o problem de
comparaie grafic: deorece disparitatea este foarte mare, se pune problema unei scale care s
le cuprind pe amndou, asfel nct s fie pe deplin perceptibil distribuia mai mic, n
condiiile n care cea mai mare nu depete nite limite rezonabile. n acest caz este foarte
util conversia frecvenelor brute n frecvene relative (procentuale), situaie n care apare ca
i cnd am avea dou distribuii cu un numr egal de cazuri, i anume 100, ariile celor dou
poligoane, forma curbei i dispersia devenind pe deplin comparabile. Transformarea
procentual este extrem de simpl. Iat un exemplu preluat din Guilford (1978, p. 34).
Tabelul 3.2. Frecvenele brute i relative pentru dou grupuri.
Scoruri f1 f2 p1 p2 140-149 8 5,0
130-139 32 20,0
120-129 48 30,0
110-119 1 29 2,0 18,10
100-109 0 18 0,0 11,20
90-99 3 14 5,9 8,8
80-89 5 5 9,8 3,1
70-79 6 5 11,8 3,1
60-69 14 0 27,5 0,0
50-59 7 1 13,7 0,6
40-49 11 21,6
30-39 4 7,8
Suma N1 = 51 N2 = 160 = 100,1 = 99,9
RVBAIETI
65.060.055.050.045.040.035.030.025.020.015.0
20
10
0
Std. Dev = 13.20
Mean = 35.1
N = 54.00
-
34
Pe coloana f1 sunt 51 de cazuri. Prin regula de trei-simpl tim c dac un 1 caz din 51
reprezint x din 100, atunci x are valoarea 1100/51 = 1,96. Acest numr (1,96) devine
factorul de multiplicare pentru toat coloana respectiv (f1), ceea ce va da coloana p1 (p de la
procente). La fel se va proceda pentru coloana f2 (unde factorul de multiplicare este 1100/160
= 0,625) din care se va obine coloana p2.
Datele din tabel se convertesc ntr-o imagine grafic prin care cele dou poligoane ale
frecvenelor devin direct comparabile. Aa cum rezult dup construcia diagramei, este
evident c al doilea grup are valori medii mult mai mari dect primul, suprapunerea dintre ele
find foarte mic; forma amndurora este asimetric, primul fiind deplasat spre stnga, al
doilea spre dreapta; grupul al doilea este mai omogen dect primul (are un singur punct care
concentreaz frecvena maxim, numit mod, n jurul cruia se repartizeaz celelalte valori, n
timp ce primul grup are dou cocoae, adic dou zone de acumulare a cazurilor); frecvena
maxim este apropiat procentual la ambele grupuri. Comparaia evideniaz elocvent faptul
c acestea sunt dou grupuri foarte diferite, care trebuie tratate statistic separat.
3.3. Frecvenele cumulate
Dup ce am stabilit intervalele i le-am ntabelat astfel nct valorile inferioare s fie
amplasate jos i cele superioare sus, dup ce am stabilit limitele inferioare i superioare pentru
fiecare interval i centrul fiecrui interval (atunci cnd avem nevoie s lucrm cu aceste
coloane), urmtoarea coloan (fb) va fi alocat frecvenelor brute. Ele se pot obine fie printr-o
coloan special de bife, n care datele brute se descarc direct n tabel, fie prin procedeul de
lucru cu care am deschis acest capitol: trasarea liniei de baz, cu toate valorile i frecvenele
corespunztoare, apoi stabilirea claselor i a frecvenelor din fiecare clas.
Pe urmtoarea coloan se trec frecvenele brute cumulate (fbc), apoi frecvenele
relative (fr) i frecvenele relative cumulate (frc), dup procedeul exemplificat anterior. Modul
cum apar datele ntabelate pentru bieii din eantionul de etalonare la testul de Recombinare
Verbal, dup modelul descris anterior, poate fi analizat n Tabelul 3.3 de mai jos.
Determinarea frecvenelor cumulate, fie ele brute sau relative, se obine extrem de simplu
printr-o adunare succesiv, ce pleac de jos n susul coloanei respective. Raiunea acestei
operaii este aceea de a ti numrul exact de cazuri care cad sub un anumit punct, adic
punctul care este limita de sus a intervalului (sau procentul, n cazul frecvenelor relative).
-
35
Tabelul 3.3. Valorile frecvenelor brute i relative, simple i cumulate, pentru biei la RV.
Scoruri
clase
Limite
exacte
Punctul
central
Frecvene
brute
Frecvene
brute
cumulate
Frecvene
relative
Frecvene
relative
cumulate
Numr
interval
fb fbc fr frc fb 65-69 64,5-69,5 67 0 54 0 100 0 12 60-64 59,5-64,5 62 4 54 7,4 100 248 11
55-59 54,5-59,5 57 3 50 5,6 92,6 171 10
50-54 49,5-54,5 52 4 47 7,4 87 208 9
45-49 44,5-49,5 47 2 43 3,7 79,6 94 8 40-44 39,5-44,5 42 2 41 3,7 75,9 84 7 35-39 34,5-39,5 37 6 39 11,1 72,2 222 6 30-34 29,5-34,5 32 11 33 20,4 61,1 352 5 25-29 24,5-29,5 27 8 22 14,8 40,7 216 4 20-24 19,5-24,5 22 8 14 14,8 25,9 176 3 15-19 14,5-19,5 17 5 6 9,3 11,1 85 2 10-14 9,5-14,5 12 1 1 1,8 1,8 12 1
N=54 =100 =1