Statistica Aplicata in Psihologie PDF

182
1 SERIA PSIHOLOGIE AUREL ION CLINCIU S T A T I S T I C Ă A P L I C A T Ă Î N P S I H O L O G I E Editura Universităţii Transilvania din Braşov 2013

Transcript of Statistica Aplicata in Psihologie PDF

1 SERIA PSIHOLOGIE AUREL ION CLINCIU S T A T I S T I C A P L I C A T N P S I H O L O G I E Editura Universitii Transilvania din Braov 2013 2 3 C u p r i n s Cuvnt nainte ................................................................................................................. 7 Capitolul 1. Introducere 1.1. Scurt istoric al statisticii .................................................................................... 10 1.2. Obiectivele statisticii . 12 1.3. Cteva concepte cheie ale demersului statistic ................................................. 13 1.4. Exerciii i aplicaii practice .............................................................................. 17 Capitolul 2. Msurarea. Organizarea coleciei de date 2.1. Msurarea n tiinele socio-umane ................................................................... 19 2.2. Proprieti ale scalelor ....................................................................................... 20 2.2.1. Magnitudinea ........................................................................................ 20 2.2.2. Intervale egale ....................................................................................... 20 2.2.3. Zero absolut ........................................................................................... 21 2.3. Tipuri de scale ................................................................................................... 21 2.3.1. Scalele nominale ................................................................................... 21 2.3.2. Scalele ordinale ..................................................................................... 22 2.3.3. Scalele de interval ............................................................................... 23 2.3.4. Scalele de raport ................................................................................ 24 2.4. Organizarea datelor brute .................................................................................. 25 2.5. Exerciii i aplicaii practice .............................................................................. 26 2.6. Quiz ................................................................................................................... 27 Capitolul 3. Distribuii i frecvene 3.1. Ordonarea i gruparea datelor ........................................................................... 28 3.1.1. Limitele de grupare ............................................................................... 31 3.1.2. Centrele intervalelor ............................................................................. 31 3.2. Histograma i poligonul frecvenelor ................................................................ 31 3.3. Frecvenele cumulate ......................................................................................... 34 3.4. Histograma i poligonul frecvenelor cumulate ................................................ 35 3.5. Criterii de evaluare vizual a formei distribuiilor ............................................ 37 3.6. Exerciii i aplicaii practice .............................................................................. 39 4 Capitolul 4. Indicatori ai tendinei centrale 4.1. Media aritmetic ................................................................................................ 40 4.2. Mediana ............................................................................................................. 44 4.3. Modul ............................................................................................................... 47 4.4. Comparaie ntre medie, median i mod n funcie de distribuie .................... 48 4.5. Cteva concluzii relative la indicatorii distribuiei univariate .......................... 50 4.6. Exerciii i aplicaii practice .............................................................................. 51 4.7. Quiz ................................................................................................................... 52 Capitolul 5. Msuri ale variabilitii 5.1. Amplitudinea mprtierii ................................................................................. 56 5.2. Abaterea intercuartilic ..................................................................................... 57 5.3. Abaterea medie absolut ................................................................................... 59 5.4. Abaterea standard i variana/ dispersia ............................................................ 60 5.4.1. Semnificaia abaterii standard .............................................................. 63 5.5. Coeficientul de variaie ..................................................................................... 64 5.6. Indicatori ai formei distribuiei ......................................................................... 65 5.6.1. Coeficientul de simetrie (skewness) i boltirea (kurtosis) ..................... 65 5.7. Exerciii i aplicaii practice .............................................................................. 66 Capitolul 6. Inferena statistic 6.1. Introducere ........................................................................................................ 68 6.2. nelesul conceptului de semnificaie statistic ................................................. 69 6.3. Eroarea standard a unei medii de selecie i semnificaia ei ............................. 70 6.4. Eroarea standard a unui cuantum procentual i semnificaia ei ........................ 71 6.5. Sarcini i probleme de comparaie. Ipoteza de nul ............................................ 71 6.6. Eantioane necorelate de volum mare. Ipoteza de nul ...................................... 72 6.7. Eantioane de volumm mare, corelate ............................................................... 75 6.8. Semnificaia diferenei dintre dou cuantumuri procentuale ............................ 76 6.9. Teste de semnificaie pentru selecii de volum mic .......................................... 76 6.10. Semnificaia diferenei mediilor a dou eantioane de volum mic corelate .... 77 6.11. Semnificaia diferenei mediilor a dou eantioane de volum mic necorelate 80 6.12. Exerciii i aplicaii practice ............................................................................ 82 5 Capitolul 7. Studiul asocierii dintre variabile prin corelaie 7.1. Introducere ........................................................................................................ 85 7.2. Calculul coeficientului de corelaie ................................................................... 88 7.2.1. Interpretarea orientativ a coeficientului de corelaie ......................... 90 7.3. Coeficientul de corelaie a rangurilor ................................................................ 92 7.4. Limitele de ncredere ale unui coeficient de corelaie ....................................... 94 7.5. Interpretarea unui coeficient de corelaie ....................................................... 94 7.6. Interpretarea varianei unui coeficient de corelaie prin coeficientul de determinare ............................................................................................................... 95 7.7. Ali coeficieni de corelaie ............................................................................... 97 7.7.1. Coeficienii de corelaie biseriali i triseriali ....................................... 97 7.7.2. Ali coeficieni de corelaie ................................................................... 98 7.8. Utilizrile coeficientului de corelaie ................................................................ 100 7.9. Exerciii i aplicaii practice ............................................................................ 101 7.10. Quiz ................................................................................................................. 103 Capitolul 8. Utilizarea predictiv a asocierii dintre variabile Regresia liniar simpl i multipl 8.1. Introducere ........................................................................................................ 104 8.2. Predicia determinist i probabilist ................................................................ 106 8.3. Regresia bivariat .............................................................................................. 107 8.3.1. Regresie versus corelaie ...................................................................... 112 8.4. Regresia liniar multipl (multivariat) ............................................................ 112 8.4.1. Probleme speciale implicate n regresie ............................................... 114 8.4.2. Validarea modelului regresiv ............................................................... 116 8.4.3. Glosar de termeni cheie ai regresiei liniare ......................................... 116 8.5. Exerciii i aplicaii practice .............................................................................. 117 Capitolul 9. Testare ipotezelor prin tehnica chi-ptrat 9.1. Teste nonparametrice, distribuii binomiale i multinomiale ............................ 119 9.2. Termeni cheie i definiii implicate n testul chi-ptrat ..................................... 120 9.3. Condiii i restricii pentru efectuarea lui chi-ptrat .......................................... 122 9.4. Utiliarea practic a testului chi-ptrat ............................................................... 122 6 9.5. Exemple de aplicare practic a testului chi-ptrat de potrivire i de asociere ... 124 9.6. Mrimea efectului pentru testul chi-ptrat al asocierii dintre variabile ............. 130 9.7. Exerciii i aplicaii practice .............................................................................. 131 Capitolul 10. Metode nonparametrice de testare a ipotezelor statistice. 10.1. Teste de semnificaie parametrice i neparametrice ......................................... 133 10.2. Testul U Mann-Whitney pentru eantioane independente .............................. 134 10.3. Exerciii i aplicaii practice ............................................................................ 137 10.4. Testul semnului T al lui Wilcoxon pentru eantioane corelate ... 138 10.5. Exerciii i aplicaii practice ............................................................................ 141 10.6. ANOVA pe o cale prin testul Kruskal-Wallis ................................................. 142 10.7. Exerciii i aplicaii practice ............................................................................ 145 10.8. Testul rsngurilor Friedman pentru msurtori repetate ................................... 146 10.9. Exerciii i aplicaii practice ............................................................................ 147 Test pentru verificarea de sintez . 149 Bibliografie ................................................................................................................. 152 Anexe cu utiliti statistice . 155 Glosar de simboluri i formule de calcul ..................................................................... 175 Rspunsuri la exerciiile i aplicaiile practice propuse . 182 7 Cuvnt nainte Prezena Statisticii ca materie obligatorie la tiinele socio-umane, n spe la specializarea Psihologie, este justificat printre altele de faptul c eafodarea acesteia ca tiin a depins n mod esenial de ncorporarea experimentului - i implicit a msurtorii - ca metod de baz n constituirea corpului su de cunotine i legi. Pe de alt parte, naterea psihologiei aplicate i extinderea sa pervaziv spre toate domeniile socialului nu ar fi fost posibil fr apelul la cuantificare, msurtoare i cifr. Deci att psihologul practician, care colecteaz, stocheaz i prelucreaz n mod constant date cantitative, ct i cel din spaiul academic, care trebuie s fie la zi cu cercetarea tiinific din domeniul su, ca i din cele conexe (medicin, biologie, sociologie au tiinele educaiei), trebuie s aib cel puin o iniiere, dac nu chiar o formare solid n domeniul Statisticii, fr de care nu se poate pstra contactul cu progresele tiinei. Apare astfel ca inexplicabil rezistena activ i rezerva aproape ostil a studentului de la tiinele socio-umane fa de Statistic, care vede adesea n acest obiect de studiu ceva ce ar contraveni chiar dimensiunii umaniste a tiinei n care el se iniiaz. Exist multe explicaii plauzibile pentru faptul semnalat. Una dintre cele mai plauzibile ar fi aceea c studenii de la Psihologie, Pedagogie, Sociologie sau Asisten social au o formaie iniial umanist, cu un grad de elaborare i consolidare mai sczute a conceptelor i deprinderilor intelectuale de tip matematic. Acest fapt poate produce din start o rezerv fa de abordrile de tip cantitativ. Pe de alt parte, progresele incredibile din ultimele decenii n domeniile metodologiei i al prelucrrii datelor fac ca centrarea pe metodele statistice elementare s nu mai fie deloc suficient pentru a ine pasul cu evoluiile din domeniu, ceea ce transform n mod obligatoriu Statistica ntr-un obiect de studiu al nvrii permanente. n cel de al treilea rnd extinderea progresiv, uneori exploziv, a arsenalului de metode statistice genereaz tot mai mari dificulti de mai pstra unitatea intern i perspectiva coerent asupra corpului su de cunotine. n cazul n care se nzuiete spre acest lucru, alocarea permanent de resurs cognitiv pentru a menine n priz domeniul statistic devine o condiie intrinsec a progresului i evoluiei n carier. Tendina la entropie a informaiei ce intr n sistemul cognitiv uman, adic la uniformizare i la tergere a diferenelor specifice, ca urmare a marii varieti de tehnici i procedee ce apar fr ncetare n cadrul acestei tiine att de dinamice i evolutive, poate genera sentimentul c Statistica este unul dintre principalii contributori la imperialismul metodologic din tiin. 8 Dincolo de cauzele enumerate exist cu siguran i elemente contextuale sau conjuncturale care pot explica rezistena activ a studentului de la tiinele sociale fa de Statistic, explicabil i prin stilul sau maniera de predare, prin calitatea cursurilor editate i a aplicaiilor propuse, prin gradul de utilizare a metodelor i tehnicilor moderne de predare-nvare-evaluare, prin numrul de ore de studiu alocate acesteia de programa universitar etc. Pe de alt parte, exist o mulime de semnale care indic faptul c starea de fapt analizat anterior poate fi depit cu bine de majoritatea studenilor. Astfel, n Romnia ultimului deceniu au aprut cel puin cinci lucrri de referin n domeniul Statisticii tiinelor sociale (pentru a face referin doar la Rotariu i colaboratorii, la Clocotici i Stan, la Sava, Labr i Popa), la care se adaug multitudinea de lucrri de iniiere n SPSS din literatura romna i din cea strin. Extinderea progresiv a numrului de aplicaii incluse n pachetele de programe computerizare pentru tratarea datelor (SPSS, SAS, NCSS etc.) a fcut ca accesarea i derularea unor foarte complicate i avansate tehnici statistice s depind efectiv doar de o apsare de buton. Aceast facilitate i accesibilitate extraordinare nu elimin ns n nici un fel problema crerii infrastructurii conceptuale i a deprinderilor matematice, fr de care tehnica rmne mut n faa neiniiatului. Lucrarea de fa este n fapt un curs de iniiere n Statistica psihologic. Prin elaborarea sa ne-am propus s prezentm conceptele i procedeele de baz ale statisticii descriptive i infereniale, univariate i bivariate, ntr-o manier prietenoas, inteligibil i cu bune valene formative. Preocuparea noastr de baz a constat n selectarea informaiei utile, lsnd n planul secundar prezentarea ntemeierii matematice a tehnicilor statistice prezentate. De asemenea, legtura cu programele computerizate de prelucrare a datelor, acolo unde s-a produs o revoluie nevzut la care suntem cu toii martori, este doar vag i inconstant sugerat. Aceasta deoarece considerm c prelucrarea informatizat a datelor trebuie s se fac ulterior n mod distinct, dup ce s-a construit eafodajul minimal de concepte i tehnici necesare utilizrii programelor computerizate. Cartea de fa nu este una extins ca volum, cele 10 capitole care o compun putnd fi ntlnite, cu mici variaiuni, n toate lucrrile actuale de iniiere n Statistic. Astfel, dup primele trei capitole introductive, relative la istoricul, obiectivele i conceptele de baz ale domeniului statistic, despre msurare, tipuri de scale, distribuii i frecvene, sunt prezentai indicatorii tendinei centrale, determinarea indicilor de mprtiere a datelor i ai celor relativi la forma distribuiei. Capitolul al aptelea trateaz inferena statistic i testarea ipotezelor bazate pe diferene ale mediilor, el continundu-se n mod firesc cu un capitol care prezint testarea ipotezelor relative la asocierea variabilelor prin corelaie i cu un altul despre regresia 9 bivariat. Acest capitol face doar trimiteri la regresia multivariat, rmnnd cantonat preponderent n zona regresiei simple, deoarece regresia multipl depete nivelul iniierii statistice, fiind greu de prezentat fr cunotine avansate i fr apelul la programe puternice de tratare a datelor. Ultimele dou capitole trimit la testarea ipotezelor statistice prin teste neparametrice, aplicabile datelor nominale i categoriale, cum sunt testele chi-ptrat, Man-Whitney, Wilcoxon, Kruskal-Wallis sau Friedman. Aa cum se poate cu uurin observa, lucrarea a acordat un spaiu amplu testrii ipotezelor statistice, fiind prezentat aproape toat gama procedeelor tehnice destinate acestui scop. Nu am inclus aici i tehnicile analizei de varian ANOVA care, prin multitudine i complexitate, fac obligatoriu apel la un program automat de prelucrare computerizat a datelor, fiind mai potrivit s fie incluse n volumul destinat statisticilor multivariate. Menionm de asemenea c am preferat s prezentm toate metodele de testare a ipotezelor incluse n acest volum fr a face n nici un fel apel la resursele SPSS cci acest lucru face obiectul unui curs special cu aceast misiune. Fiind destinat nceptorului, lucrarea de fa a ncercat s in cont maximal de principiul accesibilitii, prin simplificarea discursului teoretic i prin reliefarea constant mai ales a informaiei utile. Pe de alt parte, o lege a nvrii leag temeinicia i calitatea acesteia de calitatea i profunzimea interaciunii cu materialul de nvat. Pentru a facilita centrarea pe aspectele aplicative toate capitolele, inclusiv cel introductiv, sunt nsoite de exerciii i aplicaii practice, de teste rapide de verificare a cunotinelor (quiz, pstrnd terminologia englez) i de un test final de sintez i evaluare de ansamblu, destinat autoverificrii stadiului atins n nvarea statisticilor introductive. Pentru majoritatea acestor aplicaii practice s-au oferit soluiile problemelor propuse, nsoite deseori de explicaii adiionale care s contribuie la mai buna lor nelegere. Astfel, o seciune final a lucrrii ofer soluia rezolvrii corecte a majoritii problemelor prezentate cu scop de autoevaluare la sfritul fiecrei uniti de curs. Lucrarea de fa i are continuarea ntr-un al doilea volum, destinat deprinderii i perfecionrii n utilizarea procedurilor computerizate de prelucrare a datelor cu SPSS, dar i de un al treilea volum, destinat prezentrii statisticilor avansate (Statistici multivariate pentru psihologie). Ordinea apariiei lor editoriale nu este cea din secvena prezentat anterior, acest volum introductiv fiind eleaborat ultimul, complexitatea i mai ales miza lui pedagogic deosebit genernd cele mai mari probleme de elaborare i editare. n felul acesta se poate vorbi de o trilogie statistic, ce se constituie ntr-un ghid complex de monitorizare a formrii i perfecionrii n domeniul abordrilor de tip cantitativ. Feedback-ul primit din partea principalului sau utilizator, studentul, va contribui la mbuntirea calitii acestui volum, motiv pentru care sugestiile utilizatorilor sunt ateptate cu real i legitim interes. 10 CAPITOLUL 1 INTRODUCERE 1.1. Scurt istoric al statisticii Statistica nu s-a nscut n cmpul psihologiei tiinifice, aceasta prelund i ncorpornd procedeele ei pentru a putea depi posibilitile limitate oferite de cea mai rspndit dintre metodele sale, observaia, care plaseaz psihologul () n domeniul relativului empiric, adic n lumea fenomenelor, a caracteristicilor i a proprietilor care sunt vag conturate i neasamblate n sisteme de cunotine riguros nchegate (Clocotici i Stan, 2000, p. 11). Destinul nsui al tiinei nou aprute, psihologia, a depins de ruperea acesteia din cmpul filosofiei i translarea spre tiinele pozitive, care i-au ncorporat experimentul ca metod predilect de cercetare a relaiei cauz efect. Intrarea ei n laborator, separarea variabilelor dependente i independente presupunea cu necesitate metode i tehnici statistice de prelucrare a datelor obinute prin msurtoare. Impactul acestei apropieri reciproce avea s fie benefic reciproc, o serie de mari psihologi (Galton, Spearman, Pearson, Guilford sau Cattell) avnd contribuii remarcabile, care au schimbat faa statisticii. Aceasta deoarece domeniul faptelor psihice este mai complex dect fizica cuantic, biologia celular sau astronomia, prin aceea c el este marcat de multicauzalitate, sau de alte aspecte caracteristice specifice ale cauzalitii. Muli autori leag apariia statisticii de probleme pragmatice, preponderent economice sau administrative, cum ar fi aa-numitele tabele de mortalitate ale lui Graunt (1661), prin care ptura negustoreasc din Anglia ncerca s pun bazele unui sistem de asigurri pe via. Graunt este considerat i printele demografiei, pe care a fundamentat-o prin aa-numita aritmetic politic, nscut n 1662 (termenul aparine lui Petty). Analiza datelor despre evenimentele demografice, n spe despre decese, arta o neateptat constan i regularitate, ceea ce sugereaz posibilitatea gsirii unor legi n domeniul vieii sociale, de consisten apropiat celor din tiinele naturii (Rotariu, 1999, p. 16). Curiozitatea tiinific produs de o asemenea descoperire remarcabil va fi generatoarea unei activiti sistematice de culegere, stocare, prelucrare i interpretare a unor informaii numerice despre importante domenii ale statului, corespondentul centrelor 11 naionale de statistic din timpurile moderne. De altfel, chiar i etimologic statistic pleac de la status, care poate fi interpretat att ca stare de fapt, ct i ca stat, deci statistica ar putea fi considerat o tiin de stat. Aceasta corespunde i etimologiei propuse de cel considerat a fi introdus termenul de statistic, Achenwall. Corespondena susinut dintre Pascal i Fermat (1654) a stat la baza fundamentrii unei teorii matematice asupra verosimilitii, n timp ce cooperarea mai tardiv dintre Gauss i Laplace (1809-1812) s-a concretizat n conceptul de distribuie normal (clopotul lui Gauss). Dei problemele demografice i economice au fost primordiale n conturarea obiectului statisticii, contactul psihologiei cu aceast tiin avea s fie fundamental pentru destinul ei. Iat cteva aspecte mai semnificative: - Cel care a introdus psihologia n registrele de stare civil, dup inspirata expresie a lui Pavelcu, n anii 1730 i 1732, Christian Wolff (prin lucrrile Psihologia empirica i Psihologia rationalis) anticipa chiar de atunci necesitatea existenei unei subramuri matematice a acesteia, pe care el a numit-o, inspirat, psihometrie. Dei termenul va cpta o cu totul alt semnificaie la cei care au studiat fenomenele paranormale n Anglia secolului al XIX-lea (care au i creat o Societate Regal de Psihometrie), sensul iniial va fi cel care se va impune, prin ncercrile lui Galton i Binet de a dezvolta domeniile aplicative ale psihologiei, indestructibil legate de un aparat matematic de tip statistic. - Este meritul unui astronom belgian, Qutelet (1796-1874) de a fi extins aplicarea unor legi ale statisticii, cum ar fi legea distribuiei normale sau binomial, derivat din luarea n considerarea distribuiilor probabiliste, spre alte domenii dect cele sociale, aici incluzndu-se i cele psihologice. - Galton, iniiatorul colii psihometrice engleze (al crei punct forte va fi chiar ideea de msurtoare i cuantificare a faptului psihic) a creat metode statistice de abordare a legilor ereditii (metoda gemenilor i a genealogiilor, de exemplu), avndu-i ca succesori pe Pearson, teoreticianul metodei corelaiei prin metoda produselor (1896), pe Spearman, creatorul metodei corelaiei prin metoda rangurilor i ntemeietorul analizei factoriale (1904). Continuatorii acestora (Fisher, Burt i Vernon) vor merge mai departe pe liniile de for ale colii engleze de statistic, considerat principala contributoare n conturarea domeniului acesteia. n domeniul personalitii, H.J. Eysenck i R.B. Cattell (ultimul a imigrat n America dup perioada de formare n Anglia) vor fi exponeni strlucii ai metodelor statistice i cu precdere ai analizei factoriale. 12 - Al doilea mare contributor a fost coala german, prin Conring (1606-1682), Achenwall (1719-1772) i, bineneles, Gauss (1777-1785). - n America muli matematicieni i psihologi au continuat n mod natural coala englez, prin Thurstone, Hotelling, Guilford, Lord, Novick, Fruchter sau Cronbach. - n psihologie, statistica a evideniat o evoluie de la distribuii spre corelaie, analiza factorial i de cluster, teoria rspunsurilor la itemi sau a generalizabilitii, pe lng analiza varianei simple aprnd tehnici de analiz multivariat (ANOVA, MANOVA. ANCOVA, MANCOVA), n timp ce pentru psihologia social i sociologie, pe lng problema analizei relaiilor dintre variabile, s-au impus tot mai mult problemele legate de selecie, eantionare i reprezentativitate (statistica inferenial). 1.2. Obiectivele statisticii De la o tiin global a statului (vezi Rotariu et al., 1999, pp. 15-22), care i propunea s ofere conductorilor instrumente de aciune eficace, rezultate din investigarea principalelor aspecte ce puteau fi nregistrate, pstrate, prelucrate i interpretate, statistica s-a extins spre planurile psihologic, biologic, fizic, chimic, economic, politic, agricultur, devenind un mod de gndire al viitorului (Vod). S-au nscut o multitudine de ramuri i de abordri speciale, bazate pe proceduri ce se adapteaz la specificul domeniului investigat, desprinse toate din trunchiul aceleeai tiine, statistica general. Aceast tiin cuprinde un corp sistematic de cunotine i de metode statistice, care au ca obiect colectarea, prelucrarea i interpretarea rezultatelor ce provin de la populaii i indivizi statistici. Acetia pot fi oameni, nsuiri, plante, gene, porumbei, maimue, peti, culturi, chiar i atomi sau electroni, pentru toate acestea legile statisticii opernd ntr-o manier similar. Datele statisticii provin fie de la aceleai populaii, care se comport diferit ca urmare a faptului c asupra lor acioneaz o multitudine de cauze, fie de la acelai individ, entitate, de-a lungul diferitelor sale manifestri pe scara timpului. Dei nu este o ramur a matematicii (nu pleac de la axiome, pentru a deriva prin demonstraii sau teoreme enunuri sistematice), statistica ofer un larg cmp de aplicaii matematicii, n primul rnd datorit faptului c ambele lucreaz cu numere i reguli de calcul i, de la un anumit nivel, relaiilor dintre entitile statistice li se substituie raporturi matematice abstracte, tipice entitilor ideale. Aceasta face foarte dificil trasarea unei linii de demarcaie dintre matematic i statistic. Dei nu are un referenial empiric anume (ea propundu-i s stabileasc regula general aplicabil, indiferent de domeniul realitii de care se ocup) statistica coboar totui din 13 planul general abstract (matematica rmnnd cantonat n turnul de filde al propriilor sale abstracii), avnd un caracter aplicativ mult mai explicit, deoarece i propune s rezolve probleme concrete. Mai mult, demersul statistic nu este posibil fr materia prim a datelor colectate anterior, ntr- o direcie n care prelucrarea i interpretarea datelor este doar o parte a secvenei, adic cea mai tehnic i mai specializat. S nu uitm totui c momentul creator al cercetrii tiinifice, scnteia sau impulsul iniial sunt date de conturarea ipotezei specifice. Apoi, sesizarea semnificaiei datelor prelucrate nu este posibil fr o solid cultur a domeniului n care sunt aplicate metodele statistice. Psihologul, pedagogul, sociologul sau economistul sunt cei care valorific rezultatele tehnice pe care le ofer statistica sau statisticienii. 1.3. Cteva concepte cheie ale demersului statistic Termenul de populaie statistic, alctuit din indivizi statistici, care pot fi persoane, fapte, entiti fizice etc. a fost deja definit anterior. El nu este sinonim cu cel de populaie din limbajul comun. Cum tot ceea ce exist, n plan fizic sau ideal, are o mulime de determinri i de atribute ce nu pot fi cuprinse i analizate simultan, separat sau exhaustiv, sunt selectate doar o parte dintre acestea, limitarea fiind impus i de mijloacele de care dispunem la un moment dat. Asfel, indivizii umani se pot diferenia n funcie de vrst, sex, mediu de provenien, nivelul propriu de instrucie sau al prinilor, status cultural, nivel economic, religie, ras, etnie etc. Fiecare dintre aceste criterii care opereaz diferene se numete variabil, deoarece n absena lor oamenii ar fi identici. Unele variabile sunt discontinue (discrete), cum ar fi sexul (masculin, feminin), mediul (urban, suburban, rural); altele sunt continue (nlimea, greutatea, vrsta). Mulimea valorilor pe care le poate lua o caracteristic particular constituie distribuia variabilei respective. Fiecare populaie are propria sa distribuie pentru fiecare variabil. De exemplu tim c la natere raportul dintre biei i fete este de aproximativ de 52 la 48 de procente, pentru ca acesta s se inverseze dup primii ani de via din cauza vulnerabilitii, i implicit a mortalitii mai mari n rndul sexului masculin. La vrsta a treia acest raport se dezechilibreaz i mai mult, femeile avnd o speran de via cu aproape 10 ani mai mare dect brbaii. Deci aceeai populaie are, n trei momente diferite ale existenei sale, trei distribuii diferite, n funcie de aceeai caracteristic, apartenena de gen. 14 Parametrii sunt valorile fixe ce exist la un moment dat pentru o populaie, luat n ansamblul ei, n raport cu o variabil. Ideea de variabil este strns asociat cu aceea de cuantificare, msurtoare, ca mijloc de determinare a variabilitii. Orice msurtoare presupune, la rndul ei, o scal de msurare. Toate aceste elemente: individ, populaie statistic, variabil, distribuie definesc domeniul statisticii descriptive, alctuit din corpul de metode prin care pot fi caracterizate faptele i fenomenele studiate. Dar statistica a tins de la nceputuri spre numerele mari, spre populaiile extinse, a cror cuprindere i descriere detaliate sunt adesea imposibile, din cauza costurilor pe care le-ar antrena. Chiar i atunci cnd acest lucru ar fi tehnic posibil, investigaiile i prelucrrile ar presupune perioade mari de timp, care este el nsui o mare surs de variabilitate, antrennd modificri nsemnate ale multor variabile. Soluia gsit este statistica inferenial, un ansamblu de tehnici i de metode (de eantionare, de selecie etc.), prin care estimrile fcute asupra unui numr mai mic de entiti ce compun populaia de ansamblu sunt extrapolate asupra acestei populaii, n limite de ncredere rezonabile. Acest domeniu al statisticii este extrem de utilizat de sociologie (metoda anchetei pe baz de chestionar sau a sondajelor de opinie fiind doar dou exemple). Dac vom lua n considerare faptul c instrumentul de baz al psihodiagnozei, testul psihologic, este etalonat pe populaii reprezentative zonal sau naional, vom vedea c statistica inferenial are importante utilizri i n psihologie. Statistica inferenial presupune alte cteva concepte care o circumscriu. Eantionul este o parte, redus ca numr, din populaia statistic de baz care, atunci cnd este extras corect, permite estimaia parametrilor acestei populaii, adic o aproximare a valorii reale a acestora n limite de ncredere ce pot fi determinate. O ndelung practic social a dus la dezvoltarea cu precdere a statisticii infereniale, i aceasta din mai multe motive: - Costurile incomparabil mai mici (s comparm costurile unui referendum naional cu ale unui sondaj de opinie desfurat pe un eantion reprezentativ naional). - Utilizarea ei extensiv, pentru un numr tot mai mare de beneficiari: ageni economici, organizaii, partide, guverne etc., n scopuri diagnostice, dar i prognostice, care fundamenteaz decizii de o mare importan social. - Rafinarea progresiv a tehnicilor, ceea ce a fcut ca marja de eroare s fie tot mai mic, astfel nct predicia pe eantioane mici s poat fi extrapolat la populaii statistice foarte mari. Statistica din tiinele socio-umane are ca i concept primar pe acela de variabilitate a datelor, care poate fi interindividual (cel mai adesea), dar i intraindividual. Acesta angajeaz alte concepte, cum ar fi cel de surs de variaie (previzibil sau imprevizibil, 15 sistematic sau aleatoare, determinabil sau nedeterminabil), sau cel de msurare. Dac sursele previzibile sunt dinainte tiute i circumscrise din start de investigaia n cauz (a se vedea controlul variabilelor de la metoda experimental, variabilele test, subiect i examinator, la metoda testului), exist i o multitudine de surse fortuite de variaie (variabilele externe necontrolate, n primul exemplu, i variabila situaional, n cel de al doilea). Analiza statistic ncearc s deceleze ponderea fiecrei surse de variaie. Deoarece datele numerice de natur statistic reprezint rezultatul amalgamrii unui mare numr de cauze, este posibil ca statistica s fie continuarea fireasc a experimentului, pe care tinde s l nlocuiasc (Yule i Kendall, 1969, p. 16), ntruct ea va determina care sunt cauzele cele mai importante i care sunt rezultatele observrii ce pot fi atribuite fiecrei categorii de cauze. Msurarea este o operaie prin care se atribuie numere unor aspecte ale obiectelor sau evenimentelor, potrivit unei reguli (Smith, S.S., 1974). Dup cum arta i Piaget, problema metriei este una fundamental n psihologie, deoarece puine din domeniile sau fenomenele sale se preteaz, n sens strict, la cuantificare. Aceasta poate fi chiar una dintre cauzele (dac nu cumva i cea mai important) pentru care psihologia are un trecut lung, dar o istorie, c tiin, scurt (Ebbinghaus). Msurarea aduce cu sine problema scalei de msur, care trebuie s fie corect, constant (produce date identice pentru fenomene identice, n condiii de msurare identice), exhaustiv (ea poate msura toate entitile crora le este destinat) i reciproc exclusiv (n urma msurtorii, fiecare entitate capt o valoare i numai una). Principalele tipuri de scale cunoscute (nominal, ordinal, de interval i de raport) evideniaz proprieti care dau conotaii i aplicaii specifice msurtorilor ce rezult din fiecare tip, astfel nct cele mai complexe nglobeaz caracteristicile celor mai simple, dar aducnd elemente noi, difereniatoare. Caracteristicile variabilei pot fi calitative i cantitative, continue i discontinue. Distribuiile obinute aduc n discuie problema frecvenelor (absolute i relative, simple sau cumulate), dar i a modalitilor de a le reprezenta grafic: poligonul frecvenelor, histograme, curbe, grafice, scatter etc. O bun parte a statisticii descriptive urmrete definirea celor mai importante tendine centrale, adic media, mediana i modul, dar i a tendinelor extreme, cum ar fi amplitudinea mprtierii, abaterea medie, abaterea semiinterquartil, abaterea standard sau dispersia, variana. Distribuia n sine poate fi judecat din punctul de vedere al formei (simetrie sau boltire, adic skewness i kurtosis, n englez). Toate aceste noiuni, unele dintre ele derivate din teoria probabilitilor, prin care sunt fundamentate matematic valorile tipice ale 16 variabileleor, dar i repartiiile de diverse tipuri, contureaz mai exact domeniul statisticii descriptive. Statistica inferenial, pe lng conceptele deja amintite (populaie, eantion eantionare, estimare), include i testarea ipotezelor statistice. n capitole distincte, statistica trateaz corelaia, asocierea datelor calitative i cantitative, analiza dispersional, unifactorial sau bifactorial, analiza factorial i analiza de cluster. Cursul de fa este unul de iniiere, n consecin el va acoperi doar o parte dintre problemele enunate, adic elementele care fundamenteaz cunoaterea statistic n scopul aplicaiilor ei la situaii uzuale, comune. Pentru atingerea acestui obiectiv avem n vedere dou aspecte importante: comprimarea la minimum a prii de ntemeiere matematic a subiectelor tratate, problem care rmne n grija teoreticienilor statisticii, adic a celor ce contureaz dimensiunea savant, tiinific a domeniului; permanenta preocupare de a oferi situaii sau aplicaii concrete, pentru a evidenia puterea real a procedeelor de lucru prezentate. n fond, acest curs se adreseaz n principal studenilor de la psihologie i pedagogie, cel mai adesea avnd o dominant umanist a formaiei i pregtirii lor. Intenia noastr a fost aceea de a nu-i inhiba cu demonstraii abstracte, de factur matematic, ci de a-i familiariza cu cele mai des ntlnite aplicaii statistice, prin care s fie capabili s-i valorifice cercetrile proprii. Cursul are de asemenea n vedere practicianul din aceste domenii, cel care, dup ce acumuleaz o cantitate de date brute prin teste sau chestionare, tinde s le valorifice sau s le gestioneze mai bine. Aplicaiile speciale sau savante ale statisticii presupun, pe lng aceast iniiere, stagii de pregtire mai avansate, susinute de programe computerizate (SPSS, SAS sau NCSS). Extraordinara lor putere de lucru, precizia, elegana, multitudinea opiunilor i alte faciliti de acerst gen par a transforma o ntreag evoluie a domeniului (i procedee de lucru altdat extensiv utilizate) n istorie. Susinem ns opinia potrivit creia sensul acestor aplicaii computerizate nu poate fi dedus fr o cultur a domeniului, fr un stagiu prealabil de iniiere dup procedeele i cu mijloacele clasice (creion, caiet de matematic, rigl, minicalculator cu panou de lucru statistic), prin care vom deslui cele mai importante aplicaii statistice n situaiile curente. Saltul spre puternicele programe computerizate va fi astfel mult facilitat, deoarece vom ti ce s cerem computerului, la ce tip de prelucrri s facem apel i ce relevan vor avea datele pe care acesta ni le ofer cu generozitate. 17 1.4. Exerciii i aplicaii practice 1. V intereseaz problema abandonului colar la ciclul gimnazial din Romnia de azi. 1.1. Precizai care este populaia studiului i care eantionul. 1.2. Identificai cteva dintre variabilele de interes pentru studiul desfurat. 1.3. Evideniai cteva dintre variabilele categoriale i real numerice implicate n acest studiu. 2. Sugerai cum s-ar putea obine obine un eantion complet randomizat (sau aproape complet randomizat) din populaia unui micu orel (5 000 de locuitori). 3. Dac ai folosi cartea de telefon ai putea obine un eantion randomizat pentru acest ora? 4. De ci cai ai avea nevoie pentru a determina cu exactitate cte picioare are un cal? Dar de ci cai ai avea nevoie pentru a determina precis care este greutatea medie a unui cal? Unde avem de-a face cu o variabil i unde cu o constant i care dintre cele dou categorii este mai informativ? 5. Cineva ar putea obiecta c a doua ntrebare de mai sus conine o capcan: caii de vrste foarte mici (sub un an, adic mnjii) aparin i ei speciei cabaline, dar dac i-am include n eantion ei ar putea contribui la scderea semnificativ a mediei greutii cailor ca specie. Apoi, greutatea medie poate diferi de la ras la ras i de aceea determinarea greutii medii a speciei cabaline s-ar putea s nu aib sens. Mai mult, ca i la oameni, caii au oasele mai grele dect iepele i n consecin un indicator sintetic al greutii comune ntregii specii cabaline ar fi irelevant. 5.1. Identificai n exemplul de mai sus variabilele implicate. 5.2. Identificai care sunt datele categoriale i cele real numerice (de msurtoare). 5.3. Precizai i alte variabile de interes pentru greutatea medie a cailor, indicnd tipul acestora. 5.4. Identificai care sunt cazul, variabilele i valorile implicate n exemplul analizat. 6. Dai cte trei exemple n care interesul nostru este: 6.1. De a determina diferena dintre dou sau mai multe grupuri. 6.2. De a determina realaiile sau gradul de asociere dintre aceste variabile. 6.3. De a exemplifica cu cteva date categoriale. 6.4. De a exemplifica cu cteva date de msurtoare. 7. Precizai care este diferena dintre: 7.1. Eantion i populaie. 7.2. Statistici i parametri. 7.3. Eantioane randomizate i eantioane de convenien. 8. Explicai urmtoarele: 8.1. De ce variabilitatea este conceptul de baz al statisticii? 8.2. Ce nelegei prin faptul c genul masculin prezint mai mult variabilitate dect cel feminin n ceea ce privete nlimea, greutatea sau inteligena? 8.3. Din ntrebarea de mai sus rezult c brbaii ca grup sunt neaprat mai nali, mai grei sau mai inteligeni dect femeile? Pe ce v bazai afirmaia? 18 9. Explicai diferenele existente ntre statistica descriptiv i cea inferenial. 10. Facei parte din echipa care studiaz pattern-urile de dezvoltare fizic a populaiei infantile i tinere (0 - 20 de ani) a Romniei de azi. n planificarea studiului dvs. utilizai ct mai multe concepte, termeni (populaie, eantion, variabile etc.) i metode (eantionare) prezentate n capitolul de fa. 11. Definii pe scurt termenii de: date, variabil, eantionare, populaie i inferen statistic. 12. Vom lua n considerare toi studenii de anul nti de la specializarea Psihologie a Facultii de Psihologie i tiinele Educaiei. Dai cteva exemple din care s rezulte c: 12.1. Acetia reprezint populaia. 12.2. Acetia reprezint un eantion dintr-o populaie. 12.3. Cnd l considerm eantion, acesta este unul randomizat sau nealeator? (Explicai opiunea fcut). 13. Rectorul universitii noastre este interesat de repartiia pe judee, pe sexe, pe grupuri etnice i pe categorii de vrst a studenilor admii la aceast universitate, ca i de evoluia lor ca rezultate academice n ultimii 10 ani. 13.1. Care este populaia studiat? 13.2. Care sunt variabilele implicate n acest studiu? 13.3. Avem de-a face cu eantioane aleatorii sau cu unele de convenien? 13.4. Identificai variabilele categoriale i pe cele real numerice prezente n studiul invocat. 14. La un meci de fotbal sunt prezentate la final de partid urmtoarele statistici: - uturi pe poart; - uturi pe spaiul porii; - goluri marcate; - pase de gol; - cartonae galbene i roii primite de fiecare echip; - posesia mingii exprimat n procente pentru fiecare echip; - numrul mediu de metri alergat de fiecare juctor pe parcursul perioadei jucate. 14.1. Care dintre aceste date sunt tipice statisticii descriptive i care celei infereniale? 14.2. Care dintre datele de mai sus sunt real numerice i care categoriale? 14.3. Argumentai care dintre datele de mai sus prezint cea mai mare variabilitate. 14.4. Care dintre aceste date provin de la variabile continue i care de la variabile discontinue? 14.5. Ierarhizai i explicai care dintre primele patru variabile prezint mai mult variabilitate. 19 CAPITOLUL 2 MSURAREA ORGANIZAREA COLECIEI DE DATE 2.1. Msurarea n tiinele socioumane Cele mai multe aspecte pe care vrem s le msurm n tiinele socioumane (psihologie, pedagogie, sociologie) se prezint adesea sub form numeric, sau sunt aduse ntr-o asemenea form printr-o operaie de codare. Psihologul msoar adesea date fizice (stimuli vizuali, auditivi, tactili, kinestezici etc.), prin manifestrile lor caracteristice (intensitate, durat, frecven, greutate), culese de aparate special elaborate, ce dispun de propriile uniti metrice. El msoar n egal msur efectul stimulilor asupra fiinei vii i atunci determin timpul de reacie, numrul rspunsurilor corecte, erorile. Msura poate ajunge la niveluri de rafinare i complexitate foarte ridicate: msurm inteligena prin componentele acesteia determinate prin intermediul unei teorii; msurm memoria prin parametri de volum, fidelitate, numr de repetiii necesare ntipririi; msurm factorii de personalitate de ordin primar sau secundar, dedui din complexe construcii teoretice; msurm atitudini sau reacii interpersonale (simpatie-antipatie, atracie-respingere). Unele caracteristici sunt foarte uor de degajat (msurtorile fizice), altele sunt deductibile prin construcii sau montaje experimentale ingenioase, iar altele se fundamenteaz pe soluii reieite din teorii tiinifice. De multe ori datele calitative culese prin observaie sau experiment sunt transformate n date cantitative printr-o gril de observaie, care ofer cadrul de referin n clasificarea datelor. Acest instrument n care faptele sunt clasificate pentru a putea fi urmrite sub raportul intensitii i al frecvenei se cheam protocol i este alctuit dintr-un tabel ce descrie faptele observate pe linii i frecvena de apariie a acestora pe coloane. Msurarea n psihologie trebuie luat n sensul ei cel mai larg, acela de atribuire de numere datelor continue sau discontinue (discrete), pentru c psihologia nu i-a conturat uniti metrice la fel de tari matematic ca cele din tiinele fizice. i totui, ea aspir s fac prin operaiile de msurare mai mult dect o operaie de codare, cum este de exemplu aceea de atribuire a notelor colare (operaie care nu poate exclude subiectivitatea). 20 Din punct de vedere matematic msurarea este o operaie prin care fiecrui element din mulimea de obiecte (domeniul de definiie al variabilei) i se ataeaz un numr i numai unul din mulimea n care aceasta ia valori (domeniul variabilei). Se stabilete astfel o relaie de izomorfism ntre mulimea obiectelor i mulimea msurilor obiectelor, fiecare obiect fiind definit de o singur msur. Sistemul de reguli impus de teoria i practica din domeniu definete mai multe tipuri de msurare n funcie de tipul de scal utilizat: nominal, ordinal, de interval i de raport. Alegerea celui mai potrivit tip de scal este impus de numrul i mai ales de tipul de relaii existente ntre elementele investigate, dar toate caracteristicile unei scale de rang inferior se regsesc la cele de ordin superior. n plus, fiecare scal permite doar anumite operaii i procedee matematice. Cu ct este mai sus n aceast ierarhie, cu att ea este mai precis, permind prelucrri statistice mai complexe i implicit concluzii mai fundamentate matematic. 2.2. Proprietile scalelor Exist trei proprieti care fac ca scalele de msurare s difere ntre ele: magnitudinea intervalele egale i zero absolut. 2.2.1. Magnitudinea O scal are aceast proprietate cnd putem spune c o caracteristic a atributului msurat reprezint mai mult, mai puin sau la fel (tot att, adic egal) o cantitate sau nsuire, comparativ cu o alt stare a aceluiai atribut. n ceea ce privete talia, de exemplu, putem afirma c George este mai nalt, mai scund sau la fel de nalt ca Horia, deci scala nlimii are proprietatea magnitudinii. Numerele de pe tricourile fotbalitilor nu au n schimb aceast nsuire, deoarece ele sunt atribuite ca nite etichete, doar pentru identificarea juctorilor. 2.2.2. I ntervalele egale O scal are intervale egale dac diferena dintre dou puncte aflate pe oricare zon a scalei are aceeai semnificaie, valoare, ca diferena dintre alte dou puncte care difer prin acelai numr de uniti. De exemplu, diferena dintre anii 1200 i 1400 este egal cu diferena dintre anii 1800 i 2000, n timp ce diferena dintre coeficienii de inteligen 50 i 100 nu are aceeai semnificaie ca diferena dintre coeficienii 100 i 150, dup cum nu putem spune c cel cu QI de 100 este de dou ori mai inteligent dect cel cu QI de 50. Psihometricienii au ncercat s ocoleasc aceste dificulti i, folosind tehnici matematice 21 sofisticate, au creat instrumente care se apropie de cerina unei scale de interval (adic cu intervale de scal egale). 2.2.3. Zero absolut Acest proprietate este posibil de evideniat cnd variabila msurat are un nivel la care ea nu mai exist deloc: zero ca distan nseamn absena oricrei distane, zero ca ritm cardiac nseamn moartea, dar zero ca agresivitate, emoie, curaj, inteligen (caracteristici umane) este extrem de greu, dac nu imposibil, de evideniat sau de definit. Tabelul 2.1. Scalele de msurare i proprietile lor (dup Kaplan si Saccuzzo, 1993, p. 32). P r o p r i e t i Tip de scal Magnitudine I ntervale egale Zero absolut Nominal Nu Nu Nu Ordinal Da Nu Nu De interval Da Da Nu De raport Da Da Da 2.3. Tipuri de scale 2.3.1. Scalele nominalen sens strict, scala nominal nu este o scal, pentru c ea nu are nici una dintre cele trei caracteristici enumerate anterior. Scopul ei este s numeasc obiectele, aa cum se ntmpl cu numerele de pe tricourile fotbalitilor. Cu toate acestea este comod s atribuim numerele 1, 2, 3 i 4 pentru a codifica etnia romn, maghiar, german i altele, 0 i 1 pentru sexul masculin i feminin sau 1, 2 i 3 pentru mediul urban, suburban i rural, ntr-un studiu n care apar astfel de variabile. Singura restricie este aceea ca numerele s fie atribuite tuturor obiectelor care au aceleai caracteristici, i numai lor. Fiind n fond vorba de o operaie de clasificare, singurul procedeu matematic admisibil aici este determinarea frecvenelor de apariie, care se pot calcula fie n valori brute, fie n valori relative, adic n procente. n acest din urm caz, dei ar fi normal ca eantionul s depeasc 100 de cazuri (prin definiie pro-cent indic ideea de sut), se accept totui exprimarea procentual i a numerelor de la 30 n sus, dar nu mai mici. Aceasta deoarece, prin transformarea n procente, numerele mai mici de 100 se amplific, procedeu care, n ciuda rigorii aparente, trdeaz superficialitatea metodologic (Chelcea, 1982, p. 158). 22 n sintez, reinem cteva aspecte mai importante pentru acest tip de scal: - Scala nominal este mai degrab una calitativ, ea fiind de fapt o premsurare. - Ea se preteaz foarte bine pentru datele culese prin observaie, anchet, chestionar, care vor fi repartizate n categorii distincte, astfel nct un element s se afle numai ntr-o categorie (clas) i numai una. - Literele sau cifrele folosite ca etichet nu vor face obiectul calculelor statistice, ci vor servi doar la reperarea claselor, la determinarea frecvenelor brute i a celor relative. Fiecare element al unei clase (categorii) este considerat a fi echivalent cu toate celelalte din aceeai clas. - Singurul procedeu matematic de verificare este aa-numitul test chi ptrat (2). 2.3.2. Scalele ordinale Reprezint, dup Favrge, nivelul cel mai rspndit de msurare din psihologie i pedagogie, deoarece valorile din aceste domenii n majoritatea lor sunt continue i simplu ordonate. Aceasta permite ca elementele s fie aranjate fie cresctor, fie descresctor, existnd i posibilitatea ca mai multe elemente s ocupe acelai loc. Se stabilete astfel o relaie de ordine total ntre elemente, dat de formula Pxxy, care va fi interpretat ca x este superior, preferat sau naintea lui y (Radu, 1993, p. 49). Deoarece relaiile formulate (A B C D) permit stabilirea unei ierarhii, nseamn c importante caracteristici umane, fizice (nlime, greutate, perimetre), dar i psihice (capaciti, aptitudini, preferine, interese, atitudini, valori) pot beneficia de acest tip de scal. Numerele asociate obiectelor i fenomenelor n msurarea de tip ordinal au doar semnificaia unui rang, adic nu indic mrimi absolute. Pentru a atribui numerele n serie cresctoare sau descresctoare, trebuie ca i caracteristica respectiv s aib valori care cresc sau descresc. n scalele de tip Likert, de exemplu, se pot atribui numere de la 1 la 7, 4 exprimnd neutralitatea, numerele mici (3, 2 i 1) dezacordul sau insatisfacia tot mai accentuate, n timp ce numerele mari (5, 6 i 7) acordul sau satisfacia tot mai intense. Creterea regulat a numerelor nu trebuie s sugereze ns c i caracteristicile respective cresc n aceeai proporie. Exemplul clasic este cel al militarilor dintr-un pluton, aezai ntr-o ordine ierarhic, de la mic la mare: al aselea din ir nu este de dou ori mai mare dect al treilea, i aceasta deoarece scalele ordinale nu au o unitate de msur care s indice i cantitatea diferenei dintre ranguri. Scala metric a inteligenei, publicat de Binet n 1905, permitea un clasament ierarhic al unor inteligene diferite care, pentru nevoile practice, 23 echivala cu un clasament. n psihodiagnoz, exemplul tipic pentru acest tip de msurare este procedeul centilrii (ordonarea ierarhic pe o scar cu 100 de trepte), iar n pedagogie nota colar, ca procedeu de evaluare care n acelai timp i ierarhizeaz elevii. n concluzie pot fi reinute urmtoarele aspecte: - Deoarece scala ordinal nu are o unitate de msur constant, ea nu permite adunarea i scderea (nu are proprietatea aditivitii). - Este legitim ns calcularea frecvenelor brute i a celor relative (a procentelor) i aplicarea procedurilor statistice nonparametrice (adic exprimate calitativ, nu prin numere): coeficientul de corelaie al rangurilor al lui Spearman, coeficientul de corelaie Kendall, testele de semnificaie Mann-Whitney, Wilcoxon, Kolmogorov-Smirnov etc. - Centilarea, decilarea - n psihodiagnoz, i nota colar - n pedagogie, sunt ilustrrile cele mai frecvente ale utilizrii acestui tip de scal n domeniile amintite. - Cel mai important indicator al tendinei centrale este mediana. 2.3.3. Scalele de interval Scalele de interval nu reprezint nivelul curent de msurare n tiinele socioumane, dei se tinde spre aceasta, deorece, pe lng ordinea i ierarhia nivelurilor anterioare, trebuie s existe specificarea mrimii exacte a intervalelor sau a distanelor care separ elementele aflate pe toate treptele succesive ale scalei. Aceasta presupune cu necesitate prezena unitii constante i comune de msur. Exemplul cel mai concludent l dau calendarele, unde existena unei uniti de msur precizat i constant, anul, face posibil echivalena a 200 de ani de la nceputul mileniului cu 200 de ani de la sfritul lui. Mai mult, dac operm cu calendare diferite (iulian, gregorian, evreiesc sau mahomedan), deoarece unitile de msur nu sunt diferite, transpunerea dintr-un calendar n altul nu pune nici un fel de problem (Richelle, 1995, p. 222). Rezumm cteva dintre nsuirile de baz ale scalei de interval: - Specificul scalei de interval este proprietatea aditivitiii (intervalele - i nu valorile! - pot fi adunate i sczute). - Neexistnd un punct zero (care s exprime absena caracteristicii msurate), intervalele pot fi deplasate, extinse sau comprimate, dac prin aceasta ele devin mai maniabile sau mai bine adaptate realitii msurate. 24 - La acest nivel se pot aplica procedee statistice mai elaborate, cum ar fi corelaia prin produsul momentelor a lui Pearson, testele de semnificaie t i z ale lui Fisher, ca i analiza de regresie. - Aceasta deoarece la acest nivel se pot determina media aritmetic, abaterea standard i variana. 2.3.4. Scalele de raport Acestea au toate proprietile unei scale de msur: magnitudine, intervale egale i zero absolut. Ele sunt caracteristice mrimilor fizice (nlime sau lungime, greutate, for), ceea ce nu se ntmpl cu fenomenele sau faptele din psihologie, sociologie sau pedagogie, deoarece neputnd fiina fr un minimum de inteligen, coeziune, atracie etc. acestor fenomene nu li se poate stabili starea zero. Cu temperatura lucrurile stau altfel: deoarece scalele Celsius i Fahrenheit au un zero convenional, n timp ce sistemele Kelvin sau Rankine au un punct zero neconvenional (absena oricrei temperaturi), doar acestea din urm sunt scri de raport. Elementele eseniale ale scalelor de raport sunt deci urmtoarele: - Scalele de raport se cheam aa pentru c, pe lng toate caracteristicile scalelor de sub ele, permit relaia de proporionalitate de tipul b/a = c/b = d/c. - Ele permit toate tipurile de statistici, parametrice i neparametrice, toate procedeele de verificare i toi coeficienii de corelaie cunoscui. - Aceasta deoarece se permite calculul mediei geometrice i a coeficientului de variaie. - n afara unor situaii de excepie (mrimi fizice de intrare, puse n legtur cu timpul de reacie, de exemplu), psihologii, pedagogii i sociologii nu sunt ndreptii s foloseasc un asemenea tip de scal. Corespunztor tipurilor de scal amintite, vom avea tipuri de variabile (nominale, ordinale sau numerice), care sunt definite de domeniul de variaie, adic de registrul de valori pe care acestea le pot lua. Cnd lum n considerare numrul indivizilor sau al cazurilor susceptibile de a prezenta aceast modalitate, vorbim de domeniul de definiie. De exemplu, la o prob de motricitate, tapping, numrul de puncte btute cu mn dreapt, adunat cu numrul punctelor btute cu mna stng ia valori diferite n funcie de vrst, sex i de lateralizare (dreptaci sau stngaci). De pild, la 6 ani acest numr poate s ia valori de la 10 la 60, acesta fiind domeniul de variaie, n timp ce numrul subiecilor ce nregistreaz aceste valori, pentru fiecare punctaj, d domeniul de definiie. 25 O atitudine, considerat ca o variabil codificat pe o scar Likert, are mai multe modaliti de manifestare, dar i o populaie care prezint toate aceste modaliti. Deci fiecrui individ din domeniul de definiie putem face s i corespund o modalitate i numai una n domeniul de variaie. Noiunea de variabil este ns mai general pentru c ea se poate referi fie la o mulime de date, fie la efective observate, fie la date prezumate, ipotetice, virtuale. Scalele descrise anterior se refer la date efectiv observate. Ion Radu (1993, p. 51) apreciaz c n prelucrarea datelor, n funcie de cerinele studiului i pentru a ne nscrie ntr-o schem statistic, noi introducem astfel o metric, adic tratm datele ca i cum s-ar situa la nivelul scalei de interval (). Se comite astfel o eroare, care practic este neglijabil. Deoarece prediciile fcute n felul acesta sunt valide, transformarea respectiv este considerat ca fiind acceptabil. 2.4. Organizarea datelor brute Pentru a fi posibile procedurile detaliate de tratare i de analiz statistic a datelor, acestea trebuie culese i ordonate n tabele sau grafice. Datele brute efectiv rezultate din anchet, testare sau evaluare nu au nici o semnificaie prin ele nsele, ci prin raportarea la un sistem de referin. Cel mai adesea acesta rezult din comparaia scorurilor individuale cu datele obinute de un eantion mai larg din populaia investigat, prin care se pune n eviden poziia unui subiect n cadrul grupului mai larg. n calitatea lui de sistem de referin, grupul ofer posibilitatea construciei unei tipologii ori a unui tabel de norme (barem sau etalon). Acestea alctuiesc aa-numitele cote standard, ceea ce arat c investigaia individului i a grupului sunt corelative i complementare. Extragerea informaiilor coninute de datele brute i organizarea lor ntr-o colecie/ baz de date, presupune intrarea n funcie a unor proceduri statistice elaborate (determinarea medianei, a mediei, a abaterii standard i a varianei, aprecierea msurii n care cele descoperite pot fi generalizate i la ce nivel de ncredere). Dac prin organizarea primar a datelor (ordonare i grupare) putem face o prim inspecie vizual a acestora, cci ele se prezint ca histograme, poligoane ale frecvenelor, scattere etc., prin calculul tendinelor aflate pe centrul distribuiei (media, mediana i modul), ca i a celor aflate spre extreme (amplitudinea mprtierii, abaterea standard i dispersia) putem face inferene statistice valide, pentru ca prin corelaie, analiz factorial i de cluster s avem o nelegere mai de adncime a relaiilor i a structurilor subiacente. Analiza de varian, regresia simpl i multipl permit, dincolo de sesizarea structurii de adncime a datelor studiate, predicia unor legiti, aa cum reies din analiza i modelarea lor matematic. 26 2.5. Exerciii i aplicaii practice 1. Dai cte unu-dou exemple de variabile ntlnite n psihologie care apeleaz la scale de msur nominale, ordinale, de interval i de raport. 2. Avei mai jos spectrul culorilor vizibile de ochiul uman, reprezentat pe dou tipuri de scal. Simbol R O G V A I V Nume Rou Oranj Galben Verde Albastru Indigo Violet Lungime de und 800-620 619-590 589-575 574-510 509-480 479-450 449-430 2.1. Precizai numele fiecrui tip de scal, indicnd avantajele i locul lor de utilizare. 2.2. Lumina este o variabil continu sau discontinu? (Argumentai). 3. Msurnd nlimea a 10 studente de la Psihologie s-au obinut urmtoarele valori: 165 160 168 170 156 158 163 180 155 162 Utiliznd pe X ca simbol al acestei variabile (nlimea): 3.1. Precizai care sunt X3, X5, X8 i X10. 3.2. Calculai X. 3.3. Scriei formula de nsumare de la punctul anterior ntr-o form mai complet. 4. Concomitent s-a determinat i greutatea pentru cele 10 studente, obinndu-se valorile de mai jos (n kilograme). 62 61 70 72 52 55 66 80 49 53 Utiliznd pe Y ca simbol al acestei noi variabile (greutatea): 4.1. Precizai care sunt Y2, Y4, Y7 i Y9. 4.2. Calculai X din exemplul anterior. 4.3. Calculai (X)2 i X2. Folosind semnele = i indicai care este relaia dintre cele dou valori obinute. 4.4. Determinai X/N i Y/N, unde N (10) reprezint numrul de scoruri observate. 4.5. Cum numii valorile pe care tocmai le-ai calculat la punctul anterior? 4.6. n mod similar calculai pe (Y)2 i Y2. 4.7. Utiliznd valorile numerice deja obinute determinai valoarea formulei de mai jos 4.8. Extragei rdcin ptratic din valoarea numeric a expresiei de mai sus. 5. Utilizai datele de mai sus pentru a arta c: 5.1. (X+Y) = X + Y 5.2. XY XY 5.3. CX = CX, n care C este o constant. 5.4. X2 (X)2 5.5. (X+C) = X + NC, n care N este numrul de cazuri iar C are valoarea 3. 6. Poate o variabil ordinal s fie msurat cu o scal continu (de interval sau de raport)? Poate o variabil continu s fie msurat cu o scal ordinal? Argumentai folosind cte un exemplu adecvat. 7. Notele colare trecute n catalog sunt msurtori tipice unei scale ordinale sau uneia de interval? Dar mediile colare pentru fiecare obiect n parte (rotunjite)? Dar media general (nerotunjit)? 8. Media (nerotunjit) de la Matematic i cea de la Purtare sunt msurate pe acelai tip de scal? (Argumentai rspunsul). ( )122 NNYY 27 2.6. Quiz: Da Nu 1. (Exemplu) Pentru scalele de interval suntem ndreptii s utilizm frecvenele absolute (count) i pe cele relative (procente). Rspuns: Adevrat, pentru c, dei tipice scalelor ordinale, procedeele respective sunt prezente i la scalele de interval i de raport, tiut fiind c scalele de rang superior ncorporeaz proprietile celor de rang inferior. 2. Magnitudinea unei scale este proprietatea matematic ce permite ierarhizarea populaiei de date de la mic la mare sau invers. 3. Deoarece distana (n cunotine sau deprinderi) dintre nota 8 i nota 9 este egal cu distana dintre nota 3 i nota 4, nseamn c sistemul de notare colar are proprietile scalei de interval. 4. Atunci cnd codificm genul masculin cu 1 i pe cel feminin cu 2 efectum o operaie de msurare. 5. Inteligena nu are uniti de msur tipice scalelor de interval. 6. Scala care msoar era noastr are un zero natural naterea lui Isus fiind deci o scal de raport. 7. IQ-ul se msoar pe o scal ordinal deoarece distana de 10 puncte dintre IQ 50 i 60 are aceeai semnificaie psihologic ca i diatana dintre IQ 120 i 130. 8. Pentru datele de observaie, de anchet i de chestionar sunt utilizate scalele nominale, care fac de fapt o premsurare. 9. La un chestionar s-a utilizat o scal Likert n 5 trepte cu urmtoarea semnificaie: 1=Foarte rar 2=Uneori 3=Aa i aa 4=Deseori 5=Foarte des. Se poate determina o valoare numeric medie a rspunsurilor pentru ntregul chestionar. Argumentai. 10. Pentru datele culese pe o scal ordinal putem face media deoarece aceasta are proprietatea aditivitii. 11. n tiinele socio-umane nivelul de msurtoare maximal este al scalelor de interval iar cel uzual al scalelor ordinale. 12. Scala de interval permite deplasarea punctului zero (adic a originii) spre stnga sau spre dreapta scalei i, de asemenea, permite comprimarea sau dilatarea acesteia. 13. Scalele de msurare a timpului (calendarele iulian, gregorian, iudaic, mahomedan, maya etc.) pot fi transpuse unul n altul i obinute valori echivalente deoarece au uniti de scal egale. 14. Scalele nominale i ordinale sunt categoriale,cele de interval i raport sunt real numerice. 15. n sistemul romnesc de notare colar domeniul de definiiei al variabilei l reprezint elevii iar domeniul ei de variaie intervalul de notare 1-10. 16. Notele colare i centilarea/decilarea nu fac dect s stabileasc ierarhii, adic s rangheze subiecii cresctor sau descresctor. 17. n principiu notele colare nu pot fi adunate pentru a se determina media pe materii deoarece scala de notare nu are proprietatea matematic a intervalelor egale. 18. Nu pot fi inventate uniti de msur valabile, tipice scalelor de interval, pentru iubire, fric, simpatie sau depresie. 19. Funciile cognitive senzaiile, gndirea, memoria se bucur de scale de msur mai tari dect funciile afective. 20. Numii tipul de scal de msurare reprezentat de categoriile de mai jos, alocnd cifrele 1, 2, 3 i 4 pentru scalele nominal, ordinal, de interval i de raport: scala Celsius, scala Kelvin, numrul de pe uile camerelor unui hotel, ordinea de sosire la maraton, scorul la acest test QUIZ, presiunea sanguin, genul i greutatea. (Se acord punctul pentru minimum 5 rspunsuri corecte din cele 8 posibile.) 28 CAPITOLUL 3 DISTRIBUII I FRECVENE Pentru determinarea celor mai importani indicatori statistici avem nevoie de frecvene. n domeniul variabilei, fiecare mrime are un numr de reprezentani, numit efectiv. n statistic efectivul se numete frecven sau frecven absolut. Cnd frecvena este transformat n procente, ea se numete frecven relativ i este foarte util pentru compararea, de exemplu, a dou colective diferite ca mrime, i aceasta pentru c transformarea n procente pstreaz echivalena i proporia n ce privete distribuia i caracteristicile ei. 3.1. Ordonarea i gruparea datelor Cea mai mare parte a operaiilor i procedeelor de lucru care urmeaz a fi prezentate mai jos sunt extrem de mult facilitate de programele de prelucrare automat a datelor pe calculator, de tip SPSS sau SAS. Ele fac parte din abc-ul statisticii, fiind primele ordonri i prelucrri ale datelor brute, la sfritul crora distribuiile respective i dezvluie o parte din caracteristicile de suprafa, adic cele vizuale. Le vom prezenta detaliat, pentru c ele reprezint moduri de lucru practice, uor de executat ntr-o diversitate de situaii concrete, ca un preambul al unor prelucrri ulterioare mai sofisticate. Parcurgnd aceti pai vom putea sesiza fora pe care instrumentul statistic l poate da muncii noastre, deoarece el ordoneaz, triaz, clasific datele, forndu-le s i dezvluie semnificaiile. De aceea operaiile iniiale de ordonare i de grupare a datelor ar trebui s devin operaii de rutin pentru oricine este interesat s dea muncii sale rigoare tiinific. Iat scorurile brute la un test de vocabular (Recombinare Verbal) culese la biei i fete de 14 ani din eantionul care a fost utilizat pentru etalonarea acestui test: Biei Fete 57 56 48 36 24 23 28 23 33 26 16 57 56 45 35 36 43 26 34 46 24 25 53 34 22 34 34 42 34 25 24 29 18 53 55 55 48 43 48 35 36 27 27 26 60 33 51 40 47 36 36 29 26 22 14 60 62 44 57 70 36 38 35 28 31 19 52 34 60 61 56 34 22 28 30 23 34 52 53 56 49 46 37 48 33 27 19 29 51 64 37 33 36 28 35 19 18 15 51 58 44 51 38 48 26 36 22 25 15 29 Avem nevoie de o foaie de hrtie cu liniatur matematic, format A4, de o rigl i un creion, la care vom putea aduga ulterior un minicalculator cu panou statistic, ca instrumente i materiale uzuale de lucru. Foaia de hrtie va fi mprit prin 3 linii orizontale, trasate pe lungul ei, n 3 panouri (registre) de lucru, pentru biei, fete i total. Observm c cea mai mic valoare de scor (Xmin) este la biei 14 i la fete 15, iar cea mai mare (Xmax) 64 la biei i 70 la fete. Prin urmare fiecare ptric de pe linia de baz va fi numerotat de la 11 la 70, avnd grij ca aceast numerotaie s fie identic pe toate cele trei registrele, pentru a le putea nsuma ulterior pe vertical. Dup aceea descrcm primul tabel pe primul registru al foii, sub care vom scrie Biei, al doilea tabel n al doilea registru, sub care vom scrie Fete, fcnd un x s-au un punct n ptrica corespunznd scorurilor care se descarc, la valoarea corespunztoare de pe linia de baz. La sfritul operaiei vom numra frecvenele corespunztoare fiecrui scor de la 11 la 70 i numrul va fi trecut sub ptrica corespunztoare fiecrui scor, att la biei, ct i la fete i total (care rezult din nsumarea pe vertical a frecvenelor pentru fiecare scor). Inspecia vizual evideniaz urmtoarele aspecte: - amplitudinea scorurilor (Xmax - Xmin) uor diferit pentru cele dou categorii: 64 - 14 = 50, la biei i 70 - 15 = 55, la fete; - aglomerarea datelor mai accentuat n prima jumtate (spre stnga), cu o mai mare densitate pe zona central (34, 36 i 37), la biei; o repartiie spre dreapta a datelor fetelor; - bieii au o singur frecven maxim (la 34 sunt 7 cazuri), n timp ce fetele au dou (la 36 i 48, cte 4 cazuri). Prima ntrebare care se pune este dac pentru anumite tratamente statistice (alctuirea unui etalon) datele trebuie tratate separat sau mpreun, iar rspunsul l putem afla condensnd informaia pentru a fi vizualizat, dup ce vom grupa datele. Pentru a determima mrimea intervalului de grupare reinem cteva reguli de lucru: - Vom prefera nu mai puin de 5 - 7 intervale i nu mai mult de 20. Pentru gruparea datelor, uzual se folosesc ntre 9 i 15 clase. - Pentru determinarea mrimii intervalului, amplitudinea mprtierii se mparte la cteva din mrimile dorite ale intervalului, pentru a vedea cte clase rezult i se alege aceea care se apropie cel mai mult de numrul de clase considerat convenabil. - Ca mrime a intervalului este preferabil s folosim numere impare (3, 5 sau 7), pentru a avea ca valori centrale de interval numere ntregi. 30 - Primul interval este bine s nceap cu un multiplu al mrimii lui. De exemplu intervalele de lungime 3 pot ncepe cu 3, 6 sau 9, cele de lungimea 5 pot ncepe cu 5, 10 sau 15 etc. n cazul nostru, dac am dori s avem intervale din 3, atunci rezult 55/3 = 15 intervale, iar dac am dori intervale de 5, atunci ar rezulta 55/5 = 11 intervale. Pentru c avem o distribuie relativ mic, optm pentru a doua variant. Delimitm prin linii verticale clasele astfel obinute (10-14, 15-19, 20-24,, 70-74) i n dreptul fiecreia vom trece n mijlocul clasei i n partea ei de sus frecvenele clasei respective, rezultate prin nsumarea valorilor individuale din interiorul fiecrui interval (1, 5, 8, 8, ..., 0, pentru biei; 0, 3, 2, 10, , 1, pentru fete). Trebuie inut cont c percepia noastr opereaz din ce n ce mai greu cu intervale care depesc 20, chiar dac mrimea populaiei i lungimea spectrului de variaie ar impune-o. De aici recomandarea de a nu avea nici prea puine intervale (prin gruparea datelor se pierde o parte din informaia primar, pentru c nu se mai cunoate exact valoarea msurat a fiecrei observaii), i nici prea multe (sunt mai greu de manevrat i de sesizat perceptiv), de unde regula deja enunat a celor 9 -15 clase de grupare a datelor. Sturges (citat de Rotariu et al.,1999, p. 33) propune o formul de lucru pentru aceast operaie prin care se determin numrul intervalelor de grupare, lund n calcul amplitudinea variaiei i numrul de cazuri: (3.1) Utiliznd formula lui Sturges, se obine urmtorul tabel orientativ pentru stabilirea numrului de interval (clase) de grupare: Tabel 3.1. Numrul de interval de grupare dup formula lui Sturges. Nr. de observaii 15-24 25-44 45-89 90-179 180-359 360-719 720-1500 Nr. de clase 5 6 7 8 9 10 11 Aplicat n cazul nostru, pentru biei, i = (64-14)/(1+3,322 log54) = 50/6,755 = 7,40; pentru fete vom avea i = (70-15)/(1+3,322 log55) = 55/7,77 = 7,21. Pentru numrul de cazuri ale distribuiei noastre am avea teoretic nevoie de 8 intervale. S reinem i regula practic a celor 9 - 15 intervale, care realizeaz un bun echilibru ntre nevoia de condensare a datelor i aceea de a avea pierderi de informaie ct mai mici. NX Xilog 222 , 3 1min max+ = 31 3.1.1. Limitele de grupare n cazul variabilelor continue, cel mai adesea raportm clasele la nite numere ntregi, care constituie limitele de raportare a acestora. n cazul variabilei continue care este nlimea, de exemplu, putem avea clasele 125-129, 130-134, 135-139 etc. Ce se ntmpl ns cu nlimile de 129,54 sau 134,82, care par a cdea n golurile dintre clase? Deoarece limitele de raportare nu acoper n ntregime domeniul variabilelor continue, trebuie s se defineasc nite limite exacte, asfel nct, respectnd regula de rotunjire, valorile interclase s fie uor de alocat la una dintre clase. Aceste limite au deci dou funcii: a) reconstituie continuitatea variabilei, nemailsnd goluri i b) servesc drept baz de calcul pentru determinarea unor puncte speciale de pe linia valorilor variabilei, numite quantile, cum ar fi mediana, centilele, decilele sau oricare alt punct percentil. n acest sens trebuie precizat c fiecare interval are o limit superioar (ls) i o limit inferioar (li). De exemplu, intervalul 125-129 se exprim matematic astfel, n funcie de cele dou limite: [125,5; 129,5], sau 125,5-129,5. 3.1.2 Centrele intervalelor Centrul unui interval, notat cu Ci, este valoarea situat n mijlocul intervalului respectiv i se determin astfel Ci = (li + ls)/2. Aplicnd aceast formul la exemplul nostru, intervalul 124,5-129,5 are drept centru valoarea 127, ceea ce justific preferina pentru intervalele de numr impar, care dau o valoare ntreag pentru centrele lor. Celelalte centre de interval se pot determina extrem de uor ulterior, pentru c ele sunt multipli ai lungimii intervalului, deci n cazul nostru vor fi: 127, 132, 137 etc. Aproximarea prin centrele intervalului creeaz posibilitatea ca toate valorile care aparin unui interval s fie tratate n calcule ca egale cu centrul acestuia, de unde posibilitatea erorii pe care gruparea datelor o introduce, lucru de care am vorbit anterior. Se poate dovedi matematic c aceast grupare satisface criteriul matematic al celei mai mici erori. Important de menionat este i faptul c, cu ct intervalul este mai mare, cu att mrimea acestei erori va crete. 3.2. Histograma i poligonul frecvenelor Dup ce am vzut modul practic de lucru pentru cele dou reprezentri grafice ale frecvenelor, s avertizm asupra faptului c exist precauii speciale privind mrimea diagramei rezultate n raport cu spaiul de lucru al foii (problem rezolvat corect cu ajutorul computerului), ca i localizarea punctului de mijloc sau trasarea figurilor. 32 O problem care merit atenie o reprezint raportul dintre nlimea i limea diagramei, care de regul este de 60%. Vom recunoate n aceasta o problem real, deoarece ea face posibil minciuna statistic, dup expresia lui Smith: manevrnd (intenionat sau nu) acest raport, se poate accentua sau aplatiza o pant de cretere a unui indicator pentru a sugera ceva ce realitatea nu confirm. Histograma d o imagine n scar a distribuiei, fiind cea mai potrivit reprezentare a datelor ordinale, discontinue, caz n care ntre bare trebuie s existe mici spaii pentru a sugera discontinuitatea. Ea este la fel de mult utilizat i pentru datele continue, de interval, caz n care barele verticale apar unite ntre ele. Ca i poligonul frecvenelor, histograma este informativ n legtur cu forma distribuiei, cu simetria ei, dar este mai puin adecvat s exprime boltirea (aplatizarea acesteia), deoarece am vzut c raportul dintre unitile de msur de pe abscis i de pe ordonat poate fi modificat n funcie de opiunea cercettoului. Cea mai bun redare a datelor de interval o constituie poligonul frecvenelor, fie ele brute, fie cumulate. Diferena este nu numai de form (scalar - la histogram, linii drepte care unesc ntre ele puncte - la poligon), ci este dat de chiar asumpia lor de baz, aceea c la histogram toate valorile dintr-un interval sunt egale ntre ele ca frecven, i egale cu valoarea centrului de interval, n timp ce la poligonul frecvenelor datele tind s se grupeze de o parte i de alta a acestei valori centrale. Histograma ofer o imagine mai clar a numrului de cazuri din fiecare interval, dar d o imagine cu totul confuz cnd pe aceeai linie de baz se redau, pentru comparaie, dou sau mai multe distribuii. n acest caz este evident c poligonul frecvenelor apare ca mult mai indicat, comparaia putndu-se face fie n valori absolute (cnd nu exist diferene prea mari numeric ntre cele dou distribuii), fie n frecvene relative (procentuale), caz n care comparaia devine posibil, deoarece distribuiile sunt redate proporional. De asemenea poligonul frecvenelor poate s se refere la frecvenele brute simple sau cumulate, dar i la cazul frecvenelor relative simple sau cumulate, cnd se obine aa-numita ogiv a lui Galton. 33 MF_Metoda+Fisa175.0165.0155.0145.0135.0125.0115.0105.095.085.075.065.055.045.0Frequency160140120100806040200Std. Dev = 21.99 Mean = 132.2N = 1408.00 Figura 3.1. Dou histograme ale frecveelor brute pentru o distribuie foarte mare i una mic. Cnd numrul indivizilor din cele dou grupuri difer foarte mult apare o problem de comparaie grafic: deorece disparitatea este foarte mare, se pune problema unei scale care s le cuprind pe amndou, asfel nct s fie pe deplin perceptibil distribuia mai mic, n condiiile n care cea mai mare nu depete nite limite rezonabile. n acest caz este foarte util conversia frecvenelor brute n frecvene relative, situaie n care apare ca i cnd am avea dou distribuii cu un numr egal de cazuri, i anume 100, ariile celor dou poligoane, forma curbei i dispersia devenind pe deplin comparabile. Transformarea procentual este extrem de simpl. Iat un exemplu preluat din Guilford (1978, p. 34). Tabelul 3.2. Frecvenele brute i relative pentru dou grupuri. Scoruri f1 f2 p1 p2 140-149 8 5,0 130-139 32 20,0 120-129 48 30,0 110-119 1 29 2,0 18,10 100-109 0 18 0,0 11,20 90-99 3 14 5,9 8,8 80-89 5 5 9,8 3,1 70-79 6 5 11,8 3,1 60-69 14 0 27,5 0,0 50-59 7 1 13,7 0,6 40-49 11 21,6 30-39 4 7,8 Suma N1 = 51 N2 = 160 = 100,1 = 99,9 RVBAIETI65.0 60.0 55.0 50.0 45.0 40.0 35.0 30.0 25.0 20.0 15.020100Std. Dev = 13.20 Mean = 35.1N = 54.00 34 Pe coloana f1 sunt 51 de cazuri. Prin regula de trei-simpl tim c dac un 1 caz din 51 reprezint x din 100, atunci x are valoarea 1 100/51 = 1,96. Acest numr (1,96) devine factorul de multiplicare pentru toat coloana respectiv (f1), ceea ce va da coloana p1 (p de la procente). La fel se va proceda pentru coloana f2 (unde factorul de multiplicare este 1 100/160 = 0,625) din care se va obine coloana p2. Datele din tabel se convertesc ntr-o imagine grafic prin care cele dou poligoane ale frecvenelor devin direct comparabile. Aa cum rezult din diagram, este evident c al doilea grup are valori medii mult mai mari dect primul, suprapunerea dintre ele find foarte mic; forma amndurora este asimetric, primul fiind deplasat spre stnga, al doilea spre dreapta; grupul al doilea este mai omogen dect primul (are un singur punct care concentreaz frecvena maxim, numit mod, n jurul cruia se repartizeaz celelalte valori, n timp ce primul grup are dou cocoae, adic dou zone de acumulare a cazurilor); frecvena maxim este apropiat procentual la ambele grupuri. Comparaia evideniaz elocvent faptul c acestea sunt dou grupuri foarte diferite, care trebuie tratate statistic separat. 3.3. Frecvenele cumulate Dup ce am stabilit intervalele i le-am ntabelat astfel nct valorile inferioare s fie amplasate jos i cele superioare sus, dup ce am stabilit limitele inferioare i superioare pentru fiecare interval i centrul fiecrui interval (atunci cnd avem nevoie s lucrm cu aceste coloane), urmtoarea coloan (fb) va fi alocat frecvenelor brute. Ele se pot obine fie printr-o coloan special de bife, n care se descarc datele brute, fie prin procedeul de lucru cu care am deschis acest capitol: trasarea liniei de baz, cu toate valorile i frecvenele corespunztoare, apoi stabilirea claselor i a frecvenelor din fiecare clas. Pe urmtoarea coloan se trec frecvenele brute cumulate (fbc), apoi frecvenele relative (fr) i frecvenele relative cumulate (frc), dup procedeul exemplificat anterior. Modul cum apar datele ntabelate pentru bieii din eantionul de etalonare la testul de Recombinare Verbal, dup modelul descris anterior, poate fi analizat n Tabelul 3.3 de mai jos. Determinarea frecvenelor cumulate, fie ele brute sau relative, se obine extrem de simplu printr-o adunare succesiv, ce pleac de jos n susul coloanei respective. Raiunea acestei operaii este aceea de a ti numrul exact de cazuri care cad sub un anumit punct, adic punctul care este limita de sus a intervalului (sau procentul, n cazul frecvenelor relative). 35 Tabelul 3.3. Valorile frecvenelor brute i relative, simple i cumulate, pentru biei la RV. Scoruri clase Limite exacte Punctul central Frecvene brute Frecvene brute cumulate Frecvene relative Frecvene relative cumulate Numr interval fb fbc fr frc fb 65-69 64,5-69,5 67 0 54 0 100 0 12 60-64 59,5-64,5 62 4 54 7,4 100 248 11 55-59 54,5-59,5 57 3 50 5,6 92,6 171 10 50-54 49,5-54,5 52 4 47 7,4 87 208 9 45-49 44,5-49,5 47 2 43 3,7 79,6 94 8 40-44 39,5-44,5 42 2 41 3,7 75,9 84 7 35-39 34,5-39,5 37 6 39 11,1 72,2 222 6 30-34 29,5-34,5 32 11 33 20,4 61,1 352 5 25-29 24,5-29,5 27 8 22 14,8 40,7 216 4 20-24 19,5-24,5 22 8 14 14,8 25,9 176 3 15-19 14,5-19,5 17 5 6 9,3 11,1 85 2 10-14 9,5-14,5 12 1 1 1,8 1,8 12 1 N=54 =100 =1868 Se ncepe cu prima clas de pe coloana fb, ce are n cazul nostru frecvena 1, care va fi trecut ca atare pe coloana fc; la a doua clas 1+5 = 6 (frecvena anterioar cumulat cu cea a clasei respective), valoare care se i trece n rubrica corespunztoare. Valorile urmtoare, de jos n sus, vor fi 6+8 = 14, apoi 14+8 = 22 i aa mai departe, pn la clasa din vrf unde, dac operaia a fost executat corect, vom regsi numrul total al eantionului nostru (N=54), ceea ce constituie chiar procedeul de control al acurateei calculelor. Pentru coloana frecvenelor cumulate procedeul este similar, cu meniunea c pot aprea i valori zecimale (care se pot rotunji la o zecimal), iar valoarea din vrf trebuie s fie 100, sau ct mai aproape de aceast valoare, acesta fiind i procedeul practic de verificare a corectitudinii n lucru. 3.4. Histograma i poligonul frecvenelor cumulate Histograma cumulativ arat ce adaug fiecare nou frecven celei precedente, de sub ea. Ca i n cazul histogramei obinuite construcia ei se face tot cu bare sau dreptunghiuri, fiecare adugat colului din dreapta sus al celui precedent, ca n imaginea de mai jos. Unind diagonalele stnga jos - dreapta sus din fiecare dreptunghi, se obine poligonul frecvenelor cumulate, care n cazul de fa evideniaz urmtoarele aspecte: X X 36 - Curba este progresiv cresctoare i nu nregistreaz inversiuni sau ntoarceri, deoarece frecvenele cumulative sunt valori pozitive progresiv cresctoare, exceptnd situaia frecvenelor zero. - Linia de sus nu este dreapt, dei tinde spre orizontal. - Cnd distribuia noncumulativ (obinuit) este simetric, cea cumulativ are o form foarte apropiat de litera S. Figura 3.2. Poligonul frecvenelor cumulate i ogiva lui Galton. Sursa: Guilford i Fruchter, 1978, pp. 37 i 39. Ogiva lui Galton este de fapt o curb construit plecnd de la frecvenele relative cumulate. n mijlocul fiecrei clase se trece un punct, corespunznd frecvenei relative cumulate a clasei respective, iar n final se traseaz o curb care nu trece exact prin fiecare punct, ci este ajustat astfel nct s ia forma cea mai regulat n raport cu punctele respective (fig. 2). De aceea forma ei de S este mai bine reliefat ca n cazul precedent, iar cnd distribuia noncumulativ este simetric, acest lucru este cu att mai evident. n cazul nostru se remarc o bun regularitate pentru prima jumtate a ogivei i un deficit sau lips n partea ei superioar, dat de asimetria distribuiei noncumulate. O raiune pentru care se ajusteaz ogiva, cnd acest lucru se poate face n mod rezonabil, este aceea de a nivela anumite iregulariti ale distribuiei ce ar rezulta dintr-un numr prea mic al cazurilor din eantion cu scopul de a ti cum ar arta de fapt distribuia probabil a populaiei mai largi. Deoarece pentru fiecare punct al curbei se poate determina numrul cazurilor care cad sub el, ogiva lui Galton poate servi la construirea etaloanelor prin procedeul centilelor sau al decilelor. 37 3.5.Criterii de evaluare vizual a formei distribuiilor Pentru evaluarea de ansamblu a caracteristicilor unei distribuii exist o multitudine de posibiliti, dintre care unele mai elementare, bazate pe inspecia ei vizual, iar altele mai elaborate, care condenseaz sub form numeric precis aceste caracteristici. Acestea din urm vor fi abordate ulterior, cnd vor fi prezentai indicatorii formei unei distribuii care sunt simetria i boltirea. O distribuie poate fi simetric, atunci