AIC 3 Statistica Aplicata ID

206

Click here to load reader

description

AIC 3 Statistica Aplicata ID

Transcript of AIC 3 Statistica Aplicata ID

  • 1

    UNIVERSITATEA TRANSILVANIA DIN BRAOV

    FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI

    CENTRUL PENTRU NVMNT LA DISTAN I NVMNT

    CU FRECVEN REDUS

    AUREL ION CLINCIU

    S T A T I S T I C A P L I C A T N P S I H O L O G I E

    Editura Universitii Transilvania din Braov

    2014

  • 2

    EDITURA UNIVERSITII TRANSILVANIA DIN BRAOV

    Adresa: 500091 Braov, B-dul Iuliu Maniu 41A Tel:0268 476050

    Fax: 0268 476051 E-mail : [email protected]

    Tiprit la:

    Tipografia Universitii Transilvania din Braov B-dul Iuliu Maniu 41A Tel: 0268 476050

    Copyright Autorul, 2013 Editur acreditat de CNCSIS

    Adresa nr.1615 din 29 mai 2002

    Descrierea CIP a Bibliotecii Naionale a Romniei Clinciu, Aurel Ion Statistic aplicat n psihologie / Aurel Ion Clinciu. Braov : Editura Universitii "Transilvania", 2013 Bibliogr. ISBN 978-606-19-0239-2 311:159.9

  • 3

    C u p r i n s

    Cuvnt nainte ................................................................................................................. 7

    Capitolul 1. Introducere

    1.1. Scurt istoric al statisticii .................................................................................... 10

    1.2. Obiectivele statisticii . 12

    1.3. Cteva concepte cheie ale demersului statistic ................................................. 13

    1.4. Exerciii i aplicaii practice .............................................................................. 17

    Capitolul 2. Msurarea. Organizarea coleciei de date

    2.1. Msurarea n tiinele socio-umane ................................................................... 19

    2.2. Proprieti ale scalelor ....................................................................................... 20

    2.2.1. Magnitudinea ........................................................................................ 20

    2.2.2. Intervale egale ....................................................................................... 20

    2.2.3. Zero absolut ........................................................................................... 21

    2.3. Tipuri de scale ................................................................................................... 21

    2.3.1. Scalele nominale ................................................................................... 21

    2.3.2. Scalele ordinale ..................................................................................... 22

    2.3.3. Scalele de interval ................................................................................. 23

    2.3.4. Scalele de raport ................................................................................... 24

    2.4. Organizarea datelor brute .................................................................................. 25

    2.5. Exerciii i aplicaii practice .............................................................................. 26

    2.6. Quiz ................................................................................................................... 27

    Capitolul 3. Distribuii i frecvene

    3.1. Ordonarea i gruparea datelor ........................................................................... 28

    3.1.1. Limitele de grupare ............................................................................... 31

    3.1.2. Centrele intervalelor ............................................................................. 31

    3.2. Histograma i poligonul frecvenelor ................................................................ 31

    3.3. Frecvenele cumulate ......................................................................................... 34

    3.4. Histograma i poligonul frecvenelor cumulate ................................................ 35

    3.5. Criterii de evaluare vizual a formei distribuiilor ............................................ 37

    3.6. Exerciii i aplicaii practice .............................................................................. 39

  • 4

    Capitolul 4. Indicatori ai tendinei centrale

    4.1. Media aritmetic ................................................................................................ 40

    4.2. Mediana ............................................................................................................. 44

    4.3. Modul ................................................................................................................ 47

    4.4. Comparaie ntre medie, median i mod n funcie de distribuie .................... 48

    4.5. Cteva concluzii relative la indicatorii distribuiei univariate .......................... 50

    4.6. Exerciii i aplicaii practice .............................................................................. 51

    4.7. Quiz ................................................................................................................... 52

    Capitolul 5. Msuri ale variabilitii

    5.1. Amplitudinea mprtierii ................................................................................. 56

    5.2. Abaterea intercuartilic ..................................................................................... 57

    5.3. Abaterea medie absolut ................................................................................... 59

    5.4. Abaterea standard i variana (dispersia) .......................................................... 60

    5.4.1. Semnificaia abaterii standard .............................................................. 63

    5.5. Coeficientul de variaie ..................................................................................... 64

    5.6. Indicatori ai formei distribuiei ......................................................................... 65

    5.6.1. Coeficientul de simetrie (skewness) i boltirea (kurtosis) ..................... 65

    5.7. Exerciii i aplicaii practice .............................................................................. 66

    Capitolul 6. Inferena statistic

    6.1. Introducere ........................................................................................................ 68

    6.2. nelesul conceptului de semnificaie statistic ................................................. 69

    6.3. Eroarea standard a unei medii de selecie i semnificaia ei ............................. 70

    6.4. Eroarea standard a unui cuantum procentual i semnificaia ei ........................ 71

    6.5. Sarcini i probleme de comparaie .................................................................... 71

    6.6. Eantioane necorelate de volum mare. Ipoteza de nul ...................................... 72

    6.7. Eantioane de volumm mare, corelate ............................................................... 75

    6.8. Semnificaia diferenei dintre dou cuantumuri procentuale ............................ 76

    6.9. Tabelele t i z pentru testele de semnificaie ..................................................... 76

    6.10. Semnificaia diferenei mediilor a dou eantioane de volum mic corelate .... 77

    6.11. Semnificaia diferenei mediilor a dou eantioane de volum mic necorelate 80

    6.12. Exerciii i aplicaii practice ............................................................................ 82

  • 5

    Capitolul 7. Studiul asocierii dintre variabile prin corelaie

    7.1. Introducere ........................................................................................................ 86

    7.2. Calculul coeficientului de corelaie ................................................................... 89

    7.2.1. Interpretarea orientativ a coeficientului de corelaie ......................... 91

    7.3. Coeficientul de corelaie a rangurilor ................................................................ 93

    7.4. Limitele de ncredere ale unui coeficient de corelaie ....................................... 96

    7.5. Interpretarea unui coeficient de corelaie .......................................................... 96

    7.6. Interpretarea varianei unui coeficient de corelaie prin coeficientul de

    determinare ...............................................................................................................

    97

    7.7. Ali coeficieni de corelaie ............................................................................... 99

    7.7.1. Coeficienii de corelaie biseriali i triseriali ....................................... 99

    7.7.2. Ali coeficieni de corelaie ................................................................... 100

    7.8. Utilizrile coeficientului de corelaie ................................................................ 101

    7.9. Exerciii i aplicaii practice .............................................................................. 102

    7.10. Quiz ................................................................................................................. 105

    Capitolul 8. Utilizarea predictiv a asocierii dintre variabile

    Regresia liniar simpl i multipl

    8.1. Introducere ........................................................................................................ 106

    8.2. Predicia determinist i probabilist ................................................................ 108

    8.3. Regresia bivariat .............................................................................................. 109

    8.3.1. Regresie versus corelaie ...................................................................... 114

    8.4. Regresia liniar multipl (multivariat) ............................................................ 114

    8.4.1. Probleme speciale implicate n regresie ............................................... 116

    8.4.2. Validarea modelului regresiv ............................................................... 118

    8.4.3. Glosar de termeni cheie ai regresiei liniare ......................................... 118

    8.5. Exerciii i aplicaii practice .............................................................................. 119

    Capitolul 9. Testare ipotezelor prin tehnica chi-ptrat

    9.1. Teste neparametrice, distribuii binomiale i multinomiale .............................. 121

    9.2. Termeni cheie i definiii implicate n testul chi-ptrat ..................................... 122

    9.3. Condiii i restricii pentru efectuarea lui chi-ptrat .......................................... 124

    9.4. Utiliarea practic a testului chi-ptrat ............................................................... 124

  • 6

    9.5. Exemple de aplicare practic a testului chi-ptrat de potrivire i de asociere ... 126

    9.6. Mrimea efectului pentru testul chi-ptrat al asocierii dintre variabile ............. 133

    9.7. Exerciii i aplicaii practice .............................................................................. 133

    Capitolul 10. Metode nonparametrice de testare a ipotezelor statistice.

    10.1. Teste de semnificaie parametrice i neparametrice ......................................... 135

    10.2. Testul U Mann-Whitney pentru eantioane independente .............................. 136

    10.3. Exerciii i aplicaii practice ............................................................................ 139

    10.4. Testul semnului T al lui Wilcoxon pentru eantioane corelate ... 140

    10.5. Exerciii i aplicaii practice ............................................................................ 143

    10.6. ANOVA pe o cale prin testul Kruskal-Wallis ................................................. 143

    10.7. Exerciii i aplicaii practice ............................................................................ 147

    10.8. Testul rsngurilor Friedman pentru msurtori repetate ................................... 148

    10.9. Exerciii i aplicaii practice ............................................................................ 150

    Test pentru verificarea de sintez .

    151

    Bibliografie ................................................................................................................. 154

    Anexe cu utiliti statistice .... 157

    Glosar de simboluri i formule de calcul ..................................................................... 177

    Rspunsuri la exerciiile i aplicaiile practice propuse . 184

  • 7

    Cuvnt nainte

    Prezena Statisticii ca materie obligatorie la tiinele socio-umane, n spe la

    specializarea Psihologie, este justificat printre altele de faptul c eafodarea acesteia ca

    tiin a depins n mod esenial de ncorporarea experimentului - i implicit a msurtorii - ca

    metod de baz n constituirea corpului su de cunotine i legi. Pe de alt parte, naterea

    psihologiei aplicate i extinderea sa pervaziv spre toate domeniile socialului nu ar fi fost

    posibil fr apelul la cuantificare, msurtoare i cifr. Deci, att psihologul practician, care

    colecteaz, stocheaz i prelucreaz n mod constant date cantitative, ct i cel din spaiul

    academic, care trebuie s fie la zi cu cercetarea tiinific din domeniul su, ca i din cele

    conexe (medicin, biologie, sociologie au tiinele educaiei), trebuie s aib cel puin o

    iniiere, dac nu chiar o formare solid n domeniul Statisticii, fr de care nu se poate pstra

    contactul cu progresele tiinei.

    Apare astfel ca inexplicabil rezistena activ i rezerva aproape ostil a studentului de

    la tiinele socio-umane fa de Statistic, care vede adesea n acest obiect de studiu ceva ce ar

    contraveni chiar dimensiunii umaniste a tiinei n care el se iniiaz. Exist multe explicaii

    posibile pentru faptul semnalat. Una dintre cele mai plauzibile ar fi aceea c studenii de la

    Psihologie, Pedagogie, Sociologie sau Asisten social au o formaie iniial umanist, cu un

    grad de elaborare i consolidare mai sczute a conceptelor i deprinderilor intelectuale de tip

    matematic. Acest fapt poate produce din start o rezerv fa de abordrile de tip cantitativ. Pe

    de alt parte, progresele incredibile din ultimele decenii n domeniile metodologiei i al

    prelucrrii datelor fac ca centrarea pe metodele statistice elementare s nu mai fie deloc

    suficient pentru a ine pasul cu evoluiile din domeniu, ceea ce transform n mod obligatoriu

    Statistica ntr-un obiect de studiu al nvrii permanente.

    n cel de al treilea rnd extinderea progresiv, uneori exploziv, a arsenalului de

    metode statistice genereaz tot mai mari dificulti de mai pstra unitatea intern i

    perspectiva coerent asupra corpului de cunotine al acestui domeniu. n cazul n care se

    nzuiete spre acest lucru, alocarea permanent de resurs cognitiv pentru a menine n

    priz domeniul statistic devine o condiie intrinsec a progresului i evoluiei n carier.

    Tendina la entropie a informaiei ce intr n sistemul cognitiv uman, adic la uniformizare i

    la tergere a diferenelor specifice, ca urmare a marii varieti de tehnici i procedee ce apar

    fr ncetare n cadrul acestei tiine att de dinamice i evolutive, poate genera sentimentul c

    Statistica este unul dintre principalii contributori la imperialismul metodologic din tiin.

  • 8

    Dincolo de cauzele enumerate exist cu siguran i elemente contextuale sau

    conjuncturale care pot explica rezistena activ a studentului de la tiinele sociale fa de

    Statistic, explicabil i prin stilul sau maniera de predare, prin calitatea cursurilor editate i a

    aplicaiilor propuse, prin gradul de utilizare a metodelor i tehnicilor moderne de predare-

    nvare-evaluare, prin numrul de ore de studiu alocate acesteia de programa universitar etc.

    Pe de alt parte, exist o mulime de semnale care indic faptul c starea de fapt

    analizat anterior poate fi depit cu bine de majoritatea studenilor. Astfel, n Romnia

    ultimului deceniu au aprut cel puin cinci lucrri de referin n domeniul Statisticii tiinelor

    sociale (pentru a face referin doar la Rotariu i colaboratorii, la Clocotici i Stan, la Sava,

    Labr i Popa), la care se adaug multitudinea de lucrri de iniiere n SPSS din literatura

    romna i din cea strin. Extinderea progresiv a numrului de aplicaii incluse n pachetele

    de programe computerizare pentru tratarea datelor (SPSS, SAS, NCSS etc.) a fcut ca

    accesarea i derularea unor foarte complicate i avansate tehnici statistice s depind efectiv

    doar de o apsare de buton. Aceast facilitate i accesibilitate extraordinar nu elimin ns n

    nici un fel problema crerii infrastructurii conceptuale i a deprinderilor matematice, fr de

    care tehnica rmne mut n faa neiniiatului.

    Lucrarea de fa este n fapt un curs de iniiere n Statistica psihologic. Prin

    elaborarea sa ne-am propus s prezentm conceptele i procedeele de baz ale statisticii

    descriptive i infereniale, univariate i bivariate, ntr-o manier prietenoas, inteligibil i cu

    bune valene formative. Preocuparea noastr de baz a constat n selectarea informaiei utile,

    lsnd n plan secundar prezentarea ntemeierii matematice a tehnicilor statistice prezentate.

    De asemenea, legtura cu programele computerizate de prelucrare a datelor, acolo unde s-a

    produs o revoluie nevzut la care suntem cu toii martori, este doar vag i inconstant

    sugerat. Aceasta deoarece considerm c prelucrarea informatizat a datelor trebuie s se

    fac ulterior n mod distinct, dup ce s-a construit eafodajul minimal de concepte i tehnici

    necesare utilizrii programelor computerizate.

    Cartea de fa nu este una extins ca volum, cele 10 capitole care o compun putnd fi

    ntlnite, cu mici variaiuni, n toate lucrrile actuale de iniiere n Statistic. Astfel, dup

    primele trei capitole introductive, relative la istoricul, obiectivele i conceptele de baz ale

    domeniului statistic, despre msurare, tipuri de scale, distribuii i frecvene, sunt prezentai

    indicatorii tendinei centrale, determinarea indicilor de mprtiere a datelor i ai celor relativi

    la forma distribuiei. Capitolul al aptelea trateaz inferena statistic i testarea ipotezelor

    bazate pe diferene ale mediilor, el continundu-se n mod firesc cu un capitol care prezint

    testarea ipotezelor relative la asocierea variabilelor prin corelaie i cu un altul despre regresia

  • 9

    bivariat. Acest capitol face doar trimiteri la regresia multivariat, rmnnd cantonat

    preponderent n zona regresiei simple, deoarece regresia multipl depete nivelul iniierii

    statistice, fiind greu de prezentat fr cunotine avansate i fr apelul la programe puternice

    de tratare a datelor. Ultimele dou capitole trimit la testarea ipotezelor statistice prin teste

    neparametrice, aplicabile datelor nominale i categoriale, cum sunt testele chi-ptrat, Man-

    Whitney, Wilcoxon, Kruskal-Wallis sau Friedman. Aa cum se poate observa cu uurin,

    lucrarea a acordat un spaiu amplu testrii ipotezelor statistice, fiind prezentat aproape toat

    gama procedeelor tehnice destinate acestui scop. Nu am inclus aici i tehnicile analizei de

    varian ANOVA care, prin multitudine i complexitate, fac obligatoriu apel la un program

    automat de prelucrare computerizat a datelor, fiind mai potrivit s fie incluse n volumul

    destinat statisticilor multivariate. Menionm, de asemenea, c am preferat s prezentm toate

    metodele de testare a ipotezelor incluse n acest volum fr a face n nici un fel apel la

    resursele SPSS, cci acest lucru face obiectul unui curs special elaborat cu aceast misiune.

    Fiind destinat nceptorului, lucrarea de fa a ncercat s in cont maximal de

    principiul accesibilitii, prin simplificarea discursului teoretic i prin reliefarea constant mai

    ales a informaiei utile. Pe de alt parte, o lege a nvrii leag temeinicia i calitatea acesteia

    de calitatea i profunzimea interaciunii cu materialul de nvat. Pentru a facilita centrarea pe

    aspectele aplicative, toate capitolele, inclusiv cel introductiv, sunt nsoite de exerciii i

    aplicaii practice, de teste rapide de verificare a cunotinelor (quiz, pstrnd terminologia

    englez) i de testul final de sintez i evaluare de ansamblu, destinat autoverificrii stadiului

    atins n nvarea statisticilor introductive. Pentru majoritatea acestor aplicaii practice s-au

    oferit soluiile problemelor propuse, nsoite deseori de explicaii adiionale care s contribuie

    la mai buna lor nelegere. Astfel, o seciune final a lucrrii ofer soluia rezolvrii corecte a

    majoritii problemelor prezentate cu scop de autoevaluare la sfritul fiecrei uniti de curs.

    Lucrarea de fa i are continuarea ntr-un al doilea volum, destinat deprinderii i

    perfecionrii n utilizarea procedurilor computerizate de prelucrare a datelor cu SPSS, dar i

    de un al treilea volum, destinat prezentrii statisticilor avansate (Statistici multivariate pentru

    psihologie). Ordinea apariiei lor editoriale nu este cea din secvena prezentat anterior, acest

    volum introductiv fiind eleaborat ultimul, complexitatea i mai ales miza lui pedagogic

    deosebit genernd cele mai mari probleme de elaborare i editare. n felul acesta se poate

    vorbi de o trilogie statistic, ce se constituie ntr-un ghid complex de monitorizare a

    formrii i perfecionrii n domeniul abordrilor de tip cantitativ. Feedback-ul primit din

    partea principalilor si utilizatori, studenii, va contribui la mbuntirea calitii acestui

    volum, motiv pentru care sugestiile acestora sunt ateptate cu real i legitim interes.

  • 10

    CAPITOLUL 1

    INTRODUCERE

    1.1. Scurt istoric al statisticii

    Statistica nu s-a nscut n cmpul psihologiei tiinifice, aceasta prelund i

    ncorpornd procedeele ei pentru a putea depi posibilitile limitate oferite de cea mai

    rspndit dintre metodele sale, observaia, ... care plaseaz psihologul () n domeniul

    relativului empiric, adic n lumea fenomenelor, a caracteristicilor i a proprietilor care sunt

    vag conturate i neasamblate n sisteme de cunotine riguros nchegate (Clocotici i Stan,

    2000, p. 11).

    Destinul nsui al tiinei nou aprute, psihologia, a depins de ruperea acesteia din

    cmpul filosofiei i translarea spre tiinele pozitive, care i-au ncorporat experimentul ca

    metod predilect de cercetare a relaiei cauz efect. Intrarea ei n laborator, separarea

    variabilelor independente i dependente presupunea cu necesitate metode i tehnici statistice

    de prelucrare a datelor obinute prin msurtoare.

    Impactul acestei apropieri reciproce avea s fie benefic reciproc, o serie de mari

    psihologi (Galton, Spearman, Pearson, Guilford sau Cattell) avnd contribuii remarcabile,

    care au schimbat faa statisticii. Aceasta deoarece domeniul faptelor psihice este mai complex

    dect fizica cuantic, biologia celular sau astronomia, prin aceea c el este marcat de

    multicauzalitate, cauzalitate retroactiv sau de alte aspecte caracteristice ale cauzalitii.

    Muli autori leag apariia statisticii de probleme pragmatice, preponderent economice

    sau administrative, cum ar fi aa-numitele tabele de mortalitate ale lui Graunt (1661), prin

    care ptura negustoreasc din Anglia ncerca s pun bazele unui sistem de asigurri pe via.

    Graunt este considerat a fi i printele demografiei, pe care a fundamentat-o prin aa-numita

    aritmetic politic, nscut n 1662 (termenul aparine lui Petty). Analiza datelor despre

    evenimentele demografice, n spe despre decese, arta o neateptat constan i

    regularitate, ceea ce sugereaz posibilitatea gsirii unor legi n domeniul vieii sociale, de

    consisten apropiat celor din tiinele naturii (Rotariu, 1999, p. 16).

    Curiozitatea tiinific produs de o asemenea descoperire remarcabil va fi

    generatoarea unei activiti sistematice de culegere, stocare, prelucrare i interpretare a unor

    informaii numerice despre importante domenii ale statului, corespondentul centrelor

  • 11

    naionale de statistic din timpurile moderne. De altfel, chiar i etimologic statistic pleac de

    la status, care poate fi interpretat att ca stare de fapt, ct i ca stat, deci statistica ar putea fi

    considerat o tiin de stat. Aceasta corespunde i etimologiei propuse de cel considerat a fi

    introdus termenul de statistic, Achenwall.

    Corespondena susinut dintre Pascal i Fermat (1654) a stat la baza fundamentrii

    unei teorii matematice asupra verosimilitii, n timp ce cooperarea mai tardiv dintre Gauss i

    Laplace (1809-1812) s-a concretizat n conceptul de distribuie normal (clopotul lui Gauss).

    Dei problemele demografice i economice au fost primordiale n conturarea

    obiectului statisticii, contactul psihologiei cu aceast tiin avea s fie fundamental pentru

    destinul ei. Iat cteva aspecte mai semnificative:

    Cel care a introdus psihologia n registrele de stare civil, dup inspirata expresie a

    lui Pavelcu, n anii 1730 i 1732, Christian Wolff (prin lucrrile Psihologia empirica

    i Psihologia rationalis) anticipa chiar de atunci necesitatea existenei unei subramuri

    matematice a acesteia, pe care el a numit-o, inspirat, psihometrie. Dei termenul va

    cpta o cu totul alt semnificaie la cei care au studiat fenomenele paranormale n

    Anglia secolului al XIX-lea (care au i creat o Societate Regal de Psihometrie),

    sensul iniial va fi cel care se va impune, prin ncercrile lui Galton i Binet de a

    dezvolta domeniile aplicative ale psihologiei, indestructibil legate de un aparat

    matematic de tip statistic.

    Este meritul unui astronom belgian, Qutelet (1796-1874) de a fi extins aplicarea unor

    legi ale statisticii, cum ar fi legea distribuiei normale sau binomial, derivat din

    luarea n considerare a distribuiilor probabiliste, spre alte domenii dect cele sociale,

    aici incluzndu-se i cele psihologice.

    Galton, iniiatorul colii psihometrice engleze (al crei punct forte va fi chiar ideea de

    msurtoare i cuantificare a faptului psihic) a creat metode statistice de abordare a

    legilor ereditii (metoda gemenilor i a genealogiilor, de exemplu), avndu-i ca

    succesori pe Pearson, teoreticianul metodei corelaiei prin metoda produselor (1896),

    pe Spearman, creatorul metodei corelaiei prin metoda rangurilor i ntemeietorul

    analizei factoriale (1904). Continuatorii acestora (Fisher, Burt i Vernon) vor merge

    mai departe pe liniile de for ale colii engleze de statistic, considerat principala

    contributoare n conturarea domeniului acesteia. n domeniul personalitii, H. J.

    Eysenck i R. B. Cattell (ultimul a imigrat n America dup perioada de formare n

    Anglia) vor fi exponeni strlucii ai metodelor statistice i cu precdere ai analizei

    factoriale.

  • 12

    Al doilea mare contributor a fost coala german, prin Conring (1606-1682),

    Achenwall (1719-1772) i, bineneles, Gauss (1777-1785).

    n America muli matematicieni i psihologi au continuat n mod natural coala

    englez, prin Thurstone, Hotelling, Guilford, Lord, Novick, Fruchter sau Cronbach.

    n psihologie, statistica a evideniat o evoluie de la distribuii spre corelaie, analiza

    factorial i de cluster, teoria rspunsurilor la itemi sau a generalizabilitii, pe lng

    analiza varianei simple aprnd tehnici de analiz multivariat (ANOVA, MANOVA.

    ANCOVA, MANCOVA), n timp ce pentru psihologia social i sociologie, pe lng

    problema analizei relaiilor dintre variabile, s-au impus tot mai mult problemele legate

    de selecie, eantionare i reprezentativitate (statistica inferenial).

    1.2. Obiectivele statisticii

    De la o tiin global a statului (vezi Rotariu et al., 1999, pp. 15-22), care i

    propunea s ofere conductorilor instrumente de aciune eficace, rezultate din investigarea

    principalelor aspecte ce puteau fi nregistrate, pstrate, prelucrate i interpretate, statistica s-a

    extins spre planurile psihologic, biologic, fizic, chimic, economic, politic, agricultur,

    devenind un mod de gndire al viitorului (Vod, 1977). S-au nscut o multitudine de ramuri

    i de abordri speciale, bazate pe proceduri ce se adapteaz la specificul domeniului

    investigat, desprinse toate din trunchiul aceleiai tiine, statistica general.

    Aceast tiin cuprinde un corp sistematic de cunotine i de metode statistice, care

    au ca obiect colectarea, prelucrarea i interpretarea rezultatelor care provin de la populaii i

    indivizi statistici. Acetia pot fi oameni, nsuiri, plante, gene, porumbei, maimue, peti,

    culturi, chiar i atomi sau electroni, pentru toate legile statisticii opernd ntr-o manier

    similar.

    Datele statisticii provin fie de la aceleai populaii, care se comport diferit ca urmare

    a faptului c asupra lor acioneaz o multitudine de cauze, fie de la acelai individ, entitate,

    de-a lungul diferitelor sale manifestri pe scara timpului. Dei nu este o ramur a matematicii

    (nu pleac de la axiome, pentru a deriva prin demonstraii sau teoreme enunuri sistematice),

    statistica ofer un larg cmp de aplicaii matematicii, n primul rnd datorit faptului c

    ambele lucreaz cu numere i reguli de calcul i, de la un anumit nivel, relaiilor dintre

    entitile statistice li se substituie raporturi matematice abstracte, tipice entitilor ideale.

    Aceasta face foarte dificil trasarea unei linii de demarcaie ntre matematic i statistic. Dei

    nu are un referenial empiric anume (ea propundu-i s stabileasc regula general aplicabil,

    indiferent de domeniul realitii de care se ocup) statistica coboar totui din planul general

  • 13

    abstract (matematica rmnnd cantonat n turnul de filde al propriilor sale abstracii),

    avnd un caracter aplicativ mult mai explicit, deoarece i propune s rezolve probleme

    concrete.

    Mai mult, demersul statistic nu este posibil fr materia prim a datelor colectate

    anterior, ntr-o direcie n care prelucrarea i interpretarea datelor este doar o parte a secvenei,

    adic cea mai tehnic i mai specializat. S nu uitm totui c momentul creator al cercetrii

    tiinifice, scnteia sau impulsul iniial sunt date de conturarea ipotezei specifice. Apoi,

    sesizarea semnificaiei datelor prelucrate nu este posibil fr o solid cultur a domeniului n

    care sunt aplicate metodele statistice. Psihologul, pedagogul, sociologul sau economistul sunt

    cei care valorific rezultatele tehnice pe care le ofer statistica sau statisticienii.

    1.3. Cteva concepte cheie ale demersului statistic

    Termenul de populaie statistic, alctuit din indivizi statistici, care pot fi persoane,

    fapte, entiti fizice etc. a fost deja definit anterior. El nu este sinonim cu cel de populaie din

    limbajul comun.

    Cum tot ceea ce exist, n plan fizic sau ideal, are o mulime de determinri i de

    atribute ce nu pot fi cuprinse i analizate simultan, separat sau exhaustiv, sunt selectate doar o

    parte dintre aceste determinri, limitarea fiind impus i de mijloacele de care dispunem la un

    moment dat. Asfel, indivizii umani se pot diferenia n funcie de vrst, apartenen de gen,

    mediu de provenien, nivel propriu de instrucie (proprie sau a prinilor), status cultural,

    nivel economic, religie, ras, etnie etc. Fiecare dintre aceste criterii care opereaz diferene se

    numete variabil, deoarece n absena lor oamenii ar fi identici.

    Unele variabile sunt discontinue (discrete), cum ar fi sexul (masculin, feminin),

    mediul (urban, suburban, rural); altele sunt continue (nlimea, greutatea, vrsta). Mulimea

    valorilor pe care le poate lua o caracteristic particular constituie distribuia variabilei

    respective. Fiecare populaie are propria sa distribuie pentru fiecare variabil. De exemplu se

    tie c la natere raportul dintre biei i fete este de aproximativ de 52 la 48 de procente,

    pentru ca acesta s se inverseze dup primii ani de via din cauza vulnerabilitii infantile, i

    implicit a mortalitii mai mari n rndul sexului masculin. La vrsta a treia acest raport se

    dezechilibreaz i mai mult, femeile avnd o speran de via cu aproape 10 ani mai mare

    dect brbaii. Deci aceeai populaie are, n trei momente diferite ale existenei sale, trei

    distribuii diferite, n funcie de aceeai caracteristic, apartenena de gen.

    Parametrii sunt valorile fixe ce exist la un moment dat pentru o populaie, luat n

    ansamblul ei, n raport cu o variabil. Ideea de variabil este strns asociat cu aceea de

  • 14

    cuantificare, msurtoare, ca mijloc de determinare a variabilitii. Orice msurtoare

    presupune, la rndul ei, o scal de msurare. Toate aceste elemente: individ, populaie

    statistic, variabil, distribuie definesc domeniul statisticii descriptive, alctuit din corpul

    de metode prin care pot fi caracterizate faptele i fenomenele studiate.

    Dar statistica a tins de la nceputuri spre numerele mari, spre populaiile extinse, a

    cror cuprindere i descriere detaliate sunt adesea imposibile sau extrem de dificile, din cauza

    costurilor pe care le-ar antrena. Chiar i atunci cnd acest lucru ar fi tehnic posibil,

    investigaiile i prelucrrile ar presupune perioade mari de timp, care este el nsui o mare

    surs de variabilitate, antrennd modificri nsemnate ale multor variabile, sau chiar moartea

    experimental. Soluia gsit acestei probleme este statistica inferenial, un ansamblu de

    tehnici i de metode (de eantionare, de selecie etc.), prin care determinrile fcute asupra

    unui numr mai mic de entiti ce compun populaia de ansamblu sunt extrapolate ca estimri

    asupra acestei populaii, n limite de ncredere rezonabile. Acest domeniu al statisticii este

    extrem de utilizat de sociologie, metoda anchetei pe baz de chestionar sau a sondajelor de

    opinie fiind doar dou exemple. Dac vom lua n considerare faptul c instrumentul de baz al

    psihodiagnozei, testul psihologic, este etalonat pe populaii reprezentative zonal sau naional,

    vom vedea c statistica inferenial are importante utilizri i n psihologie.

    Statistica inferenial presupune alte cteva concepte care o circumscriu. Eantionul

    este o parte, redus ca numr, din populaia statistic de baz care, atunci cnd este extras

    corect, permite estimaia parametrilor acestei populaii, adic o aproximare a valorii reale a

    acestora n limite de ncredere ce pot fi determinate. O ndelung practic social a dus la

    dezvoltarea puternic a statisticii infereniale, i aceasta din mai multe motive:

    Costurile incomparabil mai mici (s comparm costurile unui referendum naional cu

    ale unui sondaj de opinie desfurat pe un eantion reprezentativ naional).

    Utilizarea ei extensiv, pentru un numr tot mai mare de beneficiari: ageni economici,

    organizaii, partide, guverne etc., n scopuri diagnostice, dar i prognostice, care

    fundamenteaz decizii de o mare importan social.

    Rafinarea progresiv a tehnicilor de eantionare, ceea ce a fcut ca marja de eroare s

    fie tot mai mic, astfel nct predicia pe eantioane mici s poat fi extrapolat la

    populaii statistice foarte mari.

    Statistica din tiinele socio-umane are ca i concept primar pe acela de variabilitate a

    datelor, care poate fi interindividual (cel mai adesea), dar i intraindividual. Acesta

    angajeaz alte concepte, cum ar fi cel de surs de variaie (previzibil sau imprevizibil,

    sistematic sau aleatoare, determinabil sau nedeterminabil), sau cel de msurare. Dac

  • 15

    sursele previzibile de variaie sunt dinainte tiute i circumscrise din start de investigaia n

    cauz (a se vedea controlul variabilelor de la metoda experimental, variabilele test, subiect i

    examinator, la metoda testului), exist i o multitudine de surse fortuite de variaie (variabilele

    externe necontrolate, n primul exemplu, i variabila situaional, n cel de al doilea). Analiza

    statistic ncearc s deceleze ponderea fiecrei surse de variaie n efectul final. Deoarece

    datele numerice de natur statistic reprezint rezultatul amalgamrii unui mare numr de

    cauze, este posibil ca statistica s fie continuarea fireasc a experimentului, pe care tinde s l

    nlocuiasc (Yule i Kendall, 1969, p. 16), ntruct ea ... va determina care sunt cauzele cele

    mai importante i care sunt rezultatele observrii ce pot fi atribuite fiecrei categorii de

    cauze.

    Msurarea este operaia prin care se atribuie numere unor aspecte ale obiectelor sau

    evenimentelor, potrivit unei reguli (Smith, 1974). Dup cum arta i Piaget, problema metriei

    este una fundamental n psihologie, deoarece puine din domeniile sau fenomenele sale se

    preteaz, n sens strict, la cuantificare. Aceasta poate fi chiar una dintre cauzele (dac nu

    cumva i cea mai important) pentru care psihologia are un trecut lung, dar o istorie scurt ca

    tiin (Ebbinghaus). Msurarea aduce cu sine problema scalei de msur, care trebuie s fie

    corect, constant (produce date identice pentru fenomene identice, n condiii de msurare

    identice), exhaustiv (ea poate msura toate entitile crora le este destinat) i reciproc

    exclusiv (n urma msurtorii, fiecare entitate capt o valoare i numai una). Principalele

    tipuri de scale cunoscute (nominal, ordinal, de interval i de raport) evideniaz proprieti

    care dau conotaii i aplicaii specifice msurtorilor ce rezult din fiecare tip, astfel nct cele

    mai complexe nglobeaz caracteristicile celor mai simple, dar aducnd aducnd suplimentar

    elemente i posibuiliti noi, difereniatoare.

    Caracteristicile variabilei pot fi calitative i cantitative, continue i discontinue.

    Distribuiile obinute aduc n discuie problema frecvenelor (absolute i relative, simple sau

    cumulate), dar i a modalitilor de a le reprezenta grafic: poligon al frecvenelor, histograme,

    curbe, grafice, scatter etc.

    O bun parte a statisticii descriptive urmrete definirea celor mai importante tendine

    centrale, adic media, mediana i modul, dar i a tendinelor extreme, cum ar fi amplitudinea

    mprtierii, abaterea medie, abaterea semiinterquartil, abaterea standard sau dispersia,

    variana. Distribuia n sine poate fi judecat din punctul de vedere al formei (simetrie sau

    boltire, adic skewness i kurtosis, n englez). Toate aceste noiuni, unele dintre ele derivate

    din teoria probabilitilor, prin care sunt fundamentate matematic valorile tipice ale

  • 16

    variabileleor, dar i repartiiile de diverse tipuri, contureaz mai exact domeniul statisticii

    descriptive.

    Statistica inferenial, pe lng conceptele deja amintite (populaie, eantion

    eantionare, estimare), include i testarea ipotezelor statistice. n capitole distincte, statistica

    trateaz corelaia, asocierea datelor cantitative i calitative, analiza dispersional, unifactorial

    sau bifactorial, analiza factorial i analiza de cluster. Cursul de fa este unul de iniiere, n

    consecin el va acoperi doar o parte dintre problemele enunate, adic elementele care

    fundamenteaz cunoaterea statistic n scopul aplicrii ei la situaii uzuale, comune.

    Pentru atingerea acestui obiectiv avem n vedere dou aspecte importante:

    comprimarea la minimum a prii de ntemeiere matematic a subiectelor tratate, problem

    care rmne n grija teoreticienilor statisticii, adic a celor ce contureaz dimensiunea

    savant, tiinific a domeniului; permanenta preocupare de a oferi exemple sau aplicaii

    concrete, pentru a evidenia puterea real a procedeelor de lucru prezentate. n fond, acest curs

    se adreseaz n principal studenilor de la psihologie i pedagogie, cel mai adesea avnd o

    dominant umanist a formaiei i pregtirii lor. Intenia noastr a fost aceea de a nu-i inhiba

    cu demonstraii abstracte, de factur matematic, ci de a-i familiariza cu cele mai des ntlnite

    aplicaii statistice, prin care s fie capabili s-i valorifice cercetrile proprii. Cursul are de

    asemenea n vedere practicianul din aceste domenii, cel care, dup ce acumuleaz o cantitate

    de date brute prin metoda testlor sau a chestionarelor, tinde s le valorifice sau s le

    gestioneze mai bine.

    Aplicaiile speciale sau savante ale statisticii presupun, pe lng aceast iniiere,

    stagii de pregtire mai avansate, susinute de programe computerizate (SPSS, SAS sau

    NCSS). Extraordinara lor putere de lucru, precizia, elegana, multitudinea opiunilor i alte

    faciliti de acerst gen par a transforma o ntreag evoluie a domeniului (i procedee de lucru

    altdat extensiv utilizate) n istorie. Susinem ns opinia potrivit creia sensul acestor

    aplicaii computerizate nu poate fi dedus fr o cultur a domeniului, fr un stagiu prealabil

    de iniiere dup procedeele i cu mijloacele clasice (creion, caiet de matematic, rigl,

    minicalculator cu panou de lucru statistic), prin care vom deslui cele mai importante aplicaii

    statistice n situaiile curente. Saltul spre puternicele programe computerizate va fi astfel mult

    facilitat, deoarece vom ti ce s cerem computerului, la ce tip de prelucrri s facem apel i ce

    relevan vor avea datele pe care acesta ni le ofer cu generozitate.

  • 17

    1.4. Exerciii i aplicaii practice

    1. V intereseaz problema abandonului colar la ciclul gimnazial din Romnia de azi. Precizai care este populaia studiului i care eantionul. Identificai cteva dintre variabilele de interes pentru studiul desfurat. Evideniai cteva dintre variabilele categoriale i real numerice implicate n acest studiu. 2. Sugerai cum s-ar putea obine obine un eantion complet randomizat (sau aproape

    complet randomizat) din populaia unui micu orel (5 000 de locuitori). 3. Dac ai folosi cartea de telefon ai putea obine un eantion randomizat pentru acest ora? 4. De ci cai ai avea nevoie pentru a determina cu exactitate cte picioare are un cal? Dar

    de ci cai ai avea nevoie pentru a determina precis care este greutatea medie a unui cal? Explicai unde avem de-a face cu o variabil i unde cu o constant i care dintre cele dou categorii este mai informativ.

    5. Cineva ar putea obiecta c a doua ntrebare de mai sus conine o capcan: caii de vrste

    foarte mici (sub un an, adic mnjii) aparin i ei speciei cabaline, dar dac i-am include n eantion ei ar putea contribui la scderea semnificativ a mediei greutii cailor ca specie. Apoi, greutatea medie poate diferi de la ras la ras i de aceea determinarea greutii medii a speciei cabaline s-ar putea s nu aib sens. Mai mult, ca i la oameni, caii au oasele mai grele dect iepele i n consecin un indicator sintetic al greutii comune ntregii specii cabaline ar fi irelevant.

    Identificai n exemplul de mai sus variabilele implicate. Identificai care sunt datele categoriale i cele real numerice (de msurtoare). Precizai i alte variabile de interes pentru greutatea medie a cailor, indicnd tipul acestora. Identificai care sunt cazul, variabilele i valorile implicate n exemplul analizat. 6. Dai cte trei exemple n care interesul de cercetare este:

    6.1. De a determina diferena dintre dou sau mai multe grupuri. 6.2. De a determina realaiile sau gradul de asociere dintre aceste variabile. 6.3. De a exemplifica cu cteva date categoriale. 6.4. De a exemplifica cu cteva date de msurtoare.

    7. Precizai care este diferena dintre: 7.1. Eantion i populaie. 7.2. Statistici i parametri. 7.3. Eantioane randomizate i eantioane de convenien. 8. Explicai urmtoarele: 8.1. De ce variabilitatea este conceptul de baz al statisticii? 8.2. Ce nelegei prin faptul c genul masculin prezint mai mult variabilitate dect

    cel feminin n ceea ce privete nlimea, greutatea sau inteligena? 8.3. Din ntrebarea de mai sus rezult c brbaii ca grup sunt neaprat mai nali, mai

    grei sau mai inteligeni dect femeile? Pe ce v bazai afirmaia?

  • 18

    9. Explicai diferenele existente ntre statistica descriptiv i cea inferenial. 10. Facei parte din echipa care studiaz pattern-urile de dezvoltare fizic a populaiei infantile i tinere (0 - 20 de ani) a Romniei de azi. n planificarea studiului dvs. utilizai ct mai multe concepte, termeni (populaie, eantion, variabile etc.) i metode (eantionare) prezentate n capitolul de fa. 11. Definii pe scurt termenii de: date, variabil, eantionare, populaie i inferen statistic. 12. Vom lua n considerare toi studenii de anul nti de la specializarea Psihologie a Facultii de Psihologie i tiinele Educaiei. Dai cteva exemple din care s rezulte c: 12.1. Acetia reprezint populaia. 12.2. Acetia reprezint doar un eantion dintr-o populaie. 12.3. Cnd l considerm eantion, acesta este unul randomizat sau nealeator?

    (Explicai opiunea fcut). 13. Rectorul universitii noastre este interesat de repartiia pe judee, pe sexe, pe grupuri etnice i pe categorii de vrst a studenilor admii la aceast universitate, ca i de evoluia lor ca rezultate academice n ultimii 10 ani.

    13.1. Care este populaia studiat? 13.2. Care sunt variabilele implicate n acest studiu? 13.3. Avem de-a face cu eantioane aleatorii sau cu unele de convenien? 13.4. Identificai variabilele categoriale i pe cele real numerice prezente n studiul invocat.

    14. La un meci de fotbal sunt prezentate la final de partid urmtoarele statistici: - uturi pe poart; - uturi pe spaiul porii; - goluri marcate; - pase de gol; - cartonae galbene i roii primite de fiecare echip; - posesia mingii exprimat n procente pentru fiecare echip; - numrul mediu de kilometri alergat de fiecare juctor pe parcursul perioadei jucate. 14.1. Care dintre aceste date sunt tipice statisticii descriptive i care celei infereniale? 14.2. Care dintre datele de mai sus sunt real numerice i care categoriale? 14.3. Argumentai care dintre datele de mai sus prezint cea mai mare variabilitate. 14.4. Care dintre aceste date provin de la variabile continue i care de la variabile

    discontinue? 14.5. Ierarhizai i explicai care dintre primele patru variabile prezint mai mult

    variabilitate.

  • 19

    CAPITOLUL 2

    MSURAREA

    ORGANIZAREA COLECIEI DE DATE

    2.1. Msurarea n tiinele socioumane

    Cele mai multe aspecte pe care dorim s le msurm n tiinele socioumane

    (psihologie, pedagogie, sociologie) se prezint adesea sub form numeric, sau sunt aduse

    ntr-o asemenea form printr-o operaie de codare. Psihologul msoar adesea date fizice

    (stimuli vizuali, auditivi, tactili, kinestezici etc.), prin manifestrile lor caracteristice

    (intensitate, durat, frecven, greutate), culese de aparate special elaborate, ce dispun de

    propriile uniti metrice. El msoar n egal msur efectul stimulilor asupra fiinei vii i

    atunci determin timpul de reacie, numrul rspunsurilor corecte, erorile. Msura poate

    ajunge la niveluri de rafinare i complexitate foarte ridicate: msurm inteligena prin

    componentele acesteia, determinate prin intermediul unei teorii; msurm memoria prin

    parametri de volum, fidelitate, numr de repetiii necesare ntipririi; msurm factorii de

    personalitate de ordin primar sau secundar, dedui din complexe construcii teoretice;

    msurm atitudini sau reacii interpersonale (simpatie-antipatie, atracie-respingere).

    Unele caracteristici sunt foarte uor de degajat (msurtorile fizice), altele sunt

    deductibile doar prin construcii sau montaje experimentale ingenioase, iar altele se

    fundamenteaz pe soluii reieite din teorii tiinifice. De multe ori datele calitative culese prin

    observaie sau experiment sunt transformate n date cantitative printr-o gril de observaie,

    care ofer cadrul de referin n clasificarea datelor. Acest instrument n care faptele sunt

    clasificate pentru a putea fi urmrite sub raportul intensitii i al frecvenei se cheam

    protocol i este alctuit dintr-un tabel ce descrie faptele observate pe linii i frecvena de

    apariie a acestora pe coloane.

    Msurarea n psihologie trebuie luat n sensul ei cel mai larg, acela de atribuire de

    numere datelor continue sau discontinue (discrete), pentru c psihologia nu i-a conturat

    uniti metrice la fel de tari matematic ca cele din tiinele fizice. i totui, ea aspir s fac

    prin operaiile de msurare mai mult dect o operaie de codare, cum este de exemplu aceea

    de atribuire a notelor colare (operaie care nu poate exclude subiectivitatea).

  • 20

    Din punct de vedere matematic msurarea este o operaie prin care fiecrui element

    din mulimea de obiecte (domeniul de definiie al variabilei) i se ataeaz un numr i numai

    unul din mulimea n care aceasta ia valori (domeniul variabilei). Se stabilete astfel o relaie

    de izomorfism ntre mulimea obiectelor i mulimea msurilor obiectelor, fiecare obiect fiind

    definit de o singur msur.

    Sistemul de reguli impus de teoria i practica din domeniu definete mai multe tipuri

    de msurare n funcie de tipul de scal utilizat: nominal, ordinal, de interval i de raport.

    Alegerea celui mai potrivit tip de scal este impus de numrul i mai ales de tipul de relaii

    existente ntre elementele investigate. De remarcat un fapt esenial: toate caracteristicile unei

    scale de rang inferior se regsesc la cele de ordin superior, care ns adaug posibiliti

    suplimentare. Aadar fiecare scal permite doar anumite operaii i procedee matematice. Cu

    ct este mai sus n aceast ierarhie, cu att ea este mai precis, permind prelucrri statistice

    mai complexe i implicit concluzii mai fundamentate matematic.

    2.2. Proprietile scalelor

    Exist trei proprieti care fac ca scalele de msurare s difere ntre ele: magnitudinea

    intervalele egale i zero absolut.

    2.2.1. Magnitudinea

    O scal are aceast proprietate atunci cnd se poate spune c o caracteristic a

    atributului msurat reprezint mai mult, mai puin sau la fel (tot att, adic egal) o cantitate

    sau nsuire, comparativ cu o alt stare a aceluiai atribut. n ceea ce privete talia, de

    exemplu, putem afirma c George este mai nalt, mai scund sau la fel de nalt ca Horia, deci

    scala nlimii are proprietatea magnitudinii. Numerele de pe tricourile fotbalitilor nu au n

    schimb aceast nsuire, deoarece ele sunt atribuite ca nite etichete, servind doar la

    identificarea juctorilor.

    2.2.2. Intervalele egale

    O scal are intervale egale dac diferena dintre dou puncte aflate pe oricare zon a

    scalei are aceeai semnificaie, valoare, ca diferena dintre alte dou puncte care difer prin

    acelai numr de uniti. De exemplu, diferena dintre anii 1200 i 1400 este egal cu

    diferena dintre anii 1800 i 2000, n timp ce diferena dintre coeficienii de inteligen 50 i

    100 nu are aceeai semnificaie ca diferena dintre coeficienii 100 i 150, dup cum nu putem

    spune c cel cu QI de 100 este de dou ori mai inteligent dect cel cu QI de 50.

  • 21

    Psihometricienii au ncercat s ocoleasc aceste dificulti i, folosind tehnici matematice

    sofisticate, au creat instrumente care se apropie de cerina unei scale de interval (adic avnd

    intervale de scal egale).

    2.2.3. Zero absolut

    Acest proprietate este posibil de evideniat cnd variabila msurat are un nivel la

    care ea nu mai exist deloc: zero ca distan nseamn absena oricrei distane, zero ca ritm

    cardiac nseamn moartea, dar zero ca agresivitate, emoie, curaj, inteligen (caracteristici

    umane) este extrem de greu, dac nu imposibil, de evideniat sau de definit.

    Tabelul 2.1. Scalele de msurare i proprietile lor (dup Kaplan i Saccuzzo, 1993, p. 32).

    P r o p r i e t i

    Tip de scal Magnitudine Intervale egale Zero absolut

    Nominal Nu Nu Nu

    Ordinal Da Nu Nu

    De interval Da Da Nu

    De raport Da Da Da

    2.3. Tipuri de scale

    2.3.1. Scalele nominale

    n sens strict, scala nominal nu este o scal, pentru c ea nu are nici una dintre cele

    trei caracteristici enumerate anterior. Scopul ei este s numeasc obiectele, aa cum se

    ntmpl cu numerele de pe tricourile fotbalitilor. Cu toate acestea este comod s atribuim

    numerele 1, 2, 3 i 4 pentru a codifica etnia romn, maghiar, german i altele, 0 i 1 pentru

    sexul masculin i feminin sau 1, 2 i 3 pentru mediul urban, suburban i rural, ntr-un studiu n

    care apar astfel de variabile. Singura restricie este aceea ca numerele s fie atribuite tuturor

    obiectelor care au aceleai caracteristici, i numai lor.

    Fiind n fond vorba de o operaie de clasificare, singurul procedeu matematic admisibil

    aici este determinarea frecvenelor de apariie, care se pot calcula fie n valori brute, fie n

    valori relative, adic n procente. n acest din urm caz, dei ar fi normal ca eantionul s

    depeasc 100 de cazuri (prin definiie pro-cent implic ideea de sut), se accept totui

    exprimarea procentual i a numerelor de la 30 n sus, dar nu mai mici. Aceasta deoarece, prin

    transformarea n procente, numerele mai mici de 100 se amplific i cu ele eroarea de

    msurare, procedeu care ... n ciuda rigorii aparente, trdeaz superficialitatea metodologic

    (Chelcea, 1982, p. 158).

  • 22

    n sintez, pot fi reinute cteva aspecte mai importante pentru acest tip de scal:

    Scala nominal este mai degrab una calitativ, ea fiind de fapt o premsurare.

    Ea se preteaz foarte bine pentru datele culese prin observaie, anchet, chestionar,

    care vor fi repartizate n categorii distincte, astfel nct un element s se afle numai

    ntr-o categorie (clas) i numai una.

    Literele sau cifrele folosite ca etichet nu vor face obiectul calculelor statistice, ci

    vor servi doar la reperarea claselor, la determinarea frecvenelor brute i a celor

    relative. Fiecare element al unei clase (categorii) este considerat a fi echivalent cu

    toate celelalte din aceeai clas.

    Singurul procedeu matematic de verificare este aa-numitul test chi-ptrat (2).

    2.3.2. Scalele ordinale

    Dup Favrge acestea reprezint nivelul cel mai rspndit de msurare din psihologie

    i pedagogie, deoarece n majoritatea lor valorile din aceste domenii sunt continue i simplu

    ordonate. Aceasta permite ca elementele s fie aranjate fie cresctor, fie descresctor, existnd

    i posibilitatea ca mai multe elemente s ocupe acelai loc. Se stabilete astfel o relaie de

    ordine total ntre elemente, dat de formula Pxxy, care va fi interpretat ca x este superior,

    preferat sau naintea lui y (Radu, 1993, p. 49). Deoarece relaiile formulate (A B C D)

    permit stabilirea unei ierarhii, nseamn c importante caracteristici umane, fizice (nlime,

    greutate, perimetre), dar i psihice (capaciti, aptitudini, preferine, interese, atitudini, valori)

    pot beneficia de acest tip de scal.

    Numerele asociate obiectelor i fenomenelor n msurarea de tip ordinal au doar

    semnificaia unui rang, adic nu indic mrimi absolute. Pentru a atribui numerele n serie

    cresctoare sau descresctoare, trebuie ca i caracteristica respectiv s aib valori care cresc

    sau descresc. n scalele de tip Likert, de exemplu, se pot atribui numere de la 1 la 7, 4

    exprimnd neutralitatea, numerele mici (3, 2 i 1) dezacordul sau insatisfacia tot mai

    accentuate, n timp ce numerele mari (5, 6 i 7) acordul sau satisfacia tot mai intense.

    Creterea regulat a numerelor nu trebuie s sugereze ns c i caracteristicile

    respective cresc n aceeai proporie. Exemplul clasic este cel al militarilor dintr-un pluton,

    aezai ntr-o ordine ierarhic, de la mic la mare: al distana dintre al cincilea i al aselea din

    irul ordonat nu este aceeai ca distana dintre al doilea i al treilea, i aceasta deoarece scalele

    ordinale nu au o unitate de msur care s indice i cantitatea diferenei dintre ranguri. Scala

    metric a inteligenei, publicat de Binet n 1905, permitea un clasament ierarhic al unor

  • 23

    inteligene diferite care, pentru nevoile practice, echivala cu un clasament. n psihodiagnoz,

    exemplul tipic pentru acest tip de msurare este procedeul centilrii i decilrii (ordonarea

    ierarhic pe o scar cu 100, respectiv 10 trepte), iar n pedagogie nota colar, ca procedeu de

    evaluare care n acelai timp i ierarhizeaz elevii.

    n concluzie pot fi reinute urmtoarele aspecte:

    Deoarece scala ordinal nu are o unitate de msur constant, ea nu permite adunarea

    i scderea, adic nu are proprietatea aditivitii.

    Este legitim ns calcularea frecvenelor brute i a celor relative (a procentelor) i

    aplicarea procedurilor statistice neparametrice (adic exprimate calitativ sau prin

    numere ce exprim categorii): coeficientul de corelaie al rangurilor al lui Spearman,

    coeficientul de corelaie Kendall, testele de semnificaie Mann-Whitney, Wilcoxon,

    Kruskal-Wallis etc.

    Centilarea, decilarea - n psihodiagnoz, i nota colar - n pedagogie, sunt ilustrrile

    cele mai frecvente ale utilizrii acestui tip de scal n domeniile amintite.

    Cel mai important indicator al tendinei centrale este n cest caz mediana.

    2.3.3. Scalele de interval

    Scalele de interval nu reprezint nivelul curent de msurare n tiinele socioumane,

    dei se tinde spre aceasta, deorece, pe lng ordinea i ierarhia nivelurilor anterioare, trebuie

    s existe specificarea mrimii exacte a intervalelor sau a distanelor care separ elementele

    aflate pe toate treptele succesive ale scalei. Aceasta presupune cu necesitate prezena unitii

    constante i comune de msur. Exemplul cel mai concludent l dau calendarele, unde

    existena unei uniti de msur precizat i constant, anul, face posibil echivalena a 200 de

    ani de la nceputul mileniului cu 200 de ani de la sfritul lui. Mai mult, dac operm cu

    calendare diferite (iulian, gregorian, evreiesc sau mahomedan), deoarece unitile de msur

    nu sunt diferite, ... transpunerea dintr-un calendar n altul nu pune nici un fel de problem

    (Richelle, 1995, p. 222).

    Rezumm cteva dintre nsuirile de baz ale scalei de interval:

    Specificul scalei de interval este proprietatea aditivitiii (intervalele - i nu valorile! -

    pot fi adunate i sczute).

    Neexistnd un punct zero (care s exprime absena caracteristicii msurate),

    intervalele pot fi deplasate, extinse sau comprimate, dac prin aceasta ele devin mai

    maniabile sau mai bine adaptate realitii msurate.

  • 24

    La acest nivel se pot aplica procedee statistice mai elaborate, cum ar fi corelaia r prin

    produsul momentelor a lui Pearson, testele de semnificaie t i z ale lui Fisher, ca i

    analiza de regresie.

    Aceasta deoarece la nivelul scalei de interval se pot determina media aritmetic,

    abaterea standard i variana.

    2.3.4. Scalele de raport

    Acestea au toate proprietile unei scale de msur: magnitudine, intervale egale i

    zero absolut. Ele sunt caracteristice mrimilor fizice (nlime sau lungime, greutate, for),

    ceea ce nu se ntmpl cu fenomenele sau faptele din psihologie, sociologie sau pedagogie,

    deoarece neputnd fiina fr un minimum de inteligen, coeziune, atracie etc. acestor

    fenomene nu li se poate stabili starea zero. Cu temperatura lucrurile stau altfel: deoarece

    scalele Celsius i Fahrenheit au un punct zero convenional, n timp ce sistemele Kelvin sau

    Rankine au un punct zero neconvenional (absena oricrei temperaturi), doar acestea din

    urm sunt scri de raport.

    Elementele eseniale ale scalelor de raport sunt deci urmtoarele:

    Scalele de raport se cheam aa pentru c, pe lng toate caracteristicile scalelor de

    sub ele, permit relaia de proporionalitate de tipul b/a = c/b = d/c.

    Ele permit toate tipurile de statistici, parametrice i neparametrice, toate procedeele de

    verificare i toi coeficienii de corelaie cunoscui.

    Aceasta deoarece se permite calculul mediei geometrice i a coeficientului de variaie.

    n afara unor situaii de excepie (mrimi fizice de intrare, puse n legtur cu timpul

    de reacie, de exemplu), psihologii, pedagogii i sociologii nu sunt ndreptii s

    foloseasc un asemenea tip de scal.

    Corespunztor tipurilor de scal amintite, vom avea tipuri de variabile (nominale,

    ordinale sau numerice), care sunt definite de domeniul de variaie, adic de registrul de valori

    pe care acestea le pot lua. Cnd lum n considerare numrul indivizilor sau al cazurilor

    susceptibile de a prezenta aceast modalitate, vorbim de domeniul de definiie. De exemplu, la

    o prob de motricitate, tapping, numrul de puncte btute cu mn dreapt, adunat cu numrul

    punctelor btute cu mna stng ia valori diferite n funcie de vrst, sex i de lateralizare

    (dreptaci sau stngaci). De pild, la 6 ani acest numr poate s ia valori de la 10 la 60, acesta

    fiind domeniul de variaie, n timp ce numrul subiecilor ce nregistreaz aceste valori, pentru

    fiecare punctaj, d domeniul de definiie (al frecvenelor).

  • 25

    O atitudine, considerat ca o variabil codificat pe o scar Likert, are mai multe

    modaliti de manifestare, dar i o populaie care prezint toate aceste modaliti. Deci

    fiecrui individ din domeniul de definiie i se poate face s i corespund o modalitate i

    numai una n domeniul de variaie. Noiunea de variabil este ns mai general pentru c ea

    se poate referi fie la o mulime de date, fie la efective observate, fie la date prezumate,

    ipotetice, virtuale. Scalele descrise anterior se refer la date efectiv observate.

    Ion Radu (1993, p. 51) apreciaz c n prelucrarea datelor, n funcie de cerinele

    studiului i pentru a ne nscrie ntr-o schem statistic, noi introducem astfel o metric, adic

    tratm datele ca i cum s-ar situa la nivelul scalei de interval. (). Se comite astfel o eroare,

    care practic este neglijabil. Deoarece prediciile fcute n felul acesta sunt valide,

    transformarea respectiv este considerat ca fiind acceptabil.

    2.4. Organizarea datelor brute

    Pentru a fi posibile procedurile detaliate de tratare i de analiz statistic a datelor,

    acestea trebuie culese i ordonate n tabele sau grafice. Datele brute efectiv rezultate din

    anchet, testare sau evaluare nu au nici o semnificaie prin ele nsele, ci prin raportarea la un

    sistem de referin. Cel mai adesea acesta rezult din comparaia scorurilor individuale cu

    datele obinute de un eantion mai larg din populaia investigat, prin care se pune n eviden

    poziia unui subiect n cadrul grupului mai larg. n calitatea lui de sistem de referin, grupul

    ofer posibilitatea construciei unei tipologii ori a unui tabel de norme (barem sau etalon).

    Acestea alctuiesc aa-numitele cote standard, ceea ce arat c investigaia individului i a

    grupului sunt corelative i complementare. Extragerea informaiilor coninute de datele brute

    i organizarea lor ntr-o colecie sau baz de date, presupune intrarea n funciune a unor

    proceduri statistice elaborate (determinarea medianei, a mediei, a abaterii standard i a

    varianei, aprecierea msurii n care cele descoperite pot fi generalizate i la ce nivel de

    ncredere).

    Dac prin organizarea primar a datelor (ordonare i grupare) se poate face o prim

    inspecie vizual a acestora, cci ele se prezint ca histograme, poligoane ale frecvenelor,

    scattere etc., prin calculul tendinelor aflate pe centrul distribuiei (media, mediana i modul),

    ca i a celor aflate spre extreme (amplitudinea mprtierii, abaterea standard i dispersia) se

    pot face inferene statistice valide, pentru ca prin corelaie, analiz factorial i de cluster s

    avem o nelegere mai de adncime a relaiilor i a structurilor subiacente. Analiza de

    varian, regresia simpl i multipl permit, dincolo de sesizarea structurii de adncime a

    datelor studiate, predicia unor legiti, aa cum reies din analiza i modelarea lor matematic.

  • 26

    2.5. Exerciii i aplicaii practice 1. Dai cte unu-dou exemple de variabile ntlnite n psihologie care apeleaz la scale de msur nominale, ordinale, de interval i de raport.

    2. Avei mai jos spectrul culorilor vizibile de ochiul uman, reprezentat pe dou tipuri de scal. Simbol R O G V A I V Nume Rou Oranj Galben Verde Albastru Indigo Violet Lungime de und

    800-620 619-590 589-575 574-510 509-480 479-450 449-430

    2.1. Precizai numele fiecrui tip de scal, indicnd avantajele i locul lor de utilizare. 2.2. Lumina este o variabil continu sau discontinu? (Argumentai).

    3. Msurnd nlimea a 10 studente de la Psihologie s-au obinut urmtoarele valori: 165 160 168 170 156 158 163 180 155 162

    Utiliznd pe X ca simbol al acestei variabile (nlimea): 3.1. Precizai care sunt X3, X5, X8 i X10. 3.2. Calculai X. 3.3. Scriei formula de nsumare de la punctul anterior ntr-o form mai complet.

    4. Concomitent s-a determinat i greutatea pentru cele 10 studente, obinndu-se valorile de mai jos (n kilograme).

    62 61 70 72 52 55 66 80 49 53 Utiliznd pe Y ca simbol al acestei noi variabile (greutatea): 4.1. Precizai care sunt Y2, Y4, Y7 i Y9. 4.2. Calculai X din exemplul anterior. 4.3. Calculai (X)2 i X2. Folosind semnele = i indicai care este relaia dintre cele

    dou valori obinute. 4.4. Determinai X/N i Y/N, unde N (10) reprezint numrul de scoruri observate. 4.5. Cum numii valorile pe care tocmai le-ai calculat la punctul anterior? 4.6. n mod similar calculai pe (Y)2 i Y2. 4.7. Utiliznd valorile numerice deja obinute determinai valoarea formulei de mai jos

    4.8. Extragei rdcin ptratic din valoarea numeric a expresiei de mai sus.

    5. Utilizai datele de mai sus pentru a arta c: 5.1. (X+Y) = X + Y 5.2. XY XY 5.3. CX = CX, n care C este o constant. 5.4. X2 (X)2

    5.5. (X+C) = X + NC, n care N este numrul de cazuri iar C are valoarea 3.

    6. Poate o variabil ordinal s fie msurat cu o scal continu (de interval sau de raport)? Poate o variabil continu s fie msurat cu o scal ordinal? Argumentai folosind cte un exemplu adecvat.

    7. Notele colare trecute n catalog sunt msurtori tipice unei scale ordinale sau uneia de interval? Dar mediile colare pentru fiecare obiect n parte (rotunjite)? Dar media general (nerotunjit)?

    8. Media (nerotunjit) de la Matematic i cea de la Purtare sunt msurate pe acelai tip de scal? (Argumentai rspunsul).

    ( )

    1

    22

    N

    N

    YY

  • 27

    2.6. Quiz: Da Nu

    1. (Exemplu) Pentru scalele de interval suntem ndreptii s utilizm frecvenele absolute (count) i pe cele relative (procente). Rspuns: Adevrat, pentru c, dei tipice scalelor ordinale, procedeele respective sunt prezente i la scalele de interval i de raport, tiut fiind c scalele de rang superior ncorporeaz proprietile celor de rang inferior.

    2. Magnitudinea unei scale este proprietatea matematic ce permite ierarhizarea populaiei de date de la mic la mare sau invers.

    3. Deoarece distana (n cunotine sau deprinderi) dintre nota 8 i nota 9 este egal cu distana dintre nota 3 i nota 4, nseamn c sistemul de notare colar are proprietile scalei de interval.

    4. Atunci cnd codificm genul masculin cu 1 i pe cel feminin cu 2 efectum o operaie de msurare.

    5. Inteligena nu are uniti de msur tipice scalelor de interval.

    6. Scala care msoar era noastr are un zero natural naterea lui Iisus fiind deci o scal de raport.

    7. IQ-ul se msoar pe o scal ordinal deoarece distana de 10 puncte dintre IQ 50 i 60 are aceeai semnificaie psihologic ca i diatana dintre IQ 120 i 130.

    8. Pentru datele de observaie, de anchet i de chestionar sunt utilizate scalele nominale, care fac de fapt o premsurare.

    9. La un chestionar s-a utilizat o scal Likert n 5 trepte cu urmtoarea semnificaie: 1=Foarte rar 2=Uneori 3=Aa i aa 4=Deseori 5=Foarte des.

    Se poate determina o valoare numeric medie a rspunsurilor pentru ntregul chestionar? Argumentai.

    10. Pentru datele culese pe o scal ordinal putem face media deoarece aceasta are proprietatea aditivitii.

    11. n tiinele socio-umane nivelul de msurtoare maximal este al scalelor de interval iar cel uzual al scalelor ordinale.

    12. Scala de interval permite deplasarea punctului zero (adic a originii) spre stnga sau spre dreapta scalei i, de asemenea, permite comprimarea sau dilatarea acesteia.

    13. Scalele de msurare a timpului (calendarele iulian, gregorian, iudaic, mahomedan, maya etc.) pot fi transpuse unul n altul i obinute valori echivalente deoarece au uniti de scal egale.

    14. Scalele nominale i ordinale sunt categoriale, cele de interval i raport sunt real numerice.

    15. n sistemul romnesc de notare colar domeniul de definiiei al variabilei l reprezint elevii iar domeniul ei de variaie intervalul de notare 1-10.

    16. Notele colare i centilarea/decilarea nu fac dect s stabileasc ierarhii, adic s rangheze subiecii cresctor sau descresctor.

    17. n principiu notele colare nu pot fi adunate pentru a se determina media pe materii deoarece scala de notare nu are proprietatea matematic a intervalelor egale.

    18. Nu pot fi inventate uniti de msur valabile, tipice scalelor de interval, pentru iubire, fric, simpatie sau depresie.

    19. Funciile cognitive senzaiile, gndirea, memoria se bucur de scale de msur mai tari dect funciile afective.

    20. Numii tipul de scal de msurare reprezentat de categoriile de mai jos, alocnd cifrele 1, 2, 3 i 4 pentru scalele nominal, ordinal, de interval i de raport: scala Celsius, scala Kelvin, numrul de pe uile camerelor unui hotel, ordinea de sosire la maraton, scorul la acest test QUIZ,

    presiunea sanguin, genul i greutatea. (Se acord punctul pentru minimum 5 rspunsuri corecte din cele 8 posibile).

  • 28

    CAPITOLUL 3

    DISTRIBUII I FRECVENE

    Pentru determinarea celor mai importani indicatori statistici este nevoie de frecvene.

    n domeniul variabilei, fiecare mrime are un numr de reprezentani, numit efectiv. n

    statistic efectivul se numete frecven sau frecven absolut. Cnd frecvena este

    transformat n procente, ea se numete frecven relativ i este foarte util pentru

    compararea, de exemplu, a dou colective diferite ca mrime, i aceasta pentru c

    transformarea n procente pstreaz echivalena i proporia n ce privete distribuia i

    caracteristicile ei.

    3.1. Ordonarea i gruparea datelor

    Cea mai mare parte a operaiilor i procedeelor de lucru care urmeaz s fie prezentate

    mai jos sunt extrem de mult facilitate de programele de prelucrare computerizat a datelor, de

    tip SPSS, NCSS sau SAS. Ele fac parte din abc-ul statisticii, fiind primele ordonri i

    prelucrri ale datelor brute, la sfritul crora distribuiile respective i dezvluie o parte din

    caracteristicile de suprafa, adic cele vizuale.

    Le vom prezenta detaliat, pentru c ele reprezint moduri de lucru practice, uor de

    executat ntr-o diversitate de situaii concrete, ca un preambul al unor prelucrri ulterioare mai

    elaborate. Parcurgnd aceti pai vom putea sesiza fora pe care instrumentul statistic l poate

    da muncii noastre, deoarece el ordoneaz, triaz, clasific datele, forndu-le s i dezvluie

    semnificaiile. De aceea operaiile iniiale de ordonare i de grupare a datelor ar trebui s

    devin operaii de rutin pentru oricine este interesat s dea muncii sale rigoare tiinific. Iat

    scorurile brute la un test de vocabular (Recombinare Verbal) culese la biei i fete de 14 ani

    din eantionul care a fost utilizat pentru etalonarea acestui test:

    Biei Fete

    57 56 48 36 24 23 28 23 33 26 16 57 56 45 35 36 43 26 34 46 24 25

    53 34 22 34 34 42 34 25 24 29 18 53 55 55 48 43 48 35 36 27 27 26

    60 33 51 40 47 36 36 29 26 22 14 60 62 44 57 70 36 38 35 28 31 19

    52 34 60 61 56 34 22 28 30 23 34 52 53 56 49 46 37 48 33 27 19 29

    51 64 37 33 36 28 35 19 18 15 51 58 44 51 38 48 26 36 22 25 15.

  • 29

    Avem nevoie de o foaie de hrtie cu liniatur matematic, format A4, de o rigl i un

    creion, la care vom putea aduga ulterior un minicalculator cu panou statistic, ca instrumente

    i materiale de lucru uzuale. Foaia de hrtie va fi mprit prin 3 linii orizontale, trasate pe

    lungul ei, n 3 panouri (registre) de lucru, pentru biei, fete i total. Se observ c cea mai

    mic valoare de scor (Xmin) este la biei 14 i la fete 15, iar cea mai mare (Xmax) 64 la biei i

    70 la fete. Prin urmare fiecare ptric de pe linia de baz va fi numerotat de la 11 la 70,

    avnd grij ca aceast numerotaie s fie identic pe toate cele trei registrele, pentru a le putea

    nsuma ulterior pe vertical. Dup aceea se descarc primul tabel pe primul registru al foii,

    sub care se va scrie Biei, al doilea tabel n al doilea registru, sub care se va scrie Fete,

    fcnd un x s-au o bif n ptrica corespunznd scorurilor care se descarc, la valoarea

    corespunztoare de pe linia de baz.

    La sfritul operaiei se vor numra frecvenele corespunztoare fiecrui scor de la 11

    la 70 iar numrul va fi trecut sub ptrica corespunztoare fiecrui scor, att la biei, ct i la

    fete i total (care rezult din nsumarea pe vertical a frecvenelor pentru fiecare scor).

    Inspecia vizual a datelor evideniaz urmtoarele aspecte:

    - amplitudinea scorurilor (Xmax - Xmin) este uor diferit pentru cele dou categorii: 64 - 14 =

    50, la biei i 70 - 15 = 55, la fete;

    - aglomerarea datelor este mai accentuat n prima jumtate (spre stnga), cu o mai mare

    densitate pe zona central (34, 36 i 37), la biei; o repartiie spre dreapta a datelor fetelor;

    - bieii au o singur frecven maxim (la scorul 34 sunt 7 cazuri), n timp ce fetele au dou

    (la scorurile 36 i 48 sunt cte 4 cazuri). Prima ntrebare care se pune este dac pentru

    anumite tratamente statistice (alctuirea unui etalon) datele trebuie tratate separat sau

    mpreun. Rspunsul poate fi aflat prin condensarea informaiei pentru a fi vizualizat, dup

    ce datele vor fi grupate.

    Pentru a determima mrimea intervalului de grupare reinem cteva reguli de lucru:

    Vor fi preferate nu mai puin de 5 - 7 intervale i nu mai mult de 20. Pentru gruparea

    datelor, uzual se folosesc ntre 9 i 15 clase.

    Pentru determinarea mrimii intervalului, amplitudinea mprtierii se mparte la

    cteva din mrimile dorite ale intervalului, pentru a vedea cte clase rezult i se alege

    aceea care se apropie cel mai mult de numrul de clase considerat convenabil.

    Ca mrime a intervalului este preferabil s folosim numere impare (3, 5 sau 7), pentru

    a avea ca valori centrale de interval numere ntregi.

  • 30

    Este bine ca primul interval s nceap cu un multiplu al mrimii lui. De exemplu

    intervalele de lungime 3 pot ncepe cu 3, 6 sau 9, cele de lungimea 5 pot ncepe cu 5,

    10 sau 15 etc.

    n cazul analizat, dac am dori s avem intervale din 3, atunci rezult 55/3 = 15

    intervale, iar dac am dori intervale de 5, atunci ar rezulta 55/5 = 11 intervale. Pentru c avem

    o distribuie relativ mic, optm pentru a doua variant. Delimitm prin linii verticale clasele

    astfel obinute (10-14, 15-19, 20-24, , 70-74) i n dreptul fiecreia se vor trece n mijlocul

    clasei i n partea ei de sus frecvenele clasei respective, rezultate prin nsumarea valorilor

    individuale din interiorul fiecrui interval (1, 5, 8, 8, ..., 0, pentru biei; 0, 3, 2, 10, , 1,

    pentru fete).

    Trebuie inut cont c percepia noastr opereaz din ce n ce mai greu cu intervale care

    depesc cifra 12, chiar dac mrimea populaiei i lungimea spectrului de variaie ar impune-

    o. De aici recomandarea de a nu avea nici prea puine intervale (prin gruparea datelor se

    pierde o parte din informaia primar, pentru c nu se mai cunoate exact valoarea msurat a

    fiecrei observaii), i nici prea multe (intervalele rezultate sunt mai greu de manevrat i de

    sesizat perceptiv), de unde regula deja enunat a celor 9 -15 clase de grupare a datelor.

    Sturges (citat de Rotariu et al.,1999, p. 33) propune o formul de lucru pentru aceast

    operaie prin care se determin numrul intervalelor de grupare, lund n calcul amplitudinea

    variaiei i numrul de cazuri:

    (3.1)

    Utiliznd formula lui Sturges, se obine urmtorul tabel orientativ pentru stabilirea numrului

    de interval (clase) de grupare n funcie de mrimea eantionului:

    Tabel 3.1. Numrul de interval de grupare dup formula lui Sturges.

    Nr. de observaii 15-24 25-44 45-89 90-179 180-359 360-719 720-1500

    Nr. de clase 5 6 7 8 9 10 11

    Aplicat n cazul nostru, pentru biei, i = (64-14)/(1+3,322 log54) = 50/6,755 = 7,40; pentru

    fete vom avea i = (70-15)/(1+3,322 log55) = 55/7,77 = 7,21. Pentru numrul de cazuri ale

    distribuiei noastre am avea teoretic nevoie de 8 intervale. S reinem i regula practic a celor

    7 - 12 intervale, care realizeaz cel mai bun echilibru ntre nevoia de condensare a datelor i

    aceea de a avea pierderi de informaie ct mai mici.

    NXX

    ilog222,31

    minmax

    +

    =

  • 31

    3.1.1. Limitele de grupare

    n cazul variabilelor continue, cel mai adesea raportm clasele la nite numere ntregi,

    care constituie limitele de raportare a acestora. n cazul variabilei continue care este

    nlimea, de exemplu, putem avea clasele 125-129, 130-134, 135-139 etc. Ce se ntmpl

    ns cu nlimile de 129,54 sau 134,82, care par a cdea n golurile dintre clase? Deoarece

    limitele de raportare nu acoper n ntregime domeniul variabilelor continue, trebuie s se

    defineasc nite limite exacte, asfel nct, respectnd regula de rotunjire, valorile interclase s

    fie uor de alocat la una dintre clase. Aceste limite au deci dou funcii: a) reconstituie

    continuitatea variabilei, nemailsnd goluri i b) servesc drept baz de calcul pentru

    determinarea unor puncte speciale de pe linia valorilor variabilei, numite quantile, cum ar fi

    mediana, centilele, decilele sau oricare alt punct percentil.

    n acest sens trebuie precizat c fiecare interval are o limit superioar (ls) i o limit

    inferioar (li). De exemplu, intervalul 125-129 se exprim matematic astfel, n funcie de cele

    dou limite: [125,5; 129,5], sau 125,5-129,5.

    3.1.2 Centrele intervalelor

    Centrul unui interval, notat cu Ci, este valoarea situat n mijlocul intervalului

    respectiv i se determin astfel Ci = (li + ls)/2. Aplicnd aceast formul la exemplul nostru,

    intervalul 124,5-129,5 are drept centru valoarea 127, ceea ce justific preferina pentru

    intervalele de numr impar, care dau o valoare ntreag pentru centrele lor. Celelalte centre de

    interval se pot determina extrem de uor ulterior, pentru c ele sunt multipli ai lungimii

    intervalului, deci n cazul nostru vor fi: 127, 132, 137 etc. Aproximarea prin centrele

    intervalului creeaz posibilitatea ca toate valorile care aparin unui interval s fie tratate n

    calcule ca egale cu centrul acestuia, de unde posibilitatea erorii pe care gruparea datelor o

    introduce, lucru de care am amintit anterior.

    Se poate dovedi matematic c aceast grupare satisface criteriul matematic al celei mai

    mici erori. Important de menionat este i faptul c, cu ct intervalul este mai mare, cu att

    mrimea acestei erori rezultat prin gruparea datelor va crete.

    3.2. Histograma i poligonul frecvenelor

    Dup ce am prezentat modul practic de lucru pentru cele dou reprezentri grafice ale

    frecvenelor vom avertiza asupra faptului c exist precauii speciale privind mrimea

    diagramei rezultate n raport cu spaiul de lucru al foii (problem rezolvat corect cu ajutorul

    computerului), cu localizarea punctului de mijloc sau cu trasarea figurilor.

  • 32

    O problem care merit atenie o reprezint raportul dintre nlimea i limea

    diagramei, care de regul este de 60%. Vom recunoate n aceasta o problem real, deoarece

    ea face posibil minciuna statistic, dup expresia lui Smith: manevrnd (intenionat sau nu)

    acest raport, se poate accentua sau aplatiza o pant de cretere a unui indicator pentru a sugera

    ceva ce realitatea nu confirm.

    Histograma d o imagine n scar a distribuiei, fiind cea mai potrivit reprezentare

    a datelor ordinale, discontinue, caz n care ntre bare trebuie s existe mici spaii pentru a

    sugera discontinuitatea, caz n care se numete reprezentare cu bare. Histograma este la fel de

    mult utilizat i pentru datele continue, de interval, caz n care barele verticale apar unite ntre

    ele. Ca i poligonul frecvenelor, histograma este informativ n legtur cu forma distribuiei,

    cu simetria ei, dar este mai puin adecvat s exprime boltirea (aplatizarea acesteia), deoarece

    am vzut c raportul dintre unitile de msur de pe abscis i de pe ordonat poate fi

    modificat n funcie de opiunea cercettoului.

    Cea mai bun redare a datelor de interval, fie ele brute, fie cumulate, o constituie

    poligonul frecvenelor. Diferena dintre dou tipuri de grafice este nu numai de form

    (scalar - la histogram, linii drepte care unesc ntre ele puncte - la poligon), ci este dat de

    chiar asumpia lor de baz. Astfel, la histogram toate valorile dintr-un interval sunt egale

    ntre ele ca frecven, i egale cu valoarea centrului de interval, n timp ce la poligonul

    frecvenelor datele tind s se grupeze de o parte i de alta a acestei valori centrale.

    Histograma ofer o imagine mai clar a numrului de cazuri din fiecare interval, dar

    d o imagine cu totul confuz cnd pe aceeai linie de baz se redau, pentru comparaie, dou

    sau mai multe distribuii. n acest caz este evident c poligonul frecvenelor apare ca mult mai

    indicat, comparaia putndu-se face fie n valori absolute (cnd nu exist diferene prea mari

    numeric ntre cele dou distribuii), fie n frecvene relative (procentuale), caz n care

    comparaia devine posibil, deoarece distribuiile sunt redate proporional.

    De asemenea poligonul frecvenelor poate s se refere la frecvenele brute simple sau

    cumulate, dar i la cazul frecvenelor relative simple sau cumulate, cnd se obine aa-numita

    ogiv a lui Galton.

  • 33

    MF_Metoda+Fisa

    175.0

    165.0

    155.0

    145.0

    135.0

    125.0

    115.0

    105.0

    95.085.0

    75.065.0

    55.045.0

    Frequency

    160

    140

    120

    100

    80

    60

    40

    20

    0

    Std. Dev = 21.99

    Mean = 132.2

    N = 1408.00

    Figura 3.1. Dou histograme ale frecveelor brute pentru o distribuie foarte mare i una mic.

    Cnd numrul indivizilor din cele dou grupuri difer foarte mult apare o problem de

    comparaie grafic: deorece disparitatea este foarte mare, se pune problema unei scale care s

    le cuprind pe amndou, asfel nct s fie pe deplin perceptibil distribuia mai mic, n

    condiiile n care cea mai mare nu depete nite limite rezonabile. n acest caz este foarte

    util conversia frecvenelor brute n frecvene relative (procentuale), situaie n care apare ca

    i cnd am avea dou distribuii cu un numr egal de cazuri, i anume 100, ariile celor dou

    poligoane, forma curbei i dispersia devenind pe deplin comparabile. Transformarea

    procentual este extrem de simpl. Iat un exemplu preluat din Guilford (1978, p. 34).

    Tabelul 3.2. Frecvenele brute i relative pentru dou grupuri.

    Scoruri f1 f2 p1 p2 140-149 8 5,0

    130-139 32 20,0

    120-129 48 30,0

    110-119 1 29 2,0 18,10

    100-109 0 18 0,0 11,20

    90-99 3 14 5,9 8,8

    80-89 5 5 9,8 3,1

    70-79 6 5 11,8 3,1

    60-69 14 0 27,5 0,0

    50-59 7 1 13,7 0,6

    40-49 11 21,6

    30-39 4 7,8

    Suma N1 = 51 N2 = 160 = 100,1 = 99,9

    RVBAIETI

    65.060.055.050.045.040.035.030.025.020.015.0

    20

    10

    0

    Std. Dev = 13.20

    Mean = 35.1

    N = 54.00

  • 34

    Pe coloana f1 sunt 51 de cazuri. Prin regula de trei-simpl tim c dac un 1 caz din 51

    reprezint x din 100, atunci x are valoarea 1100/51 = 1,96. Acest numr (1,96) devine

    factorul de multiplicare pentru toat coloana respectiv (f1), ceea ce va da coloana p1 (p de la

    procente). La fel se va proceda pentru coloana f2 (unde factorul de multiplicare este 1100/160

    = 0,625) din care se va obine coloana p2.

    Datele din tabel se convertesc ntr-o imagine grafic prin care cele dou poligoane ale

    frecvenelor devin direct comparabile. Aa cum rezult dup construcia diagramei, este

    evident c al doilea grup are valori medii mult mai mari dect primul, suprapunerea dintre ele

    find foarte mic; forma amndurora este asimetric, primul fiind deplasat spre stnga, al

    doilea spre dreapta; grupul al doilea este mai omogen dect primul (are un singur punct care

    concentreaz frecvena maxim, numit mod, n jurul cruia se repartizeaz celelalte valori, n

    timp ce primul grup are dou cocoae, adic dou zone de acumulare a cazurilor); frecvena

    maxim este apropiat procentual la ambele grupuri. Comparaia evideniaz elocvent faptul

    c acestea sunt dou grupuri foarte diferite, care trebuie tratate statistic separat.

    3.3. Frecvenele cumulate

    Dup ce am stabilit intervalele i le-am ntabelat astfel nct valorile inferioare s fie

    amplasate jos i cele superioare sus, dup ce am stabilit limitele inferioare i superioare pentru

    fiecare interval i centrul fiecrui interval (atunci cnd avem nevoie s lucrm cu aceste

    coloane), urmtoarea coloan (fb) va fi alocat frecvenelor brute. Ele se pot obine fie printr-o

    coloan special de bife, n care datele brute se descarc direct n tabel, fie prin procedeul de

    lucru cu care am deschis acest capitol: trasarea liniei de baz, cu toate valorile i frecvenele

    corespunztoare, apoi stabilirea claselor i a frecvenelor din fiecare clas.

    Pe urmtoarea coloan se trec frecvenele brute cumulate (fbc), apoi frecvenele

    relative (fr) i frecvenele relative cumulate (frc), dup procedeul exemplificat anterior. Modul

    cum apar datele ntabelate pentru bieii din eantionul de etalonare la testul de Recombinare

    Verbal, dup modelul descris anterior, poate fi analizat n Tabelul 3.3 de mai jos.

    Determinarea frecvenelor cumulate, fie ele brute sau relative, se obine extrem de simplu

    printr-o adunare succesiv, ce pleac de jos n susul coloanei respective. Raiunea acestei

    operaii este aceea de a ti numrul exact de cazuri care cad sub un anumit punct, adic

    punctul care este limita de sus a intervalului (sau procentul, n cazul frecvenelor relative).

  • 35

    Tabelul 3.3. Valorile frecvenelor brute i relative, simple i cumulate, pentru biei la RV.

    Scoruri

    clase

    Limite

    exacte

    Punctul

    central

    Frecvene

    brute

    Frecvene

    brute

    cumulate

    Frecvene

    relative

    Frecvene

    relative

    cumulate

    Numr

    interval

    fb fbc fr frc fb 65-69 64,5-69,5 67 0 54 0 100 0 12 60-64 59,5-64,5 62 4 54 7,4 100 248 11

    55-59 54,5-59,5 57 3 50 5,6 92,6 171 10

    50-54 49,5-54,5 52 4 47 7,4 87 208 9

    45-49 44,5-49,5 47 2 43 3,7 79,6 94 8 40-44 39,5-44,5 42 2 41 3,7 75,9 84 7 35-39 34,5-39,5 37 6 39 11,1 72,2 222 6 30-34 29,5-34,5 32 11 33 20,4 61,1 352 5 25-29 24,5-29,5 27 8 22 14,8 40,7 216 4 20-24 19,5-24,5 22 8 14 14,8 25,9 176 3 15-19 14,5-19,5 17 5 6 9,3 11,1 85 2 10-14 9,5-14,5 12 1 1 1,8 1,8 12 1

    N=54 =100 =1