Statistica ID

download Statistica ID

If you can't read please download the document

Transcript of Statistica ID

UNIVERSITATEA TITU MAIORESCUFACULTATEA DE PSIHOLOGIESTATISTICPSIHOLOGIC I PRELUCRAREA INFORMATIZAT A DATELORICurs pentru nvmntul la distanCoordonator de disciplin: Prof. univ. dr. Dumitru Gheorghiu2005CUPRINS1 INTRODUCERE1.1 Rolul statisticii n cercetarea psihologic1.2 Matematica de baz1.2.1 Operaii aritmetice de baz1.2.2 Operaii aritmetice cu numere reale1.2.3 Proprieti ale numerelor reale1.2.4 Indicatori speciali ai operaiilor aritmetice1.3 Statistici descriptive i statistici infereniale1.4 Nivele de msur1.4.1 Nivelul nominal1.4.2 Nivelul ordinal1.4.2 Nivelul de interval1.4.3 Nivelul de raport2 PREZENTAREA DATELOR STATISTICE2.1 Procente i proporii2.2 Raporturi i rate2.3 Distribuii de frecvene2.4 Diagrame i grafice3 MRIMILE TENDINEI CENTRALE I ALE DISPERSIEI3.1 Mrimile tendinei centrale3.1.1 Media aritmetic3.1.2 Mediana3.1.3 Modul3.1.4 Distribuii simetrice i distribuii asimetrice3.1.5 Media aritmetic ponderat3.1.6 Mrimile tendinei centrale pentru date grupate3.2 Percentile3.3 Mrimile dispersiei3.3.1 Indicele variaiei calitative3.3.2 Amplitudinea i amplitudinea intercuartilic3.3.3 Abaterea medie i variana3.3.4 Abaterea standard i coeficientul de variaie3.3.5 Calculul abaterii standard pentru date grupate4 DISTRIBUIA NORMAL4.1 Caracteristicile distribuiei normale4.2 Calculul scorurilor standard4.3 Distribuia normal standard4.4 Utilizarea distribuiei normale standard4.4.1 Determinarea procentelor de cazuri4.4.2 Determinarea probabilitilor pentru scoruri5 EANTIONAREA I DISTRIBUII DE EANTIONARE5.1 Procedee de eantionare aleatorie5.2 Distribuia de eantionare5.3 Determinarea probabilitilor pentru medii aritmetice5.4 Strategia inferenial6 PROCEDURI DE ESTIMARE STATISTIC6.1 Caracteristici ale estimatorilor6.2 Estimarea mediei aritmetice cnd este cunoscut6.3 Estimarea mediei aritmetice cnd este necunoscut.Distribuia tstudent6.4 Estimarea proporiilor6.5 Dimensiuni ale eantioanelor i nivele de precizie6.5.1 Controlul mrimii intervalului estimat6.5.2 Determinarea dimensiunii eantionuluipentru estimarea mediilor aritmetice6.5.3 Determinarea dimensiunii eantionului pentruestimarea proporiilor7 TESTAREA IPOTEZELOR DESPRE O SINGUR POPULAIE7.1 Testul scorurilor zpentru medii aritmetice cnd este cunoscut7.2 Erori n testarea ipotezelor7.3 Testarea ipotezelor pentru medii aritmetice cnd este necunoscut7.4 Testul scorurilor zpentru proporii8 TESTAREA IPOTEZELOR DESPRE DIFERENELEDINTRE DOU POPULAII8.1 Testul scorurilor zpentru diferena dintre dou medii aritmetice8.2 Testul scorurilor tpentru diferena dintre dou medii aritmetice8.3 Testul scorurilor zpentru diferena dintre dou proporii9 ANALIZA DE VARIAN (ANOVA)9.1 Anova pentru o variabil independent9.2 Anova pentru dou variabile independente9.3 Anova pentru eantioane dependente10 TESTE NONPARAMETRICE10.1 Testul chiptrat (2)10.1.1 Testul chiptrat pentru independen10.1.1 Testul chiptrat pentru concordan10.2 Testul McNemar10.3 Testul MannWhitney U10.4 Testul medianei10.5 Testul iteraiilor10.6 Testul Wilcoxon T10.7 Testul KruskalWallis H11 MRIMI ALE CORELAIEI11.1 Noiunea de corelaie11.2 Mrimi ale corelaiei la nivel nominal11.3 Mrimi ale corelaiei la nivel ordinal11.4 Mrimi ale corelaiei la nivel de interval sau de raport11.5 Elemente de analiz multivariat11.5.1 Corelaia parial11.5.2 Regresia multipl11.5.3 Corelaia multiplEXERCIII I PROBLEMEANEXA A: Tabelul ariilor de sub curba normalANEXA B: Tabel cu numere aleatoriiANEXA C: Tabelul valorilor critice ale distribuiei tANEXA D: Tabelul valorilor critice ale distribuiei FANEXA E: Tabelul valorilor critice ale distribuiei 2ANEXA F: Tabelul valorilor critice pentru testul Mann Whitney UANEXA G: Tabelul valorilor critice pentru testul Wilcoxon TANEXA H: Tabelul valorilor critice pentru sANEXA I: Ghid de utilizare a principalelor tehnici statistice1 INTRODUCEREDicionarulexplicativallimbiiromneconsemneazmaimultenelesuri ale cuvntului statistic. Unul dintre acestea este eviden numeric referitoare la diverse fenomene. La sfritul unei transmisiuni televizate a unui meci de fotbal, de pild, ni se prezint o statistic privind numrul de uturi pe poart, numrul de cornere, numrul de cartonae galbene i roii etc.ntr-un alt neles al acestui cuvnt, statistica este o ramur a matematicii, numit adesea statistic teoretic sau chiar statistic matematic, al crei obiect de studiu l reprezint elaborarea unor metodele matematice de analiz a aa-numitelor fenomene de mas, indiferent de natura acestora. Cercettorii din domeniul tiinelor omului i ale naturii vorbesc despre statistic ntr-un fel diferit, dar legat deprimeledounelesuri menionate, avndnvedereaplicareaunormetode statistice pentru prezentarea i interpretarea rezultatelor unor investigaii specifice.n aceast carte se prezint, n principal, statistica aplicat n psihologie. Dup evidenierea rolul statisticii n cercetarea psihologic, se trec n revist cteva operaii matematice de baz, necesare pentru a nelege statistica. n restul acestui capitol sunt introduse cteva noiuni fundamentale, folosite n statistic.1.1 ROLUL STATISTICII N CERCETAREA PSIHOLOGICPentru psiholog i, n general, pentru cercettorul n domeniul tiinelor omului, statistica este un set de metode i tehnici matematice de organizare i prelucrare a datelor, folosite cu scopul de a rspunde la anumite ntrebri i de a testa anumite ipoteze. Datele sunt informaii, n principal numerice, care reprezint anumite caracteristici. De pild, dac dorim s cunoatem nivelul de anxietate al unui grup, datele pot fi scoruri pe o scal de anxietate, iar tehnicile statistice ne ajut s descriem i s nelegem aceste scoruri.tiinele omului folosesc o mare cantitate de date pentru testarea ipotezelor i formularea unor teorii. Este important de subliniat, ns, c strngerea datelor nu este, prin sine, suficient pentru cercetarea tiinific. Chiar i cele mai obiective i mai atent culese informaii, luate ca atare, nu ne pot spune mare lucru. Pentru a fi utile, datele trebuie s fie organizate, evaluate i analizate. Fr o bun nelegere a principiilor analizei statistice i fr o aplicare corespunztoare a tehnicilor statistice, cercettorul nu va putea nelege semnificaia datelor culese.Analiza statistic este esenial n psihologie, ca i n celelalte tiine ale omului. Se poate spune, chiar, c psihologia nu poate exista fr statistic. Pe de alt parte, rolul statisticii este limitat. Aceste trsturi pot fi explicate n raport cu cele trei etape principale ale unei cercetri. Astfel, n etapa formulrii problemei de cercetare, cercettorul formuleaz un enun al unei probleme sau al unei ntrebri la care cercetarea va ncerca s dea un rspuns. Problema cercetrii poate s provin din diferite surse, incluznd teorii, cercetri anterioare i comenzi de cercetare. Odat ce a fost formulat problema cercetrii, procesul intr ntr-o a doua etap, n care se iau deciziidespre proiectul de cercetare i se aleg metodele i tehnicile de cercetare. n aceast etap, cercettorul decide ce tipuri de cazuri vor fi incluse n cercetare, ct de multe cazuri vor fi luate n considerare i n ce mod vor fi investigate acestea. Dup ce au fost investigate toate cazurile i au fost culese toate datele relevante, statistica devine realmente i n mod direct important pentru analiza rezultatelor. Este important de reinut c dac cercettorul i-a formulat greit problema sau a proiectat greitcercetarea, atunci cele mai sofisticate analize statistice sunt lipsite de valoare. mprumutnd un principiu din tiina computerelor, putem spune c metodele i tehnicile statistice se supun regulii IGIG = introduci gunoaie, ies gunoaie. Orict ar fi de util, statistica nu se poate substitui conceptualizrii riguroase i nici alctuirii unui proiect de cercetare corespunztor problemei avut n vedere.Multe persoane care nu sunt cercettori trebuie s fie consumatori avizai de rezultate de cercetare prelucrate statistic. Statistica ofer adesea suport raional pentru decizii ale managerilor din sistemul educaional, pentru consilierii educaionali, pentru psihologii clinicieni i pentru alte persoane ale cror profesii sunt legate ntr-un fel sau altul de tiinele omului. Oricare ar fi motivul pentru care se utilizeaz metode i tehnici statistice, att cercettorii, ct i consumatorii cercetrilor trebuie s neleag ce fel de informaii ofer statistica i ce fel de concluzii pot fi trase din aceste informaii.n aceast carte, statistica va fi privit ca un set de instrumente, indispensabil pentru creterea cunoaterii n tiinele omului, iar nu ca un scop n sine. Ca atare, acest subiect nu va fi abordat matematic. Tehnicile statistice prezentate n capitolele care urmeaz sunt vzute ca instrumente folosite pentru a rspunde unor probleme de cercetare specifice psihologiei (altfel spus, aceast carte nu este destinat statisticianului profesionist, ci psihologului). Pe de alt parte, aceasta nu nseamn c nu vor fi folosite anumite metode matematice. Aceast carte a fost scris cu intenia de a furniza ndeajuns material matematic pentru a se putea nelege ce poate face statistica i cum face statistica ceea ce face. Dup ce vei parcurge ntregul material, v vei familiariza cu avantajele i limitele celor mai frecvent utilizate tehnici statistice i vei ti care dintre acestea sunt aplicabile unei mulimi date de informaii i unui scop dat al cercetrii. n cele din urm, vei putea ntreprinde singuri analize statistice de baz ale datelor strnse din cercetri proprii.1.2 MATEMATICA DE BAZn statistic sunt folosite metode matematice, de la cele mai simple pn la cele mai complexe. nelegerea materialului prezentat n aceast carte nu cere o cunoatere avansat a matematicii, ci doar o familiarizare cu aritmetica, algebra elementar i cu unele simboluri matematice folosite cu precdere n statistic. n aceast seciune se ntreprinde o scurt trecere n revist a unor concepte i operaii aritmetice, pe care orice cititor cu o pregtire medie n domeniul matematicii o poate neglija.1.2.1 OPERAII ARITMETICE DE BAZStatistica folosete din plin cele patru operaii aritmetice de baz: adunarea (+), scderea (), nmulirea i mprirea. Rezultatul unei adunri se numete sum, iar rezultatul operaiei de scdere se numete diferen. nmulirea a dou numere poate fi denotat algebric n trei feluri: X Y, (X) (Y) sau pur i simplu XY. Numerele care sunt nmulite se numesc factori, iar rezultatul operaiei de nmulire se numete produs. mprirea a dou numere poate fi, de asemenea, denotat n trei feluri: X Y, X/Y sau YX. n notaia folosit aici, X este numrtorul, Y fiind numitorul. Rezultatul operaiei de mprire se numete ct.Este important de reinut relaia dintre nmulire i mprire. Astfel, ctul X/Y poate fi exprimat ca produsul (X) (1/Y). De exemplu, 15/5 = (15) (1/5) = 3.1.2.2 OPERAII ARITMETICE CU NUMERE REALEn aritmetica elementar suntem familiarizai cu numerele pozitive, i.e. numerele mai mari sau egale cu 0. statistica trebuie s foloseasc ceea ce matematicienii numesc numere reale. Numerele reale sunt toate numerele pozitive i negative, de la la +. Astfel, numerele reale includ nu numai numerele ntregi pozitive i negative, ci i fraciile i numerele zecimale.Atunci cnd se folosesc att numere pozitive, ct i numere negative ntr-o operaie aritmetic, se vorbete despre numere cu semn. Uneori este nevoie s ignorm semnul algebric, + sau , i s considerm doar valoarea absolut a numrului valoarea numrului indiferent de semnul algebric. De pild, valoarea absolut (modulul) numrului 7, notat |7| , este 7. n valori absolute, |7|= | +7|= 7.Semnul algebric din faa unui numr afecteaz rezultatul operaiilor algebrice. n cele ce urmeaz aceste efecte vor fi urmrite pe msur ce se expun regulile pentru operaiile aritmetice.Adunarea Dac dou numere au acelai semn, se adun valorile absolute i se reine semnul respectiv:(10) + (25) = 35(+15) + (+5) = +20Dac se adun dou numere care au semne opuse, se scade valoarea absolut a numrului mai mic din valoarea absolut a celuilalt numr i se reine semnul numrului care are valoarea absolut mai mare:(10) + (+15) = +5(+5) + (25) = 20Scderea Cnd se scad numere, se schimb semnul numrului de sczut, dup care se aplic regulile adunrii:(10) (+5) = (10) + (5) = 15(10) (25) = (10) + (+25) = +15nmulireaDac se nmulesc dou numere care au acelai semn, produsul este pozitiv, iar dac se nmulesc dou numere care au semne diferite, produsul este negativ:(10) (25) = +250(10) (+15) = 150mprireaDac se mpart dou numere care au acelai semn, ctul este pozitiv, iar dac se mpart dou numere care au semne diferite, ctul este negativ:10/25 = +0,40+15/10 = 1,501.2.3 PROPRIETI ALE NUMERELOR REALENumerele reale au trei proprieti importante, care sunt utilizate n formulele i calculele statistice: comutativitatea, asociativitatea i distributivitatea nmulirii fa de adunare.Comutativitatea Dou numere pot fi adunate sau nmulite n orice ordine, rezultatul fiind acelai:15 + 5 = 5 + 15 = 2015 5 = 5 15 = 75Asociativitatea Termenii unei adunri sau factorii unui produs pot fi grupai oricum, rezultatul fiind acelai:10 + (15 + 5) = (10 + 15) + 5 = 10(10) (15 5) = (10 15) 5 = 750Distributivitatea Produsul unui numr X cu suma a dou numere, Y i Z, este egal cu suma produselor lui X cu Y i lui X cu Z:5(10 + 15) = 5(10) + (5 15) = 251.2.4 INDICATORI SPECIALI AI OPERAIILOR ARITMETICEDoi indicatori speciali ai operaiilor aritmetice apar frecvent n statistic: exponentul, radicalul i operatorul nsumrii. Exponentul indic puterea la care este ridicat un numr. Astfel, X2 desemneaz ridicarea la ptrat a numrului X sau, altfel spus, nmulirea numrului X cu sine: X X, iar X4 desemneaz ridicarea la puterea a ptrat a numrului X: X X X X.Radicalul indic extragerea rdcinii unui numr. n statistic apare cel mai frecvent extragerea rdcinii ptrate a unui numr. Rdcina ptrat a unui numr, indicat de simbolul , este numrul real prin a crui ridicare la ptrat se obine numrul iniial. Astfel,36= 6, deoarece 62 = 36. Rdcina ptrat a unui numr poate fi indicat i prin exponentul fracional . De pild,36= 61/2 = 6.Operatorul nsumrii, simbolizat de majuscula din alfabetul grecesc sigma, , indic nsumarea a ceea ce urmeaz imediat n expresia respectiv. Date fiind, de pild, numerele X1 = 3, X2 = 7, X3 = 4, X4 = 2, X5 = 8,expresia 51 iiX, citit sum de X indice i de la i = 1 la 5 st pentru sumaX1 + X2 +X3 + X4 + X5 = 3 + 7 + 4 + 2 + 8 = 24Xi este simbolul general pentru numerele din seria de mai sus. Notaia de sub , i = 1, indic primul numr din sum, X1 = 3, iar numrul nscris deasupra simbolului arat pn la al ctelea numr are loc nsumarea, X5 = 8. n general, expresiaNiiX1arat c nsumarea ncepe cu primul numr din seria respectiv i se ncheie cu cel de-al N-lea numr. Adesea, notaiile aflate deasupra i dedesubtul simbolului sunt omise. ntr-un astfel de caz, indic nsumarea de la primul numr pn la ultimul.Prezentm n continuare dou reguli privind operatorul nsumrii:Regula 1 Rezultatul obinut prin aplicarea operatorului la produsul dintre o constant i o serie de numere este egal cu rezultatul obinut prin nmulirea constantei cu suma numerelor din serie. n simboluri, dac C este o constant,NiiCX1= NiiX C1Fie constanta 2 i numerele X1 = 1, X2 = 3, X3 = 4, X4 = 7; atunci,412iiX= (2 1) + (2 3) + (2 4) + (2 7) = 2 + 6 + 8 + 14 = 30412iiX= 2(1 + 3 + 4 + 7) = 2 15 = 30Regula 2 Rezultatul obinut prin aplicarea operatorului la suma a dou sau mai multe serii de cte N numere este egal cu rezultatul obinut prin aplicarea operatorului la fiecare serie n parte i adunarea sumelor astfel obinute. n simboluri: + +NiNiNii i i iY X Y X1 1 1) (Fie seriile X1 = 2, X2 = 5, X3 = 3, X4 = 1 i Y1 = 1, Y2 = 3, Y3 = 4, Y4 = 7; atunci, +Nii iY X1) ((X1 + Y1) + (X2 + Y2) + (X3 + Y3) + (X4 + Y4) = = (2 + 7) + (5 + 9) + (3 + 6) + (1 + 5) = 9 + 1 + 4 + 9 + 6 + = 38 +NiNii iY X1 1= (X1 + X2 + X3 + X4) + (Y1 + Y2 + Y3 + Y4) == (2 + 5 + 3 + 1) + (7 + 9 + 6 + 5) = 11 + 27 = 381.3 STATISTICI DESCRIPTIVE I STATISTICIINFERENIALEPentru cele ce urmeaz, este necesar s definim termenii variabil, populaie i eantion. O variabil este orice trstur care i poate schimba valoarea de la caz la caz. De pild, trsturile sex, vrst i venit sunt variabile O populaie este un grup ce include toate cazurile de care este interesat cercettorul. De pild, toi cetenii romni cu drept de vot, toi studenii unei universiti i toate rile europene sunt populaii n nelesul dat acestui cuvnt n statistic. n cele mai multe situaii de cercetare, populaiile sunt prea mari pentru a fi cercetate. n astfel de cazuri se selecteaz o submulime strict a populaiei de referin, numit eantion.Tehnicile statistice se mpart n dou mari clase: statistici descriptive i statistici infereniale. Statisticile descriptive sunt utilizate pentru a prezenta, clasifica i nsuma scorurile (valorile) unei variabile. Dac ne intereseaz descrierea unei singure variabile, atunci vom folosi statistici descriptive pentru a aranja i prelucra scorurile acelei variabile astfel nct informaia relevant s poat fi neleas i evaluat rapid.Statisticile infereniale sunt utilizate pentru a face generalizri despre o populaie pe baza studiului unui eantion din acea populaie sau, altfel spus, pentru a trage concluzii despre caracteristicile unei populaii pe baza caracteristicilor corespunztoare ale unui eantion din acea populaie.1.4 NIVELE DE MSUROrice tehnic statistic implic utilizarea unor operaii, precum ordonarea unor cazuri sau nsumarea scorurilor unei variabile. nainte de a utiliza o tehnic statistic, este necesar msurarea variabilei de interes ntr-un mod sau, altfel spus, la un nivel de msur care s justifice aplicarea operaiilor respective. De pild, multe tehnici statistice cer adunarea scorurilor unei variabile. Aceste tehnici pot fi utilizate numai dac variabila este msurat ntr-un mod care permite operaia matematic a adunrii. Astfel, alegerea unei tehnici statistice depinde de nivelul la care a fost msurat variabila. Nivelele de msur ale variabilelor sunt clasificate ntr-o ierarhie, n funcie de complexitatea lor. Aceast ierarhie include, n ordinea cresctoare a complexitii, nivelele nominal, ordinal, de interval i de raport.1.4.1 NIVELUL NOMINALMsurarea unei variabile la nivel nominal const din clasificarea diferitelor cazuri n categoriile prestabilite ale unei variabile. La nivel nominal, clasificarea este singura procedur de msurare permis. Variabilele sex, denominaia religioas (apartenena religioas declarat) i culoarea ochilor sunt exemple de variabile msurabile numai la nivel nominal. La acest nivel categoriile nu pot fi ordonate dup vreun criteriu, putnd fi comparate unele cu altele exclusiv dup numrul de cazuri clasificate n fiecare categorie. De pild, dac dorim s msurm denominaia religioas pentru un grup de persoane, prestabilim categorii precum Cretinortodox, Catolic, Protestant .a., dar nu putem ordona aceste categorii de la superior la inferior sau n vreun alt fel.Criteriile (regulile) msurrii nominale corecte sunt urmtoarele:Regula excluderii categoriilorCategoriile variabilei trebuie s fie reciproc exclusive, ceea ce nseamn c nici un caz nu trebuie s fac parte din mai mult de o categorie. n raport cu aceast regul, distingem dou tipuri de erori: (1) cel puin dou categorii au cazuri n comun, fiecare categorie coninnd i cazuri care nu aparin celeilalte categorii; (2) cel puin dou categorii se afl n raport de incluziune orice caz care face parte dintr-o categorie face parte i din cealalt categorie, nu i reciproc.Regula exhaustivitii categoriilor Trebuie s apar cte o categorie pentru fiecare manifestare a variabilei respective sau, altfel spus, fiecare caz de interes trebuie s fac parte dintr-o categorie. Avnd n vedere complexitatea manifestrilor variabilelor considerate n tiinele omului, pentru respectarea acestei reguli se obinuiete s se adauge o categorie Alii/Altele.Regula omogenitii categoriilorCategoriile trebuie s fie omogene n termenii proiectului de cercetare urmrit, ceea ce nseamn c proprietile comune cazurilor repartizate n aceeai categorie trebuie s fie mai importante n raport cu scopurile cercetrii dect proprietile care difereniaz acele cazuri. S presupunem, de pild, c indivizii dintr-o colectivitate sunt clasificai n categoriile: folosete de obicei aspirin efervescent, folosete de obicei aspirin obinuit, folosete uneori un tip de aspirin i alteori cellalt tip de aspirin, nu folosete de loc aspirin. Aceste categorii vor fi apreciate ca omogene de un distribuitor de produse farmaceutice, n timp ce un distribuitor de cafea va prefera clasificarea acelorai indivizi n categoriile: consum de obicei cafea natural, consum de obicei cafea solubil, consum uneoriun tip de cafea i alteori cellalt tip de cafea, nu consum de loc cafea.n legtur cu msurarea nominal, trebuie considerat i un al patrulea criteriu de acceptabilitate, conform cruia o clasificare trebuie s aib sens teoretic sau, altfel spus, categoriile trebuie s poat fi folosit pentru explicaie i nelegere. Putem repartiza, de pild, orice n univers n clasa bursucilor sau n clasa non-bursucilor, dar o astfel de clasificare nu ar avea nici o importan pentru cunoatere.1.4.2 NIVELUL ORDINALn cazul msurrii la nivel ordinal, pe lng clasificarea cazurilor n categorii, cazurile repartizate ntr-o categorie sau alta pot fi ordonate, comparndu-le unul cu altul, de la inferior la superior, n funcie de gradul calitativ n care acestea posed trstura msurat. De pild, variabila nivel de colarizare este msurabil la nivel ordinal. Categoriile acestei variabile sunt adesea ordonate conform urmtoarei scheme: 1. nu a absolvit nici o coal; 2. a absolvit cel mult ciclul obligatoriu de nvmnt; 3. a absolvit cel mult liceul; 4. a absolvit cel mult cursuri postliceale, neuniversitare; 5. a absolvit cel mult cursuri universitare; 6. a absolvit cursuri post universitare. Aceste categorii sunt exhaustive i reciproc exclusive i pot fi comparate n termenii numrului de cazuri pe care le conin. n plus, categoriile i cazurile individuale pot fi comparate sub aspectul trsturii msurate. Putem spune, de pild, c un individ clasificat n categoria 2 are un nivel de colarizare inferior unui individ clasificat n categoria 4, respectiv c un individ clasificat n categoria 4 are un nivel de colarizare superior unui individ clasificat n categoria 2.La nivel ordinal, dei exist o distan ntre oricare dou cazuri aflate n categorii diferite, aceast distan nu poate fi descris n termeni precii. n exemplul nostru, nu suntem ndreptii s spunem, de pild, c distana dintre un individ aflat n categoria 2 i un individ aflat n categoria 3 este egal cu distana dintre un individ aflat n categoria 3 i un individ aflat n categoria 4 i nici c un individ aflat n categoria 4 are un nivel de colarizare de dou ori mai mare dect un individ aflat n categoria 2.ntruct la nivel ordinal nu suntem ndreptii s presupunem c distanele dintre cazuri sau scoruri sunt egale, iar operaiile de adunare, scdere, nmulire i mprire pot fi aplicate n mod legitim numai dac intervalele dintre scoruri sunt egale, aceste operaii nu pot fi aplicate variabilelor msurate la nivel ordinal.1.4.2 NIVELUL DE INTERVALn msurarea la nivel de interval, pe lng clasificare i ordonare, distanele (intervalele) dintre oricare dou cazuri aflate n categorii succesive sunt egale. Cu alte cuvinte, la acest nivel variabilele sunt msurabile n uniti care au intervale egale. n legtur cu timbrele dintr-o colecie, anul emiterii este un exemplu de variabil msurabil la nivel de interval: timbrele repartizate ntr-o categorie sau alta pot fi numrate, se poate spune c un timbru emis, s zicem, n 1990 este mai recent dect unul emis n 1930, iar intervalele dintre dou clase succesive sunt egale (un an). Pe de alt parte, dei distanele dintre oricare dou cazuri aflate n categorii succesive sunt egale, la acest nivel nu se poate determina msura exact (proporia) n care un caz aflat ntr-o categorie satisface trstura msurat fa de un caz aflat n alt clas. n exemplul nostru, nu suntem ndreptii s spunem, de pild, c un timbru emis n 1990 este de 60 de ori mai recent dect un timbru emis n 1930.Este de remarcat c dac ntr-o msurare de interval apare un punct zero, acesta este doar un punct de referin arbitrar i nu un punct zero natural sau absolut, adic un punct care s reflecte absena caracteristicii msurate. De pild, un termometru cu lichid dilatabil (mercur, alcool etc.) msoar temperatura pe o scal de interval (Celsius sau Fahreinheit) n care punctul zero (0C sau 0F) este doar unul dintre punctele de pe scala de msur folosit i nu indic absena temperaturii. Ca atare, nu suntem ndreptii s spunem, de pild, c dac ieri temperatura a fost de +1C i astzi sunt +10C, astzi este de zece ori mai cald ca ieri1.Un exemplu de scal de interval n psihologie este dat de msurarea unei trsturi de personalitate, precum nivelul de stabilitate emoional. Nu suntem ndreptii s spunem c o persoan care a obinut un scor de 20 pe o scal de personalitate n privina acestei trsturi este de dou ori mai stabil emoional dect o persoan care a obinut scorul 10, deoarece nu exist un punct zero absolut care s indice absena trsturii msurate.La acest nivel sunt permise toate operaiile matematice.1.4.3 NIVELUL DE RAPORTn msurarea la nivel de raport, pe lng toate trsturile unei msurri de interval, se poate determina msura exact (proporia) n care un caz aflat ntr-o categorie satisface caracteristica msurat, n raport cu un caz aflat ntr-o alt categorie i apare un punct zero natural, care reflect absena caracteristicii msurate. De pild, nregistrarea vechimii n munc a angajailor unei firme n ani mplinii produce date de raport, deoarece unitatea de msur determin intervale egale, suntem ndreptii s spunem c un angajat cu 10 ani de vechime n munc, s zicem are o vechime de dou ori mai mare dect un angajat cu cinci ani de vechime n munc i exist un punct zero natural (0 ani vechime n munc). Venitul, numrul de copii i numrul de ani de csnicie sunt alte exemple de variabile msurabile la nivel de raport.Nivelul de msur al variabilei (variabilelor) de interes reprezint un criteriu necesar (nu i suficient) de selecie a tehnicilor statistice. De pild, calcularea mediei aritmetice este justificat numai pentru variabilele msurate la nivelele de interval i de raport, deoarece media aritmetic a unei mulimi de date impune adunarea tuturor datelor respective i mprirea sumei astfel obinute la numrul total de date.De notat c n psihologie este uneori dificil de a stabili dac o variabil a fost msurat la nivel ordinal sau la nivel de interval. ntr-un astfel de caz, este util s se presupun c variabila a fost msurat la nivel de interval, cci acest nivel permite aplicarea unor tehnici statistice mai sofisticate dect cele permise la nivel ordinal. O decizie de acest fel, ns, nu este lipsit de riscuri. n anumite situaii este nevoie s se dovedeasc faptul c analiza statistic respectiv este corect, de pild prin analize separate ale datelor la ambele nivele de msur i compararea rezultatelor. Dac rezultatele astfel obinute sunt substanial diferite, supoziia msurrii la nivel de interval trebuie s fie abandonat. 1 Aceast situaie nu trebuie s fie confundat cu cea a temperaturii Kelvin, care este temperatura absolut a unui gaz ideal i este determinat de micarea moleculelor sale. Pe scala Kelvin apare punctulzero absolut(= 273,16C), n care moleculele gazului sunt n repaus, ceea ce indic absena caracteristicii respective.Stimulat de predarea statisticii la Facultatea de Psihologie a Universitii Titu Maiorescu, am conceput aceast carte ca o introducere clar i concis n statistica aplicat n psihologie. Msura n care am reuit ndeplinirea acestui obiectiv o va da, firete, cititorul. Pentru aprofundarea unor concepte i metode statistice prezentate aici, recomand cu deosebire urmtoarele lucrri, din care am preluat multe exemple de analiz statistic: Joseph F. Healey, Statistics: A Tool for Social Research, Belmont, California, Wadsworth Publishing Company, 1984; Dennis E. Hinkle, William Wiersma i Stephen G. Jurs, Applied Statistics for the Behavioral Sciences, Boston, Houghton Mifflin Company, 1988; Gerald Keller i Brian Warrack, Essentials of Business Statistics, Belmont, California, Wadsworth Publishing Company, 1991; Leon F. Marzillier, Elementary Statistics, Wm. C. Brown Publishers, 1990.GLOSAR2 PREZENTAREA DATELOR STATISTICEFuncia de baz a statisticii descriptive este prezentarea clar i concis a rezultatelor cercetrii. n acest capitol sunt expuse o serie de tehnici de organizare i prezentare rezumativ a datelor: procente, proporii, raporturi, rate, distribuii de frecvene, diagrame i grafice.2.1 PROCENTE I PROPORIIImaginai-v c suntei eful unui departament al unei mari companii de asigurri i c, dorind s prezentai directorului executiv al companiei o problem de personal cu care v confruntai, i spunei urmtoarele: Oamenii din departamentul meu nu sunt suficient de bine pltii. Dei din cei 154 de angajai permaneni ai companiei numai 37 sunt n departamentul meu, din cele 17832 de contracte de asigurare ncheiate n companie anul trecut, 7321 au fost aduse de angajaii din departamentul pe care l conduc. Probabil c dup o astfel de prezentare, directorul executiv ar schia o grimas de plictiseal i ar amna elegant discuia pentru o dat neprecizat. ntruct este vorba de compararea a cte dou numere (personalul departamentului fa de numrul total de angajai ai companiei i volumul de munc din departament fa de volumul total de munc din companie pe timp de un an), procentele i proporiile ar fi fost modaliti mai convingtoare de prezentare a informaiei.Definiiile matematice ale proporiei i procentului sunt urmtoarele:Formula 2.1 Proporie (p) = nfFormula 2.2 Procent (%) = 100 nfn care f = frecvena sau numrul de cazuri n fiecare categorien = numrul total de cazuri (numrul de cazuri din toate categoriile)Urmtorul tabel ilustreaz calcularea proporiilor i procentelor:Tabelul 2.1 Opinia fa de interzicerea fumatului n locurile publice (date fictive)Opinia Frecvena(f)ProporiapProcentul%Acord 167 0,621 62,1Dezacord 72 0,268 26,8Nu tiu/Nu rspund30 0,111 11,1TOTAL 269 1,000 100,0Pentru a afla proporia cazurilor din prima categorie (De acord cu interzicerea fumatului n locurile publice), notm c avem aici 167 de cazuri (f= 167) fa de 269 de cazuri n eantion (n = 269). Astfel:Proporie (p) = nf = 269167 = 0, 621Procednd la fel, aflm proporiile cazurilor din celelalte categorii. Rezultatele pot fi exprimate sub form de procente. Astfel, procentul de cazuri din cea de-a treia categorie (Nu tiu/Nu rspund) esteProcent (%) = 100 nf = 10026930 = 11,1%Exprimarea rezultatelor prin procente i proporii este cu deosebire util atunci cnd dorim s comparm grupuri de mrimi diferite. S presupunem, de pild, c am adunat urmtoarele date privind dou universiti:Tabelul 2.2 Numrul de studeni nscrii pe specializrila dou universiti (date fictive)Specializarea Universitatea A Universitatea BDrept 103 312tiine Economice 82 279Psihologie 137 188Sociologie 93 217TOTAL 415 996ntruct numrul total de studeni nscrii difer mult de la o universitate la alta, compararea numrului relativ de studeni nscrii pe specializri la cele dou universiti este greu de fcut numai pe baza frecvenelor. Care universitate, de pild, are cel mai mare numr relativ de studeni nscrii la specializarea Psihologie? Pentru a nlesni comparaiile de acest fel, calculm procentele de studeni nscrii pe specializri la cele dou universiti:Tabelul 2.3 Procentul de studeni nscrii pe specializrila dou universiti (date fictive)Specializarea Universitatea A(%)Universitatea B(%)Drept 24,8 31,3tiine Economice 19,8 28,0Psihologie 33,0 18,9Sociologie 22,4 21,8TOTAL 100,0(415)100,0(996)Procentele prezentate n acest tabel permit identificarea att a diferenelor, ct i a asemnrilor dintre cele dou universiti. De pild, Universitatea A are un procent mai mare de studeni nscrii la specializarea Psihologie, dei numrul absolut de studeni nscrii la acest profil este mai mic dect la Universitatea B, iar la specializarea Sociologie, procentele sunt aproape aceleai.Remarcai c sub fiecare coloan de procente am menionat totalul n date absolute sau, altfel spus, am menionat dimensiunea eantionului. n general, dac nu se menioneaz baza de comparaie, atunci procentele i proporiile nu ne spun nimic sau chiar ne pot induce n eroare. S presupunem, de pild, c o firm care produce buturi rcoritoare anun c ultimul su produs are cu 20% mai puine calorii. Problema este: 20% mai puin fa de ce? Fr menionarea bazei de comparaie, pretenia firmei respective este lipsit de sens. Unele reclame impresioneaz prin prezentarea unor proporii, cum ar fi Dou din trei persoane prefer marca X de produs mrcii Y. Ce ai gndi despre o astfel de reclam, dac ai afla c, de fapt, au fost chestionate doar trei persoane? Cunotinele de statistic i dovedesc utilitatea i n mai buna nelegere i evaluare a informaiilor statistice prezentate n presa scris sau pe posturile de radio i televiziune.O eroare care poate s apar n folosirea procentelor const din ncercarea de a aduna procentele ca i cum ar fi numere cardinale. S presupunem de pild, c productorul naional de energie electric anun creterea preului pe kilowatt cu 50%. Pentru justificarea acestei creteri, productorul arat c au crescut costurile de producie a energiei electrice, dup cum urmeaz: preul combustibilului folosit n termocentrale cu 10%, costurile investiiilor n retehnologizare cu 20% i cheltuielile cu fora de munc cu 10%, n total, o cretere a costurilor cu 50%. O astfel de justificare este greit. Doar o cretere cu 50% a tuturor costurilor ar justifica o cretere cu 50% a preului pe kilowatt.Revenind la exemplul dat la nceputul aceste seciuni, informaia prezentat directorului executiv al companiei ar fi fost mai convingtoare dac i-ai fi spus: Dei n departamentul meu lucreaz doar 24% din angajaii companiei, oamenii mei au adus 41% din contractele de asigurare ncheiate anul trecut n companie.2.2 RAPORTURI I RATES considerm din nou tabelul 2.2. Ct de muli studeni sunt nscrii la tiine economice n comparaie cu cei nscrii la Psihologie n Universitatea B? Putem folosi frecvenele pentru a rspunde la aceast ntrebare, dar un rspuns mai uor de neles poate fi dat folosind un raport. Raporturile se calculeaz mprind frecvena cazurilor dintr-o categorie la frecvena cazurilor din alt categorie, permind astfel compararea categoriilor n termeni de frecven relativ. Definiia matematic a raportului este urmtoarea:Formula 2.3 Raport = jiffn care if = numrul de cazuri din categoria ijf = numrul de cazuri din categoria jRaportul ne spune exact n ce msur categoria i depete n numr de cazuri categoria j. n exemplul nostru, raportul studenilor nscrii la tiine Economice fa de cei nscrii la Psihologie n Universitatea B este:Raport = jiff = 188279 = 1,48Aceasta nseamn c pentru fiecare student nscris la Psihologie exist 1,48 studeni nscrii la tiine Economice.Raporturile pot fi multiplicate cu 100 pentru a elimina virgulele. Astfel, raportul calculat mai sus poate fi prezentat ca 148, ceea ce nseamn c pentru fiecare 100 de studeni nscrii la psihologie exist 148 de studeni nscrii la tiine Economice.Ratele se calculeaz mprind numrul de cazuri reale (efective) la numrul de cazuri posibile pentru variabila de interes pe o anumit unitate de timp. De pild, rata brut a natalitii pentru o populaie se calculeaz mprind numrul de nscui vii la numrul total de persoane din acea populaie pe an, ctul astfel obinut fiind nmulit cu 1000. Se spune c rezultatul este exprimat n promile (0/00). Dac, de pild, ntr-un ora cu 7000 de locuitori s-au nregistrat ntr-un anumit an 100 de nscui vii, rata brut a natalitii esteRata brut a natalitii (0/00) = 3 , 14 1000 0143 , 0 10007000100 0/00Aceasta nseamn c pentru fiecare mie de locuitori au fost n acel an 14,3 nscui vii.Ca modaliti de a exprima frecvene relative, procentele, proporiile, raporturile i ratele sunt utile n special atunci cnd dorim s comparm diferite grupuri sau/i acelai grup n momente diferite.2.3 DISTRIBUII DE FRECVENEO distribuie de frecvene este o dispunere a valorilor unei variabile care arat cte cazuri sunt coninute n fiecare categorie a variabilei respective. Construirea unei distribuii de frecvene este, de regul, primul pas n orice analiz statistic. S presupunem c urmtoarele date reprezint scorurile obinute de 180 de subieci la un test de cunotine:Tabelul 2.4 Scoruri obinute la un test de cunotine685565426445565956423850374253525457496354384649334340294360695464416344555855413749364152515349486455374750344439304261433351505463685743565447375249364856244555465845325655494755443250495362675642555346365148354748254656455946335754504656544753535050656053405739366338575756554046486240454656444848554852524949645952395638356237565655564147496341464555454947Datele brute din tabelul 2.4 sunt greu de urmrit i greu de neles. Sub supoziia c este vorba despre date de interval, putem construi o distribuie de frecvene listnd scorurile diferite n ordine cresctoare i nregistrnd frecvena de apariie a fiecrui scor. Distribuia de frecvene astfel obinut este urmtoarea:Tabelul 2.5 Distribuia de frecvene a scorurilor obinute la un test de cunotineScorulfScorul 3 Scorulf24 1 40 4 56 1425 1 41 5 57 626 0 42 5 58 227 0 43 4 59 328 0 44 4 60 229 1 45 7 61 130 1 46 9 62 331 0 47 7 63 532 2 48 8 64 433 3 49 11 65 234 1 50 7 66 035 2 51 3 67 136 4 52 6 68 237 5 53 7 69 138 4 54 739 3 55 12De notat c aceast distribuie de frecvene red i informaia conform creia n eantionul considerat nu au fost obinute scorurile 26, 27, 28, 31 i 66, aflate ntre cel mai mic scor i cel mai mare scor.n distribuia de frecvene din tabelul 2.5 am inclus toate scorurile diferite cuprinse ntre cel mai mic scor i cel mai mare scor. Cu alte cuvinte, am clasificat datele ntr-un numr de grupuri sau clase egal cu numrul de scoruri distincte. Dup cum arat i acest exemplu, construirea unei distribuii n acest fel are drept rezultat o list destul de lung i nu tocmai clarificatoare. Atunci cnd numrul de scoruri distincte este mare, se opteaz pentru o prezentare mai compact (mai puin detaliat) a datelor, prin gruparea acestora n categorii mai largi, care, n cazul datelor de interval sau de raport, se numesc intervale de clas. n tabelul 2.6 se prezint o distribuie de frecvene pentru datele din tabelul 2.4, n care apar 10 intervale de clas, mrimea fiecrui interval fiind egal cu 5 uniti. Adugnd i o coloan de procente pentru scorurile din fiecare categorie fa de numrul total de scoruri vom spori claritatea prezentrii.Tabelul 2.6 Distribuia de frecvene a scorurilorobinute la un test de cunotine(mrimea intervalului = 5)Intervale de clasf%2024 1 0,562529 2 1,113034 7 3,893539 18 10,004044 22 12,224549 42 23,335054 30 16,675559 37 20,566064 15 8,336569 6 3,33TOTAL 180 100,0Distribuia de frecvene din tabelul 2.6 evideniaz predominana relativ a scorurilor din intervalele 4549 (23,33%) i 5559 (20,56%). Pe de alt parte, gruparea scorurilor n acest tabel conduce la o pierdere de informaie fa de prezentarea din tabelul 2.5. Nu tim, de pild, ci subieci au obinut, respectiv, scorurile 35, 36, 37, 38 i 39, ci doar c sunt 18 scoruri n intervalul 3539. Apoi, din tabelul 2.6 nu reiese c n eantionul considerat nu au fost obinute scorurile 26, 27, 28, 31 i 66. S mai notm c, la rigoare, se poate spune c n distribuia de frecvene din tabelul 2.5, mrimea fiecrui interval este egal cu o unitate.n general, regulile de construire a unei distribuii de frecvene pentru date de interval sau de raport n care se utilizeaz intervale de clas de mrime diferit fa de datele iniiale sunt urmtoarele:1. Se decide asupranumrului de intervale de clascare vor fi utilizate. Numrul deintervaledeclasnutrebuiesfieatt demarenct snu permit sesizarea predominanei relative a anumitor grupri de scoruri, dar nici att de mic nct s conduc la pierderea unor informaii semnificative. De regul, se utilizeaz ntre 5 i 20 de intervale, n funcie de numrul de scoruri din mulimea iniial de date i de scopurile cercetrii.2. nfuncie de numrul deintervale declas ales, sestabiletemrimea intervalelor de clas. nmod obinuit, pentru a se nlesni interpretarea distribuieide frecvene,sefolosesc intervalede clasde aceeaimrime. Mrimeaunuiinterval de clas se stabiletemprind diferenadintre cel mai marescor i cel mai micscor dinmulimeascorurilor date, numit amplitudinea mulimii respective2, la numrul intervalelor de clas i rotunjind rezultatul pn la un numr ntreg convenabil.3. Se stabilete primul interval astfel nct s conin cel mai mic scor (limita sa inferioar s fie mai mic sau egal cu cel mai mic scor). Ultimul interval va fi acela care conine cel mai mare scor. Intervalele nu trebuie s se suprapun.4. Se numr scorurile din fiecare interval de clas i se nregistreaz rezultatelentr-ocoloanetichetatf(frecvena). Lasfritul acestei coloane se prezint numrul total de scoruri. Pentru mai mult claritate, se poate aduga o coloan de procente.S vedem cum au fost aplicate aceste reguli pentru construirea distribuiei de frecvene din tabelul 2.6. Scorul cel mai mare i scorul cel mai mic fiind, respectiv, 69 i 24, amplitudinea scorurilor este 69 24 = 45. Alegnd un numr de 10 intervale de clas, mrimea fiecrui interval de clas este 45 10 = 4,5 5. Primul interval, care trebuie s includ cel mai mic scor, poate fi oricare dintre urmtoarele:2024, 2125, 2226, 2327, 2428Fiecare dintre aceste intervale conine cinci scoruri3, inclusiv scorul 24, deci poate fi ales. n exemplul nostru am ales intervalul 2024. Ca atare, urmtorul interval este 2529 .a.m.d. pn la ultimul interval, 6569, care conine cel mai mare scor. De notat c intervalele din tabelul 24 par a nu fi reciproc exclusive. n realitate lucrurile nu stau aa. Dac, dup intervalul 2024 ar fi urmat 2428, 2832 .a.m.d., am fi obinut intervale suprapuse dou cte dou. Scorul 24, de pild, ar fi fcut parte att din intervalul 2024, ct i din intervalul 2428. Intervalele de clas din tabelul 2.6 sunt exhaustive (acoper toate scorurile din mulimea iniial de scoruri) i reciproc exclusive (fiecare scor face parte dintr-un singur interval).Distribuiile de frecvene pentru date de interval sau de raport pot conine dou instrumente ajuttoare n prezentarea datelor: frecvene cumulate i procente cumulate. Frecvenele cumulate prezint numrul de cazuri dintr-un interval de clas i din toate intervalele de clas precedente, iar procentele cumulate prezint procentul de cazuri 2 Vvezi capitolul 3, 3.3.2.3 Aparent, fiecare interval acoper doar patru scoruri. Pentru a v convinge c nu este aa, numrai-le!dintr-un interval de clas i din toate intervalele precedente4. Tabelul urmtor prezint o coloan de frecvene cumulate i o coloan de procente cumulate pentru distribuia de frecvene din tabelul 2.6.Tabelul 2.7 Distribuia de frecvene a scorurilorobinute la un test de cunotineIntervale de clasf fc% %c2024 1 1 0,56 0,562529 2 3 1,11 1,673034 7 10 3,89 5,563539 18 28 10,0 15,564044 22 50 12,22 27,784549 42 92 23,33 51,115054 30 122 16,67 67,785559 37 159 20,56 88,346064 15 174 8,33 96,676569 6 180 3,33 100,0TOTAL 180 100,0Pentru a construi distribuia de frecvene cumulate din tabelul 2.7 ncepem cu primul interval de clas, 2024. Pentru acest interval, intrarea n coloana de frecvene cumulate este identic cu numrul de scoruri din interval, 1. Pentru intervalul imediat urmtor, 2529, se adun numrul de scoruri din interval, 2, cu numrul de scoruri din primul interval, 1, obinndu-se frecvena cumulat a intervalului, 3. Se procedeaz la fel pentru fiecare interval, adunnd frecvena din intervalul respectiv cu frecvena cumulat n intervalul imediat anterior. Evident, frecvena cumulat n ultimul interval de clas este egal cu numrul total de scoruri.Construirea coloanei de procente cumulate urmeaz acelai model aditiv cu cel folosit pentru frecvene cumulate. Astfel, pentru primul interval, intrarea n coloana de procente cumulate este identic cu procentul din interval. Pentru intervalul imediat urmtor, procentul cumulat este procentul scorurilor din interval plus procentul scorurilor din primul interval .a.m.d. pn la ultimul interval, n care, evident, procentul cumulat este egal cu 100%. De notat c aceleai rezultate se obin prin aplicarea formulei 2.2, n caref se nlocuiete cu fc pentru fiecare interval de clas, n fiind numrul total de scoruri.Frecvenele i procentele cumulate arat felul n care sunt distribuite cazurile n plaja de scoruri. De pild, tabelul 2.7 arat c o majoritate semnificativ de subieci din eantion 122, respectiv 67,78% au obinut scoruri mai mici de 55.Pn acum am considerat scorurile nregistrate la testul de cunotine ca fiind date discrete. Msurarea unei variabile produce date discrete, dac nregistrarea acestora se face n categorii reciproc exclusive (nesuprapuse). Pentru anumite scopuri5, distribuia unei variabile msurabil la nivel de interval sau de raport trebuie construit ca o serie continu de categorii parial suprapuse. Pentru a obine o distribuie continu 4 Considernd, att pentru frecvenele cumulate, ct i pentru procentele cumulate, c intervalele de clas apar n tabel n ordine cresctoare.5 De pild, cum vom vedea n seciunea urmtoare, pentru construirea unei histograme.de scoruri ale unei astfel de variabile, se pornete de la limitele intervalele de clas stabilite iniial, numite limite stabilite i, pe baza acestora, se determin aa-numitele limite reale sau exacte. Pentru determinarea acestor limite, se mparte la doi distana aritmetic dintre intervalele de clas stabilite iniial, iar rezultatul astfel obinut se scade din fiecare limit inferioar stabilit i se adun la fiecare limit superioar stabilit. Tabelul 2.8 prezint rezultatele aplicrii aceste proceduri la intervalele de clas stabilite n tabelul 2.6. ntruct distana aritmetic dintre intervalele de clas din tabelul 2.4 este de o unitate, limitele reale se afl scznd 0,5 din fiecare limit inferioar i adunnd 0,5 la fiecare limit superioar. n tabelul 2.8 este adugat o coloan etichetat centre de interval. Centrele de interval sunt punctele situate exact la mijlocul unui interval i se afl mprind la doi suma limitelor inferioar i superioar ale intervalului6. De notat c centrele de interval sunt aceleai, indiferent dac folosim limite stabilite sau limite reale.Tabelul 2.8 Distribuia de frecvene a scorurilorobinute la un test de cunotine (incluzndlimite reale i centre de interval)Intervale de clasLimite reale Centre de intervalf2024 19,524,5 22 12529 24,529,5 27 23034 29,534,5 32 73539 34,539,5 37 184044 39,544,5 42 224549 44,549,5 47 425054 49,554,5 52 305559 54,559,5 57 376064 59,564,5 62 156569 64,569,5 67 6TOTAL 180Se poate observa c intervalele de clas cu limite reale se suprapun parial dou cte dou, astfel c distribuia apare ca fiind continu.Distribuiile de frecvene se pot construi i pentru variabile msurate la nivelele nominal sau ordinal. Pentru fiecare categorie a variabilei respective se numr cazurile i se prezint subtotalurile, precum i numrul total de cazuri (n). S presupunem, de pild, c suntem interesai de msurarea variabilei nivel de colarizare pentru cei 180 de subieci care au rspuns la un test de cunotine i c decidem s folosim urmtoarea scal ordinal de msur: 1. nu a absolvit nici o coal; 2. a absolvit cel mult ciclulobligatoriu de nvmnt; 3. a absolvit cel mult liceul; 4. a absolvit cel mult cursuripostliceale, neuniversitare; 5. a absolvit cel mult cursuri universitare; 6. a absolvitcursuri post universitare. Folosind numerele de ordine ale categoriilor drept coduri (etichete), tabelul 2.9 ilustreaz construirea unei distribuii de frecvene pentru variabila menionat.6 Centrele de interval sunt utile n construirea histogramelor.Tabelul 2.9 Nivelul de colarizare pentru cei 180 de subieciNivel de colarizaref%1 0 02 61 33,893 82 45,564 24 13,335 7 3,896 6 3,33TOTAL 180 100,0Adugarea unei coloane de procente pentru categorii aduce un spor de claritate a prezentrii. De notat c la nivelele nominal i ordinal, frecvenele cumulate i procentele cumulate sunt lipsite de sens. De asemenea, ntruct la aceste nivele categoriile sunt ntotdeauna discrete, nu are sens s se determine limitele de clas reale i centrele de interval. Singura coloan care poate fi adugat la distribuiile de frecvene pentru variabile la orice nivel de msur este coloana de procente.2.4 DIAGRAME I GRAFICEDiagramele i graficele sunt modaliti de prezentare vizual a datelor statistice i furnizeaz o imagine global a formei unei distribuii. Alegerea unei modaliti sau a alteia depinde, n principal, de nivelul de msur folosit i de scopurile cercetrii.Diagrame circulareO diagram circular este pur i simplu un cerc mprit ntr-un numr de sectoare egal cu numrul de categorii ale variabilei de interes, mrimea fiecrui sector fiind proporional cu procentajul de cazuri din categoria respectiv. Diagramele circulare pot fi folosite pentru variabile msurate la nivelele nominal i ordinal.S presupunem c am nregistrat statusul marital al celor 180 de subieci care au rspuns la un test de cunotine i c am obinut urmtoarele date:Tabelul 2.10 Statusul marital pentru cei 180 de subieciStatus maritalf%Celibatar63 35,0Cstorit 90 50,0Divorat 27 15,0TOTAL 180 100,0Persoan care nu a fost niciodat cstoritS construim o diagram circular pentru datele din acest tabel. ntruct circumferina unui cerc are 3600, vom aloca 1260 (35% din 3600) pentru prima categorie, 1800 (50% din 3600) pentru cea de-a doua categorie i 540 (15 % din 3600) pentru cea de-a treia categorie. Obinem urmtoarea diagram circular:Figura 2.1 Statusul marital al celor 180 de subieciCstorii50%Celibatari35%Divorai15%Diagrama din figura 2.1 evideniaz vizual preponderena relativ a subiecilor cstorii i lipsa relativ a subiecilor divorai din eantionul considerat.Diagrame cu coloane i diagrame cu liniiDiagramele cu coloane reprezint o alt modalitate de prezentare vizual a datelor statistice. Ca i diagramele circulare, diagramele cu coloane pot fi folosite pentru variabile msurate la nivelele nominal i ordinal. ntr-o astfel de diagram, categoriile variabilei de interes apar pe o ax orizontal (axa absciselor), iar frecvenele (relative) apar pe axa vertical corespunztoare (axa ordonatelor). Pe axa orizontal se construiesc attea coloane (dreptunghiuri) cu baze egale cte categorii sunt de prezentat. nlimea unei coloane este proporional cu frecvena (relativ) a cazurilor din categoria respectiv. ntruct la nivelele nominal i ordinal categoriile variabilelor sunt discrete, coloanele sunt separate ntre ele de o distan egal, de regul, cu din limea lor.Diagrama cu coloane din figura 2.2 prezint n procente fa de total statusul marital al subiecilor din tabelul 2.9.Figura 2.2 Statusul marital al celor 180 de subieci0102030405060Cstorii Celibatari DivoraiStatus maritalProcentDecizia de a utiliza o diagram circular sau o diagram cu coloane depinde de numrul de categorii ale variabilei de interes i de scopul cercetrii. Dac o variabil are mai mult de ase sau apte categorii, atunci este preferabil o diagram cu coloane, cci o diagram circular cu prea multe categorii devine prea aglomerat i deci greu de citit.Diagramele cu coloane sunt utile n special pentru a prezenta frecvenele (relative) pentru dou sau mai multe categorii ale unei variabile, cu scopul de a face unele comparaii. S presupunem, de pild, c dorim s facem o comparaie pe sexe a numrului de angajai ai unei firme care, n primele ase luni ale unui an, au apelat la serviciile centrului de consiliere psihologic al firmei. Figura 2.3 prezint datele (fictive) obinute.Figura 2.3 Numrul de angajai care au apelat la serviciilecentrului de consiliere psihologic051015202530ian feb mar apr mai iunFrecvenaBrbaiFemeiAceast diagram arat c, n timp ce numrul de angajai care au apelat la serviciile centrului de consiliere psihologic n perioada menionat a fost n cretere, numrul de apelani femei a crescut mai repede dect numrul de apelani brbai. Aceeai informaie este prezentat printr-o diagram cu linii n figura 2.4.Figura 2.4 Numrul de angajai care au apelat la serviciilecentrului de consiliere psihologic051015202530ian feb mar apr mai iunFrecvenaBrbaiFemeiCa i diagramele circulare i diagramele cu coloane, diagramele cu linii, ndeobte cunoscutesubdenumirea de grafice, sunt largfolosite nmassmedia pentru prezentarea diferitelor date statistice.Histograme i poligoane de frecveneHistogramelesunt modaliti de prezentare vizual a distribuiilor de frecvene pentrudatedeinterval sauderaport, asemntoarediagramelorcucoloane. ntruct ntr-o histogram se folosesc limitele de clas reale ale intervalelor considerate, coloanele apar n contact dou cte dou. Figura 2.5 prezint o histogram pentru datele din tabelul 2.7.Figura 2.5 Histograma scorurilor obinute la un test de cunotine051015202530354045Scoruri (limite reale)Frecvena19,5 24,5 29,534,539,5 44,549,5 54,559,564,5 69,5n general, o histogram se construiete dup cum urmeaz:1. Intervalele de clas sau scorurile se dispun pe axa orizontal (axa absciselor), utiliznd limite de clas reale.2. Frecvenele se dispun pe axa vertical (axa ordonatelor).3. Se construiete cte o coloan pentru fiecare interval, cu nlimea corespunztoare numrului de cazuri din interval i cu limea corespunztoare limitelor reale ale intervalului.4. Se eticheteaz axele.Alt modalitate obinuit deprezentare vizual a distribuiilor defrecvene pentru variabile de interval sau de raport este poligonul de frecvene. Un poligon de frecvene utilizeaz centrele de interval i se construiete dup cum urmeaz:1. Se plaseaz cte un punct n dreptul fiecrui centru de interval, la nlimea corespunztoare frecvenei din intervalul respectiv.2. Punctele astfel obinute se unesc prin linii drepte.3. Se nchide poligonul, considerndu-se cte un interval suplimentar cu frecvena zero la fiecare capt al distribuiei i unind prin linii drepte punctele extreme cu centrele de interval (aflate pe abscis) ale intervalelor suplimentare.4. Se eticheteaz axele.Pentru simplificarea construciei, pe axa absciselor se pot marca direct centrele de interval, n locul limitelor de clas. Dei red aceeai informaie ca i histogramele, poligoanele de frecvene sunt utile pentru a da o imagine general a unei distribuii de frecvene.Figura urmtoare prezint un poligon de frecvene care red aceeai informaie ca i histograma din figura precedent.Figura 2.6 Poligonul de frecvene al scorurilor obinute la un test de cunotine05101520253035404522 27 32 37 42 47 52 57 62 67Scoruri (centre de interval)FrecvenaOgiveOgivele, numite i curbe cumulative ale frecvenelor sau poligoane de frecvene cumulate, prezint vizual frecvenele cumulate sau procentele cumulate ale unei distribuii Oogivutilizeazlimiteledeclasrealesuperioarealeintervalelor (LCRS) i se construiete dup cum urmeaz:1. LCRS se dispun pe axa absciselor.2. Frecvenele cumulate sau procentele cumulate se dispun pe axa ordonatelor.3. Se plaseaz cte un punct n dreptul fiecrei LCRS, la nlimea corespunztoarefrecvenei cumulatesauprocentului cumulat nintervalul corespunztor acelei LCRS.4. Punctele astfel obinute se unesc prin linii drepte.5. Ogivasenchidelastnga,extinzndo liniedreapt ctre limita de clas real inferioar a primului interval.6. Se eticheteaz axele.Figura 2.7 prezint o ogiv pentru datele din tabelul 2.6.Figura 2.7 Ogiv pentru scorurile obinutela un test de cunotine010203040506070809010019,5 24,5 29,5 34,5 39,5 44,5 49,5 54,5 59,5 64,5 69,5Scoruri (limite reale)Procente cumulateDup cum vom vedea n capitolul 3, o ogiv poate fi utilizat pentru a afla diferite puncte de interes ntr-o distribuie de frecvene.n capitolul 11 vom folosi diagrame de mprtiere, numite i diagrame ale norilor de puncte sau scatergrame7, care sunt modaliti de prezentare vizual a corelaiei dintre dou variabile msurate la nivel de interval sau de raport.7 De la substantivul din limba englez scatter, care nseamn mprtiere.GLOSAR3 MRIMILE TENDINEI CENTRALEI ALE DISPERSIEIUtilizarea distribuiilor de frecvene i a tehnicilor grafice de prezentare a acestora permite relevarea formelor globale ale distribuiilor unor scoruri. Pentru descrierea mai detaliat a unei distribuii de scoruri, statisticienii folosesc dou tipuri de mrimi numericedescriptive. Estevorbadespreideeadecaztipicsaucentral ntr-o distribuie, redatprinmrimiletendineicentrale, idespreideeadevarietatesau eterogenitate a unei distribuii,redat prin mrimile dispersiei. Determinarea acestor mrimi furnizeaz valori precise care por fi uor interpretate i comparate ntre ele.3.1 MRIMILE TENDINEI CENTRALEMrimile folosite n mod obinuit pentru msurarea tendinei centrale sunt mediaaritmetic, medianaimodul. Fiecaredintreacestemrimi rezumontreag distribuie de scoruri, descriind cea mai tipic sau central valoare a distribuiei respective sub forma unui singur numr sau a unei singure categorii.3.1.1 MEDIA ARITMETICMediaaritmeticsecalculeaz doar pentruvariabile msurate lanivel de intervalsau deraporti sedefinete ca rezultat al mpririi sumei tuturor scorurilor dintr-omulimedescoruri lanumrul total descoruri dinaceamulime. Simbolul folosit pentru media aritmetic a unui eantion este X , iar pentru media aritmetic a unei populaii sefoloseteliteragreceasc(miu). ntruct deocamdatvafivorba numai despre eantioane, vomfolosi simbolul X . Formula matematic a mediei aritmetice este urmtoarea:Formula 3.1 X= nXi n care iX= suma scorurilorn = numrul total de scoruri.Spresupunem, depild, camnregistrat vrstelepentruuneantionde11 persoane i c am obinut urmtoarea distribuie de frecvene:Tabelul 3.1 Vrstele pentru un eantion de 11 persoaneVrstaf16 117 418 119 223 3TOTAL 11S remarcm c avem 11 scoruri, cte unul pentru fiecare persoan din eantion. Pentru a afla media aritmetic a vrstelor persoanelor din eantion sau, pe scurt, vrsta medie, trebuie s nsumm toate cele 11 scoruri i s mprim rezultatul obinut la 11. Pentru a scurta procedura, nmulim fiecare scor cu frecvena cu care apare, adunm rezultatele nmulirilor i mprim suma astfel obinut la 11:191120911) 23 3 ( ) 19 2 ( ) 18 1 ( ) 17 4 ( ) 16 1 ( + + + + nXXiAstfel, media aritmetic a vrstelor persoanelor din eantionul considerat este 19.Media aritmetic este mrimea statistic folosit cel mai des naprecierea tendinei centrale a unei mulimi de scoruri de interval sau de raport deoarece este uor de calculat i n plus are urmtoarele proprieti importante, pe care le vom folosi n unele aplicaii ulterioare.1. Pentru orice distribuie de scoruri, suma abaterilor scorurilor de la media lor aritmetic este egal cu zero.Abatereaunui scor Xifa de media aritmeticX este diferena Xi X , astfel c aceast proprietate se exprim simbolic dup cum urmeaz: iX ( X ) = 0n cuvinte, suma diferenelor dintre scoruri i media lor aritmetic este egal cu 0. Aceast proprietate, care este folosit n obinerea unor formule statistice mai complicate, poate fi exprimat i spunnd c pentru orice distribuie de scoruri, media aritmetic este punctul n jurul cruia toate scorurile se anuleaz, ceea ce face din media aritmetic o mrime descriptiv adecvat n msurarea centralitii scorurilor.2. Pentru orice distribuie de scoruri, suma ptratelor abaterilor scorurilor fa de media lor aritmetic este mai mic dect suma ptratelor abaterilor scorurilor fa de oricare alt scor din distribuie, n simboluri: iX ( X )2 X~)FrecvenaAtunci cnd o distribuie are doar cteva scoruri foarte mici sau, altfel spus, scorurile relativ mari sunt predominante, media aritmetic este mai mic dect mediana. ntr-un astfel de caz, se spune c distribuia respectiv prezint o asimetrie negativ. Figura 3.3 ilustreaz cazul unei distribuii cu asimetrie negativ.Figura 3.3 O distribuie cu asimetrie negativ ( X 30, i cazul n 30.n cazul eantioanelor cu n>30,se poate estima prin s(abaterea standard a eantionului). ntruct,dup cum am vzut,seste un estimator distorsionat pentru , formuladeconstruirea intervalului de ncredere estimat este uor modificat fa de formula 6.1, pentru a se corecta distorsiunea. Astfel, formula modificat pentru cazurile (reale) n care este necunoscut i n > 30 este urmtoarea:Formula 6.2) 1 (2 t n s Z X IEnlocuirea luincu1 nreprezint corecia cerut de faptul c s este un estimator distorsionat.Pentru ilustrare, s presupunem c venitul mediu al unui eantion aleatoriu cu n = 500 este de 5000000 de lei ( 5000000 X ) cu s= 125000. Care este intervalul de ncredere estimat pentru media aritmetic a populaiei respective, la un nivel de ncredere de 95% ( = 0,05)? t t ) 1 500 125000 ( 96 , 1 5000000 ) 1 (2n s Z X IE t ) 34 , 22 125000 ( 96 , 1 50000005000000 t1,96 5595,34 == 5000000 t10967Pebazamediei aritmeticeaeantionului, estimmcmediaaritmeticaveniturilor populaiei este cuprins ntre 4989033 lei (5000000 10967) i 5010967 lei (5000000 10967) i existdoar 5%ansecaacest interval snuconinmediaaritmetica populaiei.Atunci cnd eantioanele sunt mici (n 30) i valoarea lui este necunoscut, distribuia normal standard nu poate fi folosit pentru a descrie distribuia de eantionare a mediilor aritmetice. Pentru a construi intervale estimate semnificative n cazuln 30 se folosete o alt distribuie teoretic:distribuiatStudent30. Ca i n cazul distribuiei normale, graficul distribuiei tStudent, numit i curba t, este simetric i are form de clopot cu ambele extremiti extinse la infinit. Spre deosebire de graficul distribuiei normale, formaexactagraficului distribuieitdepindededimensiunea eantionului. Pentru eantioane mici, graficul distribuiei t este mult mai aplatizat dect cel al distribuiei normale (comparai figura urmtoare cu oricare dintre graficele de mai sus).30 Aceast distribuie este datorat lui William S. Gosset, un chimist i statistician care lucra la fabrica de bere Guiness la nceputul secolului al XX-lea. Gosset a descoperit c pentru eantioanele mici, distribuiile de eantionare difer de distribuia normal i depind de dimensiunea eantionului considerat. Gosset i-a publicat rezultatele n 1908 sub pseudonimul Student.Figura 6.2 Un exemplu de curb tPe msur ce dimensiunea eantionului crete, distribuiatseamn din ce n ce mai mult cu distribuia normal, identificndu-se cu aceasta pentru eantioane practic foarte mari (i teoretic infinite). Astfel, ntruct exist o distribuie tspecific pentru fiecare eantion de dimensiune dat, distribuia t este, de fapt, o familie de distribuii.Distribuia t particular cerut pentru rezolvarea unei anumite probleme depinde de un concept matematic numit grade de libertate. Acest concept se refer la numrul de valori libere s varieze ntr-o distribuie. De pild, dac tim c o distribuie de cinci scoruri are media aritmetic egal cu 3 i c patru dintre aceste scoruri sunt 1, 2, 3, i 4, atunci valoarea celui de-al cincilea scor este fixat: 5. n general, pentru media aritmetic a unui eantion de dimensiunen, o distribuie are n 1 grade de libertate. Fiecare distribuie teste asociat cu un numr unic de grade de libertate. Mai precis, dac se selecteaz toate eantioanele posibile de dimensiunendintr-o populaie normal, atunci distribuia de eantionare a cantitii1 n sXteste distribuia tStudent cu n 1 grade de libertate. Distribuiatvafi utilizatndeosebi ntestareaipotezelor. Deocamdatvom descrie tabelul valorilor critice ale distribuiei t, prezentat n Anexa C, i vom ilustra utilizareaacestuitabelpentruestimarea intervalelor.Schema general a acestui tabel este prezentat n figura 6.3.Figura 6.3 Schema tabelului valorilor critice ale distribuiei tgl t0,10t0,05t0,025t0,01t0,00512329 2,04530t = 0Tabelul valorilor criticealedistribuieitspecificvalorilepentrut, ceeace nseamn valorile lui t pentru care aria aflat la dreapta sub curba t este egal cu :Nivelele sunt dispuse pe primul rnd al tabelului Valorile t sunt date pentru grade de libertate (gl), dispuse pe prima coloan din stnga, de la 1 la 30 i apoi 40, 60, 120 i . De notat c, pe msur ce numrul de grade de libertate crete, diferena dintre distribuia t i distribuia normal descrete, precum i c pentru o infinitate de grade de libertate, distribuia t este identic cu distribuia normal. Pentru estimarea intervalelor, ca i pentru alte scopuri, avem nevoie de t/2. Aceast valoare se localizeaz nmulind cu 2 valoarea aflat pe primul rnd. De pild, pentru n = 30 i = 0,05, numrul de grade de libertate este 29; la intersecia coloanei de subt= 0,025 i liniei corespunztoare pentru gl = 29 gsim valoarea 2,045. Astfel, n acest caz, vom spune c valoarea lui t/2 este t 2,045.Formula pentru cazurile n care este necunoscut i n 30 este urmtoarea:Formula 6.3) (2n s t X IEt Pentru ilustrare, s presupunemc un eantion aleatoriu de 20 de adolesceni cu dificulti de nvare au obinut urmtoarele rezultate la un test de cunotine la care scorul maxim ce poate fi obinut este de 40:Tabelul 6.2 Scoruri obinute la un test de cunotinede ctre 20 de adolesceni cu dificulti de nvare1831262422203228273312252320283029201922Presupunnd c variabila msurat este normal distribuit n populaia de adolesceni cu dificulti de nvare, care este intervalul de ncredere estimat pentru media aritmetic a acestei populaii, la un nivel de ncredere de 99%? Calculm mai nti media aritmetic a scorurilor din eantion:X=45 , 2420489 nXiAbaterea standard la nivelul eantionului este:t42 , 5 4 , 29198 , 597 20 1251512 2 nX n XsiPentrun=20, numruldegradedelibertateeste19;avnd=0,01,laintersecia coloanei de sub t = 0,005 i liniei corespunztoare pentru gl = 19 gsim valoarea 2,861. Astfel, valoarea lui t/2 este t 2,861. Aplicnd formula 6.3, obinem:46 , 3 45 , 24 ) 20 42 , 5 ( 861 , 2 45 , 24 ) (2t t t n s t X IEAstfel, estimm c media aritmetic pe care o cutm este cuprins ntre 21,03 i 27,91 i exist doar 1% anse ca acest interval s nu conin media aritmetic a populaiei.De reinut c formula 6.3 poate fi aplicat doar dac variabila de interes este normal distribuit.6.4 ESTIMAREA PROPORIILORPe baza teoremei limitei centrale se demonstreaz c proporiile pentru eantioane (p) au distribuii de eantionare aproximativ normale, cu media aritmetic (p) egal cu proporia pentru populaie (P) i abaterea standard (p) egal cu n P P ) 1 ( . Teoretic, formula pentru construirea unui interval estimat bazat pe proporii ale eantioanelor este urmtoarea:Formula 6.4nP PZ p IE) 1 (2t n aceast formul, valorile pentru p i n provin de la eantion, iar valoarea lui Z/2 se determin la fel ca mai sus. Problema cu aceast formul este c valoarea proporiei pentru populaie, P, nu este cunoscut. Pentru a rezolva aceast problem, se poate proceda n dou moduri.Un prim mod de a rezolva problema const n a stabili c P = 0,5. n aceast situaie, 1 P = 0,5 iar P(1 P) = 0,5 0,5 = 0,25. Este important de remarcat c 0,25 este valoarea maxim pe care o poate lua numrtorul fraciei de sub radical, P(1 P). Stabilind pentru P orice alt valoare diferit de 0,5, valoarea expresiei P(1 P) va fi mai mic dect valoarea pentru P = 0,5. De pild, dac P = 0,4, atunci 1 P = 0,6 iP(1 P) = 0,4 0,6 = 0,24. ntruct P(1 P) are valoarea maxim cnd P = 0,5, ne asigurm c intervalul obinut va fi cel mai mare posibil pentru p, Z/2 i n date. Practic, adoptnd aceast soluie, lucrm cu formula urmtoare:Formula 6.5nZ p IE25 , 02 t A doua soluie a problemei menionate const din a estima valoarea lui P prin p, lucrnd cu formula urmtoare:Formula 6.6np pZ p IE) 1 (2t Oricum, formulele de mai sus pot fi folosite doar dac dimensiunea eantionului considerat estre destul de mare, astfel nct np 5 i n(1 p) 5.S presupunem, de pild, c ne dorim s estimm proporia de studeni de la universitatea X care au lipsit cel puin o zi pe motiv de boal ntr-un anumit semestru i c dintr-un eantion aleatoriu de 200 de studeni, gsim 30 n aceast situaie. Astfel, proporia eantionului pe care ne bazm estimarea este p = 30/200 = 0,15. La un nivel de ncredere de 95%, intervalul estimat cu ajutorul formulei 6.5 este urmtorul:07 , 0 15 , 020025 , 096 , 1 15 , 025 , 02t t t nZ p IEPe baza proporiei de 0,30 a eantionului, estimm c proporia cutat este cuprins ntre 0,08 i 0,22. Estimarea poate fi exprimat i n termeni de procente, spunnd c ntre 8% i 22% dintre studenii universitii X au lipsit cel puin o zi pe motiv de boal n semestrul considerat.S aplicm acum formula 6.6 la aceleai date, pstrnd nivelul de ncredere de 95%:t t t 20085 , 0 15 , 096 , 1 15 , 0200) 15 , 0 1 ( 15 , 096 , 1 15 , 0) 1 (2np pZ p IE05 , 0 15 , 020013 , 096 , 1 15 , 0 t t n acest caz, estimm c proporia cutat este cuprins ntre 0,10 i 0,20 sau, altfel spus, c ntre 10% i 20% dintre studenii universitii X au lipsit cel puin o zi pe motiv de boal n semestrul considerat.De notat c intervalul estimat cu ajutorul formulei 6.5 este mai larg dect cel estimat cu ajutorul formulei 6.6, astfel c prima estimare este cea mai conservatoare soluie posibil, cci este mult mai probabil ca intervalele mai largi s conin parametrul estimat. Prin urmare, din punct de vedere statistic, prima estimare este preferabil celei de-a doua estimri.6.5 DIMENSIUNI ALE EANTIOANELOR I NIVELE DEPRECIZIEFormulele 6.1 i 6.5 pot fi manipulate algebric pentru a determina dimensiunea unui eantion la orice nivel de precizie dorit sau, altfel spus, pentru orice limit de eroare stabilit.6.5.1 CONTROLUL MRIMII INTERVALULUI ESTIMATMrimea unui interval de ncredere estimat pentru medii aritmetice sau proporii poate fi controlat prinintermediul adoi termeni ai ecuaiei respective: nivelul de ncredere, care determin scorul Z/2 sau t/2 corespunztor, i dimensiunea eantionului.Relaia dintre nivelul de ncredere i mrimea intervalului este de proporionalitate direct: cu ct nivelul de ncredere crete, cu att intervalul este mai mare. Intuitiv, este mult mai probabil ca intervalele mai largi s conin valoarea pentru populaie, prin urmare putem avea mai mult ncredere n astfel de intervale. Pentru a ilustraaceastrelaie, sconsidermdinnouexemplul privindestimarea venitului mediu al unei populaii: n= 500,5000000 X , s = 125000. La un nivel de ncredere de 95% am gsit intervalul 5000000 t10967 (i.e. acest interval se extinde la 10967 lei n jurul mediei aritmetice a eantionului).Acum, dac lum un nivel de ncredere de 99%, scorul Z/2 corespunztor crete la t 2,58, iar intervalul se mrete:IE = 5000000 t2,58 5595,34 = 5000000 t14436(intervalul estimat launnivel dencrederede99%seextindela14436lei njurul mediei). Exact aceeai relaie se aplic i la proporii.Relaia dintre dimensiunea eantionului i mrimea intervalului este de proporionalitate invers: cu ct dimensiunea eantionului este mai mare, cu att intervalul este mai ngust. Intuitiv, eantioanele mai mari permit estimri mai precise. Pentruilustrare, sconsidermdinnouexemplul privindestimareavenitului mediu, modificnd doar dimensiunea eantionului: n = 1000 (95%).7753 5000000 7 , 3955 96 , 1 5000000 ) 1 1000 125000 ( 96 , 1 5000000 t t t IEPentru n = 500, la un nivel de ncredere de 95%, intervalul estimat se extinde la 10967 lei n jurul mediei; pentru n = 1000, toate celelalte rmnnd aceleai, intervalul estimat se extinde doar la 7753 lei n jurul mediei. Exact aceeai relaie se aplic i la proporii.Denotat cngustareaintervalului (=cretereapreciziei) nudepindenmod liniar de dimensiunea eantionului. n exemplul nostru amdublat dimensiunea eantionului, dar cel de-al doilea interval nu este de dou ori mai ngust dect primul, ci de aproximativ 1,41 de ori mai ngust. Aceasta nseamn c n trebuie s creasc de trei saupatruoripentruaobineodublare a preciziei.ntruct costul unei cercetri este direct proporional cudimensiuneaeantionului, uneantionde, szicem, 10000de persoane cost aproximativ de dou ori mai mult dect unul de 5000 de persoane, dar estimareabazatpeeantionul maimarenuva fidedou ori maiprecis dectcea bazat pe eantionul mai mic.6.5.2 DETERMINAREA DIMENSIUNII EANTIONULUI PENTRUESTIMAREA MEDIILOR ARITMETICES considerm formula 6.1:nZ X IE 2t n aceast formul, membrul ) (2n Z reprezint, n fapt, limita de eroare sau nivelul de precizie a estimrii: ) (2n Z este limita inferioar, iar ) (2n Z + este limita superioar. Notnd limita de eroare cu L, putem scrie urmtoarea ecuaie:nZ L 2Ridicnd la ptrat ambii membri ai ecuaiei, egalitatea se pstreaz:nZ L2222Din aceast egalitate l putem obine pe n:Formula 6.722 22LZnPentru a folosi aceast formul trebuie s cunoatem valoarea lui , or, dup cum am mai menionat, n aproape toate cazurile aceast valoare nu este cunoscut. Totui, valoarea lui poate fi aproximat, dac cunoatem amplitudinea variabilei msurate, A. Astfel, o aproximare conservatoare a lui este A/4.S ilustrm. Un psiholog industrial dorete s estimeze durata medie n care un muncitor de la o firm de produse electronice execut un anumit reglaj. Observnd un numr de muncitori care execut reglajul respectiv, psihologul constat c durata cea mai mic este de 10 minute, iar cea mai mare de 22 de minute. Ct de mare trebuie s fie eantionul selectat, dac psihologul dorete s estimeze durata medie de execuie a acelui reglaj cu o precizie de 20 de secunde, la un nivel de ncredere de 95%? n aceast problem, L = 20 i amplitudinea variabilei msurate este A = 22 10 = 12 minute, astfel c A/4 = 12/4 = 3 minute = 180 secundeAcum l putem obine pe n:300 12 , 31120180 ) 96 , 1 (22 222 22 LZnPrin urmare, psihologul trebuie s selecteze un eantion aleatoriu de aproximativ 300 de muncitori pentru a estima durata medie de executare a reglajului respectiv cu o precizie de 20 de secunde, la un nivel de ncredere de 95%.S presupunem acum c se dorete dublarea preciziei de la 20 de secunde la 10 secunde, la acelai nivel de ncredere. n acest caz avem:1244 48 , 124410180 ) 96 , 1 (22 222 22 LZnSe observ c dimensiunea eantionului crete mai repede dect precizia: pentru a dubla precizia de la 20 de secunde la 10 secunde, dimensiunea eantionului trebuie s creasc de aproximativ patru ori. Aceast relaie este important pentru planificarea costurilor unei cercetri. Eantioanele impresionant de mari pot constitui o irosire de resurse fr un ctig semnificativ n privina preciziei, n raport cu eantioanele mai mici i deci mai ieftine.6.5.3 DETERMINAREA DIMENSIUNII EANTIONULUI PENTRUESTIMAREA PROPORIILORAm vzut c, practic, n construirea unui interval estimat pentru proporii lucrm cu formulanZ p IE25 , 02 t Aici, limita de eroare a estimrii este nZ25 , 02 . Notnd tot cu L limita de eroare a estimrii, avem ecuaia:nZ L25 , 02 Ridicnd la ptrat ambii membri, avem:nZ L25 , 0222Din aceast egalitate l obinem pe n:Formula 6.822225 , 0LZnS presupunem c un institut de sondare a opiniei publice dorete s estimeze rezultatul unor alegeri prezideniale nuntrul unei marje de eroare de t 3%. Ct de mare trebuie s fie eantionul cerut pentru a sigura acest nivel de precizie la un nivel de ncredere de 95%? Exprimnd limita de eroare sub form de proporie, obinem:1000 11 , 1067) 03 , 0 (25 , 0 ) 96 , 1 (22 nPrin urmare, pentru a obine o precizie (o limit de eroare a estimrii) de t 3%, este nevoie de un eantion de aproximativ 1000 de persoane.i aici se poate constata uor c dimensiunea eantionului crete mai repede dect precizia. Tabelul urmtor prezint relaiile dintre precizie i dimensiunea eantionului pentru proporii ale eantioanelor:Tabelul 6.3 Precizia i dimensiunea eantionului( = 0,05, P = 0,5)Precizia(Mrimea intervalului)Dimensiunea aproximativa eantionuluit 10%100t 7%200t 5%400t 3%1000t 2%2400t 1%9600Se poate observa, de pild, c pentru a dubla precizia de la 10% la 5%, dimensiunea eantionului trebuie s creasc de patru ori.GLOSAR7 TESTAREA IPOTEZELOR DESPREO SINGUR POPULAIEn acest capitol sunt expuse tehnici statistice de testare a ipotezelor despre o singur populaie. ntr-un astfel de caz, pe baza unei statistici calculate pentru un eantion, cel mai adesea o medie aritmetic sau o proporie, se trage o concluzie despre parametrul corespunztor al populaiei de referin. Mai precis, cercetarea const din alctuirea unui eantion aleatoriu din populaia de referin, culegerea informaiei relevante din eantion, calcularea valorii unei statistici i compararea acestei valori cu valoarea presupus a parametrului corespunztor. n aproape toate situaiile de cercetare vom gsi o anumit diferen ntre cele dou valori, iar tehnicile de testare a ipotezelor permit s se decid dac diferena este att de mare, nct s justifice respingerea presupunerii fcute pentru populaie.Tehnicile de testare a ipotezelor prezentate n acest capitol i n capitolele care urmeaz sunt teste despre valoarea parametrilor unei populaii i cer ndeplinirea unor condiii sau supoziii despre populaiile respective, cum este, n principal, normalitatea. Testele de acest fel se numesc teste parametrice.7.1 TESTUL SCORURILOR ZPENTRU MEDII ARITMETICECND ESTE CUNOSCUTVom prezenta acest test cu ajutorul unui exemplu, pe care l vom folosi i pentru aintroducenoiunilefundamentalealetestelor parametrice:ipotezdenul,ipotez alternativ, statistic a testului i regul de decizie.Uncercettorpresupunecntr-unanumit an, mediaaritmeticapunctajelor obinutelaexamenul derezideniat al medicilor estede800. Pentruatestaaceast ipotez, cercettorul alctuiete uneantionaleatoriu de 130demedici care i-au susinut rezideniatul n acel an i constat c la nivelul acestui eantion media aritmetic a punctajului obinut este de 755. Prin investigaii extensive, cercettorul tie c abaterea standard la nivelul populaiei de referin este de aproximativ 152. Problema caresepuneestedacdiferenadintremediaaritmeticaeantionului i valoarea presupuspentrupopulaie estesaunustatistic semnificativ. Dacrspunsul este afirmativ, atunci ipotezafcutpoatefi respins. Dac, ns, rspunsul estenegativ, atunci diferena poate fi pus pe seama ntmplrii, astfel c ipoteza cercettorului nu poate fi respins. Dup cumvomvedea, testul scorurilorZpermite determinarea matematic a nelesului termenului statistic semnificativ. Datele problemei sunt, deci, urmtoarele:Populaie EantionH = 800 755 X = 152 n = 130Am notat cu Hmedia aritmetic presupus a populaiei, pentru a o deosebi de media aritmetic efectiv a populaiei, .Ipotezadenul, pecareovomnotaH0, specificoanumitvaloarepentru parametrul respectiv. n general, ipoteza de nul despre media aritmetic a unei populaii are formaH0: = HDenumirea de ipotez de nul se justific prin aceea c forma sa poate fi redat echivalent prinH0: H = 0n cuvinte, ipoteza de nul enun c nu exist nici o diferen semnificativ ntre valoarea efectiv a parametrului respectiv i valoarea presupus a acelui parametru. Dac ipoteza de nul este adevrat, atunci diferena dintre eantion i populaie nu este semnificativ, putnd fi atribuit ntmplrii.n mod obinuit, cercettorul este de prere c exist o diferen semnificativ ntre eantion i populaie i dorete s resping ipoteza de nul ca neadevrat. Aceast opinie constituie ipoteza alternativ, pe care o vom nota cu Ha. Dac cercettorul nu are posibilitatea sau nu dorete s prezic sensul diferenei, atunci ipoteza alternativ ia formaHa: HDac, ns, sensul diferenei dintre eantion i populaie poate fi prezis sau dac cercettorul este interesat doar de un singur sens al diferenei, atunci ipoteza alternativ poate lua una dintre urmtoarele dou forme:Ha: > HHa: < Hncazul ncareHaareforma H, sespunectestul estebilateralsaunon-direcional, iar n cazurile n care Haare una dintre celelalte dou forme, se spune c testul este unilateral sau direcional. Vom reveni la aceste noiuni ceva mai departe. S reinemdeocamdatcnoricetest sedecidedacserespingesaunuserespinge ipotezadenul, pebazadoveziloradusensprijinul ipotezei alternative. Astfel, dac putem respinge H0 ca neadevrat, atunci vom accepta Ha.Revenindlaexemplul nostru, ipotezadenul esteH0:=800. Dinenunul problemei rezultcnuestevorbadespre un sensal difereneimenionate,astfelc ipoteza alternativ este Ha: 800.Termenul statistic a testului se refer la formula a crei aplicare n testul respectiv permite obinerea unei valori ce formeaz baza deciziei asupra ipotezei de nul. Pentru mediile aritmetice, atunci cnd se cunoate sau se poate aproxima valoarea lui , statistica testului este dat de urmtoarea formul:Formula 7.1nXZH S notm c aceast formul este analoag structural formulelor de calcul pentru transformarea unui scor brut X n scorul Z corespunztor (v. seciunea 4.2), aici fiind vorba despre scorul Z al unei medii aritmetice. Ca atare, n numitorul formulei 7.1 apare abaterea standard a distribuiei de eantionare aX , astfel c aceast formul ne d distana n abateri standard sau fraciuni de abateri standard a mediei aritmetice a eantionului,X , fa de valoarea presupus pentru populaie. n exemplul nostru, avem36 , 34 , 134540 , 11 15245130 152800 755 nXZHDin motive care vor deveni imediat evidente, vom desemna rezultatul aplicrii formulei 7.1 prin Z (obinut). Aici, Z (obinut) = 3,36. Regula de decizie se refer la o anumit amplitudine de valori pentru rezultatul statisticii testului, numit zon critic sau zon de respingere, care conduce la respingerea ipotezei de nul. n cazul testului scorurilor Z pentru medii aritmetice, zona critic se stabilete cu ajutorul distribuiei de eantionare aX . Astfel, n exemplul de mai sus, eantionul alctuit este unul dintre toate eantioanele posibile cu n = 130 din populaia de referin. S presupunem c H0 este adevrat, Dac s-ar calcula toate mediile aritmetice posibile, atunci teorema limitei centrale asigur urmtorul rezultat:755 = 800n general, cu ctX este mai aproape de centru (diferena dintreXi X este mai mic), cu att vom fi mai nclinai s nu respingem ipoteza de nul i cu ctXeste mai departe de centru (diferena dintreX i Xeste mai mare), cu att vom fi mai nclinai srespingemipotezadenul. Cualtecuvinte, ipotezadenul poatefi respinsdacrezultatul statisticii testului esteunnumrnegativpreamaresauun numr pozitiv prea mare. nelesul expresiei prea mare se fixeaz prin alegerea unui nivel de ncredere sau nivel (revedei capitolul anterior). n cazul ipotezei alternative de forma Ha: H, nivelul ales se mparte n mod egal n cele dou extremiti ale distribuiei de eantionare:Aria de subZ/2plus aria de peste +Z/2reprezint zona critic: dac scorulZ corespunztor mediei aritmetice a unui eantion cade n aceast arie (i.e. sub Z/2sau peste+Z/2), atunci mediaaritmeticrespectivareprindefiniieoprobabilitatede apariiemai micdect. ScorurileZ/2i +Z/2senumescscoruriZcriticei se desemneaz, respectiv, prin Z/2 (critic) i +Z/2 (critic).Srevenimiari laexemplul nostruisstabilim =0,05. timcpentru aceast valoare a lui , Z/2 = t 1,96. Z (obinut) se afl n zona critic (3,36 < 1,96), dup cum se ilustreaz n figura urmtoare:Ca atare, suntem ndreptii s respingem ipoteza de nul: probabilitatea de apariie a mediei aritmetice a eantionului considerat este mai mic dect 0,05 i deci nu poate fi atribuit ntmplrii. Cu alte cuvinte, diferena dintre media aritmetic a eantionului i media aritmetic presupus pentru populaie este statistic semnificativ (eantionul de Z/2+Z/2/2 /201,96 +1,96-3,36rezideni difer semnificativ de populaia din care a fost selectat), astfel c ipoteza de nul poate fi respins.De notat c decizia pe care am luat-o (respingerea ipotezei de nul) comport un element derisc: aceastdeciziepoatefi greit, ntruct esteposibil caeantionul consideratsfieunuldintrepuinele eantioanenereprezentative pentru populaia de medici rezideni. O trstur foarte important a testrii ipotezelor const din aceea c probabilitatea de a lua o decizie greit este cunoscut, fiind dat de nivelulales. n exemplul nostru, probabilitateadealuaodeciziegreitestede0,05. Aspunec probabilitatea de a fi respins greit ipoteza de nul este de 0,05 revine la a spune c dac am repeta acest test de o infinitate de ori, vom respinge greit H0 doar de 5 ori la fiecare 100 de repetri. Rezultatul de mai sus poate fi enunat i spunnd c diferena menionat estestatisticsemnificativ la unnivel dencrederede95%. Cai pentru estimarea intervalelor, nivelurile de ncredere folosite n mod obinuit n testarea ipotezelor sunt 90%, 95% i 99%.Testulntreprinsnacest exemplu estebilateralsau nedirecional. n general, ntr-un astfel de test, ipoteza alternativ enun doar c exist o diferen ntre valoarea efectivaparametrului respectivi valoareapresupuspentruacel parametru. Dup cumamvzut, ncazul unui test bilateral, zonacriticspecificatdenivelulse mparte n mod egal n cele dou extremiti ale distribuiei de eantionare. ntr-un test bilateral, indiferent de nivelul ales, regula de decizie este urmtoarea:Se respinge H0, dac Z (obinut) > +Z/2 (critic) sau dac Z (obinut) < Z/2 (critic)ntr-untestunilateralsaudirecional, daccercettorul credecvaloareaefectiva parametrului este mai mare dect valoarea presupus, Ha ia forma > H, iar pentru un test n sensul opus, Ha ia forma < H.. n cazul unui test unilateral, ntreaga zon critic specificat de niveluleste plasat n extremitatea de interes a distribuiei de eantionare. De pild, ntr-un test bilateral n care = 0,05, zona critic ncepe de la Z/2 (critic) = t 1,96. ntr-un test unilateral, la acelai nivel , Z (critic) este +1,65 dac este vorba despre extremitatea superioar (dac Ha este de forma > H) i este 1,65 dac este vorba despre extremitatea inferioar (dac Ha este de forma < H)31. De notat c aici folosim Zn loc de Z/2, ntruct ntreaga zon critic este plasat ntr-o singur extremitate a distribuiei de eantionare.ntr-un test unilateral, indiferent de nivelul ales, dac Ha este de forma > H (test unilateral dreapta), atunci regula de decizie esteSe respinge H0, dac Z (obinut) > +Z (critic)Dac Ha este de forma < H (test unilateral stnga) atunci regula de decizie esteSe respinge H0, dac Z (obinut) < Z (critic)Dup cum rezult i din cele de mai sus, un test unilateral este mai bun dect unul bilateral, deoarecezonacritic estetrasmai aproapedemediaaritmetic, 31 Scdem 0,05 din 0,5 (proporia de cazuri aflate de o parte i de alta a mediei aritmetice a distribuiei de eantionare).Rezultatul scderii este 0,4500. Conform tabelului distribuiei normale standard,scorulZ corespunztor acestei proporii este 1,65.mbuntindastfelprobabilitatea dearespingeH0.Astfel,daccercettorularemai mult experien i mai multe cunotine n legtur cu variabila investigat, atunci se recomand folosirea unui test unilateral, ceea ce cere o ipotez alternativ direcional.Se obinuiete ca testarea ipotezelor statistice s fie organizat sub forma unui model n n pai, numrul de pai diferind de la un autor la altul n funcie de anumite opiuni de compactare sau de detaliere a informaiei. n cele ce urmeaz vom folosi un model n 4 pai, pe care l exemplificm pentru problema tratat mai sus:Pasul 1. Enunarea ipotezelorH0: = 800Ha: 800Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei criticeDistribuia de eantionare = Distribuia Z = 0,05 (test bilateral)Z/2 (critic) = t 1,96(Zona critic este notat prin scorurile Z care i marcheaz nceputurile).Pasul 3. Calcularea statisticii testului36 , 34 , 134540 , 11 15245130 152800 755 nXZHPasul 4. Luarea decizieintruct Z (obinut) se afl n zona critic (3,36 < 1,96), ipoteza de nul poate fi respins. Diferenadintreeantionul demedici rezideni i populaiadereferinnu poate fi atribuit ntmplrii sau, altfel spus, aceast diferen este statistic semnificativ (la un nivel de ncredere de 95%).Pentru a ilustra aplicarea unui test unilateral, s presupunem c cercettorul din exemplul demai susdoretestestezeipotezacmediaaritmeticapopulaiei de rezideni estemai micdect 800, toatecelelaltedatefiindaceleai. nacest caz, cercettorul este interesat doar de extremitatea stng a distribuiei de eantionare i va plasa ntreaga zon critic n aceast extremitate. n termenii modelului n patru pai, testul decurge dup cum urmeaz:Pasul 1. Enunarea ipotezelorH0: = 800Ha: < 800Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei criticeDistribuia de eantionare = Distribuia Z = 0,05 (test unilateral stnga)Z (critic) = 1,65Pasul 3. Calcularea statisticii testului36 , 34 , 134540 , 11 15245130 152800 755 nXZHPasul 4. Luarea decizieintruct Z (obinut) se afl n zona critic (3,36 < 1,65), ipoteza de nul poate fi respins i se poate accepta c media aritmetic a populaiei de rezideni este mai mic dect 800 (la un nivel de ncredere de 95%).7.2 ERORI N TESTAREA IPOTEZELORAtuncicnddecidemsrespingemsausnurespingemipotezadenul, sunt posibile patru situaii, descrise n figura urmtoare:Figura 7.1 Rezultatele unui test al ipotezelorH0 adevrat H0 falsSe respinge H0Eroare detipul I Decizie corectNu se respinge H0Decizie corectEroare detipul IIDup cum se indic n figura 7.1, H0 este n realitate adevrat sau fals i sunt posibile dou decizii: se respinge H0 sau nu se respinge H0. Ca atare, sunt posibile dou decizii corecte: respingerea unei ipoteze de nul false i nerespingerea unei ipoteze de nul adevrate. Corespunztor, sunt posibile dou decizii greite: respingerea unei ipotezenenul careesteadevrat, numiteroaredetipul I, i nerespingereaunei ipoteze de nul care este fals, numit eroare de tipul II. Probabilitatea de a comite o eroare de tipul I este desemnat prin , iar probabilitatea de a comite o eroare de tipul II este desemnat prin .Probabilitatea de a comite o eroare de tipul I este determinat de nivelul ales. Astfel, atunci cnd se alege un nivel , distribuia de eantionare este mprit n dou mulimi de rezultate ale eantioanelor posibile: zona critic, ce include toate rezultatele definite ca improbabile sau rare i care ndreptesc respingerea H0, i zona necritic, ce const din toate rezultatele definite drept non-rare. Cu ct nivelul este mai mic, cu att este mai mic zona critic i, corespunztor, este mai mare distana dintre media aritmetic a distribuiei de eantionare i nceputurile (n cazul unui test bilateral) sau nceputul (n cazul unui test unilateral) zonei critice. De pild, dac se alege = 0,05, probabilitatea de a comite o eroare de tipul I este de 0,05: dac H0 este respins, exist 5 anse din 100 ca aceast decizie s fie greit; dac = 0,01, probabilitatea de a comite o eroare de tipul I este de 0,01: dac H0este respins, exist doar 1 ans din 100 ca aceast decizie s fie greit. Prin urmare, pentru a minimiza probabilitatea de a comite o eroare de tipul I, trebuie s folosim nivele foarte mici.Pedealtparte, cuct nivelulestemai mic, cuatt estemai marezona necritic i, pstrndcelelaltedateconstante, estemai puinprobabil carezultatul obinut pe eantion s cad n zona critic, deci este mai mare probabilitatea de a comite o eroare de tipul II.Prin urmare, cele dou probabiliti sunt invers proporionale, nefiind posibil s leminimizmpeamndou: dacalegemunnivelfoartemicpentruapentrua minimiza probabilitatea de a comite o eroare de tipul I, crete probabilitatea de a comite o eroare de tipul II. Cu alte cuvinte, dac cretem dificultatea de a respinge ipoteza de nul, probabilitatea de a nu respinge ipoteza de nul atunci cnd aceasta este fals crete. n mod normal, n tiinele omului se dorete minimizarea probabilitii erorii de tipul I, socotit a fi mai grav dect eroarea de tipul II, astfel c se aleg valori mici pentru . n tabelul urmtor sunt prezentate cteva scoruriZcritice pentru nivele mai des folosite, att pentru teste bilaterale, ct i pentru teste unilaterale:Tabelul 7.1 Scoruri