Modul 4 Inferenta Statistica

24
MODULUL IV INFERENŢA STATISTICĂ STRUCTURA MODULULUI 4.1. Proprietăţile distribuţiei normale 4.2. Probleme de estimare 4.2.1. Semnificaţia unei medii 4.2.2. Semnificaţia frecvenţei 4.3. Sarcini sau probleme de comparaţie 4.3.1. Semnificaţia diferenţei între două medii în cazul eşantioanelor independente 4.3.2. Semnificaţia diferenţei între două medii în cazul eşantioanelor perechi 4.4.Sumar Bibliografie Anexa.1.1 (distribuţia t) Exerciţii Întrebări cu răspunsuri multiple OBIECTIVELE MODULULUI După parcurgerea acestui modul studentul va cunoaşte: proprietăţile distribuţiei normale interpretarea semnificaţiei mediilor şi frecvenţelor raţionamentul ipotezei nule modalităţi de testare a ipotezei nule în cazul eşantioanelor independente modalităţi de testare a ipotezei nule în cazul eşantioanelor perechi 1

Transcript of Modul 4 Inferenta Statistica

MODULUL IV

INFERENA STATISTICSTRUCTURA MODULULUI

4.1. Proprietile distribuiei normale

4.2. Probleme de estimare

4.2.1. Semnificaia unei medii

4.2.2. Semnificaia frecvenei

4.3. Sarcini sau probleme de comparaie

4.3.1. Semnificaia diferenei ntre dou medii n cazul eantioanelor independente

4.3.2. Semnificaia diferenei ntre dou medii n cazul eantioanelor perechi

4.4.Sumar

Bibliografie

Anexa.1.1 (distribuia t)

Exerciii

ntrebri cu rspunsuri multiple

OBIECTIVELE MODULULUI

Dup parcurgerea acestui modul studentul va cunoate:

proprietile distribuiei normale

interpretarea semnificaiei mediilor i frecvenelor

raionamentul ipotezei nule

modaliti de testare a ipotezei nule n cazul eantioanelor independente

modaliti de testare a ipotezei nule n cazul eantioanelor perechi4.1. PROPRIETILE DISTRIBUIEI NORMALE

Dup cum s-a artat, datele obinute n cursul unei experiene, a unei observaii sistematice sau anchete, constituie un eantion pe care l considerm extras dintr-o colectivitate mai larg sau populaie. n final, extrapolm de la eantion la populaie, extindem concluziile asupra ntregii colectiviti vizate prin cercetare.

S lum cteva exemple:

1o. Ne propunem s determinm, pe baza unor metode precizate, volumul vocabularului la copiii de 5 ani. Prin enunul ei, sarcina sau problema stabilete populaia pe care o avem n vedere: copiii de 5 ani. Ancheta noastr nu poate cuprinde n mod practic dect o subcolectivitate limitat, un eantion de populaie, n care un numr de N copii sunt alei la ntmplare. nregistrrile fcute pe acest lot stabilesc un volum al vocabularului s zicem de 2024 de cuvinte. Un alt cercettor, propunndu-i aceeai problem, ajunge la o cifr uor diferit, s zicem 1936 de cuvinte. Repetnd procedura, un al treilea cercettor gsete 2000 de cuvinte.

2o. Cerine de ordin practic ne impun determinarea procentului tulburrilor de vorbire n clasele I-II, pentru a aproxima schema de organizare a reelei logopedice.

Determinrile efectuate pe cteva eantioane ne evideniaz un procent de circa 12-13 %.

Se ridic ntrebarea dac aceast frecven caracterizeaz populaia colar din clasele menionate.

3o. Pentru organizarea reelei de nvmnt special se ridic problema estimrii proporiei de deficieni mintali pentru palierul de vrst 6-7 ani. Determinrile arat un procent de circa 2%, dac se consider ca prag psihometric al debilitii mintale IQ = 70. Dac se fixeaz un prag mai sever, evident procentul va fi mai mare.

Aceste diferene de la un eantion la altul se datoresc hazardului i se numesc fluctuaii de eantionare. Situaia este identic i n alte condiii. Compoziia eantioanelor prezint variaii, diferene ntmpltoare n diferite studii pe aceeai populaie. Dac vom lua de pild, ase clase paralele de elevi dintr-o coal i le vom supune aceleiai probe vom constata diferene sau fluctuaii n rezultatele obinute de la o clas la alta. Este vorba despre fluctuii de eantionaj datorate factorilor aleatori. Un grup natural intact, luat n compoziia sa dat, constituie un eantion la ntmplare, dac nu au intervenit factori de selecie controlai de noi.

Prelucrarea statistic, aa cum am vzut, reduce datele brute la cteva valori caracteristice: frecvene sau procente, medii, abateri standard etc. Se pune ntrebarea: n ce msur datele obinute sunt relevante pentru populaie. Aceast operaie se numete inferen statistic.

Datele obinute asupra eantionului se apropie de indicii adevrai ai populaiei, aceast apropiere sau aproximaie fiind cu att mai mare cu ct volumul eantionului N este mai mare.

Practic, nu reuim s determinm exact indicii caracteristici ai populaiei. Indicii eantionului constituie estimri ale parametrilor populaiei. n exemplul ales mai sus, volumul mediu m stabilit pe baza studierii grupului de copii reprezint o estimare a mediei adevrate a colectivitii generale. ntruct nu se pot cerceta toi copiii de 5 ani ne bazm n afirmaiile noastre pe datele asupra eantionului cercetat. Lund ca baz indicii eantionului, extrapolndu-i deci la populaie, comitem o anumit eroare, a crei valoare probabil trebuie s fie, evident, ct mai mic.

n felul acesta, n legtur cu indicii stabilii asupra eantionului medii sau frecvene se pune problema erorii probabile pe care o comitem bazndu-ne pe ei n extrapolarea la populaie.

Raionamentul se ntemeiaz pe proprietile distribuiei normale, schiate deja n capitolul precedent n legtur cu semnificaia abaterii standard. n psihologie, ca i n alte domenii, modelul distribuiei normale este un model privilegiat, pentru c l regsim n numeroase situaii.

S-a stabilit c 2, mai exact 1,96, n raport cu media acoper 95% din rezultate (elemente). Cu alte cuvinte, 95% din elemente cad n intervalul m 1,96, iar 5% cad n afara acestui interval. Procentul de 5% se compune din 2,5%, respectiv 2,5% de o parte i de alta a mediei spre extremitile distribuiei.De asemena, s-a stabilit c 99% din rezultate (elemente) sunt cuprinse n intervalul m 2,58 , n timp ce 1% (0,5% + 0,5%) din elemente sunt exterioare acestui interval. (Fig. 4.1.).

Figura 4.1. Proprietile distribuiei normale

Pentru a evita o anumit variabilitate a situaiilor se introduce o distribuie standard. Variabila brut x se nlocuiete cu variabila normat z pe baza formulei de transformare deja amintite:

,

prin care se mparte fiecare abatere de la medie (x m) cu abaterea standard . Graie transformrii amintite, orice distribuie normal, are media egal cu zero i variana egal cu 1. Pentru aceast ultim distribuie s-a ntocmit un tabel, care permite s avem proporia de elemente pentru care variabila este exterioar unui interval oarecare centrat pe medie.

Este vorba de tabelul legii normale reduse , care ne permite s vorbim n cele din urm n limbajul anselor, al probabilitilor. Variabila redus | z | prezint de regul valori ntre 0 i 3,00 (cu dou zecimale). Figura 4.2 red un exemplu pentru | z | = 1,00. Variabila iniial x este nlocuit cu variabila standardizat z, avnd m = 0. Din punctele z, respectiv - z, ridicm ordonatele corespunztoare, care indic punctele de inflexiune ale curbei i haurm spre cele dou extremiti suprafaa exterioar benzii cuprinse ntre cele dou ordonate (Fig. 4.2).

Fig. 4.2.

Pentru | z | = 1,00 corespunde o valoare de 0,317, ceea ce nseamn c pentru un element extras la ntmplare din mulime exist 317 anse dintr-o mie ca acesta s cad n una din suprafeele haurate ntr-o parte sau alta- deci s-i corespund o valoare | z | >1,00. Reinem n continuare dou repere: pentru | z | =1,96 corespunde 0,05 , iar pentru

| z | = 2,58 , valoarea 0,01. Cu alte cuvinte, exist 5 anse din 100 ca unui element considerat la ntmplare din mulime s-i corespund o valoare | z | > 1,96, dup cum exist o ans din 100 ca | z | s fie mai mare dect 2,58. De aceste dou repere, frecvent utilizate, se leag deci anse sau probabiliti precizate: 5%, respectiv 1%.

Rezumnd: ntr-o distribuie normal standard avem 95% din valorile z cuprinse ntre 1,96 i + 1,96; de asemenea avem 99% din valorile z cuprinse ntre 2,58 i +2,58.

De aici se poate face pasul spre o distribuie normal oarecare avnd media m i abaterea standard . ntruct variabila standardizat z s-a obinut plecnd de la variabila iniial x graie formulei:

,

reiese c: a spune c z este cuprins ntre 1,96 i +1,96 nseamn a spune c

-1,96 < (x-m)/ < 1,96

sau

(m 1,96) < x < (m + 1,96),

ceea ce s-a enunat la nceput.

Cu alte cuvinte, exist 95% din valorile x interioare intervalului :

[m 1,96; m +1,96],

dup cum exist 99% din valorile x interioare intervalului:

[m 2,58; m + 2,58].

Afirmaiile fcute anterior au devenit astfel propoziii motivate.

4.2. PROBLEME DE ESTIMARE

Aa cum s-a artat, marcm indicii eantionului cu o bar aazat deasupra , ,, iar parametrii populaiei i notm n mod obinuit: m, f, . Pornind de la indicii eantionului stabilim cu o anumit probabilitate valoarea parametrilor. n mod obinuit nu putem determina exact valoarea parametrului, ci stabilim un interval n care se gsete cu certitudine practic parametrul respectiv. Cu ct acest interval este mai mic, cu att informaia noastr asupra adevratei valori n populaie este mai precis . Se cere deci o concentrare a masei de probabilitate ntr-o regiune restrns. Intervalul menionat se numete interval de ncredere.

4.2.1. Semnificaia unei medii

Semnificaia unei medii depinde pe de o parte de volumul eantionului studiat (N), iar pe de alt parte, de variabilitatea populaiei () din care s-a extras grupul dat. Cu ct volumul datelor crete, cu att media devine mai stabil i deci mai reprezentativ.

S-a numit eroarea standard a mediei cantitatea / care se noteaz cu E. Aceasta ne ofer un etalon pentru a evalua eroarea ce o comitem lund drept baz media eantionului n locul mediei adevrate m a colectivitii generale (pe care practic nu reuim de cele mai multe ori s o determinm).

n relaia de mai sus reprezint abaterea standard a colectivitii generale, care rmne aproape ntotdeauna necunoscut, fiind nlocuit n calcule cu determinat pe baza datelor eantionului (cnd N este destul de mare).

Relund tabelul din tabelul 3.4, avem:

N=51; ; ;

Fcnd nlocuirile:

.

n mod curent nu ne putem atepta s determinm valori punctuale pentru parametrii populaiei. n acest sens se stabilesc intervale. Pe baza erorii standard a mediei E se stabilesc limitele ntre care se gsete, cu o probabilitate dat adevrata valoare m a colectivitii generale. Aceste limite se numesc limite de ncredere, iar intervalul delimitat de ele este intervalul de ncredere. ntruct mediile prezint distribuie normal, se stabilesc drept limite de siguran : -1,96E i +1,96E.n exemplul menionat vom avea: L1 = 13,17 - (1,96 x 0,66) i L2 = 13,17 + (1,96 x 0,66). Efectund nmulirile obinem: 13,17 +/- 1,29, adic 11,88 i 14,46. Acestea sunt limitele ntre care se gsete aproape sigur (cu o probabilitate de 95%) adevrata medie m a colectivitii generale.Afirmnd c media adevrat se va gsi ntre 11,88 i 14,46 riscm totui s greim n 5% din cazuri.

Se obinuiete s se noteze i riscul pe care ni-l asumm de a grei fcnd o aseriume sau alta. Aceasta a cptat denumirea de prag sau nivel de semnificaie. Astfel, intervalul (-1,96E; +1,96E) se numete interval de ncredere la pragul de p = 0,05, ceea ce nseamn c n 5% din cazuri adevrata medie se afl n afara intervalului ales. n practic, se ia adeseori pragul p = 0,01, ceea ce indic riscul de a grei n 1% din cazuri. Limitele de ncredere vor fi atunci L1=-2,58E i L2=+2,58E.

4.2.2. Semnificaia frecvenei

Transpunnd noiunile prezentate anterior, putem spune c eroarea - tip a frecvenei este:

i c limitele de ncredere, la pragul de p = 0,05vor fi:

EMBED Word.Picture.8 .

Practic, N fiind mai mare (>100), vom comite o eroare foarte mic nlocuind n calculul limitelor de ncredere pe p prin f , i pe q prin 1- f. Dup nlocuire vom avea:

.

Exemplu (dup Faverge)

S considerm un exemplu.

ntr-o statistic a erorilor de la casierie s-au observat 134 de erori n plus i 289 de erori n minus. Frecvena f a erorilor n plus este:

(423 = 134 + 289).

Vom avea:

.

La pragul de semnificaie de p = 0,05, limitele de ncredere se obin calculnd:

1,96 x 0,020 = 0,04.

Ele sunt:

0,32 + 0,04 = 0,36,

0,32 - 0,04 = 0,28.

Cu alte cuvinte, admind c eantionul nostru face parte din cele 95% pentru care parametrii se situeaz n intervalul de ncredere, putem afirma c procentajul erorilor n plus va fi cuprins ntre 36% i 28%.

4.3. SARCINI SAU PROBLEME DE COMPARAIE

n chip frecvent intervin n cercetrile psihologice probleme de comparaie. Astfel, se compar ntre ele mediile obinute ntr-o experien i se pune ntrebarea dac diferenele constatate sunt semnificative sau nu, se pot extinde la populaie sau nu.

Exemplu (dup I. Radu):

ntr-o experian de instruire programat au fost cuprinse dou clase paralele. La probele de control date n post- test s-a constatat la clasa experimental - cu un efectiv de 33 elevi - o medie a notelor de 7,7, iar n clasa de control (N = 34), media la aceleai teste a fost de 6,7. Diferena dintre medii este 1,00. Se pune ntrebarea dac aceast diferen este semnificativ, dac putem extrapola la populaie, ceea ce ne indic dac metoda de instruire ncercat este mai bun dect cele curente.

Rezultatele unei investigaii pot s apar exprimate i sub form de frecvene sau proporii. n exemplul citat mai sus rezultatele experimentului ar putea fi exprimate i n frecvene, indicnd proporiile consemnate de rspunsuri corecte i de rspunsuri greite. i n cazul acesta se pune ntrebarea dac diferenele constatate sunt semnificative sau nu. Rspunsul la ntrebarea pus s-ar putea obine repetnd experiena. Dac rezultatele se menin statornice vom putea conchide asupra semnificaiei lor. Cum experienele nu se pot repeta indefinit - procedeu de altfel neeconomic - s-a conturat un mecanism logic prin care se infirm ipoteza hazardului, notat H0.

n condiiile experienei obinuite ne-am putea mulumi cu diferene ntre medii de 0,5 sau 0,7 ori 0,9 .a.m.d., dup cum diferene de 5%, 7% etc ntre frecvene ar prea doveditoare.

Experimentul tiinific nu poate face extrapolri la populaie bazate doar pe simpla evaluare intuitiv. ntrebarea este: de la ce nivel (0,5 sau 0,7, respectiv 5%; 7%;...) diferenele pot fi considerate semnificative?

n orice experien studiem procesul dat n anumite condiii, ntr-un anumit context: la lecie, la joc, n activitile practice, n condiii de laborator etc. Trebuie s admitem c, ntr-un fel sau altul, ntmplarea poate interveni n desfurarea fenomenului cercetat prin condiii neateptate, prin compoziia grupului, prin deosebiri n personalitatea profesorului etc. Datele obinute sunt afectate n felul acesta de un element aleator (ntmpltor). n consecin, alturi de ipoteza specific (Hs), ce st la baza experienei respective i care este o ipotez psihologic sau pedagogic se poate formula i o alt ipotez care s atribuie numai ntmplrii tendinele sau diferenele constatate. Aceasta din urm este "ipoteza ntplrii"sau ipoteza nul (H0) i se enun pentru toate cazurile n aceiai termeni. De notat c att ipoteza nul (H0) ct i ipoteza alternativ (Hs) se refer la populaie, nu la eantioane ca atare.

Preocupat s dovedeasc n mod temeinic justeea ipotezei specifice, cercettorul va admite n mod provizoriu n raionamentul su ipoteza nul i va determina ansele (probabilitatea) ca diferenele obinute n experiment s aib loc numai pe baza " legilor ntmplrii" (care sunt legi de probabilitate bine studiate). tim c probabilitatea ia valori ntre 0 i 1, iar transcris n procente ntre 0 i 100%.

Dac probabilitatea obinerii diferenei date, n baza ipotezei nule, este foarte mic (de pild, mai mic dect 0,05 ceea ce se scrie p < 0,05), atunci respingem ipoteza hazardului i artm toat ncrederea ipotezei specifice. Dac ns, probabilitatea determinat n lumina ipotezei nule este mai mare (de pild, p > 0,10 putnd merge pn la 1), atunci nu ne putem asuma riscul respingerii ipotezei nule i vom considera diferenele efectiv obinute ca fiind nc nesemnificative.

Prin urmare se accept ca semnificative acele rezultate care au ansele de a se produce prin simpla ntmplare numai ntr-un numr mic de cazuri: sub 5% din cazuri, uneori sub 10%. ansele de a obine rezultatele respective prin simplul joc al factorilor aleatori se afl n acest caz sub 10%, respectiv 5% ( ceea ce se scrie p < 0,10 respectiv p < 0,05). nseamn c, acceptnd rezultatele unei experiene drept proba justeei ipotezei specifice, ne asumm totodat riscul de a grei n mai puin de 10%, respectiv 5% din cazuri. Fiecrei aseriuni i se asociaz astfel un prag de semnificaie, care indic riscul de a grei pe care ni-l asumm.

Rezumnd: mecanismul logic al ipotezei nule permite infimarea ipotezei hazardului i acceptarea n consecin a ipotezei alternative (Hs). Ipoteza nul i ipoteza alternativ sunt contradictorii; a respinge ipoteza nul nseamn a accepta ipoteza specific. Dac plasm pe o ax probabilitile amintite vom avea situaia din figura 4.3.

1 0,05 0,01 p

|-------------------- . . . -----------------|------------------|------------------>

H0 nu se consider infirmat | H0 se consider infirmat

i se suspend decizia | i se accept Hs limita semnificativitii

Fig. 4.3

Respingnd ipoteza nul i accepnd existena unui efect al variabilei independente ceea ce susine Hs - ne asumm un risc de a grei destul de mic: 5% respectiv 1%. Msurarea acestui risc, notat cu , constituie pragul de semnificaie, care nsoete fiecare aseriune.

Se poate ntpla ca ipoteza nul s nu fie infirmat, z cal fiind mai mic dect 1,96 (deci p > 0,05). n cazul acesta nu se conchide c H0 ar fi validat, ci, pur i simplu, c nu se poate decide; intervine o zon de suspendare a judecii. Valoarea | z | care separ cele dou zone - zona de respingere a ipotezei nule i zona de suspendare a judecii - se numete valoare critic. Ea corespunde valorii z cal avnd o probanbilitate asociat egal cu . Riscul de a grei se poate lua 10%, 5%, 1%. Tradiia a acreditat pragul de p 0,05 sau p 0, 01. n funcie de cerinele cercetrii se alege pragul indicat.

De notat c ipoteza nul nu poate fi niciodat acceptat; a nu se respinge H0 nu echivaleaz cu acceptarea ei. n schimb, ipoteza specific nu poate fi niciodat respins. Fiind o ipotez statistic imprecis nu se poate calcula distribuia de eantionaj sub ipoteza alternativ (Abdi, 1987).

Valorile cririce ale criteriului z, t, .a. au fost calculate pentru diferite praguri ( fiind prezentate sub form de tabele ce urmeaz doar a fi consultate. Regula de decizie este precizat:

- dac criteriul z, calculat pe eantionul experimental este mai mare sau egal cu valoarea critic (z critic), probabilitatea sa asociat este mai mic sau egal cu pragul (se decide respingerea H0);

- dac criteriul z cal, calculat pe eantionul experimental, este mai mic dect valoarea critic (z critic), probabilitatea asociat este mai mare dect pragul . n consecin intervine suspendarea judecii: nu se va respinge nici accepta H0. n sens strict, se va decide de a nu se decide ...(Abdi, 1987).

n probleme de comparaie statistic urmeaz s se fac disticia ntre eantioane independente i eantioane perechi.

O clas de elevi, spre exemplu, poate fi considerat practic ca un eantion la ntmplare extras dintr-o colectivitate mai larg. Dac se consider o alt clas, paralel, n vederea unei experiene determinate, atunci alegerea poate fi fcut n dou feluri. Se pot alege n mod independent cele dou eantioane: faptul c un element sau altul din primul eantion a fost ales nu are nici o influen asupra alegerii elementelor din eantionul al doilea. Compoziia celor dou grupe nu este reglementat pe baza unei probe prealabile; cele dou clase sunt considerate n compoziia lor stabilit prin " legile ntmplrii". n acest caz este vorba despre eantioane independente.

Se poate proceda i altfel. Se pot constitui eantioane perechi. n cazul acesta, fiecare element dintr-un eantion corespunde unui element dintr-un alt eantion (formeaz o pereche cu el). De exemplu, pentru a compara dou metode de instruire se constituie dou grupe cu acelai numr de elevi, astfel ca fiecrui elev dintr-o grup s-i corespund un elev din cealalt grup, avnd acelai nivel de cunotine, eventual acelai C.I. n felul acesta, compoziia grupelor este precizat pe baza unei probe anterioare, n virtutea creia elementele celor dou eantioane nu se determin la ntmplare. Fiecare individ dintr-o grup are "corespondent n grupa a doua, avnd aceeai not (sau acelai nivel) n proba preliminar. Situaia este identic i n cazul cnd acelai grup de subieci este supus de dou ori la probe diferite (de exemplu, nainte i dup aciunea unui anumit factor experimental). Se obin atunci dou grupe de msurri efectuate pe aceiai subieci, care constituie perechi.

Prin urmare putem alege grupele de studiu n mod independent i atunci este vorba de o alegere la ntmplare a elementelor; sau putem asocia ntr-un anumit fel - pe baza unui criteriu precis - elementele celor dou eantioane, dou cte dou, i atunci compoziia lor este determinat de regul n virtutea unei probe prealabile: test de inteligen, test de cunotine etc.

4.3.1. Semnificaia diferenei ntre dou medii n cazul

eantioanelor independente

Probele de semnificaie difer n funcie de dou situaii:

cnd numrul de msurtori (N) n fiecare eantion este destul de mare (mai mare ca 30);

cnd numrul de msurri sau volumul eantionului este mai mic dact 30.

n experimentele cu caracter instructiv de la care am pornit N1= 33 i N2 = 34, deci ne aflm n prima situaie.

Pentru a vedea dac cele dou medii constatate difer semnificativ, facem raionamentul care urmeaz.

Admitem pentru moment ipoteza nul i stabilim care este ansa de a fi verificat. Cu alte cuvinte presupunem c diferena ntre cele dou medii i se datorete ntmplrii i c nu exist diferene reale ntre eantioanele considerate. n limbaj statistic nseamn c cele dou grupe constituie eantioane extrase la ntmplare din aceeai populaie.

Pentru a testa ipoteza nul se utilizeaz criteriul sau raportul:

,n care notaiile sunt deja cunoscute.

Calculnd valoarea raportului de mai sus, notat cu | z |, ne vom referi la proprietile curbei normale schind valorile calculate (z cal) n raport cu valorile critice (1,96 i 2,58). Dac valoarea ce va corespunde indicelui z cal este mai mare dect 1,96, atunci diferena ntre cele dou medii este semnificativ la pragul de p < 0,05, iar dac z cal > 2,58, atunci diferena este semnificativ la pragul de p < 0,01. Bineneles, dac vom avea z cal < 1,96, atunci ipoteza nul nu va fi infirmat, iar diferena obinut n cadrul experienei nu va fi considerat concludent pentru a proba justeea ipotezei specifice (vom suspenda decizia).

n exemplul considerat trebuie s cunoatem cu privire la fiecare grup , N i .

Utiliznd formula stabilit obinem:

.

Raportul gsit este mai are dect 1,96 i mai mic dect 2,58, deci p < 0,05. Fcnd un calcul de interpolare se afl p = 0,02; deci diferena este net semnificativ, ipoteza nul fiind infirmat.

Cnd volumul datelor obinute n fiecare eantion este mai mic (numrul de msurri este mai mic dect 30) se utilizeaz un procedeu ntructva diferit.

Ipoteza nul se enun la fel: presupunem c cele dou grupe de date sunt dou eantioane ntmpltoare ce provin din aceei colectivitate general. Verificm apoi ansa acestei ipoteze pe baza criteriului t:

.

Pentru a obine o estimare a dispersiei colectivitii - care este notat n formul cu s2 - se combin datele celor dou eantioane:

Formulele de la numrtor ne sunt cunoscute de la calcularea dispersiei (sumei de ptrate referitoare la cele dou grupe), iar N1 i N2 sunt efectivele celor dou eantioane.

Exist un tabel special (ntocmit de Student) n care figureaz probabilitile raportului | t | corespunztor numrului "gradelor de libertate" care depinde de volumul eantioanelor (vezi Anexa 1.1.). n cazul nostru numrul acesta - notat n - este:

n = N1 + N2 - 2.

S lum un exemplu.

n procesul nvrii ealonarea repetiiilor este mai productiv dect concentrarea lor. ntr-o experien se ia cte o grup format fiecare din cte 10 subieci i se experimenteaz n cele dou situaii prevzute: repetiii ealonate sau concentrate n timp. nc din prima perioad subiecii manifest o diferen. Vrem s tim dac ea este semnificativ (dup P. Oleron).

Datele consemnate de autor sunt:

| t | fiind calculat, ne referim la tabelul distribuiei | t | ntocmit de Student. Acest tabel prezint o coloan n sau v, care corespunde gradelor de libertate. n tabelul de mai sus n = 10 +10 - 2 = 18. Cutm n coloana n pe 18. Dup ce l-am fixat, mergem pe rndul respectiv i cutm valoarea lui | t | la pragul de 0,05 i 0,01 (probabilitatea o citim n prima linie de sus a tabelului unde gsim de la dreapta spre stnga: 0,01; 0,02; 0,05; 0,10). n cazul nostru tabelul indic 2,10 pentru | t | la pragul de 0,05 respectiv 2,88 la oragul de 0,01. Valoarea calculat n exemplul ales este 0,63, deci este mult mai mic dect 2,10 creia i corespunde p = 0,05. Putem spune atunci c pentru | t | = 0,63 avem p > 0,05. i astfel ipoteza nul nu este infirmat. Considerm diferena dintre medii ca nesemnificativ, mai exact suspendm decizia.

n general, dac valoarea gsit prin calcul este mai mic dect valoarea | t | indicat n tabel la pragul p = 0,05, atunci considerm c ipoteza nul nu este infirmat, iar diferenele obinute n experien ca nesemnificative. Dac valoarea calculat de noi este mai mare dect valoarea | t | la pragul 0,05, dar mai mic dact valoarea lui | t | la pragul de 0,01, vom spune c diferena este semnificativ la pragul de 0.05. n sfrit, dac valoarea gsit de noi este mai mare dect valoarea | t | indicat n tabel pentru

p = 0,01, atunci vom spune c diferena este semnificativ la pragul de 0,01.

Observm c respingerea ipotezei nule se face considernd un prag de semnificaie ales n prealabil (cel mai riguros este p = 0,01). De reinut este faptul c ipoteza nul nu se consider niciodat demonstrat; ea poate fi doar infirmat. Efectul admiterii sau respingerii ipotezei nule se rsfrnge asupra ipotezei specifice. Neinfirmarea ipotezei nule pune sub semnul ntrebrii ipoteza specific, infirmarea ipotezei nule consolideaz foarte mult ipoteza specific. Cele dou ipoteze H0 i Hs sunt, cum s-a spus, contradictorii.

4.3.2. Semnificaia diferenei ntre dou medii n cazul

eantioanelor perechi

Cnd elementele celor dou eantioane sunt asociate ntr-un anumit mod dou cte dou (de exemplu, rezultatele nregistrate nainte i dup aciunea unui factor experimental), procedeul cel mai simplu const n a raiona asupra diferenelor pe care le prezint fiecare pereche de date asociate, corelate.

S notm cu x rezultatele din primul grup de msurri (eantion) i cu x' valorile asociate din eantionul al doilea. Diferena corespunztoare fiecrei perechi de note x - x' o nsemnm cu d. Se obin astfel patru coloane.

Exemplu:

Cu o grup de 10 elevi s-a ncercat la geografie, n decursul trimestrului II al anului colar, o metod nou de nvare individual, pe baza unor ntrebri de control fixate pe cartonae. S-au nregistrat notele elevilor la geografie la nceputul experienei, adic la sfritul trimestrului I i apoi la ncheierea trimestrului II. Vrem s tim dac metoda respectiv aduce o mbuntire semnificativ a situaiei colare.

Pentru a determina acest lucru ntocmim un tabel n care vom nscrie subiecii, rezultatele obinute n cele dou situaii i vom calcula diferenele dintre ele (Tab.4.1.).

Se observ din tabel c avem diferene nule, pozitive i negative.

Formulm ipoteza nul, adic atribuim numai ntmplrii diferenele constatate, Dac s-ar datora numai ntmplrii, aceste diferene ar fluctua n jurul lui 0 ntr-un sens sau altul, iar media lor ar fi egal cu zero md= 0 (cu md am notat media diferenelor).

Tabelul 4.1

SubieciNote trim. II

x`Note trim. I

xdd2

A86+24

B75+24

C5500

D64+24

E56-11

F64+24

G65+11

H54+11

I46-24

K75+24

N=10d = +9d2 = 27

Vom nsuma algebric coloana d (innd deci seama de semne) i vom afla

d = T. Apoi, fcnd raportul T/N, vom afla media diferenelor md.

n exemplul ales, md = T/N = 0,09, deci md difer de zero; nu tim dac diferena aceasta este suficient de mare pentru a putea fi considerat semnificativ sau nu.

Se utilizeaz criteriul:

n care cunoatem i N, dar nu cunoatem (abaterea standard a diferenelor).

Tratm diferenele aa cum am considerat nainte datele brute.

Calculm mai nti dispersia diferenelor:

i

n exemplul ales adugm n tabel o coloan d2, pe care nsumnd-o obinem d2=27.

Fcnd nlocuirile:

de unde

Deci

Cutm n Anexa 1.1. | t | innd seama de faptul c n acest caz numrul gradelor de libertate este N - 1 (i nu N1+N2- 2, ca n primul caz).

n exemplul de mai sus, N - 1 = 9. Cutnd n tabel gsim pentu 9 grade de libertae,la pragul de p = 0,05 cifra 2,26. Valoarea calculat de noi este inferioar acestei cifre. nseamn c nu s-a demnostrat falsitatea ipotezei nule i, n felul acesta nu se poate spune c rezultatele experienei sunt semnificative.

Cnd N este destul de mare (>60) putem raporta valoarea gsit prin calcul la valorile z (1,96 i 2,58) fr s mai facem apel la Tabelul lui Student.

Trebuie reamintit n ncheiere c att raportul | z | ct i criteriul | t | presupun drept condiie aspectul normal al distribuiilor supuse comparaiei.

4.4. Sumar

n cercetarea psihologic modelul consacrat este cel al investigrii la nivelul eantioanelor urmat de extrapolarea la nivelul populaiei, proces denumit inferen. n cadrul inferenei statistice se disting dou tipuri de probleme: probleme de estimare, respectiv probleme de comparaie. Problemele de estimare, permit pe baza unui indice obinut la nivelul eantionului estimarea cu o anumit probabilitate a intervalului n care se afl parametrul pentru populaie. n problemele de comparaie pe baza unor teste de semnificaie adaptate situaiei concrete se determin probabilitatea ipotezei nule (pragul de semnificaie). n cazul eantioanelor independente se folosesc dou teste n funcie de volumul eantionului; pentru eantioane cu efective mai mari de 30 de subieci se utilizeaz testul z, iar pentru eantioane cu un volum sub 30 de subieci testul t. n cazul eantioanelor perechi se folosete testul t. Bibliografie

Abdi H. (1987). Introduction ou traitemant statistique des donnes exprimentale, Grenoble:

Presses Universitaire de Grenoble.Faverge, J.M. (1965). Mthodes statistiques en psychologie applique. t.III, Paris, P.U.F.

Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole Publishing Company, Pacific Grove.

Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures naturelles, Paris, Bordas.

Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New York, Appleton ANEXA 1.1.

Distribuia t

P

n0.100.050.020.01

16.3412.7131.8263.66

22.924.306.969.92

32.353.184.545.84

42.132.783.754.60

52.022.573.364.03

61.942.453.143.71

71.902.363.003.50

81.862.312.903.36

91.832.262.823.25

101.812.232.763.17

111.802.202.723.11

121.782.182.683.06

131.772.162.653.01

141.762.142.622.98

151.752.132.602.95

161.752.122.582.92

171.742.112.572.90

181.732.102.552.88

191.732.092.542.86

201.722.092.532.84

211.722.082.522.83

221.722.072.512.82

231.712.072.502.81

241.712.062.492.80

251.712.062.482.79

261.712.062.482.78

271.702.052.472.77

281.702.052.472.76

291.702.042.462.76

301.702.042.462.75

351.692.032.442.72

401.682.022.422.71

451.682.022.412.69

501.682.012.402.68

601.672.002.392.66

1.641.962.332.58

EXERCIII

1. Precizai i explicai care este rolul inferenei statistice n prelucrarea datelor unei cercetri de psihologie experimental.

2. n ce condiii ntreaga colectivitate a universitii n care nvai poate fi considerat o populaie? n ce condiii colectivitatea universitii poate fi considerat un eantion? n cazul n care colectivitatea universitii este folosit ca i eantion, cum este realizat selecia? Se poate vorbi de o selecie randomizat? De ce?

3. Avnd urmtoarele ipoteze specifice, formulai pentru fiecare ipoteza nul corespunztoare.

1. Exist o diferen ntre biei i fete n ceea ce privete abilitile de nvare i domeniile de studiu pentru care prezint interes: bieii prefernd tiinele exacte, iar fetele tiinele sociale.

2. Persoanele cu un stil de nvare vizual rein mai multe informaii din grafice dect persoanele cu un stil de nvare verbal.3. Un program regulat de exerciii duce la mbuntirea performanelor colare.Ce rol are formularea i testarea ipotezei nule n desfurarea unui experiment prin care se testeaz ipotezele specifice formulate?

NTREBRI CU RSPUNSURI MULTIPLE

1. Pornind de la indicii unui eantion se pot:

a) calcula parametrii populaiei

b) estima parametrii populaiei

c) determina intervalul n care se gsesc parametrii populaiei

d) determina probabilitatea cu care parametrii populaiei se ncadreaz ntr-un anumit interval

e) determina valoarea parametrilor populaiei

R. b,c,d,2. Pe baza unui test de semnificaie statistic s-a determinat o probabilitate a ipotezei nule H0 de 0,01. Ce probabilitate va avea ipoteza specific HS n acest caz?

a) 99%

b) 95%

c) 1%

d) toate rspunsurile sunt corecte

e) toate celelalte rspunsuri sunt greite

R. e.

3. Cnd probabilitatea ipotezei nule (H0 ) este mai mare de 5%:

a) putem accepta ipoteza specific

b) putem accepta ipoteza nul

c) respingem ipoteza specific

d) respingem ipoteza nule) se suspend deciziaR. e11817

_1004897751.unknown

_1004897773.unknown

_1004897742.doc

N

q

p

f

N

q

p

f

96

,

1

;

,96

1

_1004890332.unknown