Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

download Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

of 17

Transcript of Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    1/17

    Testarea diferenei dintre mai mult de dou medii independente: analiza devarian (ANOVA)

    Lector univ.dr. Perea Gheorghe

    n situaia n care am comparat performana la int a celor dou grupe de sportivi (practicani inepracticani de training autogen), testul t a rezolvat problema semnificaiei diferenei dintredou medii. n practica de cercetare ne putem ntlni ns cu situaii n care avem decomparat trei sau mai multe medii. De exemplu, atunci cnd am efectuat un test decunotine de statistic i dorim s tim dac diferenele constatate ntre cele 5 grupe aleunui an de studiu difer semnificativ. Performana la nivelul fiecrei grupe este dat demedia rspunsurilor corecte realizate de studeni. La prima vedere, am putea fi tentai srezolvm problema prin compararea repetat a mediei grupelor, dou cte dou. Din pcate,exist cel puin trei argumente pentru care aceast opiune nu este de dorit a fi urmat:

    n primul rnd, volumul calculelor ar urma sa fie destul de mare, i ar crete i mai multdac numrul categoriilor variabilei independente ar fi din ce n ce mai mare. n al doilea rnd, problema cercetrii vizeaz relaia dintre variabila dependent (nexemplul de mai sus, performana la statistic) i variabila independent, exprimat prinansamblul tuturor categoriilor sale (grupele de studiu). Ar fi bine s putem utiliza unsingur test i nu mai multe, pentru a afla rspunsul la problema noastr. n fine, argumentul esenial este acela c, prin efectuarea repetat a testului t cu fiecaredecizie statistic acumulm o cantitate de eroare de tip I de 0.05 care se cumuleaz cufiecare pereche comparat, ceea ce duce la depirea nivelului admis de conveniatiinific. S presupunem c dorim s testm ipoteza unei relaii dintre nivelul anxietiii intensitatea fumatului, evaluat n trei categorii: 1-10 igri zilnic; 11-20 igri zilnic i21-30 igri zilnic. n acest caz, avem trei categorii ale cror medii ar trebui comparatedou cte dou. Dar, n acest fel, prin efectuarea repetat a testului t pentru eantioaneindependente, s-ar cumula o cantitate total de eroare de tip I de 0.15 adic0.05+0.05+0.05.

    Pentru a elimina aceste neajunsuri, i mai ales pe ultimul dintre ele, se utilizeaz o procedur statistic numit analiza de varian (cunoscut sub acronimulANOVA, de laANalysis Of VA riance, n englez). n mod uzual, analiza de varian este inclus ntr-ocategorie aparte de teste statistice. Motivul pentru care o introducem aici, imediat dup testul t pentru eantioane independente, este acela c, n esen,ANOVA nu este altceva dect oextensie a logicii testului t pentru situaiile n care se dorete compararea a mai mult de dou

    medii independente. Dar, dac problema este similar, soluia este, aa cum vom vedea, diferit.

    Exist mai multe tipuri deANOVA , dou fiind mai frecvent folosite:

    - ANOVA unifactorial , care se aplic atunci cnd avem o variabil dependentmsurat pe o scal de interval/raport msurat pentru trei sau mai multe valoriale unei variabile independente categoriale. n contextul ANOVA, variabilaindependent este denumit factor, iar valorile pe care acesta le ia se numescniveluri. Din acest motiv, modelul de analiz de varian cu o singura variabilindependent se numete ANOVA unifactorial, ANOVA simpl sau, cel mai

    frecvent, ANOVA cu o singur cale(One-way ANOVA).

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    2/17

    o Exemple:Nivelul anxietii n raport cu trei categorii de fumtori (1-10 igrizilnic, 11-20 igri i 21-30 igri).Timpul de rspuns la un strigt de ajutor, n funcie de natura vocii persoanelor care solicit ajutorul (copil, femeie, brbat).

    Scorul la un test de cunotine statistice ale studenilor de la psihologie,n funcie de tipul de liceu absolvit (reai, umanist, agricol, artistic).

    - ANOVA multifactorial , care se aplic atunci cnd avem o singur variabildependent (la fel ca n cazul ANOVA unifactorial) dar dou sau mai multevariabile independente, fiecare cu dou sau mai multe valori, msurate pe o scalcategorial (nominal sau ordinal).

    o ExempleNivelul anxietii n raport cu intensitatea fumatului (1-10 igri zilnic,11-20 igri i 21-30 igri), i cu genul (masculin, feminin). n acestcaz, problema cercetrii este dac intensitatea fumatului i caracteristica de

    gen au, mpreun, o relaie cu nivelul anxietii.Timpul de rspuns la un strigt de ajutor n funcie de natura vocii caresolicit ajutorul (copil, femeie, brbat) i de genul (masculin, feminin) al persoanei care trebuie s rspund la solicitarea de ajutor.Scorul la un test de cunotine statistice ale studenilor de la psihologie,n funcie de tipul de liceu absolvit (reai, umanist, agricol, artistic) i degenul (masculin, feminin) al studenilor.

    Ne vom limita aici doar la prezentarea analizei de varian unifactoriale, urmnd srevenim cu alt prilej asupra altor variante de ANOVA.

    Cadrul conceptual pentru analiza de varian unifactorial

    S ne imaginm o cercetare a crei ipotez este c relaia dintre performanasportivilor n tragerea la int i trei metode de antrenament (s le denumim metoda 1,metoda 2 i metoda 3).

    n esen, ANOVA este o procedur de comparare a mediilor eantioanelor.Specificul ei const n faptul c n locul diferenei directe dintre medii se utilizeaz dispersialor, gradul de mprtiere. Procedura se bazeaz pe urmtorul demers logic: Ipoteza cercetriisugereaz c performana sportivilor antrenai cu fiecare dintre cele trei metode de antrenamentface parte dintr-o populaie distinct, creia i corespunde un nivel specific de performan

    (adic o medie caracteristic, diferit de a celorlalte dou populaii). Prin opoziie, ipoteza denul ne oblig s presupunem c cele trei eantioane1(modele de antrenament) pe care vrem s lecomparm, provin dintr-o populaie unic de valori ale performanei, iar diferenele dintremediile lor nu reprezint dect expresia variaiei fireti a distribuiei de eantionare.

    n imaginea de mai jos populaiile cercetrii (Pc1, Pc2, Pc3) sunt exprimate cu liniecontinu, iar populaie de nul cu linie discontinu.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    3/17

    Chiar dac absena unei legturi ntre metoda de antrenament i intensitatea nivelul performanei (ipotez de nul) este adevrat, cele trei grupuri (eantioane) nu trebuie saib n mod necesar aceeai medie. Ele pot avea medii diferite care s rezulte ca expresie avariaiei aleatoare de eantionare (m1m2m3) i, de asemenea, mprtieri (dispersii)diferite (s1s2s3). S ne gndim la cele trei medii pe care vrem s le comparm, ca la odistribuie de sine stttoare de trei valori (sau mai multe, pentru cazul n care variabilaindependent are mai multe categorii). Cu ct ele sunt mai diferite una de alta, cu attdistribuia lor are o mprtiere (varian) mai mare. Este evident faptul c dac eantioanelear aparine populaiei de nul, diferena mediilor (exprimat prin dispersia lor) ar fi maimic dect n cazul n care acestea ar proveni din populaii distincte (corespunztor ipotezei cercetrii).

    Mai departe, se pune urmtoarea problem: ct de diferite (mprtiate) trebuie s fiemediile celor trei eantioane, luate ca distribuie de sine stttoare de trei valori, pentru cas putem concluziona c ele nu provin din populaia de nul (dreptunghiul punctat), ci din trei populaii diferite, corespunztoare eantioanelor de cercetare (Pc1, Pc2, Pc3)?

    Pentru a rspunde la aceast ntrebare este necesar:a)S calculm dispersia valorilor individuale la nivelul populaiei de nul, care se bazeaz pe valorile performanei tuturor valorilor msurate, indiferent de metoda de antrenament; b)S calculm dispersia mediilor anxietii grupurilor cercetrii (considerate ca eantioaneseparate);

    1 Pentru simplificare, n continuare ne vom referi numai la trei eantioane, dar se va nelegetrei sau mai multe

    c) S facem raportul dintre aceste dou valori. Obinerea unei valori mai ridicate a acestuiraport ar exprima apartenena fiecreia din cele trei medii la o populaie distinct, n timpce obinerea unei valori mai sczute ar sugera proveniena mediilor dintr-o populaie

    unic (de nul). Decizia statistic cu privire la mrimea raportului i, implicit, cu privire lasemnificaia diferenelor dintre mediile comparate, se face prin raportarea valoriiraportului la o distribuie teoretic adecvat, alta dect distribuia normal, aa cum vomvedea mai departe.

    n continuare ne vom concentra asupra fundamentrii modului de calcul pentru ceidoi termeni ai raportului. Calcularea exact a dispersiei populaiei de nul este imposibil,deoarece nu avem acces la toate valorile acesteia, dar poate fi estimat prin calcularea medieidispersiei grupurilor de cercetare. Valoarea astfel obinut se numete dispersia intragrup ireprezint estimarea mprtierii valorilor msurate la nivelul populaiei de nul.

    La rndul ei, dispersia mediilor grupurilor de cercetare, calculat dup metodacunoscut de calcul a dispersiei, formeaz ceea ce se numete dispersia intergrup. Valoareaastfel obinut evideniaz ct de diferite (mprtiate) sunt mediile eantioanelor care fac

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    4/17

    obiectul comparaiei.Raportul dintre dispersia intergrup i dispersia intragrup se numete raport F i ne

    d valoarea testului ANOVA unifactorial. Cu ct acest raport este mai mare, cu attmprtierea mediilor grupurilor comparate este mai mare i, implicit, diferena lor poate fi unasemnificativ, ndeprtat de o variaie pur ntmpltoare.

    Imaginile de mai jos dau o expresie grafic acestui raionament:

    Figura a reprezint grafic ipoteza de nul: presupunem c cele trei grupuri provin din

    aceeai populaie. Ca urmare, cele treimedii sunt egale (1=2=3), iar distribuiilesunt suprapuse.

    Figura b reprezint grafic ipotezacercetrii: cele trei grupuri sunt diferite, provenind din populaii distincte(123).

    Dac distana (mprtierea) dintre mediile eantioanelor depete o anumit valoare,atunci putem concluziona c nu avem o singur populaie (ipoteza de nul), ci mai multe, mediilegrupurilor provenind din populaii cu medii distincte (cf. ipotezei cercetrii). Dac,dimpotriv, mediile eantioanelor comparate sunt apropiate, atunci vom concluziona c ele nu provin din populaii diferite, ci dintr-una singur (cf. ipotezei de nul).

    Fundamentarea procedurii de calcul ANOVA 2

    Esena procedurii de calcul pentru ANOVA se bazeaz pe o dubl estimare a dispersiei:

    (a) Estimarea dispersiei populaiei de nul pe baza mediei dispersiei grupurilor (varianaintragrup)

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    5/17

    Atta timp ct nu cunoatem dispersia populaiei (2) din care ar putea proveni grupurile,trebuie s o estimm prin dispersiile celor trei grupuri (s12, s22, s32).

    Calculnd media celor trei dispersii vom obine o valoare care estimeaz dispersia pentrucele trei grupuri luate mpreun (indiferent de metoda de antrenament utilizat). Aceastvaloare se consider c estimeaz dispersia populaiei totale. Deoarece ea se calculeaz pe baza

    dispersiilor n interiorul grupurilor, este desemnat n mod uzual prin termenul de intragrup(sau, mai frecvent, prin forma englez: within-group) i se noteaz cu s2intragrup, fiind calculatcu una dintre formulele urmtoare:

    Atunci cnd volumele eantioanelor comparate sunt egale(N1=N2=N3), ca n formula3.16:

    i atunci cnd grupurile comparate sunt de volum inegal ca n formula 3.17:

    (b) Estimarea dispersiei populaiei de nul pe baza dispersiei mediilor grupurilor (varianaintergrup)

    Mediile celor trei grupuri (eantioane) sunt numere care pot fi analizate ca distribuien sine, a cror dispersie (varian) poate fi calculat, fiind o estimare a mprtierii valorilor lanivelul populaiei. Din cauz c se bazeaz pe mediile grupurilor, aceasta se mai numete ivarian intergrupuri (between groups, n limba englez). ntre

    Vom putea utiliza dispersia mediilor celor trei eantioane pentru a estima dispersia populaiei totale (vezi exemplul de mai jos). Aceasta se numete estimarea varianeiintergrupuri, notat cu s2intergrup.

    Dac nlocuim n expresia de mai sus expresia de calcul a dispersiei (formula 3.17),

    variaia acestor medii i variaia valorilor din grupurile analizate, luate mpreun, exist olegtur care poate fi exprimat pe baza formulei transformate a erorii standard, astfel:

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    6/17

    obinem:

    unde mi este media performanei din fiecare grup, M este media celor trei grupuri luatempreun, iar ni este numrul subiecilor din fiecare grup, iar df intergrup se calculeaz ca numrulgrupurilor-1.

    Ca urmare, pentru o situaie cu trei grupuri, formula desfurat se scrie astfel:

    unde: m1, m2, m3 sunt mediile celor trei grupuri, n1, n2, n3, sunt volumele celor treieantioane, iar celelalte valori sunt cele descrise pentru formula anterioar.

    Pentru situaia n care grupurile au un numr egal de subieci, formula 3.19 devine:

    unde n este numrul subiecilor dintr-un grup.

    Ambele tipuri de estimri sunt estimri independente ale varianei populaiei de nul. ns,n timp ce variana intragrup o estimeaz n mod direct (media varianelor), variana intergrup omsoar indirect (variana mediilor). Aceasta din urm, variana intergrup, reprezint o estimare avarianei populaiei de nul numai dac ipoteza de nul este adevrat. Dac ipoteza de nul estefals, ea reflect de fapt msura n care valorile variabilei independente (factorul) influeneazmediile variabilei dependente. Pe aceast particularitate se bazeaz procedura analizei devarian. Raportul dintre cele dou estimri (s2intergrup/s2intragrup) va tinde s devin cu att mai mare cuct diferena dintre mediile grupurilor (tradus prin dispersia mediilor) devine mai mare dectdispersia din

    Interpretarea raportului F

    Numitorul raportului F (dispersia intragrup) exprim variabilitatea din interiorulgrupurilor supuse comparaiei. Dac analizm sursele acestei variaii, ea poate proveni din mai

    Atunci cnd grupurile comparate sunt de volum inegal:

    interiorul grupurilor (tradus prin media dispersiilor). Acest raport se numete raportFisher, dup numele celui care a fundamentat acest tip de analiz3, i se scrie astfel:

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    7/17

    multe surse: diferenele individuale dintre subieci, erorile de msurare ale variabileidependente, fluctuaia condiiilor n care au fost efectuate msurrile. Neputnd defini cu exactitatenici sursa i nici contribuia fiecreia, dispersia intragrup exprim aa numita varianneexplicat, definit generic i ca variana erorii.

    n conformitate cu ipoteza cercetrii, grupurile de subieci ar trebui s aib scoruri

    diferite, fie pentru au fost supuse unui tratament diferit (n exemplul nostru prin cele treimetode de antrenament), fie ca urmare a faptului c fac parte din populaii diferite. n acelaitimp, subiecii din fiecare grup n parte ar trebui s aib scoruri similare. Faptul c ele difertotui, nu poate fi explicat prin efectul tratamentului, motiv pentru care variaia lor estedefinit drept o varian a erorii.

    La rndul lui, variabilitatea numrtorului raportului F este rezultatul manipulrii dectre cercettor (atunci cnd operm n context experimental), sau este rezultatul unor grupuri preexistente (atunci cnd efectum un studiu observaional). i valoarea acestuia esteamplificat de variana erorii. Aceasta deoarece, chiar i n cazul n care tratamentul cu celetrei metode de antrenament ar fi total ineficient, i toate populaiile ar avea medii identice,mediile grupurilor comparate ar diferi ntre ele, sub efectul unor surse diverse (erori). Caurmare, avem dou surse de variabilitate la numrtor i numai una singur la numitor, fapt care poate fi sintetizat prin urmtoarea expresie:

    Atunci cnd ipoteza de nul este adevrat, efectul tratamentului se apropie de zero,iar raportul F este rezultatul varianei erorii. Dac cele dou variane ale erorii ar fi identice, F ar avea valoarea 1 dar, de fapt, cele dou variane ale erorii pot avea valori diferite, ceea ceconduce la fluctuaii ale lui F n jurul lui 1.

    Atunci cnd efectul tratamentului nu este zero (ipoteza de nul este fals), ne ateptm

    ca valoarea raportului F s fie mai mare dect 1. ns pentru a respinge ipoteza de nul valoarealui F trebuie s fie nu doar mai mare dect 1, ci mai mare dect un prag critic convenionalasumat (alfa), astfel nct probabilitatea ca un rezultat similar s decurg din ntmplare s fiemai mic sau cel mult egal cu alfa.

    Distribuia Fisher

    Valorile raportului F (sau testul F) se distribuie ntr-un mod particular, numit distribuia Fsau distribuia Fisher. Ca i distribuia normal, distribuia F este o familie de distribuii, avndurmtoarele caracteristici:

    1.asimetrie pozitiv (tendina valorilor de grupare spre partea stng, cu valori mici);

    2.poate lua valori orict de mari;3.valoarea minim este 0, deoarece decurge din raportul a dou dispersii, iar dispersiile nu pot fi niciodat negative4.4.forma distribuiei variaz n funcie de o pereche de grade de libertate format din numrulgrupelor (categoriile variabilei independente) i numrul subiecilor.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    8/17

    Imaginea de mai sus reprezint curba F pentru 3 grupuri cu 30 de subieci n total.Distribuia Fisher are forme distincte n funcie de numrul eantioanelor comparate i volumulacestora.

    Calcularea gradelor de libertate

    Ca i n cazul distribuiei t, distribuia F se prezint sub o varietate de forme. Distribuia Frezult dintr-un raport a dou distribuii diferite (s2intergpupi s2intragrup), fiecare cu gradele ei de libertate.Ca urmare, i schimb forma, n acelai timp n funcie de numrul grupurilor, i de numrulsubiecilor din fiecare grup. n concluzie, vom avea dou grade de libertate, unul pentrudispersia integrup i altul pentru dispersia intragrup, calculate astfel:

    df intergrup=numrul grupurilor-1df intragrup=numrul cumulat al subiecilor din toate grupurile-numrul grupurilor

    3 Sir Ronald Aylmer Fisher (1890-1962). Astronom de formaie, interesat de teoriaerorilor, s-a remarcat prin contribuiile sale n teoria statisticii creia, din anul 1922, i-a dat onou orientare.4 n practic, se poate ajunge n situaia ca dispersia intragrup s rezulte a fi mai mic dectdispersia intergup i, ca urmare, valoarea lui F s fie mai mic dect 0. Acest lucru estedeterminat de inegalitatea sever a dispersiilor ntre grupurile analizate.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    9/17

    EXEMPLU DE CALCUL

    Problema cercetrii:Avem rezultatele la o edin de tragere la int pentru trei grupuri de cte 6 sportivi,

    fiecare grup fiind antrenat cu o alt metod, i vrem s vedem dac exist o legtur ntre

    nivelul performanei i metoda de antrenament.Ipoteza cercetrii:

    Performana sportiv este n legtur cu metoda de antrenament utilizat.

    Ipoteza de nul:Nu exist o legtur ntre performana sportiv i metoda de antrenament.

    Fixm criteriile deciziei statistice: Nivelul =0.05 Stabilim F critic:

    dfintergrup=3-1=2

    df intragrup=18-3=15Citim F critic (F(0.05, 2, 15)) din tabelul F pentru =0.05:Fcritic=3.6823 (vezi tabelul anexat)

    Not privind utilizarea tabelei pentru distribuiile F

    Spre deosebire de tabelele distribuiilor utilizate pn acum, (z i t), pentru interpretarealui F avem mai multe tabele, calculate fiecare pentru un anume nivel al lui . Mai nti cutmtabela pentru dorit (s zicem, =0.05). Apoi citim valoarea critic pentru F la interseciadintre coloana care reprezint numrul gradelor de libertate pentru numrul grupurilor (df B) culinia care reprezint numrul gradelor de libertate pentru volumul total al subiecilor (df W). Dac

    valoarea obinut prin calcul este mai mare sau egal dect cea tabelar, atunci putem lua deciziade respingere a ipotezei de nul.O precizare important cu privire la ANOVA, ca test statistic, privete caracterul ei

    unilateral (one-tailed). ntr-adevr, spre deosebire de celelalte teste studiate pn acum,ANOVA este interpretat ntr-o singur direcie i anume, dac mediile grupurilor difersemnificativ ntre ele (au o variaie mai mare dect cea normal pentru o distribuie aleatoare). Nu putem avea o valoare negativ pentru F i, ca urmare, testul F este ntotdeauna un testunilateral.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    10/17

    Calculm F pe baza datelor centralizate n tabelul urmtor 5:

    Metoda de antrenamentmetoda 1 metoda 2 metoda 3

    X1

    (puncte)(X1-m1)2 X2

    (puncte)(X2-m2)2 X3

    (puncte)(X3-m3)2

    10 2,79 3 8.00 4 1.369 0,45 6 0.02 5 4.7010 2,79 6 0.02 2 0.687 1,77 5 0.68 3 0.028 0,11 8 4.70 2 0.026 5,43 7 1.36 1 3.34

    X 50 13.33 35 14.78 17 10.14 N 6 6 6M m1=8.33 m2=5.83 m3=2.83 M= m1+m2+m3 /3=5.66s2 2.66 2.96 2.02m-M 2.67 0.17 -2.83(m-M)2 7.12 0.02 8.00 2(m-M)2=15.14 |

    Distribuia valorilor celor trei grupuri poate fi ilustrat grafic astfel:

    Recunoatem n interiorul graficului parametrii fiecrui grup (m i s2) precum imedia mare (M), a valorilor individuale din toate grupurile, luate mpreun.Avnd calculai parametrii celor trei grupuri, putem trece la calcularea raportului F.Mai nti calculm numrtorul, adic dispersia mediilor celor trei grupuri. Dat fiind

    5 Atenie, acest mod de prezentare a datelor servete calculrii manuale a testului F. ntr-o baz de date SPSS vom avea cte o nregistrare pentru fiecare subiect, cu dou variabile,una pentru nivelul anxietii i cealalt pentru intensitatea fumatului, aceasta din urm cutrei valori convenionale, s zicem 1, 2, 3 pentru fiecare nivel de intensitate a fumatului.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    11/17

    faptul c nu cunoatem dispersia populaiei vom utiliza dispersia eantioanelor, conformformulei 3.19 pentru grupuri egale.

    Prin nlocuire cu valorile calculate n tabelul de mai sus, obinem:

    Mai departe, calculm numitorul raportului F (dispersia intragrup), prin nlocuireavalorilor calculate pentru dispersiile din interiorul celor trei grupuri luate separat, n formula3.16:

    Valoarea astfel obinut o comparm cu F critic gsit anterior n tabel. Constatm c Fcalculat (5.94), este mai mare dect F critic (3.6823).

    Decizia statistic:Respingem ipoteza de nul i acceptm ipoteza cercetrii: Nivelul performanei prezint

    o variaie n legtur cu metoda de antrenament utilizat.

    Mrimea efectului pentru testul F

    La fel ca i n cazul testelor statistice introduse anterior, valoarea testului F nu esteinformativ n sine. Mrimea lui F indic doar dect de cte ori este cuprins dispersiaintragrup n dispersia intergrup. Pentru a decide dac acest raport este mare sau mictrebuie s calculm un indice al mrimii efectului. n cazul analizei de varian sunt utilizai nmod obinuit doi indici de mrime a efectului: eta ptrat (2) i omega ptrat (2). Spredeosebire de indicele d (Cohen), care este un indice al diferenei, eta ptrat i omega ptratsunt indici ai asocierii6 (B. Cohen, 2001), similari cu coeficientul de corelaie, pe care l vomanaliza analiza n alt loc.

    6 Fr a intra n amnunte, facem precizarea c indicii de mrime a efectului pot fi transformaicu uurin unii ntr-alii, cu ajutorul unor formule de conversie.

    n acest caz df intragrup=nr. grupurilor, pentru c N1=N2=N3 nfinal, calculm raportul F:

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    12/17

    Vom prezenta aici doar indiceleeta ptrat , dat fiind faptul c este accesibil cu metoda pe care am utilizat-o pentru calcularea lui F7. Formula de calcul pentru 2 este urmtoarea:

    n esen, indicele eta ptrat descrie procentul din variana (mprtierea) variabileidependente care este explicat de variana variabilei independente.

    Nu exist o gril unic de interpretare a indicelui eta ptrat dar, prin similitudine cucoeficientul de corelaie, putem prelua sugestiile unor autori diferii, ale cror opinii sunt, n liniimari, convergente. Redm aici, pentru comparaie, dou variante de interpretare pentru eta ptrat:

    Varianta de interpretare a lui Hopkins (2000):0.9-1 Aproape perfect, descrie relaia dintre dou variabile practic

    0.7-0.9 Foarte mare, foarte ridicat0.5-0.7 Mare, ridicat, ma or 0.3-0.5 Moderat, mediu0.1-0.3 Mic, minor 0.0-0.1 Foarte mic, neglijabil, nesubstan ial

    Varianta de interpretare a lui Davis (citat de Kotrlik i Williams, 2003)0.70 asociere foarte puternic0.50 0.69 asociere substanial0.30 0.49 asociere moderat0.10 0.29 asociere sczut0.01 0.09 asociere neglijabil

    Vom observa c, n ambele variante, pentru a fi important indicele eta ptrat trebuies ating cel puin valoare de 0.50, ceea ce nseamn c 50% din varian variabileidependente este explicat de variabila independente.

    Pentru datele exemplului nostru, indicele de mrime a efectului este:

    La rndul lui, Cohen (1988) a dezvoltat un indice de mrime a efectului (f) pentruANOVA, care atenueaz ceea ce se consider a fi tendina de supraestimare a mrimiiefectului de ctre indicele eta ptrat:

    Programele statistice ofer, de regul, posibilitatea de a calcula ambii indici ai puterii

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    13/17

    Pentru rezultatul din exemplul nostru, avem mai sus formula care se vede.

    n conformitate cu recomandrile lui Cohen, valorile lui f se interpreteaz astfel: efectmic=0.10; efect mediu=0.25; efect mare=0.40. Interpretarea mrimii efectului trebuie fcutcu precauie i modestie (Runyon et. al, 1996). Un indice redus de mrime a efectului indic,desigur, o slab intensitate a relaiei dintre variabila independent i variabila dependent. Cutoate acestea, uneori, chiar i o relaie slab ntre variabile poate fi important pentru cercetareatiinific din tiinele sociale i umane. Comportamentul uman este supus unor surse extrem decomplexe de determinri, fapt care face aproape imposibil controlarea (eliminarea) unoradintre surse, pentru stabilirea exact a efectului uneia anume. Acest lucru face inevitabil prezena unei anumite cantiti de erori de msurare n toate cercetrile psihologice. n aceste

    condiii, uneori, chiar i un efect mic poate fi considerat un ctig important din punct devedere tiinific, chiar dac este puin relevant din punct de vedere practic. De exemplu, unrezultat semnificativ statistic, dar cu un indice sczut de mrime a efectului, poate constitui punctul de plecare al unei noi cercetri, n care efectele colaterale ale unor variabile s fie mai bine controlate (eliminarea erorii), ceea ce poate conduce la evidenierea unei relaii mai puternice ntre variabilele studiate.

    Dac privim cei doi indici ai mrimii efectului calculai pentru exemplul dat, putemaprecia c, n contextul datelor cercetrii noastre, 44% din variaia performanei de instruire esteexplicat de utilizarea metodelor de antrenament (ceea ce nseamn, implicit, c un procent de56% provine din alte surse). n conformitate cu recomandrile de interpretare pentru eta ptrat, putem afirma c relaia dintre metodele de antrenament utilizate i performan este moderatsau medie. n acelai timp, indicele f al lui Cohen indic un nivel ridicat al mrimiiefectului. Nu trebuie s privim aceste dou aprecieri ale mrimii efectului ca fiindcontradictoirii, ci ca pe dou perspective asupra aceleiai realiti.

    Analiza post-hoc

    Graficul de mai sus prezint variaia mediilor performanei celor grupuri de sportivi. Aacum se observ, nivelul performanei are nivelul cel mai ridicat pentru prima metod de

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    14/17

    antrenament (8.33), i din ce n ce mai reduse la urmtoarele dou (5.83; 2.83).

    Testul ANOVA ne ofer o imagine global a variaiei mediilor fr s ne spunnimic cu privire la sursa de provenien acesteia, i nici n ce msur difer mediilegrupurilor luate dopu ct dou. n exemplul nostru valoarea obinut pentru F ar putea decurge

    doar prin contribuia unui singur grup (de ex., cei antrenai cu metoda 1), celelalte grupuriavnd o contribuie minor sau inexistent. Cercettorul poate fi ns interesat care dintregrupuri difer ntre ele, i n ce sens.

    Pentru a rezolva aceast problem se efectueaz aa numitele comparaii multiple, pe baza unor teste statistice denumite post-hoc, pentru c, n mod normal, acestea se calculeazdup aplicarea procedurii ANOVA. Printre cele mai frecvent utilizate sunt testele: Scheffe,Tukey i Bonferoni (desigur, se utilizeaz unul sau altul dintre ele, la alegere). Nu vom intran detalii teoretice i de calcul cu privire la aceste teste. Fiecare are avantajele i dezavantajelesale. Important aici este s nelegem c testele post-hoc se interpreteaz n mod similar testuluit pentru diferena mediilor pentru eantioane necorelate, calculate astfel nct s ia, att ct se poate, msuri de precauie mpotriva excesului de eroare de tip I menionat anterior. Este

    important de reinut, de asemenea, faptul c analiza post-hoc este practicat, de regul, numaidac a fost obinut un rezultat semnificativ pentru testul F8. Aceasta nseamn c analiza post-hoc nu poate fi utilizat ca substitut pentru testul t efectuat n mod repetat. Ca urmare, n practic, analiza de varian va cuprinde dou faze: prima, n care se decide asupra semnificaieitestului F, i a doua, n cazul c acest raport este semnificativ, n care se analizeazcomparativ diferenele dintre categoriile analizate, pe baza unui test post- hoc.

    n ce privete calcularea testelor post-hoc menionate mai sus, vom prezenta modullor de calcul n seciunea dedicat programului SPSS.

    Publicarea rezultatului testului F (ANOVA)

    n raportul de publicare pentru ANOVA vor fi descrise grupurile (categoriile)comparate, mediile lor, valoarea testului F cu numrul gradelor de libertate i pragul desemnificaie al testului. La acestea se adaug indicele de mrime a efectului. ntr-o maniernarativ, rezultatul obinut pe exemplul de mai sus, poate fi prezentat astfel:

    A fost analizat performana n tragerea la int a trei grupuri de sportivi, antrenai cumetode diferite. Mediile performanei pentru cele trei grupuri au fost 8.33, 5.83, respectiv 2.83.Analiza de varian unifactorial a relevat o diferen semnificativ ntre aceste medii, F (2,15)=6; p 0.05. Mrimea efectului apreciat cu indicele eta ptrat indic un efect moderat(2=0.44), n timp ce indicele f al lui Cohen indic un efect mare (f=0.88).

    Atunci cnd vom calcula ANOVA cu ajutorul unui program care ne va oferi icomparaiile multiple ntre grupurile comparate (analiza post-hoc), la descrierea de mai sus vomaduga i comparaiile grupurilor, dou cte dou, care exprim diferenele directe dintregrupurile supuse comparaiei, explicnd analitic sursele semnificaiei raportului F global.

    8 Cu toate acestea, exist autori care consider c nimic nu ne mpiedic s calculm testele post-hoc chiar dac testul F s-a finalizat cu admiterea ipotezei de nul.

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    15/17

    Avantajele ANOVA

    Utilizarea ANOVA pentru testarea ipotezelor n cazul unui numr mai mare de grupuri(eantioane) prezint dou avantaje. Primul, ine de ceea ce am precizat deja, i anume faptul c

    eliminm riscul cumulrii unei cantiti prea mari de eroare de tip I, prin efectuarea repetat atestului t. Al doilea, rezult din faptul c avem posibilitatea s punem n eviden diferenesemnificative ntre mediile mai multor grupuri, chiar i atunci cnd nici una dintre ele nudifer semnificativ una de cealalt (testul t).

    Dei, n mod normal, analiza de varian este utilizat doar n situaia n care se doretetestarea diferenei dintre mediile a mai mult de dou grupuri independente, ea d rezultateechivalente i n cazurile n care exist numai dou grupuri (singura diferen fiind valoareacalculat a testului, nu i nivelul lui p). Utilizarea testului t pentru testarea diferenei dintre doumedii este, totui, o metod mult mai direct, mai uor de aplicat i de neles, dect analiza devarian.

    De exemplu, dac lum n considerare datele din tabelul alturat, n careavem o variabil dependent distribuit pe dou valori ale unei variabileindependente, valoarea testului t este 3.13, iar valoarea testului F este9.82 (ceea ce reprezint ptratul valorii t). n acelai timp, rezultatul laambele teste este semnificativ pentru aceeai valoare a lui p (0.035).

    Condiii pentru utilizarea testului ANOVA

    Utilizarea analizei de varian unifactoriale presupune ndeplinirea urmtoarelor condiii:o independena eantioanelor (grupurilor supuse comparaiei);o normalitatea distribuiei de eantionare, n conformitate cu teorema limitei

    centrale; o absena valorilor extreme (outliers); o egalitatea varianei grupurilor comparate (denumit homoscedasticitate).

    Atunci cnd una sau mai multe dintre aceste condiii nu sunt ntrunite, se poate adoptauna dintre soluiile urmtoare:

    o renunarea la ANOVA n favoarea unei prezentri descriptive (soluie care nelipsete de posibilitatea unei concluzii testate statistic);

    o transformarea variabilei dependente astfel nct s dobndeasc proprietilenecesare (printre metodele uzuale, citm aici doar logaritmarea sau extragerearadicalului din toate valorile variabilei dependente);

    o transformarea variabilei pe o alt scal de msurare i aplicarea altui test statistic(de exemplu, prin transformarea pe o scal nominal, se poate aplica testulneparametric chi-ptrat sau, prin transformarea pe o scal ordinal, se poateaplica testul neparametric Kruskal-Wallis, ambele urmnd a fi tratate maideparte).

    v.indep. v.dep.1 91 51 72 142 152 10

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    16/17

    EXERCIII

    Efectul Stroop este un fenomen studiat n psihologia experimental, care const ntr-osituaie informaional conflictual. De exemplu, cuvntul albastru este tiprit cu litere deculoare roie, iar subiectul trebuie s rspund indicnd culoarea literelor.

    Un cercettor efectueaz urmtorul experiment cu privire la efectul Stroop:-Selectioneaz aleatoriu patru grupuri de subieci, fiecare grup fiind format din ase subieci;-Subiecilor din primul grup li se prezint ptrate colorate i li se cere s identifice culoarea;-Celor din grupul 2 li se prezint adjective scrise cu culori corespunztoare (rou estescris cu rou);-Grupurilor 3 i 4 li se prezint combinaii conflictuale ntre cuvinte i culori, dar subieciidin grupul 3 trebuie s identifice cuvntul, n timp ce subiecii din grupul patru trebuie sidentifice culoarea.-Variabila dependent este timpul pentru rspuns corect, msurat n zecimi de secund-Toi subiecii primesc 10 stimuli de acelai fel, fiind consemnat timpul mediu de rspuns.-Rezultatele sunt centralizate n tabelul urmtor:

    Gru 1 Gru 2 Gru 3 Gru 40.3 0.5 1.1 1.30.5 0.5 0.9 1.20.3 0.3 0.9 1.40.2 0.2 1.2 0.90.4 0.4 1.0 1.50.2 0.3 1.2 1.1

    n raport cu datele experimentului de mai sus:1.Enunai ipoteza cercetrii2.Enunai ipoteza de nul3.Calculai testul F pentru alfa=0.054.Enunai decizia statistic5.Enunai decizia cercetrii6.Calculai indicii de mrime a efectului eta ptrat i f 7.Prezentai rezultatul cercetrii n conformitatea cu recomandrile de publicare

  • 8/7/2019 Sp Test Area Diferentei Dintre Mai Mult de 2 Medii ova

    17/17

    Anexa 3. Tabelul parial al distribuiei F pentru =0.059df intragrup(within)

    df inter ru between1 2 3 4 5 6 7 8 9 10

    1 161.447 199.500 215.707 224.583 230.161 233.986 236.768 238.882 240.543 242 18.5128 19.0000 19.1643 19.2468 19.2964 19.3295 19.3532 19.3710 19.3848 193 10.1280 9.5521 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.74 7.7086 6.9443 6.5914 6.3882 6.2561 6.1631 6.0942 6.0410 5.9988 5.95 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.76 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.0990 4.07 5.5914 4.7374 4.3468 4.1203 3.9715 3.8660 3.7870 3.7257 3.6767 3.68 5.3177 4.4590 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.39 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.110 4.9646 4.1028 3.7083 3.4780 3.3258 3.2172 3.1355 3.0717 3.0204 2.911 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.9480 2.8962 2.812 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.713 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.614 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6

    15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.516 4.4940 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.417 4.4513 3.5915 3.1968 2.9647 2.8100 2.6987 2.6143 2.5480 2.4943 2.418 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.419 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.320 4.3512 3.4928 3.0984 2.8661 2.7109 2.5990 2.5140 2.4471 2.3928 2.321 4.3248 3.4668 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205 2.3660 2.322 4.3009 3.4434 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.223 4.2793 3.4221 3.0280 2.7955 2.6400 2.5277 2.4422 2.3748 2.3201 2.224 4.2597 3.4028 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.225 4.2417 3.3852 2.9912 2.7587 2.6030 2.4904 2.4047 2.3371 2.2821 2.226 4.2252 3.3690 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.227 4.2100 3.3541 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.228 4.1960 3.3404 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 2.2360 2.129 4.1830 3.3277 2.9340 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.130 4.1709 3.3158 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1

    (Sursa: Electronic Textbook, STATSOFT, Copyright StatSoft, Inc., 1984-1999)

    9 Tabelul este aplicabil pentru maxim 11 grupuri (df Between=10) i df Within maxim=30. Tabelecomplete pentru F se gsesc n manualele recomandate n bibliografie