Suport Curs 11-12

28
Curs_11&12: Teste nonparametrice Testul Mann-Whitney (echivalentul nonparametric al testului t pentru 2 eșantioane independente) Testul Wilcoxon (echivalentul nonparametric al testului t pentru 2 eșantioane dependente) 1

description

statistica

Transcript of Suport Curs 11-12

  • Curs_11&12: Teste nonparametrice

    Testul Mann-Whitney (echivalentul nonparametric al testului t pentru 2 eantioane independente)

    Testul Wilcoxon (echivalentul nonparametric al testului t pentru 2 eantioane dependente)

    1

  • 2 Condiii generale pentru testele parametrice

    1- VD msurat pe scal cantitativ (I/R)2- Volumul eantionului/eantioanelor (N30)3- Distribuia datelor respect un model teoretic al normalitii4- Omogenitatea (egalitatea) varianei distribuiilor grupurilor comparate(n cazul eantioanelor independente)

    Cteva soluionri ale nclcrilor condiiilor n cazul testelor parametrice

    1- Abaterile minore de la normalitate sunt acceptate n cazul procedurilor robuste (testul t, ANOVA)2- Pentru volum mai mic de 30 (N

  • 3 Utilizarea teste nonparametrice devine o ultim soluieatunci cnd:

    1-VD este msurat pe scal calitativ (nominal, ordinal)2-VD este msurat pe scal cantitativ, dar nu respectcondiiile cerute de testul parametric (normalitate,omogenitatea mprtierii, volumul eantionului)3-Volum foarte mic al eantionului (chiar sub 20!)

    Utilizarea acestor teste are att avantaje ct i dezavantaje

  • 4AVANTAJE ale utilizrii testelor nonparametrice

    1- nu presupun condiii speciale2- calcule sunt relativ simple i uor de efectuat manual3- se pot utiliza pe scale ordinale, nominale4- pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate.

  • 5DEZAVANTAJE ale utilizrii testelor nonparametrice

    1- msurtorile ordinale sau nominale sunt mai puin precise dect cele cantitative2- au o putere mai redus dect testele parametrice;3- exist tentaia de utilizare i n situaii n care se pot utiliza teste parametrice

  • 6Testul nonparametric Mann-Whitney (U) pentru doueantioane independente

    Utilizare:1. Datele sunt msurate la nivel ordinal, mediile valorilor nu pot fi

    calculate2. Date sunt msurate la nivel de interval/raport ns condiiile de

    aplicare sunt grav nclcate.3. Procedurile de normalizare a distribuiilor au euat.

    Comparaia nu presupune compararea mediilor ci a distribuiilor n sine prin intermediul rangurilor.Rangul unei valori reprezint poziia ierarhic a acelei valori n irul ordonat de valori.

  • 7Testul nonparametric Mann-Whitney (U) pentru dou eantioaneindependente

    Formula de calcul a coeficientului (U)

    U1 = 12 +

    1

    U2 = 12 +

    2

    U1 + U2 = 12 1 + 2=(n+1)n/2, unde n=1 + 2

    1= numrul cazurilor n eantionul 12= numrul cazurilor n eantionul 21= rangurile valorilor n eantionul 12= rangurile valorilor n eantionul 2

    Dintre cele dou valori se alege ntotdeauna valoarea cea mai mic

  • 8

  • 9Un studiu asupra dexteritii realizat de psihologi a presupus nregistrarea timpului de finalizare a unor probe n care erau construite diverse obiecte la copiii de 3 ani. Un lot de 13 copii au participat la studiu (5 biei i 8 fete)

    Eantion biei: 23, 18, 29, 42, 21Eantion fete: 37, 56, 39, 34, 26, 104, 48, 25

    S se testeze la un =0,05 dac bieii au o dexteritate diferit de a fetelor la aceast vrst.

  • 10H0: nu exist diferen semnificativ n privina timpului de finalizare a probelor de dexteritate ntre biei i fete

    H1: exist diferen semnificativ n privina timpului de finalizare a probelor de dexteritate ntre biei i fete

    n conformitate cu tabelul valorilor critice ale lui U, Ucritic=6

    Respingerea ipotezei de nul se face numai dac U < Ucritic

  • 11

  • 12 Valorea (timpul in min.) Rangurile valorilor

    18 1

    21 2

    23 3

    25 4

    26 5

    29 6

    34 7

    37 8

    39 9

    42 10

    48 11

    56 12

    104 13

  • 13

    Rang(B) Rang(F)

    1 4

    2 5

    3 7

    6 8

    10 9

    11

    12

    13

    n1=5 n2=8

    R1=22 R2=69

  • 14U1 = 1 2 +

    1

    U1 = 5 8 +

    22 = 40+ 15 22 = 33

    U2 = 1 2 +

    2

    U2 = 5 8 +

    69 = 40+ 36 69 = 7

    sau U2 = 1 2 U1= 40-33=7

    U2

  • 15

    Testul nonparametric Mann-Whitney (U) pentru dou eantioaneindependente (n1>20, n2>20)

    Formulele de calcul ale coeficientului (U) rmn aceleai.

    U1 = 12 +

    1

    U2 = 12 +

    2

    U1 + U2 = 12 1 + 2=(n+1)n/2, unde:

    n=1 + 21= numrul cazurilor n eantionul 12= numrul cazurilor n eantionul 21= rangurile valorilor n eantionul 12= rangurile valorilor n eantionul 2

    Dintre cele dou valori se alege ntotdeauna valoarea cea mai mic

  • 16

    Testul nonparametric Mann-Whitney (U) pentru dou eantioaneindependente (n1>20, n2>20)

    Dup cum se observ tabelul valorilor lui U conine valori ale volumelor eantioanelor pn la 20, dup aceast valoare, valorile lui U urmeaz destul de bine distribuia normal cu:

    =

    i =

    Z=

    , Z=

    Pentru =0,05 intervalul de ncredere este (-1.96, +1.96)

  • 17

    Mrimea efectului (Hans Wendt) r = 1

    n cazul de mai sus

    r = 1

    = 1-

    = 1-

    = 1-

    = 1- 0,35

    r = 0,65

  • 18Testul nonparametric Wilcoxon (T) pentru dou eantioanedependente

    Utilizare:1. Date sunt msurate la nivel de interval/raport, ns condiiile de

    aplicare sunt grav nclcate sau la nivel ordinal (scale Likert).2. Procedurile de normalizare a distribuiilor au euat.3. Cele dou msurtori sunt dependente

    Comparaia nu presupune compararea mediilor ci a distribuiilor n sine prin intermediul diferentelor rangurilor.S ne reamintim c rangul unei valori reprezint poziia ierarhic a acelei valori n irul ordonat de valori.

  • 19

    Testul nonparametric Wilcoxon (T) pentru dou eantioanedependente

    Condiii:1. nivel de msur interval/raport sau ordinal (scale Likert)2. distribuia diferenelor s fie simetric (n caz contrar se

    transform distribuia pentru simetrizare sau se aplic testul semnului )

    Formula de calcul presupune calcularea a dou sume de ranguri din care se alege valoarea cea mai mic:

    T(-) = rangurilor diferenelor negativeT(+) = rangurilor diferenelor pozitive

    H0 se respinge dac valoarea calculat este mai mic dect cea critic

  • 20

    compania % nainte % dup Diferena

    A 18 18 0

    B 24 24 0

    C 31 30 -1

    D 28 24 -4

    E 17 24 +7

    F 16 24 +8

    G 15 26 +11

    H 18 29 +11

    I 20 36 +16

    J 9 28 +19

    Procentele de participare din 10 companii nainte i dup un training privitor la o campanie de donaii de snge sunt redate mai jos.

  • 21

    Dac avem diferene egale cu zero ntre rangurile perechi procedm n urmtoarele moduri:

    a) se elimin cazurile care dau diferene egale cu zero i, implicit, reducerea volumului eantionului cu aceste cazuri, sau...

    b) atribuirea arbitrar a semnului + la jumtate dintre ele isemnul la cealalt jumtate.

    c) dac exist un numr impar de diferene egale cu zero se va elimina una dintre ele (reducnd N cu 1), dup care se aplic regula b

  • 22

    compania % nainte % dup Diferena Rangurile dif.

    A 18 18 0 1,5

    B 24 24 0 1,5

    C 31 30 -1 3

    D 28 24 -4 4

    E 17 24 +7 5

    F 16 24 +8 6

    G 15 26 +11 7,5

    H 18 29 +11 7,5

    I 20 36 +16 9

    J 9 28 +19 10

    Procentele de participare din 10 companii nainte i dup un trainingprivitor la o campanie de donaii de snge sunt redate mai jos. Exist vreodiferen semnificativ ntre cele dou momente la un =0,05?

  • 23

  • 24

    N=10, Tcritic= 8

    Verificarea distribuiei simetrice a diferenelor

    T(-) = rangurilor diferenelor negative =1,5+3+4=8,5T(+) = rangurilor diferenelor pozitive =1,5+5+6+7,5+7,5+9+10=46,5

    Dintre cele dou valori T, valoarea cea mai mic este T(-) =8,5

    T(-) =8,5 > Tcritic= 8 prin urmare nu putem respinge H0

  • 25

    Testul nonparametric Wilcoxon (T) pentru dou eantioanedependente (n>20)

    Dup cum se observ tabelul valorilor lui T conine valori ale volumelor eantioanelor pn la 30, dup aceast valoare, valorile lui T urmeaz destul de bine distribuia normal (iar pentru n>20 aproximarea este destul) de bun cu:

    = ()

    i =

    ()

    Z=

    , Z=

    ()

    ()

    , Z=

    ()

    ()

    Pentru =0,05 intervalul de ncredere este (-1.96, +1.96)

  • 26

    Mrimea efectului r =

    ,

    n cazul de mai sus,

    z =

    ()

    ()

    = ,

    ()

    ()

    = 1,94

    r =

    = ,

    = 0,61

  • Finalul suportului de curs_11&12

    85%

    15%

    Curs Statistica aplicat n psihologie

    cursuri parcurse cursuri rmase

    27

  • 28