Teste neparametrice

10
1 Teste neparametrice Testul Mann-Whitney (două eșantioane independente) Testul Kruskal-Wallis (mai mult de două eșantioane independente) Testele Wilcoxon, semnului, McNemar (două antioane dependente) Testul U Mann Whitney pentru eșantioane independente Acest test: nu ține cont de distribuția valorilor se aplică și în cazul eșantioanelor mici compară distribuțiile valorilor unei variabile obținute pentru două grupuri independente ține cont de numărul de cazuri și de rangurile datelor. Ipoteza nulă H 0 : nu există diferență semnificativă între distribuțiile celor două populații din care au fost extrase cele două eșantioane / grupe Ipoteza alternativă H 1 : există diferență semnificativă între distribuțiile celor două populații din care au fost extrase cele două eșantioane. Diferența poate fi din punct de vedere a centrului sau/și a formei. Pas 1. Calculăm statistica testului conform formulelor: unde: dimensiunea primului eșantion dimensiunea celui de-al doilea eșantion suma rangurilor primului eșantion suma rangurilor celui de-al doilea eșantion Pas 2. Se determină valoarea critică Dacă n20 statistica testului se compară cu valoarea corespondentă din tabelul valorilor critice Mann- Whitney: Dacă : o U se acceptă ipoteza nulă H 0 (nu avem motive să afirmăm că există o diferență semnificativă între distribuții) o U se respinge ipoteza nulă H 0 (există o diferență semnificativă între cele două distribuții) Dacă n20, distribuția testului U se apropie de distribuția normală și se determină valoarea critică a testului (scorul z al testului) folosind formula: Dacă : o se acceptă ipoteza nulă H 0 (nu avem motive să afirmăm că există o diferență semnificativă între distribuții) o se respinge ipoteza nulă H 0 (există o diferență semnificativă între cele două distribuții)

description

MANN-WHITNEY

Transcript of Teste neparametrice

Page 1: Teste neparametrice

1

Teste neparametrice Testul Mann-Whitney (două eșantioane independente)

Testul Kruskal-Wallis (mai mult de două eșantioane independente)

Testele Wilcoxon, semnului, McNemar (două eșantioane dependente)

Testul U Mann – Whitney pentru eșantioane independente

Acest test:

nu ține cont de distribuția valorilor

se aplică și în cazul eșantioanelor mici

compară distribuțiile valorilor unei variabile obținute pentru două grupuri independente

ține cont de numărul de cazuri și de rangurile datelor.

Ipoteza nulă H0: nu există diferență semnificativă între distribuțiile celor două populații din care au fost extrase

cele două eșantioane / grupe

Ipoteza alternativă H1: există diferență semnificativă între distribuțiile celor două populații din care au fost

extrase cele două eșantioane. Diferența poate fi din punct de vedere a centrului sau/și a formei.

Pas 1. Calculăm statistica testului conform formulelor:

unde:

dimensiunea primului eșantion

dimensiunea celui de-al doilea eșantion

suma rangurilor primului eșantion

suma rangurilor celui de-al doilea eșantion

Pas 2. Se determină valoarea critică

Dacă n 20 statistica testului se compară cu valoarea corespondentă din tabelul valorilor critice Mann-

Whitney:

Dacă :

o U se acceptă ipoteza nulă H0 (nu avem motive să afirmăm că există o diferență

semnificativă între distribuții)

o U se respinge ipoteza nulă H0 (există o diferență semnificativă între cele două

distribuții)

Dacă n 20, distribuția testului U se apropie de distribuția normală și se determină valoarea critică a

testului (scorul z al testului) folosind formula:

Dacă :

o se acceptă ipoteza nulă H0 (nu avem motive să afirmăm că există o diferență

semnificativă între distribuții)

o se respinge ipoteza nulă H0 (există o diferență semnificativă între cele două distribuții)

Page 2: Teste neparametrice

2

Observație

=1.96 ; =2.58

Atenție

Acceptarea ipotezei nule, pentru n 20, s-a realizat în baza relației (mai mare): U , în timp ce pentru

n 20, s-a realizat în baza relației (mai mic):

Exemplu

Măsurând o aceeași variabilă pentru două grupuri s-au obținut valorile:

Grup 1 Grup 2

16 37

20 31

14 19

9 26

39 25

22 9

20 20

19 11

31

40

n1=10 n2=8

Dorim să verificăm dacă distribuțiile celor două grupuri diferă sau nu.

Rezolvare

Pas 1. Determinăm ragnul fiecărui rezultat pentru ambele grupuri. Pentru aceasta mai întâi cumulăm cele două

șiruri de valori într-un singur șir și ordonăm șirul crescător: șirul

cumulat

șirul sortat Ranguri

inițiale

Ranguri

finale

16 9 1 1.5 =

20 9 2 1.5 =

14 11 3 3

9 14 4 4

39 16 5 5

22 19 6 6.5 =

20 19 7 6.5 =

19 20 8 9 =

31 20 9 9 =

40 20 10 9 =

37 22 11 11

31 25 12 12

19 26 13 13

26 31 14 14.5 =

25 31 15 14.5 =

9 37 16 16

20 39 17 17

11 40 18 18

Pas 2. Calculăm suma rangurilor pentru fiecare grup:

Grup 1 Grup 2 Rang1 Rang2

16 37 5 16

Page 3: Teste neparametrice

3

20 31 9 14.5

14 19 4 6.5

9 26 1.5 13

39 25 17 12

22 9 11 1.5

20 20 9 9

19 11 6.5 3

31 14.5

40 18

total R1=95.5 R2=75.5

Pas 3. Calculăm statistica testului:

Pas 4. Determinăm valoarea critică din tabelul valorilor critice Mann-Whitney:

Deoarece U=39.5 se acceptă ipoteza nulă H0 (nu avem motive să afirmăm că există o

diferență semnificativă între distribuții)

Testul Wicoxon pentru eșantioane perechi

Acest test:

nu ține cont de distribuția valorilor

compară distribuțiile valorilor unei variabile obținute pentru două grupuri perechi

ține cont de semnele diferențelor și valoarea acestora

Ipoteza nulă H0: nu există diferență semnificativă între distribuțiile celor două populații din care au fost extrase

cele două eșantioane / grupe

Ipoteza alternativă H1: există diferență semnificativă între distribuțiile celor două populații din care au fost

extrase cele două eșantioane.

Exemplu

Pas 1.

Calculăm diferențele dintre situația inițială și situația finală: nr GROD

înainte

GROD

după

înainte

- după

abs(înainte

– după)

1 22 18 4 4

2 20 30 -10 10

3 14 23 -9 9

4 8 21 -13 13

5 49 46 3 3

6 37 45 -8 8

7 1 14 -13 13

8 15 30 -15 15

9 28 25 3 3

10 23 29 -6 6

Pas 2. Stabilim rangul valoarii absolute a diferențelor:

Page 4: Teste neparametrice

4

nr dif sort( Rang

inițial

Rang

1 4 4 3 1 1.5

2 -10 10 3 2 1.5

3 -9 9 4 3 3

4 -13 13 6 4 4

5 3 3 8 5 5

6 -8 8 9 6 6

7 -13 13 10 7 7

8 -15 15 13 8 8.5

9 3 3 13 9 8.5

10 -6 6 15 10 10

Pas 3. Determinăm rangul cu semn al valorii absolute pentru cele două grupuri:

nr GROD

înainte

GROD

după

înainte

- după

Rang Rang

cu

semn

1 22 18 4 3 3

2 20 30 -10 7 -7

3 14 23 -9 6 -6

4 8 21 -13 8.5 -8.5

5 49 46 3 1.5 1.5

6 37 45 -8 5 -5

7 1 14 -13 8.5 -8.5

8 15 30 -15 10 -10

9 28 25 3 1.5 1.5

10 23 29 -6 4 -4

Pas 4. Calculăm suma rangurilor pozitive și suma rangurilor negative:

Pas 5. Determinăm statistica testului:

în cazul nostru W=6

Pas 6. Se determină valoarea critică

Dacă n 20 statistica testului se compară cu valoarea corespondentă din tabelul valorilor critice

Wilcoxon:

Dacă :

o W se acceptă ipoteza nulă H0

o W se respinge ipoteza nulă H0

Dacă n 20, distribuția testului W se apropie de distribuția normală și se determină valoarea critică a

testului (scorul z al testului) folosind formula:

Dacă :

o se acceptă ipoteza nulă H0

o se respinge ipoteza nulă H0

Page 5: Teste neparametrice

5

În cazul nostru, n 20 vom compara statistica testului cu valoarea corespondentă din tabelul valorilor critice

Wilcoxon obținând:

W=6

și vom respinge ipoteza nulă: distribuțiile sunt diferite

Page 6: Teste neparametrice

6

Valori critice ale statisticii U în cazul testului

Mann-Whitney

( )

Page 7: Teste neparametrice

7

Valori critice ale statisticii W în cazul testului

Wilcoxon

Page 8: Teste neparametrice

8

Cronbach alpha / consistența internă

Coeficientul alpha (Cronbach alpha)

Calcularea acestui coeficient se bazează pe presupunerea că există un factor unic care explică variabilitatea

itemilor.

Teoretic, calcularea acestui coeficient presupune:

variabilele să fie măsurate pe o scală cu valori cantitative, de tip continuu

sunt acceptate și variabile măsurate la nivel ordinal (de ex. scale de tip Lickert (5,7 sau 3 variante de

răspuns))

Formula de calcul:

unde:

k reprezintă numărul de itemi (întrebări)

reprezintă varianța asociată itemului i

reprezintă varianța asociată totalului (sumei) celor k itemi

Coeficientul Cronbach alpha standardizat

Formula de calcul:

unde

k reprezintă numărul de itemi (întrebări)

reprezintă media coeficienților de corelație ai celor k(k-1)/2 perechi de itemi ce se pot calcula pornind

de la cei k itemi

Interpretare:

ia valori mai mici decât 1

valori confirmă consistența internă a itemilor analizați

Exercițiu

Tabelul următor conține răspunsurile oferite de 15 angajați la 6 întrebări pentru a măsura nivelul de autoînvățare

al acestora. Răspunsurile la întrebări sunt codificate de la 1 la 5 (1-dezacord putenic, 2-dezacord, 3-indecis, 4-

acord, 5-acord puternic). Respondenți I1 I2 I3 I4 I5 I6

1 5 5 3 3 2 2

2 4 4 3 5 4 4

3 4 5 4 4 4 4

4 5 3 4 4 2 2

5 4 3 5 4 3 3

6 5 2 1 1 1 1

7 5 5 4 4 4 4

8 4 4 3 2 1 1

9 5 5 1 1 1 1

10 5 4 1 2 2 1

11 4 4 3 4 3 2

12 3 2 3 4 3 4

13 5 5 5 1 4 1

14 5 5 3 2 4 4

15 5 4 3 2 4 2

Să se determine coeficientul de consistență internă al itemilor chestionarului.

Rezolvare

Metoda 1 – calculul coeficientului Cronbach alpha

Page 9: Teste neparametrice

9

Pas 1. Se identifică numărul de itemi (întrebări). În cazul nostru avem 6 întrebări, deci k=6

Pas 2. Se calculează scorul total pentru fiecare respondent (toatalul pe linie)

Pas 3. Se calculează varianța fiecărui item, , (varianța valorilor obținute pentru fiecare întrebare în

parte) și varianța pentru scorul total

Exemplificare pentru prima întrebare (I1) -

=

4.5333

I1 ( )

1 5 0.47 0.22

2 4 -0.53 0.28 3 4 -0.53 0.28

4 5 0.47 0.22 5 4 -0.53 0.28

6 5 0.47 0.22

7 5 0.47 0.22 8 4 -0.53 0.28

9 5 0.47 0.22 10 5 0.47 0.22

11 4 -0.53 0.28 12 3 -1.53 2.34

13 5 0.47 0.22 14 5 0.47 0.22

15 5 0.47 0.22

Calculând pentru toate întrebările și pentru scorul total, obținem : I1 I2 I3 I4 I5 I6 Total

1 5 5 3 3 2 2 20

2 4 4 3 5 4 4 24

3 4 5 4 4 4 4 25

4 5 3 4 4 2 2 20

5 4 3 5 4 3 3 22

6 5 2 1 1 1 1 11

7 5 5 4 4 4 4 26

8 4 4 3 2 1 1 15

9 5 5 1 1 1 1 14

10 5 4 1 2 2 1 15

11 4 4 3 4 3 2 20

12 3 2 3 4 3 4 19

13 5 5 5 1 4 1 21

14 5 5 3 2 4 4 23

15 5 4 3 2 4 2 20

0.4095 1.1429 1.6381 1.8381 1.4571 1.6857 18.3809

Pas 5. Se calculează coeficientul Cronbach alpha:

=

=0.6665

Metoda 2 – calculul coeficientului Cronbach alpha standardizat

Pas 1. Se identifică numărul de itemi (întrebări) k=6

Pas 2. Se calculează numărul k(k-1)/2 de perechi de itemi pentru care se pot calcula coeficienții de corelație

Pas 3. Se calculează cei 15 coeficienți de corelație:

Page 10: Teste neparametrice

10

Exemplificăm calculul coeficientului de corelație dintre I1 și I2:

=

4.5333

=

4

;

I1( ) I2( ) ( )2 ( )2 ( )*

( )

1 5 5 0.47 1 0.22 1 0.47

2 4 4 -0.53 0 0.28 0 0

3 4 5 -0.53 1 0.28 1 -0.53

4 5 3 0.47 -1 0.22 1 -0.47

5 4 3 -0.53 -1 0.28 1 0.53

6 5 2 0.47 -2 0.22 4 -0.94

7 5 5 0.47 1 0.22 1 0.47

8 4 4 -0.53 0 0.28 0 0

9 5 5 0.47 1 0.22 1 0.47

10 5 4 0.47 0 0.22 0 0

11 4 4 -0.53 0 0.28 0 0

12 3 2 -1.53 -2 2.34 4 3.06

13 5 5 0.47 1 0.22 1 0.47

14 5 5 0.47 1 0.22 1 0.47

15 5 4 0.47 0 0.22 0 0

4.53 4 0.62 1.03 4

I1 I2 I3 I4 I5

I2 0.4176

I3 -0.2209 0.1566

I4 -0.5708 -0.1478 0.4583

I5 -0.1295 0.3321 0.6103 0.4190

I6 -0.4470 0.0515 0.4126 0.7223 0.6972

Pas 4. Se calculează media coeficienților de corelație:

Pas 5. Se calculează coeficientul Cronbach alpha standardizat: