Comparea mediilor

26
Compararea mediilor Conf .Dr. Cornelia Muresan Universitatea Babes-Bolyai

description

Comparea mediilor

Transcript of Comparea mediilor

Page 1: Comparea mediilor

Compararea mediilor

Conf .Dr. Cornelia MuresanUniversitatea Babes-Bolyai

Page 2: Comparea mediilor

2

Structura cursului

Ipoteze care implica compararea mediilor Cat de mare trebuie sa fie diferenta dintre doua medii? Testul z pentru esantioane mari Testul Student pentru esantioane mici (t ) Exemplu Problema egalitatii variantelor Testul Ficher Testul t pentru esantioane perechi Exemplu Restrictii de utilizare a testului t Lucrare de laborator

Page 3: Comparea mediilor

3

Ipoteze care implica compararea mediilor

Cauta legatura dintre o variabila calitativa (de regula cea independenta) si una cantitativa (cea dependenta).

Examineaza daca diferentele dintre doua sau mai multe (sub)esantioane sunt suficient de mari ca sa nu se datoreze erorii de esantionare.

O diferenta statistic semnificativa nu sugereaza ca o variabila este cauza variatiei celeilalte.

Ex1: Ip

c

: Elevii care participa la activitati interactive de preventie

Page 4: Comparea mediilor

4

Variabile independente categoriale des intalnite in asistenta sociala:

- tratament 1 si tratament 2- inainte si dupa interventie- grup experimental si grup de control

Variabile dependente cantitative de interes in asistenta sociala:

Operationalizate cantitativ- stima de sine- aspiratia spre bunastare- satisfactia maritala- nivelul de adaptare sociala- cunostintele acumulate intr-un anume domeniu- rezultate scolare

Cantitative prin natura lor- numar de interventii reusite- numar comportamente violente indreptate impotriva sotiei /copilului- numar de absente de la scoala

Ipoteze care implica compararea mediilor

Page 5: Comparea mediilor

5

Ipoteze care implica compararea mediilor

Atuuri ale testelor de comparare a mediilor:

Se poate utiliza si pentru dimensiuni relativ mici a esantioanelor (20-30 cazuri)

Posibilitatea ca grupul experimental si cel de control sa aiba dimensiuni diferite

Test parametric (puternic)

Testul Student sau Testul t (autor William Gosset)

Page 6: Comparea mediilor

6

Cat de mare trebuie sa fie diferenta dintre doua medii?

Ex1: Ip

c

: Elevii care participa la activitati interactive de preventie

Page 7: Comparea mediilor

7

Distributia ipotezei nule

Diferenţa dintre medii

Populatia 1

Elevii cu care se lucreaza interactiv la clasa sau extrascolar

Populatia 2

Elevii carora li se distribuie doar materiale scrise

Eş. 1 m11

- m21

Eş. 2

Eş. 1

Eş. 2

Eş. 3

m12

- m22

m13

- m23Eş. 3

Page 8: Comparea mediilor

8

Distributia ipotezei nule

Problema de rezolvat: diferenta dintre mediile celor doua esantioane este suficient de mare sa nu se datoreze doar intamplarii?

Daca s-ar datora doar intamplarii (Ipo) cele doua medii (m1

si m2) ar face parte din aceeasi populatie diferenta dintre ele ar tinde catre 0

Va trebui sa comparam diferenta noastra cu marimi care s-ar obtine prin extragerea aleatoare a doua esantioane dintr-o aceeasi populatie distribuita normal in jurul mediei 0

µ1-µ2 = 0

(m1-2 – m2-2) (m1-3 – m2-3)

(m1-1 – m2-1)

Page 9: Comparea mediilor

9

Testul z pentru esantioane mari

Mediile de esantionare tind catre media populatiei, daca esantioanele sunt suficient de mari (teorema limitei centrale)

Mediile de esantionare au o distributie normala, daca volumul esantioanelor e mare (teorema limitei centrale)

Daca ambele esantioane apartin aceleiasi populatii (Ipo), diferenta dintre medii tinde catre 0 Distributia diferentelor mediilor fata de zero (Ipo ) este o distributie z standardizata (normala, m=0, σ=1)

z este raportul dintre diferenta mediilor si eroarea standard a diferentei

Eroarea standard a diferentei = suma erorilor standard a celor doua esantioane

2

22

1

21

21

nn

mmzσσ +

−=

Page 10: Comparea mediilor

10

Testul z pentru esantioane mari

Nivelul de semnificatie p asociat testului z se afla din tabelele cu ariile de sub curba normala si ±z , valoarea calculata

Aria cuprinsă între curba normală, medie şi valoarea Z Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59 0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53 0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41 0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17 0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79

0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24 0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49 0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52 0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33 0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89

1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21

...

Page 11: Comparea mediilor

11

Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

1. Distributia diferentei dintre medii nu este normala (nu are forma de clopot) si este cu atat mai ascutita cu cat dimensiunile esantioanelor sunt mai mici

Marimea t (calculata dupa aceasi formula ca z) depinde de gradele de libertate (df)

df = n1 + n2 – 2

2

22

1

21

21

ns

ns

mmt+

−=

Obs. La esantioane mici la calculul variantei (s2 ) in loc de n se foloseste n-1

Page 12: Comparea mediilor

12

Testul Student pentru esantioane mici (t )

Nivelul de semnificatie se determina din tabelele cu valori t

Tabel cu valori critice pentru testul t . Nivele de semnificaţie pentru test direcţional (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 . Nivele de semnificaţie pentru test nedirecţional (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 . 1 3.078 6.314 12.706 31.821 63.657 636.619 2 1.886 2.920 4.303 6.965 9.925 31.689 3 1.638 2.353 3.182 4.541 5.841 12.941 4 1.533 2.132 2.776 3.747 4.604 8.610 5 1.476 2.015 2.571 3.365 4.032 6.859 6 1.440 1.943 2.447 3.143 3.707 5.959 7 1.415 1.895 2.365 2.998 3.499 5.405 ...

Page 13: Comparea mediilor

13

Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

2. Daca variantele din cele doua populatii de provenienta a esantioanelor sunt egale, formula erorii standard a diferentei introduce distorsiuni mari

se foloseste formula variantei cumulate (s2cum)

Marimea t pentru variante egale:

)11(2

)1()1(

2121

222

211

21

nnnnsnsn

mmt+

−+−+−

−=

2)1()1(

21

222

2112

−+−+−=

nnsnsnscum

Page 14: Comparea mediilor

14

Exemplu: calcul manual

Ip0 nu poate fi respinsa

. Nivele de semnificaţie pentru testul direcţionat (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 Nivele de semnificaţie pentru testul nedirecţionat (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 . … 14 1.345 1.761 2.145 2.624 2.977 4.140 …

Esantion 1: Esantion 2:Preventie cu metode interactive (discutii, activitati) Preventie cu metode indirecte (brosuri, pliante)

X1 k1 x1*k1 x-m1 (x-m1)2 (x-m1)

2* k1 X2 k2 x2*k2 x-m2 (x-m2)2 (x-m2)

2* k2

6 1 6 -2.14 4.59 4.59 5 1 5 -2.33 5.44 5.447 1 7 -1.14 1.31 1.31 6 2 12 -1.33 1.78 3.568 2 16 -0.14 0.02 0.04 7 2 14 -0.33 0.11 0.229 2 18 0.86 0.73 1.47 8 2 16 0.67 0.44 0.89

10 1 10 1.86 3.45 3.45 9 1 9 1.67 2.78 2.7810 1 10 2.67 7.11 7.11

7 57 10.86 9 66 20.00media m1 = 8.14 media m2 = 7.33varianta s1

2=10.86/(n1 -1) = 1.81 varianta s22=20/(n2 -1) = 2.50

diferenta intre medii m1 - m2 = 0.81scom

2 = ((n1-1)*s12 +(n2-1)*s2

2 / (n1+n2-2)) = 2.20Es = sqrt (scom

2 * (1/n1+1/n2) ) = 0.75

t = (m1-m2) / Es = 1.08df = n1+n2-2=9+7-2=14t critic = 2,145 p > 0,20 > 0,05

Tabel cu valori t

Page 15: Comparea mediilor

15

Exemplu: Prezentarea rezultatelor

1. Se prezinta mediile variabilei cantitative calculate pentru pentru cele doua esantioane si se fac comparatii directe

Ex: m

1

= 8.14; m

2

= 7.33 m

1

> m

2

, diferenta de 0.8 puncte

Page 16: Comparea mediilor

16

SPSS: COMPARE MEANS, Independet Sample T Test

T-TestGroup Statistics

Metoda preventie N Mean Std. Deviation Std. Error Mean

Nivel cunostinte HIV Indirecte 9 7.33 1.581 .527

Interactive 7 8.14 1.345 508

Independent Samples Test Levene's Test for

Equality of Variances

t-test for Equality of Means

F Sig. t df Sig. (2-tailed)

Mean Differen

ce

Std. Error

Difference

95% Confidence Interval of the Difference

Lower Upper

Nivel cunostinte HIV

Equal variances assumed

.338 .570 -1.082 14 .298 -.810 .748 -2.414 .795

Equal variances not assumed

-1.105 13.839 .288 -.810 .732 -2.382 .763

Page 17: Comparea mediilor

17

Problema egalitatii variantelor

Formula de calcul al erorii standard a diferentelor (numitorul din formula de calcul al lui t) este diferita pentru esantioane provenind din populatii cu variante egale sau, respectiv, diferite

nevoia testarii egalitatii variantelor in populatie

Ip0: Variantele sunt egale

Page 18: Comparea mediilor

18

Testul Ficher (F)

Cum determinam daca cele doua esantioane provin din populatii cu acelasi grad de omogenitate (variante egale) ?

Testul Ficher de egalitate a variantelor:

unde s12 este varianta mai mare si s2

2 varianta mai mica (de obicei)

Nivelul de semnificatie a lui F depinde de doua grade de libertate: df1 = n1 - 1 si df2 = n2 - 1

Tabel cu valori critice pentru testul F A. Nivelul p = 0.05 B. Nivelul p = 0.01 df1 2 3 4 … df1 2 3 4 … df2 df2 . 2 19.00 19.16 19.25 2 99.00 99.17 99.25 3 9.55 9.28 9.12 3 30.81 29.46 28.71 4 6.94 6.59 6.39 4 18.00 16.69 15.98 5 5.79 5.41 5.19 5 13.27 12.06 11.39 6 5.14 4.79 4.53 5 10.91 9.78 9.15 7 4.74 4.35 4.12 7 9.55 8.45 7.85 ... …

22

21

ssF =

Page 19: Comparea mediilor

19

SPSS: COMPARE MEANS, Independet Sample T Test

T-TestGroup Statistics

Metoda preventie N Mean Std. Deviation Std. Error Mean

Nivel cunostinte HIV Indirecte 9 7.33 1.581 .527

Interactive 7 8.14 1.345 .508

Independent Samples Test Levene's Test for

Equality of Variances

t-test for Equality of Means

F Sig. t df Sig. (2-tailed)

Mean Differen

ce

Std. Error

Difference

95% Confidence Interval of the Difference

Lower Upper

Nivel cunostinte HIV

Equal variances assumed

.338 .570 -1.082 14 .298 -.810 .748 -2.414 .795

Equal variances not assumed

-1.105 13.839 .288 -.810 .732 -2.382 .763

Page 20: Comparea mediilor

20

Testul t pentru esantioane perechi

Ipoteze in care esantioanele nu sunt independente

Individul statistic1. un individ statistic in doua ipostaze:

inainte si dupa o interventie inainte si dupa o perioada de timp inainte si dupa o actiune

2. individul statistic este cuplul:sot - sotiecopil - parinteelev - profesor

3. individul statistic este perechea:individ din – individ corespondent ingrupul experimental grupul de controlpereche de gemeni

Variabile de comparat - atitudini, cunostinte, comportamnete, etc.- se urmareste sesizarea diferentelor: se masoara cu acelasi instrument- comparatiile se fac intre 2 variabile, nu intre 2 esantioane

Page 21: Comparea mediilor

21

Testul t pentru esantioane perechi

Ex: Ip

c

: Nivelul cunostintelor privind riscurile infectiei cu virusul HIV, in

unde mD este media diferentelor individuale di = xi dupa – xi inainte

di = xindivid – xpereche

sD2 este varianta diferentelor individuale

df = n -1nsmtD

D2

=

Page 22: Comparea mediilor

22

Exemplu: calcul manual

Inainte de interventie

X1

Dupa interventie

X2 D = X2-X1 D-mD (D-mD)2

6 6 0 -1 16 8 2 1 17 9 2 1 17 7 0 -1 18 8 0 -1 18 9 1 0 08 10 2 1 1

suma: 50 57 7 6media: m1 = 7,143 m2 = 8,143 mD = 1varianta: sD

2= 6/(n-1) = 1

Es = sqrt (sD2 /n ) = 0.378

t = mD / Es = 2.646df = n-1 = 7-1 = 6t critic = 2,447 p < 0,05

. Nivele de semnificaţie pentru testul direcţionat (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 Nivele de semnificaţie pentru testul nedirecţionat (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 . … 6 1.440 1.943 2.447 3.143 3.707 5.959 …

se repincge Ip0, se accepta Ipc

Cuntintele despre HIV ale elevilor din program, inainte si dupa interventie

Tabel cu valori t

Page 23: Comparea mediilor

23

Exemplu: Prezentarea rezultatelor

1. Se prezinta mediile variabilei cantitative calculate pentru cele doua ipostaze si se fac comparatii directe

Ex: m

inainte

= 7,14; m

dupa

= 8,14 m

dupa

> m

inainte

diferenta de 1pct

Page 24: Comparea mediilor

24

Restrictii de utilizare a testului t

Situatii in care testul t nu poate fi folosit:

Cand distributia variabilei cantitative in populatie nu este normala (numai pt esantioane mici)

Cand avem de comparat mai mult decat doua medii, pentru ca nivelurile de semnificatie isi pierd semnificatia prin cumulare, chiar daca ele sunt acceptabile fiecare in parte analize ANOVA

Abordarea socanta, cu o baterie de variabile dependente de comparat fara justificare teoretica sau practica

Page 25: Comparea mediilor

25

Laborator SPSS: exercitiu 1

Fisierul de date: “1991 US General Social Survey”

Ipc: Barbatii au un nivel de educatie mai inalt decat femeile

Variabila dependenta: nivelul de educatie, operationalizat in numarul anilor de scoala absolviti

Variabila independenta: sexul

Comanda SPSS: COMPARE MEANS, Independent Sample, T Test

Se cere: a) analiza datelor cu SPSS b) interpretarea rezultatelor (pe o foaie de hartie, semnata)

Page 26: Comparea mediilor

26

Laborator SPSS: exercitiu 2

Fisierul de date: “Employee data.sav”

Ipc: Veniturile salariale ale angajatilor cresc semnificativ dupa angajare

Indvid statistic : salariatul inainte si dupa o perioada de timp

Perechea de variabile: - salariu curent - salariu la angajare

Comanda SPSS: COMPARE MEANS, Paired-Sample T Test

Se cere: a) analiza datelor cu SPSS b) interpretarea rezultatelor (pe o foaie de hartie, semnata)