II. Testul u al egalităţii mediilor a două populaţiiileana.brudiu.ro/MVR/CURS/16.Teste...

43
II. Testul u al egalităţii mediilor a două populaţii P 1 şi P 2 , două populaţii cu repartiţia normală ce au parametrii 1 şi 2 mediile, 1 2 şi 2 2 dispersiile. Din aceste populaţii se extrag câte o selecţie de volum n din populaţia P 1 pentru care se pot calcula media X 1 şi dispersia S 1 2 , de volum m şi P 2 cu media X 2 şi dispersia S 2 2 . Ipoteza care se testează este H0: 1 = 2

Transcript of II. Testul u al egalităţii mediilor a două populaţiiileana.brudiu.ro/MVR/CURS/16.Teste...

II. Testul u al egalităţii mediilor a două populaţii

P1 şi P2, două populaţii cu repartiţia normală ce au parametrii 1 şi 2 mediile, 1

2 şi 22dispersiile.

Din aceste populaţii se extrag câte o selecţie de volum n din populaţia P1 pentru care se pot calcula media X1 şi dispersia S1

2, de volum m şi P2 cu media X2 şi dispersia S22.

Ipoteza care se testează este H0:1=2

a) se cunosc dispersiile celor două populaţii(1

2, 22)

se foloseşte testul u sub următoarea formulă.

mn

xxu

2

2

2

1

21

se compară ucalculat cu u0,05 şi se ia decizia cum s-a văzut mai înainte.

b) 12 şi 2

2 sunt necunoscute şi m+n>120

se foloseşte testul u sub următoarea formulă.

mnS

xxu

11

21

2

)1(1 2

2

2

12

mn

SmSnS

Eşantion 1 Eşantion 2

volum n m

medie x1 x2

dispersie S12 S2

2

Exemplu Să se specifice dacă între cantitatea totală de grăsime în lapte la 109 vaci Bălţată Românească din zona Bihor şi 96 vaci Bălţată Românească din zona Arad există diferenţe semnificative. Cantitatea medie de grăsime este de 80,79 kg respectiv 92.01, iar varianţele sunt 609,37 şi 631,537.

n=109 m=96

X=80,79 X=92,01

S12=609,37 S2

2=631,537

Se testează ipoteza nulă H:1=2

mnS

xxucalculat

11

21

2

)1(1 2

2

2

12

mn

SmSnS

se obţine ucalculat=-3,22 cum u0,01ucalculat u0,001 diferenţa între cantitatea totală de grăsime din lapte din cele două zone este distinct semnificativă.

Testul t

Se foloseşte:

nu se cunoaşte dispersia (dispersiile) populaţiei (populaţiilor)

volumul (suma volumelor) selecţiei (selecţiilor) este mai mic ca 120.

a) compararea cu o medie ipotetică

Se verifică ipoteza H: =0

testul t este dat de formula:

n

s

xt 0

n este volumul selecţiei X este media selecţiei S este abaterea standard 0 este media ipotetică

Se citeşte din tabele t la nivele =0,05 şi n-1 grade de libertate. Dacă tcalculatt0,05;n-1 ipoteza se acceptă, adică nu sunt diferenţe semnificative.

Eroarea standard a mediei

b) compararea mediilor a două populaţii

Se verifică ipotezei H:1=2

se foloseşte formula:

mnS

xxtcalculat

11

21

2

)1(1 2

2

2

12

mn

SmSnS

n este volumul selecţiei extrase din prima populaţie m este volumul selecţiei extrase din a doua populaţie X1 este media primei selecţii X2 este media celei de-a două selecţii

Se citeşte din tabele t0,05;n+m-2. Se compară tcalculat cu valoarea t0,05;n+m-2, decizia se ia la fel ca în celelalte cazuri.

Comparare 0xcux

Dispersia(2) cunoscută

Dispersia(2) necunoscută

DA NU NU DA

DA DA NU DA NU

n

xxu 0

Se utilizează

teste neparametrice

n

s

xxu 0

n

s

xxt 0

Testul STUDENT egalitatea mediei cu o medie ipotetică

Este populaţia cu

exactitate sau cu aproximaţie normal distribuită

Este populaţia cu exactitate sau cu aproximaţie

normal distribuită

Este n30 Este n30 Este n30

SE POT APLICA TESTELE:

1 – Testul u in situaţia in care datele sunt

repartizate normal si se cunosc dispersiile (cu volum

mare de date / cel puţin 30).

2 – Testul t pentru date repartizate normal dar nu

se cunosc dispersiile (daca volumul de date este

mare, peste 30 testul t converge către u).

COMPARAREA MEDIILOR A DOUA ESANTIOANE

COMPARAREA MEDIILOR A DOUA ESANTIOANE

0

0.2

0.4

0.6

0.8

1

1.2 f(z)

sau p

M[z]=0 calculatZ

INTERPRETAREA GRAFICA IN CADRUL DECIZIEI MEDICALE

Prin calculul statisticii se deduce valoarea ucalculat si corespunzator acesteia se poate

determina valoarea semnificatiei p calculate.

DECIZIA Daca uc>uacceptat (tabelat) sau daca pcalculat>0,05 deducem existenta diferențelor semnificativ

statistic

Daca uc<uacceptat (tabelat) sau daca pcalculat<0,05 nu exista diferențe semnificative statistic

Programul Excel permite calculul probabilităţilor în cazul aplicării testul t Funcţia apelată este TTEST. Argumentele sunt:

1. Primul set de date 2. Al doilea set de date 3. Numărul de distribuţii urmărit (1 sau 2) 4. Tipul distribuţiei:

Valoarea probabilităţii mai mică decât 5% conduce la respingerea ipotezei. Între mărimile comparate există diferenţe semnificative. Valori mai mari de 5% conduce la acceptarea ipotezei

1 Împerecheat

2 Varianțe egale pentru două eșantioane (homoscedatic)

3 Varianțe inegale pentru două eșantioane (heteroscedatic)

Testul t

Prezintă variante diferite funcţie de:

1 – Datele sunt perechi (inainte / dupa tratament)

2 – Se cunoaste că varianțele sunt egale.

3 – Varianțele nu sunt egale (sau nu se cunoaște acest lucru).

Testul t (Student) este folosit de obicei în doua situatii: A. cele doua grupuri de observatii (ce trebuie

comparate) sunt obtinute de la aceiasi indivizi, testati de doua ori (de exemplu înainte si dupa un tratament). Este evident ca datele obtinute sunt "în perechi", prin urmare Type = 1. Se testeaza: a) în cazul unui test unilateral, afirmatia "în urma

tratamentului, situatia pacientului se îmbunatateste". Este evident ca va trebui sa controlam, anterior efectuarii testului, daca între mediile observatiilor exista relatia corespunzatoare afirmatiei (în caz contrar testul nu-si are rostul, el se aplica de fapt pentru afirmatia "în urma tratamentului, situatia pacientului se înrautateste"); în acest caz Tails = 1;

b) în cazul unui test bilateral, afirmatia "în urma tratamentului, situatia pacientului se modifica"; în acest caz Tails = 2;

B. cele doua grupuri de observatii sunt obtinute de la indivizi din grupuri net diferite (de exemplu, un grup este format din pacientii tratati cu un medicament, celalalt grup, cel de control, este format din pacientii "tratati" cu placebo).

De data aceasta Type este 2 sau 3, în functie de situatia variantelor celor doua grupuri.

De regula nu avem informati despre variante, ceea ce ne obliga sa acceptam ca ele ar fi diferite între ele (cazul heteroscedastic), ceea ce înseamna ca Type = 3.

Uni- sau bilateralitatea se trateaza exact ca în situatia a). Se testeaza de fapt afirmatia "pacientii tratati medicamentos se comporta mai bine (respectiv diferit) fata de cei tratati cu placebo".

Testul t este un test parametric, comparatia facându-se la nivelul mediilor.

Testul neparametric corespunzator, aplicabil în cazul datelor ordinale, este testul Wilcoxon.

Analizăm rezultatele obţinute în urma aplicării Testul t pentru verificarea egalităţii a

două medii set 1 set 2

150 309 140 188

148 410 150 259

152 290 150 205

156 315 155 225

179 196 157 228

164 246 158 258

171 239 159 224

170 369 160 283

181 186 165 300

190 393 167 322

200 396 169 209

215 252 170 167

210 319 172 220

190 328 204 292

225 184 210 199

238 175 216 229

260 151 250 312

290 182 279 201

325 304 312 296

395 160 325 202

360 191 356 185

410 354 397 296

Pacienţi trataţi cu un medicament M, Rezultate de laborator obţinute înainte (set 1) şi după tratament (set 2) (de exemplu, valori ale creatininei).

Scăderea valorilor caracterului cercetat după tratament conduce la

o primă concluzie:

• starea pacientului s-a îmbunătăţit, lucru ce se observă şi din

valoarea obţinută la media aritmetică a datelor observate înainte

şi după tratament.

Prin urmare, aceste date indică îmbunătăţirea stării pacienţilor după

tratamentul cu medicamentul M, ceea ce ne îndeamnă să credem în

adevărul ipotezei alternative:

(Ha): în urma tratamentului cu medicamentul M, valoarea creatininei scade. Valoarea p a acestei afirmaţii, obţinută printr-un test t pereche, este de 0,01581, confirmând adevărul ipotezei alternative. =TTEST(B2:C24;D2:E24;2;1)

P=0,0158098

În a doua alternativă:

Admite ca datele provin de la două populaţii diferite, primul set provine de la

pacienţii „trataţi” cu medicamentul M1, al doilea set de la pacienţii trataţi cu

medicamentul M2.

Media aritmetică a valorilor observate provenite din lotul tratat cu M2 este mai

mică decât a celor provebnite din lotul tratat cu M1.

=TTEST(B2:C24;D2:E24;2;2)

P=0,1559326 =TTEST(B2:C24;D2:E24;2;3)

P=0,1561907

Valoarea pentru p, obţinută prin testul t nepereche, este însă de 0.1559. O

asemenea valoare nu confirmă adevărul ipotezei alternative! Cu toate că

valoarea medie obţinută pentru lotul tratat cu M2 ne-ar putea tenta să

credem şi să afirmăm că există diferenţe semnificative, valoarea lui p

obţinută în urma aplicării testului infirmă rezultatul presupus.

TTEST(B2:C24;D2:E24;2;1) TTEST(B2:C24;D2:E24;2;2) TTEST(B2:C24;D2:E24;2;3)

P=0,0158098 P=0,1559326

P=0,1561907

rezultat

semnificativ

statistic

eşantion concluzia cercetării

Da mic rezultat important

Da mare importanţa practică posibilă dar incertă

Nu mic rezultat neconcludent

Nu mare ipoteza cercetării este, probabil, falsă

Puterea testului

„Puterea testului” este definită prin capacitatea sau „sensibilitatea” unui test statistic de a detecta un efect real (sau o legătură reală) între variabile.

Formulat în termeni statistici, puterea testului este probabilitatea de a respinge ipoteza de nulă atunci când ea este cu adevărat falsă, şi se exprimă ca 1-beta (probabilitatea erorii de tip II).

Cunoaşterea puterii unei cercetări este utilă în două situaţii:

In faza premergătoare a unei cercetări estimarea puterii este utilă pentru a evalua şansa de a obţine un rezultat semnificativ statistic în contextul unei cercetări.

După efectuarea unei cercetări, pentru a şti care este probabilitatea ca rezultatul acesteia să indice un „efect” al variabilei independente asupra variabilei dependente atunci când acest efect există şi în realitate.

In practică calcularea puterii unei cercetări se face cu programe

specializate.

Unul dintre cele mai accesibile şi mai cunoscut dintre acestea este

GPower, care poate fi descărcat gratuit de la adresa http://www.psycho.uni-

duesseldorf.de/aap/projects/gpower/ (Buchner, Erdfelder &Faul, 1997).

Factori care contribuie la creşterea puterii testelor statistice

1. Eroarea standard a mediei este cu atât mai mare cu cat eşantionul este mai mic. Ca urmare, una din modalităţile prin care putem creşte puterea este creşterea volumului eşantionului (N).

2. Dacă împrăştierea datelor de cercetare este mică, atunci puterea testului de a surprinde un efect semnificativ se reduce.

3. Reducerea erorilor de măsurare are ca efect mărirea puterii cercetării.

4. Testul bilateral reduce probabilitatea erorii de tip I, dar creşte probabilitatea erorii de tip II şi, implicit, reduce puterea.

Compararea mediilor provenite din două eşantioane independente – abordarea practică.

Martor Lot 1

10,79 13,20 12,17 12,35 11,14 13,26 14,88 11,85

9,46 10,86 12,31 12,87 10,84 13,89 11,17 10,94

10,95 12,46 11,68 12,28 10,83 12,56 12,39 10,73

11,28 11,62 12,80 11,92 12,64 12,33 11,45 11,15

11,41 13,28 12,45 13,07 12,52 14,85 12,45 11,72

11,44 12,96 12,41 12,51 11,73 12,36 12,30 11,08

11,38 10,63 10,21 11,82 11,78 13,13 11,95 11,72

11,88 11,13 10,40 11,95 12,07 11,81 12,75 12,37

10,80 11,80 11,55 11,18 12,35 13,33 13,02 12,68

12,48 11,85 12,53 11,40 12,12 13,30 12,18 12,48

12,23 11,87 12,07 11,27 12,45 11,18 12,92 11,89

11,25 10,17 11,96 12,64 12,64 10,20 11,78 12,55

12,13 11,23 11,48 12,91 12,77 12,79 13,54 11,68

12,60 11,57 11,56 9,03 12,79 12,58 10,12 11,57

11,77 12,48 10,95 12,85 11,81 11,63 12,93 12,04

11,75 11,39

Nivelul sangvin al calciului la un număr de 61 de pui broiler constituiţi în lotul L1, hrăniţi în condiţii de aport de aluminiu în raţie şi nivelul sangvin al calciului la un număr de 61 de pui broiler constituiţi în lotul Martor Exista diferenţe semnificative între nivelul sangvin al calciului între cele 2 loturi de pui?

Problema poate fi rezolvată în două

moduri: •metoda clasică, aplicând formula de calcul •metoda cu ajutorul programelor de calcul

implementate (Excel, Minitab, etc.)

Rezolvarea cu metoda clasică

21

2

21

11

nnS

xxt

p

2

11

21

2

22

2

112

nn

SnSnS p

loturile provin din aceiaşi populaţie, In această situaţie dispersiile se consideră egale

(Testul t pentru verificarea egalităţii a două medii (σ1,σ2 necunoscute cu σ1=σ2) ).

În urma efectuării calculelor se obţine:

martor Lot1

media 11,758852 12,186066

varianta 0,7727137 0,8848409

n 61 61

tcalculat=9,945. Această valoare se compară cu 1,96

Acestei valori, în urma verificării cu valorile tabelate pentru 120 de grade de libertate (df=n1+n2-2), îi corespunde o probabilitate foarte mica (p<0,01), ca urmare, ipoteza emisă, (H0: X1=X2) se respinge, acceptându-se ipoteza alternativă HA:X1X2.

Rezolvarea cu ajutorul funcţiei TTEST din Excel.

domeniul din foaia de calcul unde se găsesc caracteristice observate din primul eşantion.

domeniul din foaia de calcul unde se găsesc caracteristice observate din al doilea eşantion.

valoarea 1 dacă testul este unilateral sau valoarea 2 dacă testul este bilateral.

ultimul parametru poate lua valorile 1, 2 sau 3, astfel: dacă eşantioanele sunt perechi şi provin din aceiaşi populaţie, valoarea parametrului este 1, dacă eşantioanele provin din aceiaşi populaţie (se presupune că au varianţele egale) valoarea parametrului este 2, iar în situaţia în care eşantioanele provin din populaţii a căror dispersii nu sunt egale, valoarea parametrului este 3.

În urma apelării funcţiei TTEST, rezultatul obţinut care reprezintă probabilitatea ca ipoteza emisă (mediile celor două eşantioane să fie egale) să fie adevărată. Valoarea obţinută este mai mică decât 5%, ipoteza se respinge, între cele două eşantioane există diferenţe semnificative. Răspunsul la întrebarea: „Exista diferenţe semnificative între nivelul sangvin al calciului între cele 2 loturi de pui?” este DA, puii hrăniţi în condiţii de aport de aluminiu în raţie au nivelul sanguin al calciului diferit de cei hrăniţi fără aport de aluminiu în raţie

Rezolvarea cu ajutorul Data Analysis Tools din Excel.

Compararea dispersiilor a două eşantioane independente

Testul F (Fisher-Snedecor), se utilizează pentru a testa dacă variaţia unei variabile este mai mare într-o populaţie decât în alta.

Notăm cu σ12 varianţa în primul eşantion şi cu σ2

2 varianţa în cel de al doilea. Testul F compară varianţa σ1

2 a primului eşantion cu varianţa σ2

2 în cel de al doilea. Presupunem că prima din cele două valori este mai mare.

Etapele unui test statistic

1. Se specifică ipoteza nulă şi ipoteza alternativă. 2. Se alege statistica adaptată situaţiei. 3. Se alege nivelul de semnificaţie şi pe baza sa calculăm

pragul de separare (între valorile “acceptabile” şi cele considerate ca “inacceptabile”).

4. Se calculează valoarea statisticii, folosind datele din eşantion (ales aleator).

5. Se decide, prin compararea valorii calculate cu pragul dat de nivelul de semnificaţie, dacă respingem sau nu ipoteza nulă.

Pasul 1.

Formularea ipotezei nule şi a ipotezei alternative

H0: σ12 = σ2

2

H1: σ12 σ2

2

Pasul 2.

Alegerea statisticii (formulei) adaptată situaţiei:

Pasul 3.

Pasul 4.

Calculul valori lui F (Fcalculat)

Identificarea valorii critice.

Deoarece testul este bilateral se determină o singură valoare

critică dată de:

),,2

( 21 F

α nivelul de semnificaţie ales

v1=(n-1) unde n este volumul eşantionului care are dispersia mai

mare;

v2=(n-1) unde n este volumul eşantionul cu dispersia mai mică.

Pasul 5.

Regula de decizie este:

se acceptă H0 dacă valoarea calculată a testului este mai mică

decât valoarea critică.

se respinge H0 (se acceptă H1) dacă valoarea calculată a testului

este mai mare decât valoarea critică.

Compararea mediilor provenite din mai multe eşantioane independente

Pentru a pune în evidenţă în ce măsură unul sau mai mulţi

factori (sau chiar o combinaţie a acestora) influenţează în mod

esenţial asupra unei caracteristici rezultative se utilizează

analiza dispersională

Analiza dispersională este cunoscută şi sub denumirea de

analiză de varianţă (Anova),

Analiza varianţei (abreviat ANOVA) este metoda utilizata

atunci când se doreşte compararea a mai mult de doua medii

ANOVA ţine cont de variaţiile tuturor variabilelor şi le împarte

în:

variaţii între fiecare subiect şi media eşantionului din care

acesta face parte;

variaţii între mediile fiecărui eşantion şi media generala (media

mediilor tuturor eşantioanelor luate în studiu).

Utilizarea testului ANOVA impune acceptarea a trei premise:

1. Cazurile observate reprezintă un eşantion reprezentativ (de exemplu alcătuit prin tragere la sorţi) şi fiecare caz este independent (valoarea unei observaţii nu este dependenta în nici un mod de valoarea alteia).

2. Dispersiile populaţiilor sunt egale;

3. Valorile variabilei dependente trebuie să fie normal distribuite în cadrul fiecărui grup ca şi la toate nivelele variabilei dependente

Analiza funcţională unifactorială

Procedura One-Way ANOVA (ANOVA unifactorială) constă în analiza variantei (dispersiei) pentru o variabilă dependentă.

Este folosită pentru a testa ipoteza potrivit căreia mai multe medii sunt egale.

ANOVA este considerata o extensie a testului t pentru două eşantioane.

•Cele trei coloane etichetate VD EC,

VD NC şi VND NC - reprezintă fiecare,

observații pentru câte un eşantion

•Caracteristica observată fiind

valoarea măsurată a limfocitelor la 3

eşantioane de viţei

Rezultatele conţin două tabele, primul cu caracteristici specifice

analizei descriptive iar cel de-al doilea al analizei inferențiale

•P-value – Probabilitatea.

•Dacă p>0,05. se adevereşte

ipoteza nulă, că media

aritmetică a celor trei

eşantioane nu diferă

semnificativ, atunci

•Dacă p<0,05, atunci mediile

diferă semnificativ. In cazul

nostru p-value>0,05 deci

trebuie să acceptăm ipoteza

nulă.

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

În momentul în care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau nu semnificative statistic.

Răspunsul la această întrebare este dat de valoarea lui p calculată de orice program statistic la prelucrarea unor date.

În cazul testelor statistice, ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decât 0,05 iar programele de prelucrare statistică a datelor vor afişa o steluţă (*) în tabelul rezultatelor.

Semnificaţia lui p: reguli empirice

0,01 ≤ p < 0,05: rezultatul e semnificativ statistic (diferenţe semnificative)

0,001 ≤ p < 0,01: rezultatul e înalt semnificativ statistic (diferenţe distinct semnificative)

p < 0,001: rezultatul e foarte înalt semnificativ statistic (diferenţe foarte semnificative)

p ≥ 0,05: rezultatul e considerat nesemnificativ statistic

De reţinut!

Paşii testului statistic sunt identici.

Orice test statistic se poate interpreta din perspectiva valorii critice sau a intervalului critic şi respectiv din perspectiva valorii p.

Orice test statistic are asociat 2 tipuri de erori. Fiecare tip de eroare are o anumită semnificaţie.

Puterea unui test statistic este în relaţie cu eroarea de tip II şi depinde de volumul eşantionului.