Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul...

34
Categorii de teste Teste pentru variabile cantitative - (teste parametrice) Teste pentru variabile calitative (nominale sau ordinale) – (teste neparametrice).

Transcript of Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul...

Page 1: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Categorii de teste

Teste pentru variabile cantitative

- (teste parametrice)

Teste pentru variabile calitative (nominale sau ordinale)

– (teste neparametrice).

Page 2: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Teste parametrice sau non-parametrice?

Testele parametrice se utilizează când:

Variabile luate în studiu sunt de natură cantitativă;

Presupun o distribuţie normală în populaţie (ori eşantioane suficient de mari ca să putem folosi Teorema Limitei Centrale)

Testele parametrice se numesc astfel deoarece utilizează în relaţiile de calcul necesare obţinerii statisticii proprii, parametri repartiţiilor variabilelor testate (media (), varianţele (2).

Testele neparametrice utilizează când:

Distribuţia normală variabilelor este încălcată flagrant;

Nu se cunoaşte distribuţia variabilelor;

Variabilele sunt de natură calitativă (de tip ordinal sau nominal (categorial)).

Testele neparametrice nu se bazează pe utilizarea parametrilor unei distribuţii (medie, abatere standard) şi nu implică condiţii de distribuţie la fel de rigide ca în cazul testelor parametrice.

Page 3: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Testul u şi Testul t. (Testul lui Student)

Egalitatea mediei unei populaţii repartizate normal, cu o medie ipotetică.

Egalitatea mediilor a două populaţii repartizate normal.

Teste parametrice

Testele verifică ipotezele:

Page 4: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Testul t sau testul u?

Se aplică TESTUL u dacă:

1.se cunoaşte abaterea standard a variabilei la nivelul populaţiei;

2.daca numărul de subiecti cuprinşi în eşantionul comparativ este suficient de mare (de regula peste 30 de subiecţi).

Se aplică TESTUL t dacă nu se îndeplineşte una din condiţiile 1 sau 2.

Page 5: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

I. Testul u al ipotezei egalităţii mediei cu o medie ipotetică

Se testează ipoteza nulă H0: =0, 0 fiind media ipotetică.

Testul u

Page 6: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Etapele unui test statistic

1. Specificăm ipoteza nulă şi ipoteza alternativă. 2. Alegem statistica adaptată situaţiei. 3. Alegem nivelul de semnificaţie şi pe baza sa calculăm

pragul de separare (între valorile “acceptabile” şi cele considerate ca “inacceptabile”).

4. Calculăm valoarea statisticii, folosind datele din eşantion (ales aleator).

5. Decidem, prin compararea valorii calculate cu pragul dat de nivelul de semnificaţie, dacă respingem sau nu ipoteza nulă.

Page 7: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pasul 1: Specificarea ipotezelor nulă şi

alternativă

Ipoteza nulă H0 este ipoteza care trebuie testată, testul efectuându-se sub prezumţia că ipoteza nulă ar fi adevărată.

Ipoteza alternativă HA este acea ipoteză care într-un sens sau altul contrazice ipoteza nulă. Această

ipoteză se mai numeşte şi ipoteza de lucru.

Page 8: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pasul 2.

Alegem statistica adaptată situaţiei.

n

xu

0

a) dacă dispersia populaţiei 2 este cunoscută valoarea lui u se calculează cu formula:

unde n este volumul selecţiei extrase din populaţie X este media selecţiei 0 este media ipotetică este abaterea standard a populaţiei. Pe baza acestei formule se calculează valoarea lui u pe care îl

numim ucalculat.

b) dacă nu este cunoscută dispersia populaţiei 2 se calculează cu formula:

n

s

xu 0

Page 9: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pasul 3.

Alegem nivelul de semnificaţie şi pe baza sa calculăm pragul de separare (între valorile “acceptabile” şi cele considerate ca “inacceptabile”).

de obicei se alege un nivel de semnificaţie între 0,1%

( =0.001) şi 5%. ( =0.05)

Page 10: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pasul 4

Calculăm valoarea statisticii, folosind datele din eşantion (ales aleator).

Se cunoaşte

n

xu

0

Se obţine un u calculat

n

s

xu 0

Nu se cunoaşte

Page 11: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pasul 5. Decidem, prin compararea valorii calculate cu pragul dat de nivelul de

semnificaţie, dacă respingem sau nu ipoteza nulă.

Se compară ucalculat cu valorile lui u din tabele pentru diferite nivele de semnificaţie. (Pentru se iau valorile de 0,05; 0,01 şi 0,001) Dacă ucalculat u0,05 ipoteza se acceptă , ceea ce înseamnă că diferenţa dintre media populaţiei şi media ipotetică este nesemnificativă. Această diferenţă se datorează unor factori întâmplători Dacă ucalculat u0,05 ipoteza se respinge adică între media populaţiei şi media ipotetică există diferenţe semnificative. În această situaţie se poate specifica cât de semnificativă este diferenţa. Dacă u0,05ucalculat u0,01 diferenţa se consideră semnificativă

Dacă u0,01ucalculat u0,001 diferenţa este distinct semnificativă Dacă ucalculat u0,001 diferenţa este foarte semnificativă

Page 12: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Exemplu.

Să se testeze ipoteza nulă H0:=1,78

Calculăm valoarea lui u.

u0,05=1,96

ucalculat <u0,05

Ipoteza se acceptă, diferenţa dintre (cea mai bună estimaţie a mediei populaţiei ) şi media ipotetică 0 (0=0) nu este

semnificativă.

798.0

125

12.1

70.178.1

calculatu

regiune

respinsă regiune

respinsă

regiune

acceptată

Talia medie a unui eşantion de 125 de băieţi din FMVT este de 1,78 m. Considerând că populaţia are o distribuţie normală cu media 1,70 şi deviaţia standard de 1,12, să se verifice dacă media eşantionului este egală cu cea a populaţiei.

Page 13: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

b) dacă 2 nu este cunoscut şi n120, testul u va acea forma:

n

s

xu 0

n este volumul selecţiei extrase din populaţie este media selecţiei 0 este media ipotetică S este abaterea standard a selecţiei

Se foloseşte abaterea standard a selecţiei

x

Page 14: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Exemplu:

Să se specifice dacă între producţia medie de lapte a vacilor din rasa Bălţată Românească şi producţia medie 0=3945 l este

diferenţă semnificativă ştiind că măsurându-se producţia de lapte a 400 de vaci s-a găsit o producţie medie de 3824 l cu o abatere standard de 600 l.

Se foloseşte formula:

n

s

xu 0

se calculează ucalculat=-4,03 ucalculat = (3824-3945)/(600/sqrt(400))=4,03u0,05

deci ipoteza nulă se respinge. ucalculat u0,001

Diferenţa dintre producţia medie lapte a vacilor din rasa Bălţată Românească şi media ipotetică de 3945 este foarte semnificativă.

regiune

respinsă regiune

respinsă regiune

acceptată

Page 15: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Problema 1.

Se pune problema dacǎ în cazul unui tratament cu un anumit tip de medicament care cauzează vasoconstricţie, acesta influenţează tensiunea arterialǎ sistolicǎ a pacienţilor.

Se ştie că media tensiunii arteriale sistolice la o populaţie de adulţi sănătoşi este de 120mm Hg şi deviaţia standard 10mm Hg.

Page 16: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Rezolvare:

Pentru a răspunde la această întrebare se ia în studiu un eşantion de 40 de indivizi aleşi aleator din populaţia de adulţi sănătoasă care au consumat în prealabil un anumit medicament ce produce vasoconstricţie (mpv).

Page 17: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Nr_

id

TAS

(mm/Hg)

Nr_

id

TAS

(mm/Hg)

Nr_

id

TAS

(mm/Hg)

1 126 14 121 27 129

2 130 15 140 28 124

3 135 16 135 29 131

4 116 17 115 30 127

5 122 18 135 31 127

6 126 19 132 32 125

7 128 20 128 33 140

8 130 21 126 34 115

9 123 22 125 35 110

10 124 23 115 36 112

11 140 24 117 37 125

12 125 25 121 38 143

13 120 26 125 39 122

40 135

Page 18: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Analiza problemei

Dorim să comparăm TAS pentru cei care au consumat medicament care provoacă vasoconstricţie (mpv) cu TAS la populaţia sănătoasă care nu au consumat mpv.

Variabila TAS este cantitativǎ continuǎ, deci calcularea mediei are sens. (SE POATE APLICA UN TEST PARAMETRIC)

Metoda cea mai simplă este de a compara media TAS a indivizilor selectaţi în eşantion cu media TAS a populaţiei.

Se calculează media TAS a celor 40 de pacienţi măsurată după ce aceştia au consumat medicamentul care produce vasoconstricţie

Page 19: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Analiza problemei

Ipoteza nulă poate să fie adevărată sau falsă. Dacă este adevărată ipoteza nulă va reprezenta şi concluzia studiului, dar dacă este falsă trebuie să acceptăm o ipoteză alternativă care este negaţia ipotezei nule şi anume H1: media TAS a pacienţilor care au consumat un anumit mpv diferă de media TAS a populaţiei sănătoase.

Această diferenţă poate să fie din cauză că H1: media TAS a pacienţilor care au consumat un anumit mpv este mai mică decât media TAS a populaţiei sănătoase sau H1: media TAS a pacienţilor care au consumat un anumit medicament mpv este mai mare decât media TAS a populaţiei sănătoase (pentru aceste ipoteze este destul aplicarea unui test unidirecţional – one-tail test) .

Se formulează ipoteza nulă H0: Presupunem că media TAS a pacienţilor care au consumat mpv nu diferă de media TAS a populaţiei sănătoase care nu a consumat mpv

Page 20: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Se cere:

Stabiliţi care dintre ipoteze se confirmă: Ipoteza nulă Ho: Presupunem că media TAS a

pacienţilor care au consumat mpv nu diferă de media TAS a populaţiei sănătoase care nu a consumat mpv

Ipoteză alternativă H1: media TAS a pacienţilor care au consumat un anumit mpv diferă de media TAS a populaţiei sănătoase.

Ipoteză alternativă H1: media TAS a pacienţilor care au consumat un anumit mpv este mai mică decât media TAS a populaţiei sănătoase

Ipoteză alternativă H1: media TAS a pacienţilor care au consumat un anumit medicament mpv este mai mare decât media TAS a populaţiei sănătoas

I. Comparaţi media TAS a pacienţilor care au consumat un anumit medicament care produce vasoconstricţie cu media teoretică (cunoscută) pentru populaţia de adulţi sănătoşi cu ajutorul unui test statistic.

II. Calculaţi intervalul de încredere pentru media TAS necunoscută a populaţiei care a consumat un medicament ce produce vasoconstricţie ştiind media eşantionului.

Page 21: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Se cere:

1. Stabiliţi testul statistic potrivit în acest caz

2. Verificaţi dacă sunt îndeplinite condiţiile pentru aplicarea testului statistic

3. Aplicaţi testul în Excel.

4. Formulaţi concluzia studiului

Page 22: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Pentru a compara două medii trebuie aplicat un test statistic. Se formulează ipoteza nulă şi cea alternativă (vezi analiza problemei). Punctul 1. - alegerea testului statistic potrivit. Avem de comparat media m a eşantionului cu media a populaţiei. Variabila luatǎ în studiu este variabilǎ continuǎ. Deoarece n>30 şi se cunoaşte deviaţia standard a populaţiei putem aplica testul Z (normal) pentru compararea unei medii a unui eşantion cu media populaţiei.

Punctul 2. Verificarea condiţiilor: Condiţii pentru u-test: 1. Indivizii sunt aleşi aleator din populaţie. 2. Talia eşantionului n>30. 3. Este cunoscută deviaţia standard a populaţiei. 4. Observaţiile sunt distribuite normal în populaţie. Indivizii au fost aleşi aleator din populaţia sănătoasă (vezi modul de realizare a studiului) Talia eşantionului n = 40 > 30 Abaterea standard a populaţiei s = 10mm Hg este cunoscută.

Page 23: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Punctul 3

Aplicarea testului în Excel

Introduceţi datele într-un tabel Excel.

Introduceţi următorul tabel în coloana D: (am ales =0,05 nivelul de semnificaţie pentru testul statistic).

Page 24: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei
Page 25: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

3. Se calculează media aritmetică în celula E3 cu ajutorul funcţiei Average

(Insert-Function-Average, Number1 B2:B26).

4. Se calculează eroarea

standard în celula E7. Pentru a calcula eroarea standard se

va introduce în celula E7 următoarea formulă:

=E5/SQRT(E6) Clic Enter. SQRT este funcţia care calculează

rădăcina pătrată dintr-un număr.

Page 26: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

5. Se calculează parametrul Z în celula E8 după formula: . Selectaţi celula E8 şi introduceţi formula: =(E3-E4)/E7. Apăsaţi tasta Enter.

n

xxu 0

Page 27: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

6. Probabilitatea one-tailed. Vom afla probabilitatea one-tailed asociată cu Z calculat. Selectaţi celula E10. Introduceţi formula: =ZTEST(B2:B41;E4;E5). Apasaţi tasta Enter.

ZTEST – returnează probabilitatea corespunzătoare distribuţiei normale standard pentru compararea a două medii.

Page 28: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

7. Probabilitatea two-tailed.

Pentru a calcula probabilitatea two-tailed se poate dubla probabilitatea one-tailed. Selectaţi celula E12. Introduceţi formula: =2*E10. Apăsaţi tasta Enter.

Page 29: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

8. Interpretarea rezultatelor

Eroarea standard furnizează o aproximaţie a dispersiei datelor de la media populaţiei. Pentru acest exemplu se poate spune că media eşantionului pentru eşantioane de 40 de indivizi trebuie să fie într-o vecinătate de valoare 1,58 a mediei populaţiei. · Z este parametrul testului. · Alpha – Nivelul de semnificaţie pentru testul statistic. Nivelul de semnificaţie trebuie stabilit înainte. De obicei se alege valoarea 0,05.

Page 30: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Probabilitatea one-tailed – sau one-tailed p-value.

Din calcule rezultǎ cǎ p=0,00005 < 0,05 se poate trage concluzia că testul one-tailed este statistic semnificativ.

Ipoteza nulă H0 este infirmată. Se poate spune că media aritmetică a TAS a celor care au consumat medicamente ce produc vasoconstricţie este semnificativ mai mare decât media aritmetică a TAS a populaţiei sănătoase cu o eroare = 0,05.

Probabilitatea two-tailed– sau two-tailed p-value.

Din calcule rezultǎ cǎ P=0,0001 < 0,05

Deoarece probabilitatea obţinută este mai mică decât 0,05 se poate trage concluzia că testul two-tailed este statistic semnificativ.

Ipoteza nulă este infirmată. Se poate spune că media aritmetică a TAS a celor care au consumat medicamente ce produc vasoconstricţie este semnificativ diferită de media aritmetică a TAS a populaţiei sănătoase cu o eroare = 0,05.

Page 31: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Punctul II

Găsirea intervalului de încredere pentru medie

Intervalul de încredere al mediei populaţiei estimează intervalul care include media necunoscută a unei populaţii cu un anumit nivel de încredere. Când este 0,05, atunci vom avea un interval de încredere de 95%.

Intervalul de încredere se calculează cu formula: unde m este media aritmetică a eşantionului, Zcrit este Z critic two tailed, este eroarea standard a mediei.

n

sm

n

sm 96.1,96.1

Page 32: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei
Page 33: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei
Page 34: Categorii de testeileana.brudiu.ro/MVR/CURS/15.Teste parametrice. Testul egalităţii... · Testul t sau testul u? Se aplică TESTUL u dacă: 1.se cunoaşte abaterea standard a variabilei

Intervalul de încredere al mediei estimează intervalul care include media TAS

necunoscută a populaţiei care consumă medicamentul respectiv cu un anumit nivel de

încredere. Când este 0,05, atunci vom avea un interval de încredere de 95%.

In cazul nostru intervalul de încredere pentru media populaţiei este [123,03;129,22].

Putem afirma că media aritmetică a TAS a celor ce consumă medicamente ce produc

vasoconstricţie (a întregii populaţii) se găseşte în intervalul [123,03;129,22] cu o eroare

de 0,05.

Observaţie: Testul Z a fost semnificativ, deoarece media TAS a populaţiei sănătoase 120

nu aparţine intervalului de încredere [123,03;129,22], deci este diferită de media TAS a

populaţiei care consumă medicamentul

Interpretarea intervalului de încredere