Testarea ipotezelor statistice

7
Testarea ipotezelor statistice Etapele verificării ipotezelor statistice Identificarea ipotezelor (H 0 ,H 1 ) ce trebuie testate Alegerea testului statistic Specificarea nivelului de semnificaţie Stabilirea regiunii critice Rc Stabilirea unor presupuneri referitoare la populaţia ce va fi eşantionată (ex: normalitate) Calcularea valorii testului pe baza datelor din eşantion Utilizarea valorii testului pentru a calcula p-value si respingerea H 0 dacă p-value≤α Luarea deciziei statistice si aplicarea ei I. Teste pentru media populaţiei: dispersia σ 2 este cunoscută Testul “z” Se formulează ipoteza Se extrage un eşantion aleator din populaţie și se calculează media Se calculează valoarea statisticii z: Se stabileşte pragul de semnificaţie α (de regulă 0,05) Se compară valoarea calculată z cu o valoare tabelată zα (valoare critică) şi se ia decizia de acceptare/respingere 0 / x z n

description

Etapele verificării ipotezelor statistice; Teste pentru media populaţiei

Transcript of Testarea ipotezelor statistice

Page 1: Testarea ipotezelor statistice

Testarea ipotezelor statistice

Etapele verificării ipotezelor statistice

– Identificarea ipotezelor (H0,H1) ce trebuie testate

– Alegerea testului statistic

– Specificarea nivelului de semnificaţie

– Stabilirea regiunii critice Rc

– Stabilirea unor presupuneri referitoare la populaţia ce va fi eşantionată (ex: normalitate)

– Calcularea valorii testului pe baza datelor din eşantion

– Utilizarea valorii testului pentru a calcula p-value si respingerea H0 dacă p-value≤α

– Luarea deciziei statistice si aplicarea ei

I. Teste pentru media populaţiei: dispersia σ2 este cunoscută

Testul “z”

• Se formulează ipoteza

• Se extrage un eşantion aleator din populaţie și se calculează media

• Se calculează valoarea statisticii z:

• Se stabileşte pragul de semnificaţie α (de regulă 0,05)

• Se compară valoarea calculată z cu o valoare tabelată zα (valoare critică) şi se ia decizia de

acceptare/respingere

0

/

xz

n

Page 2: Testarea ipotezelor statistice

TEST Ipoteza nulă

H 0

Ipoteza alternativă

H A Decizia

bilateral m = m0 m ≠ m0

unilateral dreapta m ≤m0 m > m0

unilateral stânga m ≥m0 m < m0

Regiunea critică

Regiunea critică pentru:

a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga

/ 2 0

0

z z resping H

altfel accept H

0

0

z z resping H

altfel accept H

0

0

z z resping H

altfel accept H

Page 3: Testarea ipotezelor statistice

Exemplu

• Se știe că vânzările medii zilnice ale unui magazin alimentar sunt de 8000 lei, cu o abatere standard de

1200 lei.Magazinul organizează mai multe campanii publicitare pentru creşterea vânzărilor.

Pentru a vedea dacă a crescut volumul vânzărilor ca efect al publicităţii, se înregistrează vânzările zilnice

pe o perioadă de 64 zile şi se obţine un volum mediu zilnic de 8250 lei.

Se poate afirma, folosind o probabilitate de 95%, că volumul mediu al vânzărilor este semnificativ mai

mare în urma campaniei publicitare?

Soluţie-testul z

• Variabila de interes: X – volumul mediu al vânzărilor – presupunem o distribuţie normală

• Dispersia populaţiei este cunoscută, deci aplicăm testul z.

Ipotezele (test unilateral dreapta):

H0: μ ≤ μ0

H1: μ > μ0

• Pragul de semnificaţie:

• Valoarea critică: z(0,05)=1,65

• Valoarea testului:

• Verificarea:

z=1,67 > z(0,05)= 1,65 => respingem H0

=> acceptam H1 : putem afirma cu probabilitatea de 95% că volumul mediu al vânzărilor în urma capaniei

publicitare este semnificativ mai mare decât volumul mediu înainte de efectuarea campaniei publicitare.

Recomandări

• Un volum mare al eşantionului (n≥30) este adecvat când utilizăm procedura de testare utilizată în această

secţiune (testul z)

• Dacă n< 30 trebuie avută în vedere distribuţia populaţiei eşantionate şi anume:

– Dacă populaţia e normal distribuită, procedura de testare e cea pe care am descris-o şi poate fi

utilizată ptr orice volum al eşantionului

– Dacă populaţia nu e normal distribuită, dar e aproape simetrică, pentru un volum mic al

eşantionului, procedura de testare poate furniza rezultate acceptabile.

0.05 (5%)

1200

8250

80000

x

67,1

64

1200

80008250

z

Page 4: Testarea ipotezelor statistice

II. Teste pentru media populaţiei (μ) : dispersia σ2 este necunoscută

Testul “t”

• Se estimează dispersia populaţiei cu dispersia de eşantion:

• Se aplică testul “t. Se calculează valoarea statisticii:

• Valorile critice se obtin din tabelele repartiţiei t (Student), în funcţie de nivelul de semnificaţie α ales, cu

n-1 grade de libertate

Regiunea critică-testul t

Regiunea critică pentru

a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga

Exemplul 1 – testul t

• Un producător de bere afirmă că volumul unei cutii este de 0.33 litri. Inspectorii de calitate vor să verifice

acest lucru şi selectează aleator un eşantion de 16 cutii.

În urma prelucrării datelor, s-au obţinut următoarele rezultate:

Confirmă datele afirmaţia producătorului? Folosiţi un nivel de încredere de 95%.

• Variabila de interes: X – volumul unei cutii de bere – presupunem o distribuţie normală

• Dispersia populaţiei este necunoscută - va trebui estimată:

Volumul mediu ipotetic:

• Volumul mediu din eşantion:

• Pragul de semnificaţie:

2

2 1

( )

1

n

i

i

x x

sn

1

2

1

5.25

( ) 23.04

n

i

i

n

i

i

x

x x

2

2 1

( )23.04

1.5361 15

n

i

i

x x

sn

0 0.33

1 0.328

n

i

i

x

xn

0.05 (5%)

Page 5: Testarea ipotezelor statistice

• Ipotezele:

• Valoarea critică:

• Valoarea testului:

• Verificarea:

• Decizia : cu probabilitatea 95% nu sunt suficiente motive pentru a respinge ipoteza nulă.

Ex. 2. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul în anul curent. Valorile

previzionate: 2,60; 3,32; 1,80; 3,43; 2,00 (mld lei, preţurile anului anterior). Ştiind că profitul companiei în anul

anterior a fost de 2,01 mld. lei, media previziunilor experţilor este semnificativ mai mare decât profitul anului

anterior (pentru α = 0,05)?

Rezolvare. Media previziunilor experţilor este mld. lei, cu dispersia:

şi abaterea medie pătratică:

Testarea ipotezei statistice:

H0: μ ≤ 2,01,

H1: μ > 2,01 (test unilateral dreapta).

tα,n-1 = t0,05;4 = 2,132 => regiunea critică: t > tα,n-1

Cum t=1,874 < t0,05;4=2,132, nu putem respinge ipoteza că media profitului previzionată de cei 5 experţi pentru

anul curent este mai mică decât profitul anului trecut, de 2,01 mld. lei.

Recomandări

• Aplicabilitatea procedurii de testare în cazul în care σ2 e necunoscută, depinde de distribuţia populaţiei

eşantionate şi de mărimea eşantionului.

• Când populaţia e normal distribuită, procedura de testare furnizează acelaşi rezultat pentru orice n.

• Când populaţia nu e normal distribuită, procedura de testare furnizează rezultate aproximative:

– Pentru n≥30 rezultatele furnizate sunt bune în majoritatea cazurilor

0 0

0

:

:A

H

H

/ 2; 1 0.05/2;15 2.48 ( , 1)nt t TINV n

0 0.382 0.330.00038

/ 1.24 / 16

xt

s n

/ 2; 10.00038 2.48nt t

55070

4

2032

1

2

2,

,

n

xxs

i

63,2x

7402, ss

874,15/74,0

01,263,2

ns

xt

x

Page 6: Testarea ipotezelor statistice

– Dacă n< 30 şi populaţia e aproximativ normal distribuită, rezultatele furnizate sunt acceptabile

– Dacă populaţia prezintă asimetrie puternică, atunci este recomandată utilizarea eşantioanelor

mai mari de 50 unităţi.

Testarea ipotezei privind proporţia populaţiei

• Pentru variabile alternative (variabile cu 2 variante: admis/respins, DA/NU):

– media p în colectivitatea generală (proporţia succeselor) este raportul dintre nr. cazurilor

afirmative (cele care îndeplinesc condiţia cerută) şi numărul total de cazuri;

– dispersia în colectivitatea generală e p(1-p), iar abaterea medie pătratică este

– media pentru eşantion e notată cu w, dispersia w(1-w), abaterea medie pătratică

– Pentru testarea ipotezelor statistice privind proporţia este necesar ca np≥5 şi n(1-p)≥5 → numai

în acest caz distribuţia proporţiei este aproximativ normal distribuită.

Ipoteza nulă indică faptul că proporția este egală cu o valoare specificată în timp ce ipoteza alternativă

răspunde la una dintre cele trei întrebări:

– dacă proporţia este diferită de valoarea specificată (test bilateral):

– dacă proporţia este mai mare decât valoarea specificată (test unilateral dreapta):

– dacă proporţia este mai mică decât valoarea specificată (test unilateral stânga): .

• Testul statistic pentru proporţia p este:

• Regiunea critică (Rc) este dată de:

sau pentru testul bilateral;

pentru testul unilateral dreapta;

pentru testul unilateral stânga.

)1( pp

)1( ww

01 : ppH

0:1 ppH

01 : ppH

npp

pwz

/)01(0

0

2/zz 2/zz

zz

zz

Page 7: Testarea ipotezelor statistice

Ex. Managerul unui lanţ de magazine consideră (în urma unei analize financiare) că pentru un nou produs

comercializarea este profitabilă dacă procentul cumpărătorilor care ar dori să achiziţioneze produsul este mai

mare de 12%. El selectează 400 de cumpărători potenţiali şi află că 52 dintre aceştia vor achiziţiona produsul.

Pentru o probabilitate de 99% sunt suficiente dovezi care să convingă managerul să comercializeze produsul?

Rezolvare

Ipotezele sunt: (test unilateral dreapta).

Testul statistic este:

Cum şi z= 1,25 < 2,33,rezultă că nu ne aflăm în regiunea critică (Rc), deci nu avem suficiente

dovezi să respingem ipoteza nulă (procentul cumpărătorilor ≤12%) → recomandarea este să nu comercializeze

produsul.

12,0:0 pH 12,0:1 pH

25,1016,0

02,0

400/88,012,0

12,014,0

/)01(0

12,0

npp

wz

33,201.0 zz