Testarea ipotezelor statistice
description
Transcript of Testarea ipotezelor statistice
Testarea ipotezelor statistice
Etapele verificării ipotezelor statistice
– Identificarea ipotezelor (H0,H1) ce trebuie testate
– Alegerea testului statistic
– Specificarea nivelului de semnificaţie
– Stabilirea regiunii critice Rc
– Stabilirea unor presupuneri referitoare la populaţia ce va fi eşantionată (ex: normalitate)
– Calcularea valorii testului pe baza datelor din eşantion
– Utilizarea valorii testului pentru a calcula p-value si respingerea H0 dacă p-value≤α
– Luarea deciziei statistice si aplicarea ei
I. Teste pentru media populaţiei: dispersia σ2 este cunoscută
Testul “z”
• Se formulează ipoteza
• Se extrage un eşantion aleator din populaţie și se calculează media
• Se calculează valoarea statisticii z:
• Se stabileşte pragul de semnificaţie α (de regulă 0,05)
• Se compară valoarea calculată z cu o valoare tabelată zα (valoare critică) şi se ia decizia de
acceptare/respingere
0
/
xz
n
TEST Ipoteza nulă
H 0
Ipoteza alternativă
H A Decizia
bilateral m = m0 m ≠ m0
unilateral dreapta m ≤m0 m > m0
unilateral stânga m ≥m0 m < m0
Regiunea critică
Regiunea critică pentru:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
/ 2 0
0
z z resping H
altfel accept H
0
0
z z resping H
altfel accept H
0
0
z z resping H
altfel accept H
Exemplu
• Se știe că vânzările medii zilnice ale unui magazin alimentar sunt de 8000 lei, cu o abatere standard de
1200 lei.Magazinul organizează mai multe campanii publicitare pentru creşterea vânzărilor.
Pentru a vedea dacă a crescut volumul vânzărilor ca efect al publicităţii, se înregistrează vânzările zilnice
pe o perioadă de 64 zile şi se obţine un volum mediu zilnic de 8250 lei.
Se poate afirma, folosind o probabilitate de 95%, că volumul mediu al vânzărilor este semnificativ mai
mare în urma campaniei publicitare?
Soluţie-testul z
• Variabila de interes: X – volumul mediu al vânzărilor – presupunem o distribuţie normală
• Dispersia populaţiei este cunoscută, deci aplicăm testul z.
Ipotezele (test unilateral dreapta):
H0: μ ≤ μ0
H1: μ > μ0
• Pragul de semnificaţie:
• Valoarea critică: z(0,05)=1,65
• Valoarea testului:
• Verificarea:
z=1,67 > z(0,05)= 1,65 => respingem H0
=> acceptam H1 : putem afirma cu probabilitatea de 95% că volumul mediu al vânzărilor în urma capaniei
publicitare este semnificativ mai mare decât volumul mediu înainte de efectuarea campaniei publicitare.
Recomandări
• Un volum mare al eşantionului (n≥30) este adecvat când utilizăm procedura de testare utilizată în această
secţiune (testul z)
• Dacă n< 30 trebuie avută în vedere distribuţia populaţiei eşantionate şi anume:
– Dacă populaţia e normal distribuită, procedura de testare e cea pe care am descris-o şi poate fi
utilizată ptr orice volum al eşantionului
– Dacă populaţia nu e normal distribuită, dar e aproape simetrică, pentru un volum mic al
eşantionului, procedura de testare poate furniza rezultate acceptabile.
0.05 (5%)
1200
8250
80000
x
67,1
64
1200
80008250
z
II. Teste pentru media populaţiei (μ) : dispersia σ2 este necunoscută
Testul “t”
• Se estimează dispersia populaţiei cu dispersia de eşantion:
• Se aplică testul “t. Se calculează valoarea statisticii:
• Valorile critice se obtin din tabelele repartiţiei t (Student), în funcţie de nivelul de semnificaţie α ales, cu
n-1 grade de libertate
Regiunea critică-testul t
Regiunea critică pentru
a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
Exemplul 1 – testul t
• Un producător de bere afirmă că volumul unei cutii este de 0.33 litri. Inspectorii de calitate vor să verifice
acest lucru şi selectează aleator un eşantion de 16 cutii.
În urma prelucrării datelor, s-au obţinut următoarele rezultate:
Confirmă datele afirmaţia producătorului? Folosiţi un nivel de încredere de 95%.
• Variabila de interes: X – volumul unei cutii de bere – presupunem o distribuţie normală
• Dispersia populaţiei este necunoscută - va trebui estimată:
Volumul mediu ipotetic:
• Volumul mediu din eşantion:
• Pragul de semnificaţie:
2
2 1
( )
1
n
i
i
x x
sn
1
2
1
5.25
( ) 23.04
n
i
i
n
i
i
x
x x
2
2 1
( )23.04
1.5361 15
n
i
i
x x
sn
0 0.33
1 0.328
n
i
i
x
xn
0.05 (5%)
• Ipotezele:
• Valoarea critică:
• Valoarea testului:
• Verificarea:
• Decizia : cu probabilitatea 95% nu sunt suficiente motive pentru a respinge ipoteza nulă.
Ex. 2. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul în anul curent. Valorile
previzionate: 2,60; 3,32; 1,80; 3,43; 2,00 (mld lei, preţurile anului anterior). Ştiind că profitul companiei în anul
anterior a fost de 2,01 mld. lei, media previziunilor experţilor este semnificativ mai mare decât profitul anului
anterior (pentru α = 0,05)?
Rezolvare. Media previziunilor experţilor este mld. lei, cu dispersia:
şi abaterea medie pătratică:
Testarea ipotezei statistice:
H0: μ ≤ 2,01,
H1: μ > 2,01 (test unilateral dreapta).
tα,n-1 = t0,05;4 = 2,132 => regiunea critică: t > tα,n-1
Cum t=1,874 < t0,05;4=2,132, nu putem respinge ipoteza că media profitului previzionată de cei 5 experţi pentru
anul curent este mai mică decât profitul anului trecut, de 2,01 mld. lei.
Recomandări
• Aplicabilitatea procedurii de testare în cazul în care σ2 e necunoscută, depinde de distribuţia populaţiei
eşantionate şi de mărimea eşantionului.
• Când populaţia e normal distribuită, procedura de testare furnizează acelaşi rezultat pentru orice n.
• Când populaţia nu e normal distribuită, procedura de testare furnizează rezultate aproximative:
– Pentru n≥30 rezultatele furnizate sunt bune în majoritatea cazurilor
0 0
0
:
:A
H
H
/ 2; 1 0.05/2;15 2.48 ( , 1)nt t TINV n
0 0.382 0.330.00038
/ 1.24 / 16
xt
s n
/ 2; 10.00038 2.48nt t
55070
4
2032
1
2
2,
,
n
xxs
i
63,2x
7402, ss
874,15/74,0
01,263,2
ns
xt
x
– Dacă n< 30 şi populaţia e aproximativ normal distribuită, rezultatele furnizate sunt acceptabile
– Dacă populaţia prezintă asimetrie puternică, atunci este recomandată utilizarea eşantioanelor
mai mari de 50 unităţi.
Testarea ipotezei privind proporţia populaţiei
• Pentru variabile alternative (variabile cu 2 variante: admis/respins, DA/NU):
– media p în colectivitatea generală (proporţia succeselor) este raportul dintre nr. cazurilor
afirmative (cele care îndeplinesc condiţia cerută) şi numărul total de cazuri;
– dispersia în colectivitatea generală e p(1-p), iar abaterea medie pătratică este
– media pentru eşantion e notată cu w, dispersia w(1-w), abaterea medie pătratică
– Pentru testarea ipotezelor statistice privind proporţia este necesar ca np≥5 şi n(1-p)≥5 → numai
în acest caz distribuţia proporţiei este aproximativ normal distribuită.
Ipoteza nulă indică faptul că proporția este egală cu o valoare specificată în timp ce ipoteza alternativă
răspunde la una dintre cele trei întrebări:
– dacă proporţia este diferită de valoarea specificată (test bilateral):
– dacă proporţia este mai mare decât valoarea specificată (test unilateral dreapta):
– dacă proporţia este mai mică decât valoarea specificată (test unilateral stânga): .
• Testul statistic pentru proporţia p este:
• Regiunea critică (Rc) este dată de:
sau pentru testul bilateral;
pentru testul unilateral dreapta;
pentru testul unilateral stânga.
)1( pp
)1( ww
01 : ppH
0:1 ppH
01 : ppH
npp
pwz
/)01(0
0
2/zz 2/zz
zz
zz
Ex. Managerul unui lanţ de magazine consideră (în urma unei analize financiare) că pentru un nou produs
comercializarea este profitabilă dacă procentul cumpărătorilor care ar dori să achiziţioneze produsul este mai
mare de 12%. El selectează 400 de cumpărători potenţiali şi află că 52 dintre aceştia vor achiziţiona produsul.
Pentru o probabilitate de 99% sunt suficiente dovezi care să convingă managerul să comercializeze produsul?
Rezolvare
Ipotezele sunt: (test unilateral dreapta).
Testul statistic este:
Cum şi z= 1,25 < 2,33,rezultă că nu ne aflăm în regiunea critică (Rc), deci nu avem suficiente
dovezi să respingem ipoteza nulă (procentul cumpărătorilor ≤12%) → recomandarea este să nu comercializeze
produsul.
12,0:0 pH 12,0:1 pH
25,1016,0
02,0
400/88,012,0
12,014,0
/)01(0
12,0
npp
wz
33,201.0 zz