02 Inferenta Test Ipot Power 2014

72
TESTAREA IPOTEZELOR PUTEREA TESTULUI MĂRIMEA EFECTULUI ANALIZA DE PUTERE M. Popa

description

statistica

Transcript of 02 Inferenta Test Ipot Power 2014

Page 1: 02 Inferenta Test Ipot Power 2014

TESTAREA IPOTEZELORPUTEREA TESTULUI MĂRIMEA EFECTULUIANALIZA DE PUTERE

M. Popa

Page 2: 02 Inferenta Test Ipot Power 2014

cuprins

1. Mecanismul inferenței cu privire la ipoteza cercetăriia) Ipoteza cercetării și ipoteza de nul

b) Scorul standard z pentru media grupului

c) Decizia cu privire la ipoteza de nul

2. Categorii de teste statistice (tablou sintetic)

3. Aspecte critice ale testării ipotezei de nul

4. Intervalul de încredere pentru testul statistic la nivelul populației

5. Metoda bootstrap pentru calcularea intervalului de încredere al testului statistic

Page 3: 02 Inferenta Test Ipot Power 2014

Cercetarea științifică

Proces de verificare a ipotezelor

Din punct de vedere statistic, verificarea ipotezelor este un proces de inferență Eșantion

Raționament indirect

Condiții, presupuneri, modele teoretice, proceduri, reguli decizionale

Inferența statistică este doar o componentă a procesului de verificare a ipotezelor…

Page 4: 02 Inferenta Test Ipot Power 2014

Piramida experimentală (Anderson, 2001)

Cadrul conceptual

Fenomenul cercetat

Comportamentul

Măsurarea

Modelulcercetării

Inferențastatistică

Interpretarea rezultatelor

Page 5: 02 Inferenta Test Ipot Power 2014

exemplu

studiu cu privire la nivelul satisfacției profesionale

se aplică o scală special construită,tuturor angajaților organizației (populație)

Rezultate: scor numeric medie pe întreaga instituție este μ=11; σ=2.5

unul dintre compartimente (n=30): m=10, s=1.5

Diferența m-μ indică o problemă de conducere în compartimentul respectiv?

Page 6: 02 Inferenta Test Ipot Power 2014

Ipoteza cercetării (alternativă)

”angajații compartimentului respectiv au un nivel de satisfacție mai redus decât ceilalți angajați„

scorurile angajaților din acel grup nu fac parte din distribuția scorurilor întregii instituții, ci dintr-o alta, specifică lor, cu o medie mai mică

Page 7: 02 Inferenta Test Ipot Power 2014

μe μp

H1 → µe<µp

H1

Populația din care fac parte TOȚI

angajații

Populația din care fac parte SUBIECȚII

DIN GRUPUL CERCETĂRII

Page 8: 02 Inferenta Test Ipot Power 2014

H0

μe= μp

NU EXISTĂ DOUĂPOPULAȚII DIFERITE

Populația din care fac parte SUBIECȚII

DIN GRUPUL CERCETĂRII

Populația din care fac parte TOȚI

angajații

Page 9: 02 Inferenta Test Ipot Power 2014

z=-2.22 μz=0

p=0.486p=0,014

1.4% 48.6%

Scorul standard z pentru grup

22.2

30

5.2

1110

ms

mz

Eroarea standard a mediei

Rezultate: • media organizației: μ=11; σ=2.5

• media compartimentului (n=30): m=10, s=1.5

Proiecția pe distribuția de nul (normală/t)

Page 10: 02 Inferenta Test Ipot Power 2014

Decizia cu privire la ipoteza de nul

Criterii propuse de Fischer prag alfa: p=0.05 (5%)

Valoare critică pe distribuția de nul

pentru alfa=0.05, z critic=1.65

Se respinge H0 dacă valoarea calculată este mai mare sau egalădecât valoarea critică

rezultatul CONFIRMĂ ipoteza cercetării

Se admite H0 dacă valoarea calculatăeste mai mică decât valoarea critică

rezultatul NU CONFIRMĂ ipoteza cercetării.

Sir Ronald Aylmer Fisher1890-1962

μz=0

45%

zcritic=-1.65

50%p=0.05

5%

Page 11: 02 Inferenta Test Ipot Power 2014

Decizie unilaterală

z=-2.22 μz=0

p=0,014

1.4%

zcritic=-1.65

Zona de respingerea ipotezei de nul (p=0.05)

Zona de admitere a ipotezei de nul (p=0.95)

Page 12: 02 Inferenta Test Ipot Power 2014

Decizie bilaterală

z=-2.22 μz=0

p=0.475p=0,014

1.4% 47.5%

zcritic=-1.96

Zona de respingerea ipotezei de nul (p=0.025)

Zona de admitere a ipotezei de nul

p=0.95

z=+2.22

zcritic=+1.96

Zona de respingerea ipotezei de nul (p=0.025)

p=0,014

1.4%

p=0.47547.5%

Decizia split-tailed (Harris, 2005)• decizie unilaterală• repartiția inegală a valorii alfa (0.05)

• în loc de 0.025/0.025• … de exemplu: 0.04 – 0.01• ???

Page 13: 02 Inferenta Test Ipot Power 2014
Page 14: 02 Inferenta Test Ipot Power 2014

2. Categorii de teste statistice

Bivariate Modele de cercetare cu două variabile (VI și VD)

Multivariate Modele ce cercetare cu mai mult de două variabile

Teste care vizează anumite proprietăți ale variabilelor Normalitatea (Kolmogorov-Smirnov sau Shapiro-Wilk)

Egalitatea (omogenitatea) dispersiei grupurilor (Levene)

Page 15: 02 Inferenta Test Ipot Power 2014

Tipuri de teste bivariate

Obiectivul

cercetării

Variabila

Independentă

Variabila

dependentă

Testul statistic

Aplicabil

1 2 3 4

Diferenţa

dintre

grupuri

Categorială

(nr. categ.)

una -I/R z/t pentru un eşantion

Nominală z pentru o proporţie

două

independente

I/R t pt. eşant. independente

Nominală z pentru două proporţii

Ordinală Mann-Whitney U

dependente

I/R t pt. eşant. dependente

Nominală testul semnului

Ordinală Wilcoxon

trei+

independenteI/R ANOVA unifactorială

Ordinală Kruskal-Wallis

dependenteI/R

ANOVA pt. măsurări

repetate

Ordinală Friedman

Asocierea

variabilelor

Interval/Raport I/R r Pearson

Ordinală Ordinală rs Spearman

Categorial (Nominală sau Ordinală) Categorială (N/O)Chi-pătrat

Testul exact Fischer

Page 16: 02 Inferenta Test Ipot Power 2014

6 pași ai modelului testării H0

1) Formularea unei ipoteze de nul (ca opus al ipotezei cercetării) supusă în mod direct testului statistic pentru a se face o inferență asupra ipotezei cercetării

obiective:

ipoteze cu privire la diferențele dintre medii

ipoteze cu privire la asocierea între variabile

2) Alegerea unui model teoretic pentru distribuția de eșantionare distribuția normală Gauss

distribuția t Student

distribuția Fischer (pentru analiza de varianță)

distribuția chi-pătrat

distribuția binomială (utilizată pentru testarea proporțiilor).

3) Fixarea criteriilor deciziei statistice anterioară procesului de măsurare, nu poate fi schimbată după efectuarea calculelor și se referă la:

Alegerea pragului alfa.

pragul alfa este 0.05.(0.01 sau 0.001.

Alegerea tipului de decizie (unilaterală sau bilaterală)

în mod obișnuit se utilizează decizia statistica bilaterală, care este mai conservatoare, chiar și atunci când ipoteza cercetării este formulată unilateral.

Page 17: 02 Inferenta Test Ipot Power 2014

6 pași ai modelului testării H0

4) Alegerea unui test statistic adecvat, pentru care se vor avea în vedere: identificarea variabilei independente și variabilei dependente;

identificarea scalei de măsurare pentru variabila dependentă, în funcție de care se va decide pentru un test parametric (cantitativ) sau pentru un test neparametric (ordinal sau nominal);

precizarea clară a obiectivului ipotezei (diferența dintre medii sau asocierea dintre variabile).

5) Calcularea testului statistic când testul este calculat manual, valoarea critică corespunzătoare pragului alfa ales trebuie citită în

prealabil dintr-un tabel al distribuției teoretice

când se utilizează un program computerizat, atunci acesta va calcula, pe lângă valoarea testului și probabilitatea exactă (p)

dacă p este egal sau mai mic decât alfa, se respinge ipoteza de nul

dacă p este mai mare decât alfa se admite ipoteza de nul

6) Decizia statistică (admiterea/respingerea ipotezei de nul)

Page 18: 02 Inferenta Test Ipot Power 2014
Page 19: 02 Inferenta Test Ipot Power 2014

3. Aspecte critice ale testării ipotezei de nul

Deși probabilitatea alfa=0.05 este mică, aceasta nu exclude posibilitatea să existe o valoare întâmplătoare, egală sau mai mare cu valoarea calculată.

Declararea unui rezultat ca fiind semnificativ este frecvent înțeleasă și interpretată ca fiind ”important”, sau ”semnificativ” din punct de vedere practic sau social” … fundamental greșit

diferența dintre două medii poate fi semnificativă și totuși să nu prezinte o relevanță practică deosebită

Termenului ”semnificativ” este considerată o alegere nefericită (Thompson, 1998)

formulare recomandată: ”semnificativ statistic” sugerează natura probabilistică a semnificației.

Page 20: 02 Inferenta Test Ipot Power 2014

Alte interpretări greșite

rezultatul are o probabilitate mare (egală cu nivelul de încredere) de a se repeta în cazul replicării cercetării

acest lucru îl spune ”puterea testului”

semnificația statistică indică probabilitatea ca rezultatul cercetării să fie întâmplător

Rezultatul nu este extras la întâmplare, ci decurge din procedura de cercetare

rezultatul indică probabilitatea ca eșantionul să fie reprezentativ

acest lucru îl spune ”eroarea standard”

semnificația statistică (prin nivelul de încredere) indicăprobabilitatea ca ipoteza cercetării să fie adevărată

decizia cercetătorului se referă la H0, nu la H1

Page 21: 02 Inferenta Test Ipot Power 2014

Dependența rezultatului de mărimea eșantionului

Valoarea testelor statistice se calculează cu formule care au la numitor eroarea standard putem crește valoarea testului și, implicit, șansa de respingere a ipotezei de nul, prin utilizarea unui volum mai mare de subiecți

aproape orice test statistic poate deveni semnificativ, dacă avem suficient de mulți subiecți

n r

3 0 .997

5 0.878

10 0.632

20 0.444

50 0.276

100 0.196

500 0.088

1000 0.062

5000 0.0278

10000 0.0196

Page 22: 02 Inferenta Test Ipot Power 2014

Argumente pro

propune un raționament obiectiv sustrage subiectivității imediate cercetătorului, iar concluzia pe care o propune poate fi verificată de alți cercetători

reprezintă o modalitate de a ”exclude” explicația alternativă (H0) Dacă nu putem dovedi adevărul H1, cel puțin putem să dovedi căipoteza opusă este puțin probabilă

Interpretarea greșită/abuzivă a rezultatului (valoarea p), nu ar trebui să fie un motiv de respingere a procedurii ca atare Recomandabil ar fi ca ea să fie utilizată și interpretată în mod corect

Page 23: 02 Inferenta Test Ipot Power 2014

Soluții?

J. Cohen (1997) Nu există o alternativă magică la testarea ipotezei de nul!

Înainte de a generaliza pe baza datelor cercetării, acestea ar trebui explorate mai profund (Exploratory Data Analysis - Tuckey)

Utilizarea mărimii efectului

Utilizarea intervalului de încredere

Analiza de putere

Testarea ”gradului de potrivire” (goodness-of-fit)

Probleme: nu există proceduri statistice pentru toate aceste deziderate

De exemplu, multe teste statistice nu au CI

chiar și atunci când există, programele uzuale nu le oferă

SPSS nu oferă intervale de încredere pentru r, de ex.

pentru anumite soluții statistice nu există programe accesibile și utilizabile pe scară largă

Page 24: 02 Inferenta Test Ipot Power 2014
Page 25: 02 Inferenta Test Ipot Power 2014

4. Intervalul de încredere pentru testul statistic la nivelul populației

Wilkinson, & Task Force on Statistical Inference, APA Board of Scientific Affairs. 1999

Valoarea testului descrie rezultatul cercetării la nivel de eșantion, fiind doar o estimare a acestei valori pentru populație

limitele intervalului de încredere oferă o indicație cu privire la precizia estimării la nivelul populației

Page 26: 02 Inferenta Test Ipot Power 2014

Intervalul de încredere pentru testul z pentru un singur eșantion

m=10

σ=2.5

µ=m±1.96*sm

Limita inferioară=10-1.96*0.45=9.11

Limita superioară=10+1.96*0.45=10.89

45.030

ms

Page 27: 02 Inferenta Test Ipot Power 2014

Intervalul de încredere pentru diferența dintre medii

µdif=media populaţiei de diferenţe (µ1-µ2)

mdif=diferenţa dintre mediile eşantioanelor cercetării (m1-m2 )

tcritic=valoarea lui t pentru nivelul de încredere ales (de regulă 95%)

sdif=eroarea standard a diferenţei

EXEMPLU:

difcriticdifdif stm

Page 28: 02 Inferenta Test Ipot Power 2014

Utilitatea intervalului de încredere

intervalul de încredere include (cu o probabilitate asumată) media ipotezei de nul (µdif=0)

Echivalent cu admiterea H0

N mic → eroare standard mare Risc de admitere a H0

Dacă rezultatul impune admiterea H0, se pot recalcula limitele cu N progresiv mărit, până ce intervalul de încredere exclude valoarea zero

se află de câți subiecți suplimentari am avea nevoie pentru a respinge H0 (…?!)

Page 29: 02 Inferenta Test Ipot Power 2014

5. Metoda bootstrap pentru calcularea CI

Logică similară pentru calcularea CI al mediei

Page 30: 02 Inferenta Test Ipot Power 2014
Page 31: 02 Inferenta Test Ipot Power 2014

PUTEREA TESTULUI

Page 32: 02 Inferenta Test Ipot Power 2014

Cuprins

Erori statistice Tip I

Tip II

Puterea testului Distribuția ipotezei cercetării

Mijloace de creștere a creșterii puterii

Mărimea efectului Indicatori ai mărimii efectului

Intervalul de încredere pentru mărimea efectului

Raportarea mărimii efectului

Analiza de putere Tipuri de analiză de putere

G*Power 3 - exemple de operare

Concluzii

Page 33: 02 Inferenta Test Ipot Power 2014

Erori statistice

Se referă la eroarea în raport cu “realitatea vieţii”, nu la

aplicarea greşită a procedurii de testare.

În raport cu „realitatea vieţii”, decizia cu privire la

ipoteza de nul poate fi corectă sau greşită

Cercetătorul nu poate şti cu certitudine dacă decizia

pe care o ia este cu adevărat corectă sau este greşită

(dacă ar putea, nu ar mai avea nevoie de statistică)

Page 34: 02 Inferenta Test Ipot Power 2014

Decizia statistic

ă

Acceptarea H0

“Adevărul vieţii” (necunoscut)

1. decizie corectă

p=1-alfa

H0 este adevărată

Respingerea H0

H0 este falsă

3. decizie corectăp=1-beta (power)

2. eroare de tip IP=alfa

4. eroare de tip IIp=beta

decizia statistică vs. “adevărul vieţii”

Page 35: 02 Inferenta Test Ipot Power 2014

z=0 zcalculat =+1.96

Eroarea de tip I

“fals pozitiv”

Nivelul de încredere

1-alfa=0.95

zcalculat =-1.96

Eroarea de tip I

“fals pozitiv”

p=0.025p=0.025

Eroarea de tip I şi nivelul de încredere

în condiţiile deciziei bilaterale

Page 36: 02 Inferenta Test Ipot Power 2014
Page 37: 02 Inferenta Test Ipot Power 2014

Puterea (1-beta) Probabilitatea respingerii H0 când H0 este falsă

Probabilitatea ca cercetarea să detecteze un ”efect” în eșantion, dacă aceasta există în realitate

”Efect”=diferență între medii sau corelații între variabile

Eroarea de tip II (beta) Probabilitatea admiterii H0 când H0 este falsă

pentru a cuantifica valoarea beta, trebuie să ne facem o idee despre distribuția H1

H1 este mai complicată decât H0

H0… diferența dintre două medii este 0 (altă explicație nu este)

H1… dacă diferența nu e zero, poate însemna orice…

Page 38: 02 Inferenta Test Ipot Power 2014

exemplu

am aplicat o scală de evaluare a agresivității… un grup de 6 bărbați (m1=20)

un grup de 6 femei (m2=16)

diferența dintre cele două medii este semnificativă statistic?

presupunem că ambele grupuri au aceeași abatere standard (omogenitatea varianței) s=4

Să presupunem că știm adevărul vieții (bărbații sunt mai agresivi decât femeile), deci că H1 este adevărată

În realitate nu avem de unde să știm cu certitudine acest lucru (altfel nu ar mai fi avut rost cercetarea)

Ca urmare, dacă datele cercetării impun admiterea H0, comitem o eroare de tip II

Pentru cuantificarea ei trebuie să construim distribuția H1

Page 39: 02 Inferenta Test Ipot Power 2014

Modelul teoretic pentru H0 și H1 va fi distribuția t

Diferența dintre ele este că: H0 are media în zero (μ1=μ2)

H1 are media diferită de zero (μ 1> μ 2) distribuție non-centrală cu media egală cu valoarea testului t

tcritic (df=10)=2.22

tcalculat=+1.73

tcalculat<tcritic → admitem H0

…eroare de tip II

n

ss

mmt

2

2

2

1

21

73.130.2

4

6

1616

1620

t

Page 40: 02 Inferenta Test Ipot Power 2014

Distribuția cercetării(non-centrală)

Distribuția de nul alfa=0.05/2

µ=0

t=1.73

tcritic=2.22

µ= 1.73

Zona de admitere H0

Zona de admitere H0 Zona de respingere H0

Zona de respingere H0

Eroare de tip II (beta) Puterea (1-beta)

0.60 0.40??

Page 41: 02 Inferenta Test Ipot Power 2014

Distribuția cercetării(non-centrală)

Distribuția de nul alfa=0.05/2

µ=0

t=173

tcritic=2.22

µ= 1.73

Zona de admitere H0

Zona de admitere H0 Zona de respingere H0

Zona de respingere H0

Eroare de tip II (beta) Puterea (1-beta)

tcalculat=2.22

0.50 0.50

Page 42: 02 Inferenta Test Ipot Power 2014

Distribuția cercetării(non-centrală)

Distribuția de nul alfa=0.05/2

µ=0 tcritic=2.22

Zona de admitere H0

Zona de admitere H0 Zona de respingere H0

Zona de respingere H0

Eroare de tip II (beta) Puterea (1-beta)

tcalculat=2.22

tcalculat=3.0

0.40 0.600.50 0.50

Page 43: 02 Inferenta Test Ipot Power 2014

Cât de mare ar trebui să fie puterea?

< 0.5 Probabilitate mai mare pentru eroare decât pentru decizie corectă

= 0.5 șanse egale între decizie corectă și eroare

50% șanse de a discrimina între o ipoteză a cercetării adevărată sau falsă!

> 0.5 Crește puterea de discriminare între decizie corectă și eroare

0.7 este considerat acceptabil

Presupune o eroare de tip II = 0.3

0.8 este considerat un compromis rezonabil între putere și eroarea de tip II

O puterea apropiată de 1 ar face inutilă cercetarea

Page 44: 02 Inferenta Test Ipot Power 2014
Page 45: 02 Inferenta Test Ipot Power 2014

Metode de creştere a

puterii testului

Page 46: 02 Inferenta Test Ipot Power 2014

creşterea volumului eşantionului (N)

maximizarea variabilităţii primare

Reducerea variabilității secundare

(variabile covariante, erori de măsurare)

modelul de cercetare

(intra-subiect/inter-subiect)

Testul bilateral / unilateral

Testele parametrice prezintă o putere statistică

mai mare decât cele neparametrice

Page 47: 02 Inferenta Test Ipot Power 2014

Variabilitatea distribuțiilor și puterea

Variabilitate mare

Variabilitate redusă

http://www.uvm.edu/~dhowell/SeeingStatisticsApplets/PowerT.html

Power

Power

Page 48: 02 Inferenta Test Ipot Power 2014
Page 49: 02 Inferenta Test Ipot Power 2014

MĂRIMEA EFECTULUI

Page 50: 02 Inferenta Test Ipot Power 2014

puterea testului depinde de valoarea lui t calculat media a distribuției populației cercetării

este simbolizată cu litera grecească δ (delta)

corespunde valorii zero de pe distribuția de nul

poate fi înțeleasă și ca valoare așteptată pentru t

Formula de calcul…

nn

2

21

2

2

2

1

21

*2

*2

*2

21

2

21

nn

21

2121 *

2

*2

*2

n

n

n

21 d dn

*2

Mărimea efectului

Page 51: 02 Inferenta Test Ipot Power 2014

Definiția mărimii efectului

indicator statistic care cuantifică mărimea diferenței dintre medii

intensitatea asocierii dintre variabile

Pentru diferența dintre două medii:

21 d

Page 52: 02 Inferenta Test Ipot Power 2014

d=0.5d=0.2

d=0.8

Indică gradul de suprapunere dintre H0 și H1

Page 53: 02 Inferenta Test Ipot Power 2014

Pentru exemplul nostru

Pentru grupuri de volum diferit și dispersii neomogene se utilizează formula dispersiei cumulate (pooledvariance)

Recomandări de interpretare (Cohen)

În ce condiții crește mărimea efectului? Diferență mai mare între medii

Dispersii mai mici

14

1620

d

mărimea efectului d

mare 0.8

medie 0.5

mică 0.2

21 d

Page 54: 02 Inferenta Test Ipot Power 2014

Indicatori ai mărimii efectului

Numeroși Indicatori care se bazează pe diferența standardizată dintre medii:

d al lui Cohen; delta (δ) al lui Glass sau g al lui Hedges.

Indicatori care se bazează pe gradul de asociere dintre variabile (de tipul corelației Pearson r)

care descriu procentul variabilității explicate de fiecare variabilă în raport cu cealaltă:

r, r2, R2 (coeficientul de regresie), η2 (eta pătrat, pentru ANOVA), ω2 (omega pătrat, pentru ANOVA), f (pentru ANOVA), φ (fi, pentru testul chi-pătrat), φc

(fi-Cramer, pentru testul chi-pătrat) și alții

Pot fi transformați unul în altul

Page 55: 02 Inferenta Test Ipot Power 2014

Echivalența indicatorilor mărimii efectului

http://imaging.mrc-cbu.cam.ac.uk/statswiki/FAQ/effectSize

Page 56: 02 Inferenta Test Ipot Power 2014

Intervalul de încredere pentru mărimea efectului

Page 57: 02 Inferenta Test Ipot Power 2014

Raportarea mărimii efectului

APA: neraportarea este o eroare!

Beneficiile raportării Permite includerea cercetării respective în studii de meta-analiză

Oferă un sprijin cercetătorilor care vor aborda în viitor aceeași temă

facilitează evaluarea măsurii în care rezultatele unei cercetări se potrivesc cu rezultate similare din literatura științifică

Page 58: 02 Inferenta Test Ipot Power 2014

Factori care afectează mărimea efectuluiCoe, R. (2002, 12-14 September). It's the Effect Size, Stupid. What effect size is and why it is important. Paper presented at the Annual Conference of the British Educational Research Association, University of Exeter, England

Neomogenitatea varianței grupurilor comparate Când se compară două grupuri, se recomandă utilizarea abaterii standard globale

Metoda este corectă dacă cele două ab. st. sunt echivalente

Restricția de amplitudine Limitarea artificială a variației variabilelor (vezi M. Popa: Restricția de amplitudine, o

amenințare ascunsă la adresa validității de criteriu (PRU, 2012))

Non-normalitatea distribuțiilor Interpretarea mărimii efectului se bazează pe condiția de normalitate a distribuției

Fidelitatea măsurării Eroarea de măsurare diminuează nivelul corelației (vezi M. Popa: ”Infidelitatile”

coeficientului de fidelitate Cronbach alfa (PRU, 2011)

Page 59: 02 Inferenta Test Ipot Power 2014

Soluții alternative la indicii de mărimea efectului

Utilizarea diferenței nestandardizate dintre medii, concomitent cu intervalul de încredere, preferabilă atunci când: Valorile sunt exprimate pe o scală familiară

Eșantionul este restricționat în amplitudine

Nu se întrunește condiția de normalitate a distribuțiilor

Abaterile standard nu sunt echivalente (heterodasticitate)

Fidelitate redusă (sau necunoscută) a măsurării

Page 60: 02 Inferenta Test Ipot Power 2014

Mărimea efectului

Semnificație

statisticăSuficient de mare Prea mică

Acceptabilă

(p≤0.05)Nu sunt probleme de inferență

Asumarea semnificației statistice

pentru rezultate neimportante

Inacceptabilă

(p>0.05)

Eșecul de a confirma rezultate

importante, pentru că sunt

nesemnificative statistic

Nu sunt probleme de inferență

Probleme ale inferenței statistice în funcție de mărimea efectului și decizia statistică

Page 61: 02 Inferenta Test Ipot Power 2014
Page 62: 02 Inferenta Test Ipot Power 2014

ANALIZA DE PUTERE

Page 63: 02 Inferenta Test Ipot Power 2014

Analiza de putere

proceduri care integrează mărimile statistice de care depinde putere cercetării: mărimea efectului

Alfa

eroarea de tip II

volumul eșantionului

variabilitatea distribuțiilor

Puterea

Rareori oferite de programele statistice PowerStaTim (Sava & Măricuțoiu, 2007)

G*Power 3 (Faul, Erdfelder, Lang, & Buchner, 2007)

Page 64: 02 Inferenta Test Ipot Power 2014

MĂRIMEA EFECTULUI

Mărimea tendinței datelor sub aspectul diferenței dintre

medii sau a corelației

NIVELUL ALFA

Probabilitatea de confirmare eronată a ipotezei cercetării

(uzual: 0.05… 0.01)

VOLUMUL EȘANTIONULUI

Prea mic: H0 nu poate fi respinsă

Prea mare: H0 respinsă prea ușor

PUTERE

Probabilitatea de a detecta un efect în date, atunci când acesta

există

Componentele analizei de putere

Page 65: 02 Inferenta Test Ipot Power 2014

Tipuri de analiză de putere

Analiza de putere apriorică (cea mai utilizată) Ce eșantion ne trebuie în funcție de nivelul dorit al puterii, nivelul erorii de tip I (alfa) și mărimea efectului care este preconizată a fi detectată cu probabilitatea 1-beta

Ce putere avem, în anumite condiții cunoscute: N, alfa și mărimea efectului estimată

De unde luăm mărimea efectului? Metoda inductiva:

Din articole și studii cu aceleași variabile

Combinarea mărimii efectului din mai multe studii (meta-analiză)

Metoda deductivă Teorii și modele relevante

Studii pe variabile similare

Estimare convențională Pur și simplu, o presupunem

Recomandabil o valoare sub medie… (< 0.5)

Page 66: 02 Inferenta Test Ipot Power 2014

Tipuri de analiză de putere

Analiza de putere post-hoc după finalizarea cercetării

scopul = calcularea puterii cercetării, în funcție de nivelul erorii de tip I (alfa), mărimea efectului la nivelul populației și mărimea eșantionului

Atenție, nu se va baza pe mărimea efectului la nivel de eșantion!!

Analiză retrospectivă --- considerată inacceptabilă

Page 67: 02 Inferenta Test Ipot Power 2014

Tipuri de analiză de putere

Analiza de putere senzitivă calculează mărimea critică a efectului la nivelul populației în funcție de

eroarea de tip I (alfa), puterea testului (1-beta) și volumul eșantionului

utilă cu precădere pentru evaluarea cercetărilor deja publicate și oferă răspuns la o întrebare de genul: ”ce mărime a efectului este capabilă să detecteze cercetarea, pentru o putere 1-beta=0.8, având în vedere mărimea eșantionului utilizat și nivelul erorii de tip I specificat de autor?”

Aprioric:

Estimarea capacității eșantionului disponibil pentru detectarea unei anumite mărimi a efectului

criteriul diferenței minime importante semnificative (Minimally Important DifferenceSignificant), (Harris, 2001)

Page 68: 02 Inferenta Test Ipot Power 2014

Tipuri de analiză de putere

Analiza criteriilor de decizie calculează valoarea lui alfa și a criteriilor asociate, în funcție de

putere (1-beta), mărimea efectului și volumul eșantionului

este considerat important pentru cazurile în care controlul erorii de tip I (alfa) este mai puțin important decât controlul erorii de tip II (beta)

De exemplu, în cazul testelor goodness-of-fit pentru anumite modele statistice, este foarte importantă minimizarea deciziilor greșite în favoarea modelului (H0)

cercetătorul poate calcula nivelul de semnificație (alfa) compatibil cu un prag beta=0.05, pentru un nivel scăzut al mărimii efectului

Page 69: 02 Inferenta Test Ipot Power 2014

Analiza de putere cu G*Power 3

Exerciții…

Page 70: 02 Inferenta Test Ipot Power 2014

concluzii

Analiza de putere nu este un lux, ci o necesitate

Avantaje directe utilizarea analizei de putere ca instrument de planificare a cercetării (determinarea volumul

eșantionului)

ca instrument de diagnostic (analiza unor cercetări publicate sub aspectul relevanței rezultatelor)

Avantaje indirecte cercetătorii vor fi utiliza eșantioane mai mari, necesare atingerii nivelului recomandat al

puterii;

centrarea atenției pe mărimea efectului, care este un element critic al oricărei cercetări

determinarea cercetătorilor de a se gândi mai mult la intensitatea efectului, decât la măsura în care rezultatul este semnificativ statistic

Page 71: 02 Inferenta Test Ipot Power 2014

concluzii

Dezavantaje înainte de a începe o cercetare se poate ajunge la concluzia că aceasta nu

merită a fi efectuată

mărimea estimată a efectului este prea mică

atingerea nivelului acceptabil al puterii (0.8) ar impune utilizarea unui eșantion mai mare decât își poate permite cercetătorul

conduce de obicei la eșantioane mai mari, implică creșterea costurilor cercetării, sub aspectul bugetului de timp, cât și din punct de vedere financiar

Page 72: 02 Inferenta Test Ipot Power 2014