VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă...

Post on 19-Jan-2020

11 views 0 download

Transcript of VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă...

1

Probabilităţi

= şansa ca un eveniment să aibă loc considerând toate rezultatele posibile

Valoarea predictivă a probabilităţii: Reflectă ce “ar trebui” să se întâmple şi nu ce o

să se întâmple efectiv

Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate fi 75% succes

Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului analizat de a estima caracteristica unei populaţii

2

Exemplu: distribuţia greutatii

Media = 69, s = 3

68,26% = 66-72

(168-183)

p=0,68

Mai mare de 78

(198)

P=0,0013

3

Principii generale In studiul într-o populaţie P a parametrilor a unei

caracteristici oarecare (cantitative sau calitative) adesea este necesar să se urmeze procedeul: 1. Se extrage un eşantion reprezentativ al acestei populaţii.

2. Prin mijloacele statisticii descriptive se descrie distribuţia caracteristicii pe eşantionul extras la etapa 1, fiindcă talia acestuia permite o investigare exhaustivă a sa. Astfel se poate determina frecvenţa observată, dacă este vorba de o caracteristică calitativă, sau se calculează media şi variaţia, în cazul unei caracteristici cantitative.

3. Prin mijloacele statisticii inferenţiale sau inductive se extind la întreaga populaţie rezultatele observate pe eşantion. Adica, pornind de la parametrii observaţi (frecvenţa, media, variaţia, etc) pe eşantion se încearcă să se estimeze parametrii “teoretici” ai întregii populaţii.

4

Cazul unei variabile X calitative

Frecvenţa teoretică p a variabilei X în populaţia P este

necunoscută.

Din populaţia P se extrage la întâmplare

eşantionul E reprezentativ.

In eşantionul E pentru variabila X se observă o

frecvenţă f.

Se încearcă să se estimeze valoarea

necunoscută a lui p cu ajutorul lui f observat.

5

Cazul unei variabile X cantitative

Media teoretică a variabilei X ca şi

variaţia sa teoretică 2 în populaţia P sunt

necunoscute.

○ Din populaţia P se extrage la întâmplare

eşantionul E reprezentativ.

○ In eşantionul E pentru variabila X se

observă o medie m şi o variaţie s2.

○ Se încearcă să se estimeze valorile

necunoscute ale lui şi 2 cu ajutorul lui m

şi s2 observate.

6

Definiţia unui estimator

Estimatorul unui parametru este o funcţie

depinzând de observaţiile efectuate pe un

eşantion extras la întâmplare care furnizează

o valoare aleatoare numită estimarea

punctuală a parametrului.

Dacă eşantionul E are valorile x1,...,xn

pentru caracteristica studiată, estimatorul

mediei aritmetice a unei populaţii P este m

= (x1+x2+...+xn)/n

7

ESTIMAREA PUNCTUALĂ

Calităţile unui estimator:

• corectitudinea estimării obţinute,

• precizia acesteia.

Cele două noţiuni sunt distincte cum va rezultă şi

din prezentarea care urmează.

8

Estimator fără bias

Fie T estimarea punctuală a unui parametru teoretic al unei

populaţii.

T este o variabila aleatoare valorile ei variînd întâmplător odată

cu eşantionul pe baza căruia se calculează.

Estimatorul T se spune că este fără bias dacă speranţa

matematică a lui T este egală cu valoarea adevărată (teoretică)

a parametrului estimat adică M(T) = .

Se spune în acest caz că estimarea dată de T este corectă.

9

ESTIMAREA PUNCTUALĂ Proprietăţi ale estimatorilor medie si frecventa:

P1. Speranţa matematică a mediilor observate, m, pe eşantioane

extrase aleator este egală cu media teoretică a populaţiei din care sau extras eşantioanele, medie considerată pentru valorile unei variabile cantitative luată în studiu: M(m) = .

P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane

extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care sau extras eşantioanele, frecvenţă considerată pentru valorile unei variabile calitative luată în studiu: M(f) = p.

Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că

estimările realizate cu ajutorul lor sunt corecte.

10

ESTIMAREA PUNCTUALĂ

P3. Speranţa matematică a variaţiilor descriptive observate s2 pe eşantioane de talie n, extrase aleator este diferită de variaţia teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie considerată pentru valorile unei variabile cantitative luată în studiu:

P4. Variaţia punctuală de eşantionare este un estimator fără bias pentru 2:

11

21)2(M

n

ns

s21n

nS2

Concluzie

Media, frecvenţa şi variaţia de

eşantionare observate pe eşantioane

corect extrase (reprezentative) dintr-o

populaţie P sunt estimatori fără bias ale

mediei, frecvenţei şi respectiv variaţiei

teoretice ale populaţiei P

12

ESTIMAREA CU INTERVALE DE

INCREDERE

Un estimator că este cu atât mai eficace cu cât variaţia sa este mai mică, sau precizia sa depinde de mărimea variaţiei sale.

Estimarea punctuală a unui parametru teoretic furnizează o valoare pentru parametrul teoretic estimat.

Valoarea sa este tributară fluctuaţiilor de eşantionare şi poate fi la o mare distanţă de valoarea reală a parametrului estimat.

Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere, în care să se poată afirma că parametrul estimat se găseşte cu o probabilitate ridicată.

13

ESTIMAREA CU AJUTORUL INTERVALULUI DE

INCREDERE

Intervalul de încredere este un interval mărginit

de valori (limitele poartă numele de limite de

încredere) care include media caracteristicii

studiate.

Cu cât intervalul este mai larg cu atât suntem mai

siguri că media caracteristicii studiate se va

regăsi în acel interval.

Mărimea încrederii, confidenţa, este dată de

probabilitatea ca valoarea (valorile) studiate să se

găsească în acel interval.

14

ESTIMAREA UNEI MEDII

Fie P o populaţie în care variabila X are o media teoretică necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi se calculează o variaţie punctuală estimată

Se încearcă să se determine pentru valoarea

necunoscută a mediei teoretice un interval de încredere cu pragul , (cu ajutorul lui m şi S2 observate), adică să se determine un interval [a,b] în care probabilitatea ca media teoretică să se afle este 1-:

Pr(a b) = 1 - .

15

2n

( m)xin i 12 2S s

n 1n 1

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

N>=30

media de eşantionare m este o variabilă aleatoare normală

Atunci variabila aleatoare centrată redusă este o variabilă aleatoare N(0,1).

Pentru un prag de semnificaţie se determină (de exemplu, din tabela ecartului redus) valoarea Z pentru care probabilitatea ca variabila aleatoare Z să fie în intervalul [-Z,Z] este 1-, adică:

Pr(-Z Z Z) = 1 - .

16

( , )n

N m

Z

n

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Deci cu o probabilitate 1- se poate

afirma că are loc:

de unde rezultă :

17

mZ Z

n

m Z m Zn n

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Prin urmare, intervalul de încredere

pentru media cu pragul de semnificaţie

este

Atunci când nu se cunoaşte, ea poate

fi estimata corect prin s şi în acest caz

intervalul de încredere cu pragul de

semnificaţie pentru media este

18

,m Z m Zn n

,1 1

s sm Z m Zn n

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Cel mai frecvent se utilizează un prag

de semnificaţie = 0.05. Atunci Z=1.96

şi deci intervalul de încredere cel mai

utilizat în cazul eşantioanelor mari este

19

1,96 , 1,961 1

s sm mn n

Exemplu

Într-o populaţie de 50 cunoaştem media greutăţii la naştere a noilor născuţi: 3400g şi abaterea standard: 142

Pe un eşantion aleator de 10 nou născuţi: media=3275g, abaterea standard=854

Eşantionul este sau nu caracteristic pentru populaţie?

3275+/-1,96*854/3= 3275+/-558

3400 +/-1,96*142/1000= 3275+/-39,36

Eşantionarea aleatoare implică “dreptul” fiecărui membru al populaţiei de a fi ales dar nu garantează reprezentativitatea proporţională a tuturor părţilor unei populaţii

Alt eşantion altă medie, altă abatere

20

Exemplu

A – distribuţia de eşantionare a mediei pentru n=10

B – distribuţia de eşantionare a mediei pentru n=50

Pe măsură ce creşte n eroarea de eşantionare scade şi eşantioanele devin mai reprezentative, media lor este mai apropiată de cea a populaţiei

21

Exemplu (continuare)

Deviaţia standard a

distribuţiei de

eşantionare este un

indicator al erorii de

eşantionare

22

Deviaţia standard a distribuţiei de eşantionare

În practică este

imposibil să construim

distribuţia de

eşantionare

estimarea deviaţiei

standard a mediei pe

baza deviaţiei standard

şi a dimensiunii

eşantionului:

1X

ss

n

23

Exemplu (continuare)

A = media=115, abaterea standard=30 Sx=9,5

B = media=115, abaterea standard=30 Sx=4,2

Pe măsură ce creşte n scade eroarea standard a mediei

Aproximarea distribuţiei populaţiei

24

ESTIMAREA UNEI MEDII: ESANTIOANE MICI

se poate determina intervalul de

încredere al mediei doar dacă

variabila studiată X este o variabilă

aleatoare normală.

Daca se cunoaste variatia:

Nu se cunosate variatia si n<30

25

,m Z m Zn n

,1 1

s sm t m tn n

ESTIMAREA UNEI FRECVENTE

Esantioane mari np, nq>=10

F este frecventa observata

26

f(1-f) f(1-f),

n nf Z f Z

Eroarea de eşantionare a mediei

Sx= diferenţa dintre media valorilor eşantionului şi media caracteristici populaţiei din care a fost extras eşantionul

Creşterea erorii de eşantionare =>

Scăderea acurateţii mediei eşantionului de a estima caracteristica unei populaţii

Scăderea erorii de eşantionare =>

Creşterea acurateţii mediei eşantionului de a estima caracteristica unei populaţii

27

Exemplu

Studiul Fitzgerald al mobilităţii prin extensie a

coloanei lombare la indivizi de vârste cuprinse între

30 şi 39 de ani

n=42, media=40° şi s=8,8 °

Media populaţiei poate fi estimată la 40 °

Care este acurateţea acestei estimări?

Cum estimăm intervalul de încredere?

28

Intervale de încredere

= este un interval mărginit de valori (limitele

poartă numele de limite de încredere) care

include media caracteristicii studiate

Cu cât intervalul este mai larg cu atât suntem

mai siguri că media caracteristicii studiate se

va regăsi în acel interval

Mărimea încrederii probabilitate

Încrederea (confidenţa) 95%

29

Exemplu (continuare)

n=42, media=40°, s=8,8° Sx=1,36

95,45% din distribuţie este cuprinsă între ±2Sx

sau ±2Z

30

Exemplu (continuare)

Estimarea zonei de 95%

Este mărginită de un scor Z de ± 1,96

Interval de încredere de 95%

31

Intervale de încredere

Formula de determinare a limitelor

intervalului de încredere:

XszXII )(

32

Pentru intervale de încredere de 95% Z=

± 1,96

Exemplu (continuare)

95% II = 40,0± (1,96)(1,36)

95% II = 40,0±2,67

95% II = 37,33 până la 42,67

33

Exemplu 99%

Z = ± 2,576

99% II = 40,0± (2,576)(1,36)

99% II = 40,0±3,50

99% II = 36,5 până la 43,5

34

Intervale de încredere cu eşantioane mici

n<30

Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare este mai dispersată faţă de distribuţia normală

Se foloseşte o altă distribuţie: distribuţia t sau Student

Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului

35

Calculul intervalului de încredere

df = n-1

df = grade de

libertate

XstXII )(

36

Grade de libertate

df

Direcţiile disponibile pentru mişcare într-

un spaţiu dat

Numărul de componente care pot varia

într-un set de date

n-1

37

Grade de libertate - Exemplu

5 măsurători, avem o sumă de 30 şi o

medie de 6

După ce face primele 4: 8,9,10,11 a

cincea poate fi calculată şi setul de date

are numai 4 grade de libertate

38

Calculul intervalului de încredere

n=6 df = 5 II95% t= ±2,571

n=10 df = 9 II95% t= ±2,262

n=30 II95% t= ±2,042

Creşterea lui n determină ca valoarea lui t să se apropie de 1,96 curba tinde spre distribuţia normală

39

Aplicaţii ale intervalelor de încredere

Studiul Fitzgerald a stabilit cu o precizie de 95%

intervalul de încredere pentru extensia lombară la

diferite grupe de vârstă

40

Aplicaţii ale intervalelor de încredere

Interpretare:

1. Intervalul de încredere al extensiei lombare scade cu

vârsta

2. Variabilitatea este mai scăzută la tineri

3. Intervalele de încredere se întrepătrund

41