VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă...

41
1

Transcript of VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă...

Page 1: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

1

Page 2: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Probabilităţi

= şansa ca un eveniment să aibă loc considerând toate rezultatele posibile

Valoarea predictivă a probabilităţii: Reflectă ce “ar trebui” să se întâmple şi nu ce o

să se întâmple efectiv

Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate fi 75% succes

Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului analizat de a estima caracteristica unei populaţii

2

Page 3: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu: distribuţia greutatii

Media = 69, s = 3

68,26% = 66-72

(168-183)

p=0,68

Mai mare de 78

(198)

P=0,0013

3

Page 4: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Principii generale In studiul într-o populaţie P a parametrilor a unei

caracteristici oarecare (cantitative sau calitative) adesea este necesar să se urmeze procedeul: 1. Se extrage un eşantion reprezentativ al acestei populaţii.

2. Prin mijloacele statisticii descriptive se descrie distribuţia caracteristicii pe eşantionul extras la etapa 1, fiindcă talia acestuia permite o investigare exhaustivă a sa. Astfel se poate determina frecvenţa observată, dacă este vorba de o caracteristică calitativă, sau se calculează media şi variaţia, în cazul unei caracteristici cantitative.

3. Prin mijloacele statisticii inferenţiale sau inductive se extind la întreaga populaţie rezultatele observate pe eşantion. Adica, pornind de la parametrii observaţi (frecvenţa, media, variaţia, etc) pe eşantion se încearcă să se estimeze parametrii “teoretici” ai întregii populaţii.

4

Page 5: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Cazul unei variabile X calitative

Frecvenţa teoretică p a variabilei X în populaţia P este

necunoscută.

Din populaţia P se extrage la întâmplare

eşantionul E reprezentativ.

In eşantionul E pentru variabila X se observă o

frecvenţă f.

Se încearcă să se estimeze valoarea

necunoscută a lui p cu ajutorul lui f observat.

5

Page 6: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Cazul unei variabile X cantitative

Media teoretică a variabilei X ca şi

variaţia sa teoretică 2 în populaţia P sunt

necunoscute.

○ Din populaţia P se extrage la întâmplare

eşantionul E reprezentativ.

○ In eşantionul E pentru variabila X se

observă o medie m şi o variaţie s2.

○ Se încearcă să se estimeze valorile

necunoscute ale lui şi 2 cu ajutorul lui m

şi s2 observate.

6

Page 7: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Definiţia unui estimator

Estimatorul unui parametru este o funcţie

depinzând de observaţiile efectuate pe un

eşantion extras la întâmplare care furnizează

o valoare aleatoare numită estimarea

punctuală a parametrului.

Dacă eşantionul E are valorile x1,...,xn

pentru caracteristica studiată, estimatorul

mediei aritmetice a unei populaţii P este m

= (x1+x2+...+xn)/n

7

Page 8: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA PUNCTUALĂ

Calităţile unui estimator:

• corectitudinea estimării obţinute,

• precizia acesteia.

Cele două noţiuni sunt distincte cum va rezultă şi

din prezentarea care urmează.

8

Page 9: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Estimator fără bias

Fie T estimarea punctuală a unui parametru teoretic al unei

populaţii.

T este o variabila aleatoare valorile ei variînd întâmplător odată

cu eşantionul pe baza căruia se calculează.

Estimatorul T se spune că este fără bias dacă speranţa

matematică a lui T este egală cu valoarea adevărată (teoretică)

a parametrului estimat adică M(T) = .

Se spune în acest caz că estimarea dată de T este corectă.

9

Page 10: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA PUNCTUALĂ Proprietăţi ale estimatorilor medie si frecventa:

P1. Speranţa matematică a mediilor observate, m, pe eşantioane

extrase aleator este egală cu media teoretică a populaţiei din care sau extras eşantioanele, medie considerată pentru valorile unei variabile cantitative luată în studiu: M(m) = .

P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane

extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care sau extras eşantioanele, frecvenţă considerată pentru valorile unei variabile calitative luată în studiu: M(f) = p.

Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că

estimările realizate cu ajutorul lor sunt corecte.

10

Page 11: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA PUNCTUALĂ

P3. Speranţa matematică a variaţiilor descriptive observate s2 pe eşantioane de talie n, extrase aleator este diferită de variaţia teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie considerată pentru valorile unei variabile cantitative luată în studiu:

P4. Variaţia punctuală de eşantionare este un estimator fără bias pentru 2:

11

21)2(M

n

ns

s21n

nS2

Page 12: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Concluzie

Media, frecvenţa şi variaţia de

eşantionare observate pe eşantioane

corect extrase (reprezentative) dintr-o

populaţie P sunt estimatori fără bias ale

mediei, frecvenţei şi respectiv variaţiei

teoretice ale populaţiei P

12

Page 13: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA CU INTERVALE DE

INCREDERE

Un estimator că este cu atât mai eficace cu cât variaţia sa este mai mică, sau precizia sa depinde de mărimea variaţiei sale.

Estimarea punctuală a unui parametru teoretic furnizează o valoare pentru parametrul teoretic estimat.

Valoarea sa este tributară fluctuaţiilor de eşantionare şi poate fi la o mare distanţă de valoarea reală a parametrului estimat.

Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere, în care să se poată afirma că parametrul estimat se găseşte cu o probabilitate ridicată.

13

Page 14: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA CU AJUTORUL INTERVALULUI DE

INCREDERE

Intervalul de încredere este un interval mărginit

de valori (limitele poartă numele de limite de

încredere) care include media caracteristicii

studiate.

Cu cât intervalul este mai larg cu atât suntem mai

siguri că media caracteristicii studiate se va

regăsi în acel interval.

Mărimea încrederii, confidenţa, este dată de

probabilitatea ca valoarea (valorile) studiate să se

găsească în acel interval.

14

Page 15: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII

Fie P o populaţie în care variabila X are o media teoretică necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi se calculează o variaţie punctuală estimată

Se încearcă să se determine pentru valoarea

necunoscută a mediei teoretice un interval de încredere cu pragul , (cu ajutorul lui m şi S2 observate), adică să se determine un interval [a,b] în care probabilitatea ca media teoretică să se afle este 1-:

Pr(a b) = 1 - .

15

2n

( m)xin i 12 2S s

n 1n 1

Page 16: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

N>=30

media de eşantionare m este o variabilă aleatoare normală

Atunci variabila aleatoare centrată redusă este o variabilă aleatoare N(0,1).

Pentru un prag de semnificaţie se determină (de exemplu, din tabela ecartului redus) valoarea Z pentru care probabilitatea ca variabila aleatoare Z să fie în intervalul [-Z,Z] este 1-, adică:

Pr(-Z Z Z) = 1 - .

16

( , )n

N m

Z

n

Page 17: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Deci cu o probabilitate 1- se poate

afirma că are loc:

de unde rezultă :

17

mZ Z

n

m Z m Zn n

Page 18: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Prin urmare, intervalul de încredere

pentru media cu pragul de semnificaţie

este

Atunci când nu se cunoaşte, ea poate

fi estimata corect prin s şi în acest caz

intervalul de încredere cu pragul de

semnificaţie pentru media este

18

,m Z m Zn n

,1 1

s sm Z m Zn n

Page 19: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Cel mai frecvent se utilizează un prag

de semnificaţie = 0.05. Atunci Z=1.96

şi deci intervalul de încredere cel mai

utilizat în cazul eşantioanelor mari este

19

1,96 , 1,961 1

s sm mn n

Page 20: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu

Într-o populaţie de 50 cunoaştem media greutăţii la naştere a noilor născuţi: 3400g şi abaterea standard: 142

Pe un eşantion aleator de 10 nou născuţi: media=3275g, abaterea standard=854

Eşantionul este sau nu caracteristic pentru populaţie?

3275+/-1,96*854/3= 3275+/-558

3400 +/-1,96*142/1000= 3275+/-39,36

Eşantionarea aleatoare implică “dreptul” fiecărui membru al populaţiei de a fi ales dar nu garantează reprezentativitatea proporţională a tuturor părţilor unei populaţii

Alt eşantion altă medie, altă abatere

20

Page 21: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu

A – distribuţia de eşantionare a mediei pentru n=10

B – distribuţia de eşantionare a mediei pentru n=50

Pe măsură ce creşte n eroarea de eşantionare scade şi eşantioanele devin mai reprezentative, media lor este mai apropiată de cea a populaţiei

21

Page 22: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu (continuare)

Deviaţia standard a

distribuţiei de

eşantionare este un

indicator al erorii de

eşantionare

22

Page 23: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Deviaţia standard a distribuţiei de eşantionare

În practică este

imposibil să construim

distribuţia de

eşantionare

estimarea deviaţiei

standard a mediei pe

baza deviaţiei standard

şi a dimensiunii

eşantionului:

1X

ss

n

23

Page 24: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu (continuare)

A = media=115, abaterea standard=30 Sx=9,5

B = media=115, abaterea standard=30 Sx=4,2

Pe măsură ce creşte n scade eroarea standard a mediei

Aproximarea distribuţiei populaţiei

24

Page 25: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI MEDII: ESANTIOANE MICI

se poate determina intervalul de

încredere al mediei doar dacă

variabila studiată X este o variabilă

aleatoare normală.

Daca se cunoaste variatia:

Nu se cunosate variatia si n<30

25

,m Z m Zn n

,1 1

s sm t m tn n

Page 26: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

ESTIMAREA UNEI FRECVENTE

Esantioane mari np, nq>=10

F este frecventa observata

26

f(1-f) f(1-f),

n nf Z f Z

Page 27: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Eroarea de eşantionare a mediei

Sx= diferenţa dintre media valorilor eşantionului şi media caracteristici populaţiei din care a fost extras eşantionul

Creşterea erorii de eşantionare =>

Scăderea acurateţii mediei eşantionului de a estima caracteristica unei populaţii

Scăderea erorii de eşantionare =>

Creşterea acurateţii mediei eşantionului de a estima caracteristica unei populaţii

27

Page 28: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu

Studiul Fitzgerald al mobilităţii prin extensie a

coloanei lombare la indivizi de vârste cuprinse între

30 şi 39 de ani

n=42, media=40° şi s=8,8 °

Media populaţiei poate fi estimată la 40 °

Care este acurateţea acestei estimări?

Cum estimăm intervalul de încredere?

28

Page 29: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Intervale de încredere

= este un interval mărginit de valori (limitele

poartă numele de limite de încredere) care

include media caracteristicii studiate

Cu cât intervalul este mai larg cu atât suntem

mai siguri că media caracteristicii studiate se

va regăsi în acel interval

Mărimea încrederii probabilitate

Încrederea (confidenţa) 95%

29

Page 30: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu (continuare)

n=42, media=40°, s=8,8° Sx=1,36

95,45% din distribuţie este cuprinsă între ±2Sx

sau ±2Z

30

Page 31: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu (continuare)

Estimarea zonei de 95%

Este mărginită de un scor Z de ± 1,96

Interval de încredere de 95%

31

Page 32: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Intervale de încredere

Formula de determinare a limitelor

intervalului de încredere:

XszXII )(

32

Pentru intervale de încredere de 95% Z=

± 1,96

Page 33: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu (continuare)

95% II = 40,0± (1,96)(1,36)

95% II = 40,0±2,67

95% II = 37,33 până la 42,67

33

Page 34: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Exemplu 99%

Z = ± 2,576

99% II = 40,0± (2,576)(1,36)

99% II = 40,0±3,50

99% II = 36,5 până la 43,5

34

Page 35: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Intervale de încredere cu eşantioane mici

n<30

Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare este mai dispersată faţă de distribuţia normală

Se foloseşte o altă distribuţie: distribuţia t sau Student

Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului

35

Page 36: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Calculul intervalului de încredere

df = n-1

df = grade de

libertate

XstXII )(

36

Page 37: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Grade de libertate

df

Direcţiile disponibile pentru mişcare într-

un spaţiu dat

Numărul de componente care pot varia

într-un set de date

n-1

37

Page 38: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Grade de libertate - Exemplu

5 măsurători, avem o sumă de 30 şi o

medie de 6

După ce face primele 4: 8,9,10,11 a

cincea poate fi calculată şi setul de date

are numai 4 grade de libertate

38

Page 39: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Calculul intervalului de încredere

n=6 df = 5 II95% t= ±2,571

n=10 df = 9 II95% t= ±2,262

n=30 II95% t= ±2,042

Creşterea lui n determină ca valoarea lui t să se apropie de 1,96 curba tinde spre distribuţia normală

39

Page 40: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Aplicaţii ale intervalelor de încredere

Studiul Fitzgerald a stabilit cu o precizie de 95%

intervalul de încredere pentru extensia lombară la

diferite grupe de vârstă

40

Page 41: VARIABILE ALEATOARE DE ESANTIONARE - voifidoctorProbabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii:

Aplicaţii ale intervalelor de încredere

Interpretare:

1. Intervalul de încredere al extensiei lombare scade cu

vârsta

2. Variabilitatea este mai scăzută la tineri

3. Intervalele de încredere se întrepătrund

41