Curs_1_stat

56
1 Curs #1 BIOSTATISTICĂ End Facultatea de Farmacie – Disciplina Matematică-Informatică

description

FARMACIE

Transcript of Curs_1_stat

Page 1: Curs_1_stat

1

Curs #1

BIOSTATISTICĂ

End

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 2: Curs_1_stat

Indicatorii

variaţiei

Valorile medii descriu informaţia într-o formă integrată, exprimând tendinţa de localizare a datelor prin neprezentarea cunoştinţelor înglobate în lot despre variaţia existentă.

Indicatorii de localizare redau doar o singură trăsătură comună întregii colectivităţi.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 3: Curs_1_stat

Indicatorii

variaţiei

Se simte nevoia definirii unor noi indicatori statistici care să evidenţieze şi alte aspecte ale populaţiei studiate.

Categoria de indicatori de dispersie (variaţie) reprezintă o evaluare numerică a împrăştierii datelor.

Variaţia luată în considerare se poate raporta chiar la valoarea medie calculată.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 4: Curs_1_stat

Dispersia (varianţa)

Dispersia sau varianţa reprezintă o mediere a pătratelor distanţelor faţă de valoarea medie a şirului de date. Se notează cu sau D[x].

Are următoarea formulă de calcul (pentru volumul n al eşantionului de valori mari, n>30):

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 5: Curs_1_stat

Dispersia (varianţa)

( ) ( ) ( ) ( )

n

xx

nxxxxxx

n

ii

n∑=

−=

−++−+−= 1

222

22

12 .....σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 6: Curs_1_stat

Dispersia (varianţa)

Dacă avem valorile x1, x2, x3, …, xn cu frecvenţeleabsolute a1, a2, …, am, atunci formula de calcul:

( ) ( ) ( )=

+++−⋅++−⋅+−⋅

=m

mmaaa

xxaxxaxxa....

.....

21

2222

2112σ

( ) ( )

n

xxa

a

xxam

iii

m

ii

m

iii ∑

∑=

=

=−⋅

=−⋅

= 1

2

1

1

2

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 7: Curs_1_stat

Dispersia (varianţa)

Considerând frecvenţele relative fi, obţinem:

( )( ) ( )∑ ∑

= =

= −⋅=−⋅=−⋅

=m

i

m

iiii

i

m

iii

xxfxxna

n

xxa

1 1

221

2

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 8: Curs_1_stat

Dispersia (varianţa)

Sunt cazuri în care dispersia trebuie estimată dintr-un eşantion de date.

Dacă volumul eşantionului este mai mic decât 30, atunci se aplică o corecţie formulei de calcul.

În acest caz ajustarea este în sensul că nu se împarte la n ci la n-1 (numit şi numărul gradelor de libertate).

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 9: Curs_1_stat

Dispersia (varianţa)

( ) ( )

11121

2

1

2

2−

⋅=−

⋅−

=−

−=

∑∑==

nn

nn

n

xx

n

xxn

ii

n

ii

estimat σσ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 10: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

Prin extragerea rădăcinii pătrate din dispersie se obţine abaterea pătratică medie.

Astfel, deviaţia standard şi indicatorii de localizare se exprimă cu aceleaşi unităţi de măsură.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 11: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

( )

n

xxxD

n

ii∑

=−

== 1

2

][ σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 12: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

Ţinând cont de frecvenţele absolute şi relative pe intervale avem:

Putem dezvolta expresia dispersiei în continuare:

( )( ) ( )∑∑

==

= −⋅=−⋅=−⋅

=m

iii

m

ii

i

m

iii

xxfxxna

n

xxa

1

2

1

21

2

σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 13: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

( )

.21

2

1

2

1

1

2

1

2

11

2

1

2

n

xx

n

xx

n

n

x

n

xx

n

x

n

xx

n

i

n

iin

ii

n

i

n

ii

n

ii

n

ii

∑∑∑

∑∑∑∑

==

=

====

+⋅⋅−⋅=

=+⋅⋅

−=−

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 14: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

2

1

21P

n

ii Mx

n=⋅∑

=x

n

xn

ii=

∑=1

221

2

1 xxnnn

xn

i =⋅⋅=∑=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 15: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

( )

.21

2

1

2

1

1

2

1

2

11

2

1

2

n

xx

n

xx

n

n

x

n

xx

n

x

n

xx

n

i

n

iin

ii

n

i

n

ii

n

ii

n

ii

∑∑∑

∑∑∑∑

==

=

====

+⋅⋅−⋅=

=+⋅⋅

−=−

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 16: Curs_1_stat

Abaterea pătratică medie

(deviaţia standard)

Abaterea pătratică medie

Abaterea pătratică medie este rădăcina pătratică din diferenţa dintre pătratul mediei pătratice şi pătratul mediei aritmetice.

22222 2 xMxxM PP −=+⋅−=σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 17: Curs_1_stat

Amplitudinea

Este definită ca diferenţa valorilor extreme ale şirului de date studiat şi se notează cu W sau A (în majoritatea cazurilor):

W = A = Xmax -

Xmin .

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 18: Curs_1_stat

Amplitudinea

În cazul grupării datelor pe clase se defineşte şi noţiunea de amplitudine a clasei, notată cu wi (corespunzător clasei i).

Această mărime este egală cu diferenţa dintre valorile extreme ale clasei respective.

Cu cât este mai mică valoarea sa cu atât lotul este mai omogen.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 19: Curs_1_stat

Amplitudinea

Aspecte negative (dezavantaje) ale amplitudinii:

-

depinde de eşantion, având variaţii pentru fiecare eşantion în parte,

-

nu ţine seama de tipul repartiţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 20: Curs_1_stat

Intervalul intercuartilic

Cuartilele (sau cvartilele) împart datele în 4 clase de frecvenţe egale cu 25%.

Astfel, sunt necesare 3 valori Q1, Q2, Q3 care reprezintă cuartilele.

Presupunem că avem o distribuţie a frecvenţelor parametrului x (discret), conform graficului din figura urmatoare.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 21: Curs_1_stat

Cuartilele

Q1, Q2, Q3

0

2

4

6

8

10

12

parametrul x

Distributia de frecventa

Q1 Q2 Q3

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 22: Curs_1_stat

Intervalul intercuartilic

Suma frecvenţelor până la limita determinată de Q1 este egală cu suma frecvenţelor dintre Q1 şi Q2, de asemenea egală cu suma frecvenţelor dintre Q2 şi Q3şi în final, egală cu suma frecvenţelor de după Q3.

Dacă repartiţia ar fi fost de tip continuu, această sumă ar fi integrala determinată de limitele notate Qi.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 23: Curs_1_stat

Intervalul intercuartilic

(Iq)

Intervalul cuartilic se defineşte ca fiind diferenţa dintre Q3 şi Q1 (ultima şi prima cuartilă).

Q1 se numeşte cuartilă inferioară sau mică, Q3 se numeşte cuartila superioară sau mare.

Prin urmare, intervalul intercuartilic va fi:

Iq = Q3 – Q1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 24: Curs_1_stat

Coeficientul

de variaţie

intercuartilic

(q)

ObservaţieCuartila Q2 este tocmai mediana Me.

Se defineşte coeficientul de variaţie intercuartilică ca fiind raportul:

e

q

MI

QQQq =

−=

2

13

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 25: Curs_1_stat

Coeficientul de variaţie

(CV)

Abaterea pătratică medie se interpretează prin compararea cu media valorilor studiate.

Dacă avem o medie de 100 şi o abatere pătratică standard , atunci avem mici variaţii, dar dacă avem aceeaşi abatere la o medie de 10, atunci variaţia este foarte mare.

5=σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 26: Curs_1_stat

Coeficientul de variaţie

(CV)

În concluzie, este necesară raportarea abaterii pătratice la valoarea mediei, pentru a exprima corect împrăştierea datelor.

Se defineşte coeficientul de variaţie:

xCVx

σ=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 27: Curs_1_stat

Coeficientul de variaţie

(CV)

Acest coeficient este o măsură relativă a variaţiei datelor faţă de medie.

Astfel, indiferent de medie, seturile de date, chiar de natură diferită, pot fi comparate folosind coeficientul de variaţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 28: Curs_1_stat

Momente

Momentele ajută la determinarea anumitor caracteristici legate de forma (alură) repartiţiilor, care nu pot fi determinate doar cu indicatorii statistici de localizare sau variaţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 29: Curs_1_stat

Momentele centrate de ordin k (k≥1)

Se definesc momentele centrate de ordin k în raport cu originea arbitrară A, ca fiind exprimate prin formula:

( )∑=

−⋅=n

i

ki

Ak Ax

nm

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 30: Curs_1_stat

Momentele centrate de ordin k (k≥1)

Exprimăm formula în funcţie de frecvenţele absolute ai, respectiv frecvenţele relative fi şi obţinem:

( ) ( )( )∑

=

=

=

= −⋅=

−⋅

=

−⋅

=m

j

kij

m

j

kij

m

jj

m

j

kij

Ak Axf

n

Axa

a

Axam

1

1

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 31: Curs_1_stat

Momentele centrate de ordin k (k≥1)

Dacă originea aleasă este tocmai media aritmetică, atunci momentul centrat de ordin k se va calcula cu formula :

momentul centrat de ordin k în raport cu media aritmetică.

( )∑=

−⋅=n

i

kik xx

nm

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 32: Curs_1_stat

Momentele centrate de ordin k (k≥1)

În cazul notaţiei momentelor centrate în raport cu media aritmetică nu se mai afişează în partea superioară a lui m originea de centrare.Momentul centrat de ordin 2 în raport cu media aritmetică este tocmai dispersia:

( ) 2

1

22

1 σ=−⋅= ∑=

n

ii xx

nm

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 33: Curs_1_stat

Momentul

absolut

de ordin k (k≥1)

Din formula momentului centrat de ordin k în raport cu referinţa A se poate deduce momentul absolut.

Dacă A=0 se obţine momentul absolut:

∑∑∑===

⋅=⋅⋅=⋅=m

j

kjj

m

j

kjj

n

i

kik xfxa

nx

nm

111

` 11

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 34: Curs_1_stat

Momentul

absolut

de ordin k (k≥1)

ai – frecvenţa absolută;

fi – frecvenţa relativă;

m – numărul de clase;

n – numărul de elemente.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 35: Curs_1_stat

Momentul

absolut

de ordin k (k≥1)

Pentru k=1 se obţine:

, adică momentul absolut de ordin 1, care este egal cu media aritmetică.

xxn

mn

ii =⋅= ∑

=1

`1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 36: Curs_1_stat

Proprietăţi ale momentelor

Momentul centrat de ordin 1 cu originea în media aritmetică este 0 (suma algebrică a abaterilor individuale faţă de medie este egală cu 0).

Demonstraţie:

0111)(1

11 11 =−=⋅⋅−=⋅−⋅=−⋅= ∑∑ ∑

== =xxxn

nxx

nx

nxx

nm

n

i

n

i

n

iii

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 37: Curs_1_stat

Proprietăţi ale momentelor

Momentul minim centrat de ordin 2 are originea în media aritmetică (media abaterilor pătratice are valoare minimă când aceasta este calculată în raport cu media aritmetică).Demonstraţie:

Momentul centrat de ordin doi este :

∑=

−⋅=n

ii

A Axn

m1

22 )(1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 38: Curs_1_stat

Proprietăţi ale momentelor

Facem un artificiu de calcul, adăugând şi scăzând valoarea medie.

.)(1)()(2

)(1])()[(1

1

2

1

1

22

12

⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅+⎟⎟

⎞⎜⎜⎝

⎛−⋅

−⋅−

−⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅=−−−⋅=

∑∑

∑∑

==

==

n

i

n

ii

n

ii

n

ii

A

xAn

xxn

xA

xxn

xAxxn

m

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 39: Curs_1_stat

Proprietăţi ale momentelor

Conform proprietăţii (1) avem:

Astfel, paranteza a doua are valoarea 0. În continuare obţinem:

0)(11

1==−⋅= ∑

=mxx

n

n

iiσ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 40: Curs_1_stat

Proprietăţi ale momentelor

.)(

)(1)(1)(1

2

1

22

1

2

1

22

pozitivtermenm

xAn

mxAn

xxn

mn

i

n

i

n

ii

A

+=

=⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅+=⎟⎟

⎞⎜⎜⎝

⎛−⋅+⎟⎟

⎞⎜⎜⎝

⎛−⋅= ∑∑∑

===

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 41: Curs_1_stat

Proprietăţi ale momentelor

Din ultima formulă tragem concluzia că oricare ar fi A, momentul centrat de ordin 2 cu originea în A este egal cu momentul centrat cu originea în media aritmetică, la care se adaugă un termen pozitiv.

De aici deducem că momentul centrat de ordin 2 cu originea în media aritmetică este minimul momentului centrat de ordin 2.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 42: Curs_1_stat

Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică

Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu

( ) =⋅+⋅⋅⋅−⋅=−⋅= ∑∑∑∑====

m

ii

m

iii

m

iii

m

iii xfxfxxfxxfm

1

2

11

2

1

22 2)(

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 43: Curs_1_stat

Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică

Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu (Formula lui Konig):

( )( ) .

1

22`

1`22

1

1

2`1

`1

`1

`2

mmmfDar

fmmmm

n

ii

n

ii

−=⇒

⎪⎪⎭

⎪⎪⎬

=

⋅+⋅⋅−=

=

=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 44: Curs_1_stat

Asimetrie (skewness)

O distribuţie este considerată simetrică, dacă de o parte şi de alta a mediei, frecvenţele au aceleaşi valori.Notăm cu f(xi) – frecvenţa; m – mediaSimetria în raport cu media există, dacă pentru oricare Δ∈R avem relaţia:

)()( Δ+=Δ− mfmf

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 45: Curs_1_stat

Asimetrie (skewness)

În continuare, putem caracteriza asimetria în funcţie de poziţionarea mediei faţă de modul:1 – Avem asimetrie la dreapta, dacă (vezi figura).

2 – Avem asimetrie la stânga, dacă (vezi figura).

Mox >

Mox <

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 46: Curs_1_stat

Asimetrie (skewness)

Asimetrie la dreapta

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52

Mo M(x)

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 47: Curs_1_stat

Asimetrie (skewness)

Asimetrie la stânga

1 4 7 10 13 16 19 22 25 28 31 34 37 40

M(x) Mo

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 48: Curs_1_stat

Asimetrie (skewness)

Pentru a obţine o măsură a asimetriei, statisticianul englez Karl Pearson a definit indicatorul relativ de asimetrie (acest indicator este adimensional, fiind astfel util pentru a compara distribuţiile între ele):

σMoxSk −

=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 49: Curs_1_stat

Boltirea (excesul, kurtosis)

Acest indicator compară distribuţia dată cu cea normală sau gausiană (descrisă în capitolul Repartiţii continue).

Statisticianul englez Karl Pearson a definit de asemenea coeficientul de boltire:

( ) 44

22

42

σβ

mmm

==

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 50: Curs_1_stat

Boltirea (excesul, kurtosis)

Pentru o distribuţie normală,

Din punct de vedere al boltirii avem următoarea clasificare, reprezentată grafic in continuare:

32 =normalβ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 51: Curs_1_stat

Boltirea (excesul, kurtosis)

Repartiţie aplatizată sau platicurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 <β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 52: Curs_1_stat

Boltirea (excesul, kurtosis)

Repartiţie medie sau mezocurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 =β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 53: Curs_1_stat

Boltirea (excesul, kurtosis)

Repartiţie ascuţită sau leptocurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 >β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 54: Curs_1_stat

Boltirea (excesul, kurtosis)

Pentru descrierea boltirii se poate folosi şi coeficientul Fisher, ce măsoară excesul faţă de distribuţia normală. Acesta se calculează cu formula:

echivalenta

cu

33 44

22 −=−=σ

βγ m

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 55: Curs_1_stat

Boltirea (excesul, kurtosis)

( )34

1

4

2 −⋅

−=∑=

σγ

n

xxn

ii

Facultatea de Farmacie – Disciplina Matematică-Informatică

Page 56: Curs_1_stat

Boltirea (excesul, kurtosis)

Pentru valori mici ale volumului eşantionului se împarte la n-1 în loc de n.Avem următoarele modalităţi de caracterizare a distribuţiilor:- Mezocurtică .-

Leptocurtică .

- Platicurtică .

0,3 22 == γβ0,3 22 >> γβ0,3 22 << γβ

Facultatea de Farmacie – Disciplina Matematică-Informatică