Curs_1_stat

Post on 24-Dec-2015

3 views 1 download

description

FARMACIE

Transcript of Curs_1_stat

1

Curs #1

BIOSTATISTICĂ

End

Facultatea de Farmacie – Disciplina Matematică-Informatică

Indicatorii

variaţiei

Valorile medii descriu informaţia într-o formă integrată, exprimând tendinţa de localizare a datelor prin neprezentarea cunoştinţelor înglobate în lot despre variaţia existentă.

Indicatorii de localizare redau doar o singură trăsătură comună întregii colectivităţi.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Indicatorii

variaţiei

Se simte nevoia definirii unor noi indicatori statistici care să evidenţieze şi alte aspecte ale populaţiei studiate.

Categoria de indicatori de dispersie (variaţie) reprezintă o evaluare numerică a împrăştierii datelor.

Variaţia luată în considerare se poate raporta chiar la valoarea medie calculată.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

Dispersia sau varianţa reprezintă o mediere a pătratelor distanţelor faţă de valoarea medie a şirului de date. Se notează cu sau D[x].

Are următoarea formulă de calcul (pentru volumul n al eşantionului de valori mari, n>30):

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

( ) ( ) ( ) ( )

n

xx

nxxxxxx

n

ii

n∑=

−=

−++−+−= 1

222

22

12 .....σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

Dacă avem valorile x1, x2, x3, …, xn cu frecvenţeleabsolute a1, a2, …, am, atunci formula de calcul:

( ) ( ) ( )=

+++−⋅++−⋅+−⋅

=m

mmaaa

xxaxxaxxa....

.....

21

2222

2112σ

( ) ( )

n

xxa

a

xxam

iii

m

ii

m

iii ∑

∑=

=

=−⋅

=−⋅

= 1

2

1

1

2

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

Considerând frecvenţele relative fi, obţinem:

( )( ) ( )∑ ∑

= =

= −⋅=−⋅=−⋅

=m

i

m

iiii

i

m

iii

xxfxxna

n

xxa

1 1

221

2

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

Sunt cazuri în care dispersia trebuie estimată dintr-un eşantion de date.

Dacă volumul eşantionului este mai mic decât 30, atunci se aplică o corecţie formulei de calcul.

În acest caz ajustarea este în sensul că nu se împarte la n ci la n-1 (numit şi numărul gradelor de libertate).

Facultatea de Farmacie – Disciplina Matematică-Informatică

Dispersia (varianţa)

( ) ( )

11121

2

1

2

2−

⋅=−

⋅−

=−

−=

∑∑==

nn

nn

n

xx

n

xxn

ii

n

ii

estimat σσ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

Prin extragerea rădăcinii pătrate din dispersie se obţine abaterea pătratică medie.

Astfel, deviaţia standard şi indicatorii de localizare se exprimă cu aceleaşi unităţi de măsură.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

( )

n

xxxD

n

ii∑

=−

== 1

2

][ σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

Ţinând cont de frecvenţele absolute şi relative pe intervale avem:

Putem dezvolta expresia dispersiei în continuare:

( )( ) ( )∑∑

==

= −⋅=−⋅=−⋅

=m

iii

m

ii

i

m

iii

xxfxxna

n

xxa

1

2

1

21

2

σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

( )

.21

2

1

2

1

1

2

1

2

11

2

1

2

n

xx

n

xx

n

n

x

n

xx

n

x

n

xx

n

i

n

iin

ii

n

i

n

ii

n

ii

n

ii

∑∑∑

∑∑∑∑

==

=

====

+⋅⋅−⋅=

=+⋅⋅

−=−

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

2

1

21P

n

ii Mx

n=⋅∑

=x

n

xn

ii=

∑=1

221

2

1 xxnnn

xn

i =⋅⋅=∑=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

( )

.21

2

1

2

1

1

2

1

2

11

2

1

2

n

xx

n

xx

n

n

x

n

xx

n

x

n

xx

n

i

n

iin

ii

n

i

n

ii

n

ii

n

ii

∑∑∑

∑∑∑∑

==

=

====

+⋅⋅−⋅=

=+⋅⋅

−=−

Facultatea de Farmacie – Disciplina Matematică-Informatică

Abaterea pătratică medie

(deviaţia standard)

Abaterea pătratică medie

Abaterea pătratică medie este rădăcina pătratică din diferenţa dintre pătratul mediei pătratice şi pătratul mediei aritmetice.

22222 2 xMxxM PP −=+⋅−=σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Amplitudinea

Este definită ca diferenţa valorilor extreme ale şirului de date studiat şi se notează cu W sau A (în majoritatea cazurilor):

W = A = Xmax -

Xmin .

Facultatea de Farmacie – Disciplina Matematică-Informatică

Amplitudinea

În cazul grupării datelor pe clase se defineşte şi noţiunea de amplitudine a clasei, notată cu wi (corespunzător clasei i).

Această mărime este egală cu diferenţa dintre valorile extreme ale clasei respective.

Cu cât este mai mică valoarea sa cu atât lotul este mai omogen.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Amplitudinea

Aspecte negative (dezavantaje) ale amplitudinii:

-

depinde de eşantion, având variaţii pentru fiecare eşantion în parte,

-

nu ţine seama de tipul repartiţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Intervalul intercuartilic

Cuartilele (sau cvartilele) împart datele în 4 clase de frecvenţe egale cu 25%.

Astfel, sunt necesare 3 valori Q1, Q2, Q3 care reprezintă cuartilele.

Presupunem că avem o distribuţie a frecvenţelor parametrului x (discret), conform graficului din figura urmatoare.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Cuartilele

Q1, Q2, Q3

0

2

4

6

8

10

12

parametrul x

Distributia de frecventa

Q1 Q2 Q3

Facultatea de Farmacie – Disciplina Matematică-Informatică

Intervalul intercuartilic

Suma frecvenţelor până la limita determinată de Q1 este egală cu suma frecvenţelor dintre Q1 şi Q2, de asemenea egală cu suma frecvenţelor dintre Q2 şi Q3şi în final, egală cu suma frecvenţelor de după Q3.

Dacă repartiţia ar fi fost de tip continuu, această sumă ar fi integrala determinată de limitele notate Qi.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Intervalul intercuartilic

(Iq)

Intervalul cuartilic se defineşte ca fiind diferenţa dintre Q3 şi Q1 (ultima şi prima cuartilă).

Q1 se numeşte cuartilă inferioară sau mică, Q3 se numeşte cuartila superioară sau mare.

Prin urmare, intervalul intercuartilic va fi:

Iq = Q3 – Q1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Coeficientul

de variaţie

intercuartilic

(q)

ObservaţieCuartila Q2 este tocmai mediana Me.

Se defineşte coeficientul de variaţie intercuartilică ca fiind raportul:

e

q

MI

QQQq =

−=

2

13

Facultatea de Farmacie – Disciplina Matematică-Informatică

Coeficientul de variaţie

(CV)

Abaterea pătratică medie se interpretează prin compararea cu media valorilor studiate.

Dacă avem o medie de 100 şi o abatere pătratică standard , atunci avem mici variaţii, dar dacă avem aceeaşi abatere la o medie de 10, atunci variaţia este foarte mare.

5=σ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Coeficientul de variaţie

(CV)

În concluzie, este necesară raportarea abaterii pătratice la valoarea mediei, pentru a exprima corect împrăştierea datelor.

Se defineşte coeficientul de variaţie:

xCVx

σ=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Coeficientul de variaţie

(CV)

Acest coeficient este o măsură relativă a variaţiei datelor faţă de medie.

Astfel, indiferent de medie, seturile de date, chiar de natură diferită, pot fi comparate folosind coeficientul de variaţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momente

Momentele ajută la determinarea anumitor caracteristici legate de forma (alură) repartiţiilor, care nu pot fi determinate doar cu indicatorii statistici de localizare sau variaţie.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentele centrate de ordin k (k≥1)

Se definesc momentele centrate de ordin k în raport cu originea arbitrară A, ca fiind exprimate prin formula:

( )∑=

−⋅=n

i

ki

Ak Ax

nm

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentele centrate de ordin k (k≥1)

Exprimăm formula în funcţie de frecvenţele absolute ai, respectiv frecvenţele relative fi şi obţinem:

( ) ( )( )∑

=

=

=

= −⋅=

−⋅

=

−⋅

=m

j

kij

m

j

kij

m

jj

m

j

kij

Ak Axf

n

Axa

a

Axam

1

1

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentele centrate de ordin k (k≥1)

Dacă originea aleasă este tocmai media aritmetică, atunci momentul centrat de ordin k se va calcula cu formula :

momentul centrat de ordin k în raport cu media aritmetică.

( )∑=

−⋅=n

i

kik xx

nm

1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentele centrate de ordin k (k≥1)

În cazul notaţiei momentelor centrate în raport cu media aritmetică nu se mai afişează în partea superioară a lui m originea de centrare.Momentul centrat de ordin 2 în raport cu media aritmetică este tocmai dispersia:

( ) 2

1

22

1 σ=−⋅= ∑=

n

ii xx

nm

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentul

absolut

de ordin k (k≥1)

Din formula momentului centrat de ordin k în raport cu referinţa A se poate deduce momentul absolut.

Dacă A=0 se obţine momentul absolut:

∑∑∑===

⋅=⋅⋅=⋅=m

j

kjj

m

j

kjj

n

i

kik xfxa

nx

nm

111

` 11

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentul

absolut

de ordin k (k≥1)

ai – frecvenţa absolută;

fi – frecvenţa relativă;

m – numărul de clase;

n – numărul de elemente.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Momentul

absolut

de ordin k (k≥1)

Pentru k=1 se obţine:

, adică momentul absolut de ordin 1, care este egal cu media aritmetică.

xxn

mn

ii =⋅= ∑

=1

`1

1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

Momentul centrat de ordin 1 cu originea în media aritmetică este 0 (suma algebrică a abaterilor individuale faţă de medie este egală cu 0).

Demonstraţie:

0111)(1

11 11 =−=⋅⋅−=⋅−⋅=−⋅= ∑∑ ∑

== =xxxn

nxx

nx

nxx

nm

n

i

n

i

n

iii

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

Momentul minim centrat de ordin 2 are originea în media aritmetică (media abaterilor pătratice are valoare minimă când aceasta este calculată în raport cu media aritmetică).Demonstraţie:

Momentul centrat de ordin doi este :

∑=

−⋅=n

ii

A Axn

m1

22 )(1

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

Facem un artificiu de calcul, adăugând şi scăzând valoarea medie.

.)(1)()(2

)(1])()[(1

1

2

1

1

22

12

⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅+⎟⎟

⎞⎜⎜⎝

⎛−⋅

−⋅−

−⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅=−−−⋅=

∑∑

∑∑

==

==

n

i

n

ii

n

ii

n

ii

A

xAn

xxn

xA

xxn

xAxxn

m

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

Conform proprietăţii (1) avem:

Astfel, paranteza a doua are valoarea 0. În continuare obţinem:

0)(11

1==−⋅= ∑

=mxx

n

n

iiσ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

.)(

)(1)(1)(1

2

1

22

1

2

1

22

pozitivtermenm

xAn

mxAn

xxn

mn

i

n

i

n

ii

A

+=

=⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅+=⎟⎟

⎞⎜⎜⎝

⎛−⋅+⎟⎟

⎞⎜⎜⎝

⎛−⋅= ∑∑∑

===

Facultatea de Farmacie – Disciplina Matematică-Informatică

Proprietăţi ale momentelor

Din ultima formulă tragem concluzia că oricare ar fi A, momentul centrat de ordin 2 cu originea în A este egal cu momentul centrat cu originea în media aritmetică, la care se adaugă un termen pozitiv.

De aici deducem că momentul centrat de ordin 2 cu originea în media aritmetică este minimul momentului centrat de ordin 2.

Facultatea de Farmacie – Disciplina Matematică-Informatică

Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică

Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu

( ) =⋅+⋅⋅⋅−⋅=−⋅= ∑∑∑∑====

m

ii

m

iii

m

iii

m

iii xfxfxxfxxfm

1

2

11

2

1

22 2)(

Facultatea de Farmacie – Disciplina Matematică-Informatică

Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică

Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu (Formula lui Konig):

( )( ) .

1

22`

1`22

1

1

2`1

`1

`1

`2

mmmfDar

fmmmm

n

ii

n

ii

−=⇒

⎪⎪⎭

⎪⎪⎬

=

⋅+⋅⋅−=

=

=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Asimetrie (skewness)

O distribuţie este considerată simetrică, dacă de o parte şi de alta a mediei, frecvenţele au aceleaşi valori.Notăm cu f(xi) – frecvenţa; m – mediaSimetria în raport cu media există, dacă pentru oricare Δ∈R avem relaţia:

)()( Δ+=Δ− mfmf

Facultatea de Farmacie – Disciplina Matematică-Informatică

Asimetrie (skewness)

În continuare, putem caracteriza asimetria în funcţie de poziţionarea mediei faţă de modul:1 – Avem asimetrie la dreapta, dacă (vezi figura).

2 – Avem asimetrie la stânga, dacă (vezi figura).

Mox >

Mox <

Facultatea de Farmacie – Disciplina Matematică-Informatică

Asimetrie (skewness)

Asimetrie la dreapta

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52

Mo M(x)

Facultatea de Farmacie – Disciplina Matematică-Informatică

Asimetrie (skewness)

Asimetrie la stânga

1 4 7 10 13 16 19 22 25 28 31 34 37 40

M(x) Mo

Facultatea de Farmacie – Disciplina Matematică-Informatică

Asimetrie (skewness)

Pentru a obţine o măsură a asimetriei, statisticianul englez Karl Pearson a definit indicatorul relativ de asimetrie (acest indicator este adimensional, fiind astfel util pentru a compara distribuţiile între ele):

σMoxSk −

=

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Acest indicator compară distribuţia dată cu cea normală sau gausiană (descrisă în capitolul Repartiţii continue).

Statisticianul englez Karl Pearson a definit de asemenea coeficientul de boltire:

( ) 44

22

42

σβ

mmm

==

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Pentru o distribuţie normală,

Din punct de vedere al boltirii avem următoarea clasificare, reprezentată grafic in continuare:

32 =normalβ

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Repartiţie aplatizată sau platicurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 <β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Repartiţie medie sau mezocurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 =β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Repartiţie ascuţită sau leptocurtică

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

32 >β

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Pentru descrierea boltirii se poate folosi şi coeficientul Fisher, ce măsoară excesul faţă de distribuţia normală. Acesta se calculează cu formula:

echivalenta

cu

33 44

22 −=−=σ

βγ m

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

( )34

1

4

2 −⋅

−=∑=

σγ

n

xxn

ii

Facultatea de Farmacie – Disciplina Matematică-Informatică

Boltirea (excesul, kurtosis)

Pentru valori mici ale volumului eşantionului se împarte la n-1 în loc de n.Avem următoarele modalităţi de caracterizare a distribuţiilor:- Mezocurtică .-

Leptocurtică .

- Platicurtică .

0,3 22 == γβ0,3 22 >> γβ0,3 22 << γβ

Facultatea de Farmacie – Disciplina Matematică-Informatică