Curs_1_stat
-
Upload
bogdan-andrei-pinzaru -
Category
Documents
-
view
3 -
download
1
description
Transcript of Curs_1_stat
1
Curs #1
BIOSTATISTICĂ
End
Facultatea de Farmacie – Disciplina Matematică-Informatică
Indicatorii
variaţiei
Valorile medii descriu informaţia într-o formă integrată, exprimând tendinţa de localizare a datelor prin neprezentarea cunoştinţelor înglobate în lot despre variaţia existentă.
Indicatorii de localizare redau doar o singură trăsătură comună întregii colectivităţi.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Indicatorii
variaţiei
Se simte nevoia definirii unor noi indicatori statistici care să evidenţieze şi alte aspecte ale populaţiei studiate.
Categoria de indicatori de dispersie (variaţie) reprezintă o evaluare numerică a împrăştierii datelor.
Variaţia luată în considerare se poate raporta chiar la valoarea medie calculată.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
Dispersia sau varianţa reprezintă o mediere a pătratelor distanţelor faţă de valoarea medie a şirului de date. Se notează cu sau D[x].
Are următoarea formulă de calcul (pentru volumul n al eşantionului de valori mari, n>30):
2σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
( ) ( ) ( ) ( )
n
xx
nxxxxxx
n
ii
n∑=
−=
−++−+−= 1
222
22
12 .....σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
Dacă avem valorile x1, x2, x3, …, xn cu frecvenţeleabsolute a1, a2, …, am, atunci formula de calcul:
( ) ( ) ( )=
+++−⋅++−⋅+−⋅
=m
mmaaa
xxaxxaxxa....
.....
21
2222
2112σ
( ) ( )
n
xxa
a
xxam
iii
m
ii
m
iii ∑
∑
∑=
=
=−⋅
=−⋅
= 1
2
1
1
2
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
Considerând frecvenţele relative fi, obţinem:
( )( ) ( )∑ ∑
∑
= =
= −⋅=−⋅=−⋅
=m
i
m
iiii
i
m
iii
xxfxxna
n
xxa
1 1
221
2
2σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
Sunt cazuri în care dispersia trebuie estimată dintr-un eşantion de date.
Dacă volumul eşantionului este mai mic decât 30, atunci se aplică o corecţie formulei de calcul.
În acest caz ajustarea este în sensul că nu se împarte la n ci la n-1 (numit şi numărul gradelor de libertate).
Facultatea de Farmacie – Disciplina Matematică-Informatică
Dispersia (varianţa)
( ) ( )
11121
2
1
2
2−
⋅=−
⋅−
=−
−=
∑∑==
nn
nn
n
xx
n
xxn
ii
n
ii
estimat σσ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
Prin extragerea rădăcinii pătrate din dispersie se obţine abaterea pătratică medie.
Astfel, deviaţia standard şi indicatorii de localizare se exprimă cu aceleaşi unităţi de măsură.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
( )
n
xxxD
n
ii∑
=−
== 1
2
][ σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
Ţinând cont de frecvenţele absolute şi relative pe intervale avem:
Putem dezvolta expresia dispersiei în continuare:
( )( ) ( )∑∑
∑
==
= −⋅=−⋅=−⋅
=m
iii
m
ii
i
m
iii
xxfxxna
n
xxa
1
2
1
21
2
σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
( )
.21
2
1
2
1
1
2
1
2
11
2
1
2
n
xx
n
xx
n
n
x
n
xx
n
x
n
xx
n
i
n
iin
ii
n
i
n
ii
n
ii
n
ii
∑∑∑
∑∑∑∑
==
=
====
+⋅⋅−⋅=
=+⋅⋅
−=−
=σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
2
1
21P
n
ii Mx
n=⋅∑
=x
n
xn
ii=
∑=1
221
2
1 xxnnn
xn
i =⋅⋅=∑=
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
( )
.21
2
1
2
1
1
2
1
2
11
2
1
2
n
xx
n
xx
n
n
x
n
xx
n
x
n
xx
n
i
n
iin
ii
n
i
n
ii
n
ii
n
ii
∑∑∑
∑∑∑∑
==
=
====
+⋅⋅−⋅=
=+⋅⋅
−=−
=σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Abaterea pătratică medie
(deviaţia standard)
Abaterea pătratică medie
Abaterea pătratică medie este rădăcina pătratică din diferenţa dintre pătratul mediei pătratice şi pătratul mediei aritmetice.
22222 2 xMxxM PP −=+⋅−=σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Amplitudinea
Este definită ca diferenţa valorilor extreme ale şirului de date studiat şi se notează cu W sau A (în majoritatea cazurilor):
W = A = Xmax -
Xmin .
Facultatea de Farmacie – Disciplina Matematică-Informatică
Amplitudinea
În cazul grupării datelor pe clase se defineşte şi noţiunea de amplitudine a clasei, notată cu wi (corespunzător clasei i).
Această mărime este egală cu diferenţa dintre valorile extreme ale clasei respective.
Cu cât este mai mică valoarea sa cu atât lotul este mai omogen.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Amplitudinea
Aspecte negative (dezavantaje) ale amplitudinii:
-
depinde de eşantion, având variaţii pentru fiecare eşantion în parte,
-
nu ţine seama de tipul repartiţie.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Intervalul intercuartilic
Cuartilele (sau cvartilele) împart datele în 4 clase de frecvenţe egale cu 25%.
Astfel, sunt necesare 3 valori Q1, Q2, Q3 care reprezintă cuartilele.
Presupunem că avem o distribuţie a frecvenţelor parametrului x (discret), conform graficului din figura urmatoare.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Cuartilele
Q1, Q2, Q3
0
2
4
6
8
10
12
parametrul x
Distributia de frecventa
Q1 Q2 Q3
Facultatea de Farmacie – Disciplina Matematică-Informatică
Intervalul intercuartilic
Suma frecvenţelor până la limita determinată de Q1 este egală cu suma frecvenţelor dintre Q1 şi Q2, de asemenea egală cu suma frecvenţelor dintre Q2 şi Q3şi în final, egală cu suma frecvenţelor de după Q3.
Dacă repartiţia ar fi fost de tip continuu, această sumă ar fi integrala determinată de limitele notate Qi.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Intervalul intercuartilic
(Iq)
Intervalul cuartilic se defineşte ca fiind diferenţa dintre Q3 şi Q1 (ultima şi prima cuartilă).
Q1 se numeşte cuartilă inferioară sau mică, Q3 se numeşte cuartila superioară sau mare.
Prin urmare, intervalul intercuartilic va fi:
Iq = Q3 – Q1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Coeficientul
de variaţie
intercuartilic
(q)
ObservaţieCuartila Q2 este tocmai mediana Me.
Se defineşte coeficientul de variaţie intercuartilică ca fiind raportul:
e
q
MI
QQQq =
−=
2
13
Facultatea de Farmacie – Disciplina Matematică-Informatică
Coeficientul de variaţie
(CV)
Abaterea pătratică medie se interpretează prin compararea cu media valorilor studiate.
Dacă avem o medie de 100 şi o abatere pătratică standard , atunci avem mici variaţii, dar dacă avem aceeaşi abatere la o medie de 10, atunci variaţia este foarte mare.
5=σ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Coeficientul de variaţie
(CV)
În concluzie, este necesară raportarea abaterii pătratice la valoarea mediei, pentru a exprima corect împrăştierea datelor.
Se defineşte coeficientul de variaţie:
xCVx
σ=
Facultatea de Farmacie – Disciplina Matematică-Informatică
Coeficientul de variaţie
(CV)
Acest coeficient este o măsură relativă a variaţiei datelor faţă de medie.
Astfel, indiferent de medie, seturile de date, chiar de natură diferită, pot fi comparate folosind coeficientul de variaţie.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momente
Momentele ajută la determinarea anumitor caracteristici legate de forma (alură) repartiţiilor, care nu pot fi determinate doar cu indicatorii statistici de localizare sau variaţie.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentele centrate de ordin k (k≥1)
Se definesc momentele centrate de ordin k în raport cu originea arbitrară A, ca fiind exprimate prin formula:
( )∑=
−⋅=n
i
ki
Ak Ax
nm
1
1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentele centrate de ordin k (k≥1)
Exprimăm formula în funcţie de frecvenţele absolute ai, respectiv frecvenţele relative fi şi obţinem:
( ) ( )( )∑
∑
∑
∑
=
=
=
= −⋅=
−⋅
=
−⋅
=m
j
kij
m
j
kij
m
jj
m
j
kij
Ak Axf
n
Axa
a
Axam
1
1
1
1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentele centrate de ordin k (k≥1)
Dacă originea aleasă este tocmai media aritmetică, atunci momentul centrat de ordin k se va calcula cu formula :
momentul centrat de ordin k în raport cu media aritmetică.
( )∑=
−⋅=n
i
kik xx
nm
1
1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentele centrate de ordin k (k≥1)
În cazul notaţiei momentelor centrate în raport cu media aritmetică nu se mai afişează în partea superioară a lui m originea de centrare.Momentul centrat de ordin 2 în raport cu media aritmetică este tocmai dispersia:
( ) 2
1
22
1 σ=−⋅= ∑=
n
ii xx
nm
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentul
absolut
de ordin k (k≥1)
Din formula momentului centrat de ordin k în raport cu referinţa A se poate deduce momentul absolut.
Dacă A=0 se obţine momentul absolut:
∑∑∑===
⋅=⋅⋅=⋅=m
j
kjj
m
j
kjj
n
i
kik xfxa
nx
nm
111
` 11
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentul
absolut
de ordin k (k≥1)
ai – frecvenţa absolută;
fi – frecvenţa relativă;
m – numărul de clase;
n – numărul de elemente.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Momentul
absolut
de ordin k (k≥1)
Pentru k=1 se obţine:
, adică momentul absolut de ordin 1, care este egal cu media aritmetică.
xxn
mn
ii =⋅= ∑
=1
`1
1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
Momentul centrat de ordin 1 cu originea în media aritmetică este 0 (suma algebrică a abaterilor individuale faţă de medie este egală cu 0).
Demonstraţie:
0111)(1
11 11 =−=⋅⋅−=⋅−⋅=−⋅= ∑∑ ∑
== =xxxn
nxx
nx
nxx
nm
n
i
n
i
n
iii
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
Momentul minim centrat de ordin 2 are originea în media aritmetică (media abaterilor pătratice are valoare minimă când aceasta este calculată în raport cu media aritmetică).Demonstraţie:
Momentul centrat de ordin doi este :
∑=
−⋅=n
ii
A Axn
m1
22 )(1
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
Facem un artificiu de calcul, adăugând şi scăzând valoarea medie.
.)(1)()(2
)(1])()[(1
1
2
1
1
22
12
⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅+⎟⎟
⎠
⎞⎜⎜⎝
⎛−⋅
−⋅−
−⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅=−−−⋅=
∑∑
∑∑
==
==
n
i
n
ii
n
ii
n
ii
A
xAn
xxn
xA
xxn
xAxxn
m
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
Conform proprietăţii (1) avem:
Astfel, paranteza a doua are valoarea 0. În continuare obţinem:
0)(11
1==−⋅= ∑
=mxx
n
n
iiσ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
.)(
)(1)(1)(1
2
1
22
1
2
1
22
pozitivtermenm
xAn
mxAn
xxn
mn
i
n
i
n
ii
A
+=
=⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅+=⎟⎟
⎠
⎞⎜⎜⎝
⎛−⋅+⎟⎟
⎠
⎞⎜⎜⎝
⎛−⋅= ∑∑∑
===
Facultatea de Farmacie – Disciplina Matematică-Informatică
Proprietăţi ale momentelor
Din ultima formulă tragem concluzia că oricare ar fi A, momentul centrat de ordin 2 cu originea în A este egal cu momentul centrat cu originea în media aritmetică, la care se adaugă un termen pozitiv.
De aici deducem că momentul centrat de ordin 2 cu originea în media aritmetică este minimul momentului centrat de ordin 2.
Facultatea de Farmacie – Disciplina Matematică-Informatică
Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică
Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu
( ) =⋅+⋅⋅⋅−⋅=−⋅= ∑∑∑∑====
m
ii
m
iii
m
iii
m
iii xfxfxxfxxfm
1
2
11
2
1
22 2)(
Facultatea de Farmacie – Disciplina Matematică-Informatică
Relaţii între momentele absolute şi cele centrate în raport cu media aritmetică
Se pot stabili diferite relaţii între momentele absolute şi cele centrate în raport cu media aritmetică. Iată unexemplu (Formula lui Konig):
( )( ) .
1
22`
1`22
1
1
2`1
`1
`1
`2
mmmfDar
fmmmm
n
ii
n
ii
−=⇒
⎪⎪⎭
⎪⎪⎬
⎫
=
⋅+⋅⋅−=
∑
∑
=
=
Facultatea de Farmacie – Disciplina Matematică-Informatică
Asimetrie (skewness)
O distribuţie este considerată simetrică, dacă de o parte şi de alta a mediei, frecvenţele au aceleaşi valori.Notăm cu f(xi) – frecvenţa; m – mediaSimetria în raport cu media există, dacă pentru oricare Δ∈R avem relaţia:
)()( Δ+=Δ− mfmf
Facultatea de Farmacie – Disciplina Matematică-Informatică
Asimetrie (skewness)
În continuare, putem caracteriza asimetria în funcţie de poziţionarea mediei faţă de modul:1 – Avem asimetrie la dreapta, dacă (vezi figura).
2 – Avem asimetrie la stânga, dacă (vezi figura).
Mox >
Mox <
Facultatea de Farmacie – Disciplina Matematică-Informatică
Asimetrie (skewness)
Asimetrie la dreapta
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
Mo M(x)
Facultatea de Farmacie – Disciplina Matematică-Informatică
Asimetrie (skewness)
Asimetrie la stânga
1 4 7 10 13 16 19 22 25 28 31 34 37 40
M(x) Mo
Facultatea de Farmacie – Disciplina Matematică-Informatică
Asimetrie (skewness)
Pentru a obţine o măsură a asimetriei, statisticianul englez Karl Pearson a definit indicatorul relativ de asimetrie (acest indicator este adimensional, fiind astfel util pentru a compara distribuţiile între ele):
σMoxSk −
=
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Acest indicator compară distribuţia dată cu cea normală sau gausiană (descrisă în capitolul Repartiţii continue).
Statisticianul englez Karl Pearson a definit de asemenea coeficientul de boltire:
( ) 44
22
42
σβ
mmm
==
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Pentru o distribuţie normală,
Din punct de vedere al boltirii avem următoarea clasificare, reprezentată grafic in continuare:
32 =normalβ
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Repartiţie aplatizată sau platicurtică
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
32 <β
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Repartiţie medie sau mezocurtică
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
32 =β
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Repartiţie ascuţită sau leptocurtică
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
32 >β
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Pentru descrierea boltirii se poate folosi şi coeficientul Fisher, ce măsoară excesul faţă de distribuţia normală. Acesta se calculează cu formula:
echivalenta
cu
33 44
22 −=−=σ
βγ m
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
( )34
1
4
2 −⋅
−=∑=
σγ
n
xxn
ii
Facultatea de Farmacie – Disciplina Matematică-Informatică
Boltirea (excesul, kurtosis)
Pentru valori mici ale volumului eşantionului se împarte la n-1 în loc de n.Avem următoarele modalităţi de caracterizare a distribuţiilor:- Mezocurtică .-
Leptocurtică .
- Platicurtică .
0,3 22 == γβ0,3 22 >> γβ0,3 22 << γβ
Facultatea de Farmacie – Disciplina Matematică-Informatică