Cât de împrăştiate sunt valorile observate, în jurul ...ileana.brudiu.ro/MVR/CURS/09....
Transcript of Cât de împrăştiate sunt valorile observate, în jurul ...ileana.brudiu.ro/MVR/CURS/09....
Indicatori sintetici ai împrăştierii
Cât de "împrăştiate" sunt
valorile observate, în
jurul tendinţei centrale?
Distribuţii omogene
Mo=Me=m=Xi, unde Xi este fiecare dintre valorile distribuţiei
xi ni
1 2
3 2
4 2
5 2
6 2
7 2
9 2
10 2
15 2
18 2
20 20
0.5
1
1.5
2
2.5
1 3 4 5 6 7 9 10 15 18 20
Media 2
Mediana 2
Modulul 2
Eterogen omogene (antonim)
Variabilitate
DIFERĂ PRIN MODUL DE
ÎMPRĂŞTIERE A
VALORILOR.
Setul de date:
2 4 6 8 10 12 14
Media: ҧ𝑥= 8
Mediana=8
Setul de date:
7 7 8 8 8 9 9
Media: ҧ𝑥= 8
Mediana=8
Setul de date:
5 6 7 8 9 10 11
Media: ҧ𝑥= 8
Mediana=8
0
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7
Series1
Series2
Series3
Împrăştiere. Valorile dintr-o serie statistică pot fi mai
aglomerate în jurul mediei sau mai dispersate,
adică la distanţe mari de medie.
Un mod de a măsura aceste abateri de la medie
este să se facă diferenţa între toate aceste valori şi
media lor.
Unele abateri vor fi pozitive, altele negative.
Ele nu pot fi adunate, deoarece, prin adunare dau
suma 0.
Un veterinar nutriționist verifică efectul unei rețete pe un lot de subiecţi.Se evaluează greutatea înainte şi după administrarea probioticului. Distribuţia valorilor este reprezentată în imaginea alăturată: Aşa cum se observă, valorile măsurate înainte de tratament au o medie de 30 şi o împrăştiere (neomogenitate) mai mare, în timp ce valorile de după tratament prezintă o medie de 40 şi o împrăştiere mai mică, (sunt mai omogene). Acest fapt sugerează că tratamentul a avut efect.
În distribuţiile omogene media
este mai reprezentativă
decât în distribuţiile mai puţin omogene.
Lotul martor
Lotul tratat
m1=30 m2=40
greutatea
Indicatori ai variabilitățiiTipuri de indicatori
Amplitudinea absolută
Amplitudinea relativă
Abaterea medie
Dispersia (varianţa)
Abaterea standard
Coeficientul de variaţie
Indicatori elementari
Indicatori sintetici
Indicatori elementari
Dezavantaj: amplitudinea poate fi influenţat de o singură valoare aflata la extremitatea distribuţiei
ne indică în mod absolut plaja de valori între care se întinde
distribuţia.
minmax xxR
Amplitudinea absoluta
(R de la Range)
Amplitudinea relativa
100%m
RR
raportul procentual dintre amplitudinea absoluta şi
media distribuţiei
Dezavantaj: amplitudinea poate fi influenţat de o singură valoare aflata la extremitatea distribuţiei
surprind împrăştierea distribuţiei prin distanța dintre doar două valori ale acesteia.
Amplitudinea absolută, este diferenţa dintre maximul şi
minimul unei serii de valori şi ne dă informaţii despre
lărgimea plajei de valori pe care se întind datele din serie.
O serie de valori cu o amplitudine mare indică o plajă de
valori întinsă datorată fie unei dispersii sau împrăştieri
mari a datelor, fie simplului fapt că sunt multe valori.
Dacă două serii de valori au acelaşi număr de valori, dar
una are o amplitudine mai mare, atunci valorile ei sunt mai
împrăştiate.
Amplitudinea absolută
mediaminim
maxim
Aplitudinea absolută (R) diferenţa dintre valoarea maximăşi valoarea minimă
a unei distribuţii
indică în mod absolut plaja de valori între care se
întinde distribuţia.
poate fi influenţată de o singură valoare aflată la
extremitatea distribuţiei
R=Xmax-Xmin=7-1=6
1,2,3,4,5,6,7
Amplitudinea relativă (R%)
raportul procentual dintre amplitudine şi medie
utilă când cunoaştem plaja teoretică de variaţie a
valorilor.
1,2,3,4,5,6,7
𝑅% =𝑅
𝑚*100
𝑅% =6
4∗ 100 = 150%
Imprecizia amplitudinii Distribuţia A are o
amplitudine mai mare
dar şi o variabilitate mai
mare decât distribuţia B
Amplitudinile
distribuţiilor A şi B sunt
identice, dar distribuţia
A are mai multă
variabilitate.
Abaterea medie (d de la deviaţie medie)
Dispersia s2 (varianţa)
Abaterea s standard
Coeficientul de variaţie CV
Indicatori sintetici
Abaterea medie
Diferența dintre valoare caracteristicii şi media distribuţiei se numeşte abaterea valorii (xi-m).
Media abaterilor într-o distribuţie este întotdeauna egală cu zero.
Xi Xi – m
5 (5 – 4.5) = 0.5
8 (8 – 4.5) = 3.5
3 (3 – 4.5) = -1.5
2 (2 – 4.5) = -2.5
5 (5 – 4.5) = 0.5
4 (4 – 4.5) = -0.5
X = 27 (Xi-m) = 0
N = 6
m = 4.5
Xi (Xi – m)
5 │5 – 4.5│ = 0 .5
8 │8 – 4.5│ = 3.5
3 │3 – 4.5│ = 1.5
2 │2 – 4.5│ = 2.5
5 │5 – 4.5│ = 0.5
4 │4 – 4.5│ = 0.5
X = 27 |Xi-m| = 9
N = 6
m = 4.5
N
mXd
i
||
0/)( NmX i
Abaterea medie
Dispersia (varianţa)
Notaţii uzuale:
s2 (când se calculează pentru eşantion)
2 (când se calculează pentru întreaga populaţie)
Se măsoară în unități de măsură la pătrat
Dispersia - formule de calcul
Pentru eșantioane mai mici
Funcția VAR Compatibilitate: Estimează varianța pe
baza unui eșantion
Funcția VAR.P Calculează varianța pe baza întregii populații
Funcția VAR.S Estimează varianța pe baza unui eșantion
Funcția VARA Estimează varianța pe baza unui eșantion,
incluzând numere, text și valori logice
Funcția VARP Compatibilitate: Calculează varianța pe
baza întregii populații
Funcția VARPA Calculează varianța pe baza întregii
populații, incluzând numere, text și valori
logice
𝜎2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖
2
𝑛
𝑠2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖
2
𝑛 − 1
X (Xi – m) (Xi – m) 2
5 (5 – 4.5) = 0 .5 0.25
8 (8 – 4.5) = 3.5 12.25
3 (3 – 4.5) = -1.5 2.25
2 (2 – 4.5) = -2.5 6.25
5 (5 – 4.5) = 0 .5 0.25
4 (4 – 4.5) = -0.5 0.25
X = 27 (Xi-m) = 0 (X-m)2 = 21.5
N = 6
M = 4.5
Pentru a elimina inconvenientul abaterilor
de la medie de a avea suma egală cu zero, se
operează ridicarea la pătrat a abaterilor
valorilor individuale.
n-1
mXs
i
2
2)(
Abaterea standard (deviația standard)
Abaterea standard este indicatorul principal al împrăştierii utilizat în diverse proceduri statistice avansate.
Notaţii uzuale:
s (pentru eşantioane)
(pentru populaţie)
SD (Standard Deviation)
ab.std.
Se măsoară în unitățile de măsură ale caracteristicii.
Abaterea standard
Funcția STDEV Compatibilitate: Estimează
abaterea standard pe baza unui
eșantion
Funcția STDEV.P Calculează abaterea standard pe baza
întregii populații
Funcția STDEV.S Estimează abaterea standard pe baza
unui eșantion
Funcția STDEVA Estimează abaterea standard pe baza
unui eșantion, incluzând numere, text
sau valori logice
Funcția STDEVP Compatibilitate: Calculează abaterea
standard pe baza întregii populații
Funcția STDEVPA Calculează abaterea standard pe baza
întregii populații, incluzând numere,
text sau valori logice
𝜎 = 𝜎2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖
2
𝑛
Coeficientul de variaţie (%)
100*m
scv
Cu cât este mai mare, cu atât media putem spune că media este mai puţin „reprezentativă” pentru distribuţia respectivă, dată fiind ponderea ridicată a împrăştierii.
Coeficientul de variaţie este cel mai utilizat şi mai
semnificativ indicator pentru analiza variaţiei.
CV=0, seria este perfect omogenă, toți termenii seriei sunt egali între ei și sunt egali cu media: în acest caz nu există variație
cv<15%, împrăştierea este mică şi, deci, media este reprezentativă
15%<cv<30%, împrăştierea este mijlocie şi media este suficient de reprezentativă
cv > 30%, împrăştierea este mare şi media are o reprezentativitate redusă
Cv=70-75%, seria este eterogenă, variaţia este foarte mare, media nu este reprezentativă, iar gruparea trebuie refăcută.
Alegerea indicatorului împrăştierii
Abaterea standard este cea mai utilizată pentru scale de măsurare interval/raport.
Amplitudinea este un indicator nesigur şi care nici nu poate fi calculat în cazul scalelor nominale
Indicatori ai împrăştierii.
(rezumat) Cei mai importanţi, sunt:
dispersia (varianța) (𝑠2, 𝜎2), (se măsoară în unități de
măsură ale caracteristicii la pătrat)
abaterea standard (deviația standard) (𝑠, 𝜎) (se
măsoară în unități de măsură ale caracteristicii )
coeficientul de variaţie (cv %). (se măsoară în %)
Coeficientul de variaţie este cel mai utilizat şi mai
semnificativ indicator pentru analiza variaţiei.