Cât de împrăştiate sunt valorile observate, în jurul ...ileana.brudiu.ro/MVR/CURS/09....

24
Indicatori sintetici ai împrăştierii Cât de "împrăştiate" sunt valorile observate, în jurul tendinţei centrale?

Transcript of Cât de împrăştiate sunt valorile observate, în jurul ...ileana.brudiu.ro/MVR/CURS/09....

Indicatori sintetici ai împrăştierii

Cât de "împrăştiate" sunt

valorile observate, în

jurul tendinţei centrale?

Distribuţii omogene

Mo=Me=m=Xi, unde Xi este fiecare dintre valorile distribuţiei

xi ni

1 2

3 2

4 2

5 2

6 2

7 2

9 2

10 2

15 2

18 2

20 20

0.5

1

1.5

2

2.5

1 3 4 5 6 7 9 10 15 18 20

Media 2

Mediana 2

Modulul 2

Eterogen omogene (antonim)

Variabilitate

DIFERĂ PRIN MODUL DE

ÎMPRĂŞTIERE A

VALORILOR.

Setul de date:

2 4 6 8 10 12 14

Media: ҧ𝑥= 8

Mediana=8

Setul de date:

7 7 8 8 8 9 9

Media: ҧ𝑥= 8

Mediana=8

Setul de date:

5 6 7 8 9 10 11

Media: ҧ𝑥= 8

Mediana=8

0

2

4

6

8

10

12

14

16

1 2 3 4 5 6 7

Series1

Series2

Series3

Împrăştiere. Valorile dintr-o serie statistică pot fi mai

aglomerate în jurul mediei sau mai dispersate,

adică la distanţe mari de medie.

Un mod de a măsura aceste abateri de la medie

este să se facă diferenţa între toate aceste valori şi

media lor.

Unele abateri vor fi pozitive, altele negative.

Ele nu pot fi adunate, deoarece, prin adunare dau

suma 0.

Un veterinar nutriționist verifică efectul unei rețete pe un lot de subiecţi.Se evaluează greutatea înainte şi după administrarea probioticului. Distribuţia valorilor este reprezentată în imaginea alăturată: Aşa cum se observă, valorile măsurate înainte de tratament au o medie de 30 şi o împrăştiere (neomogenitate) mai mare, în timp ce valorile de după tratament prezintă o medie de 40 şi o împrăştiere mai mică, (sunt mai omogene). Acest fapt sugerează că tratamentul a avut efect.

În distribuţiile omogene media

este mai reprezentativă

decât în distribuţiile mai puţin omogene.

Lotul martor

Lotul tratat

m1=30 m2=40

greutatea

Indicatori ai variabilitățiiTipuri de indicatori

Amplitudinea absolută

Amplitudinea relativă

Abaterea medie

Dispersia (varianţa)

Abaterea standard

Coeficientul de variaţie

Indicatori elementari

Indicatori sintetici

Indicatori elementari

Dezavantaj: amplitudinea poate fi influenţat de o singură valoare aflata la extremitatea distribuţiei

ne indică în mod absolut plaja de valori între care se întinde

distribuţia.

minmax xxR

Amplitudinea absoluta

(R de la Range)

Amplitudinea relativa

100%m

RR

raportul procentual dintre amplitudinea absoluta şi

media distribuţiei

Dezavantaj: amplitudinea poate fi influenţat de o singură valoare aflata la extremitatea distribuţiei

surprind împrăştierea distribuţiei prin distanța dintre doar două valori ale acesteia.

Amplitudinea absolută, este diferenţa dintre maximul şi

minimul unei serii de valori şi ne dă informaţii despre

lărgimea plajei de valori pe care se întind datele din serie.

O serie de valori cu o amplitudine mare indică o plajă de

valori întinsă datorată fie unei dispersii sau împrăştieri

mari a datelor, fie simplului fapt că sunt multe valori.

Dacă două serii de valori au acelaşi număr de valori, dar

una are o amplitudine mai mare, atunci valorile ei sunt mai

împrăştiate.

Amplitudinea absolută

mediaminim

maxim

Aplitudinea absolută (R) diferenţa dintre valoarea maximăşi valoarea minimă

a unei distribuţii

indică în mod absolut plaja de valori între care se

întinde distribuţia.

poate fi influenţată de o singură valoare aflată la

extremitatea distribuţiei

R=Xmax-Xmin=7-1=6

1,2,3,4,5,6,7

Amplitudinea relativă (R%)

raportul procentual dintre amplitudine şi medie

utilă când cunoaştem plaja teoretică de variaţie a

valorilor.

1,2,3,4,5,6,7

𝑅% =𝑅

𝑚*100

𝑅% =6

4∗ 100 = 150%

Imprecizia amplitudinii Distribuţia A are o

amplitudine mai mare

dar şi o variabilitate mai

mare decât distribuţia B

Amplitudinile

distribuţiilor A şi B sunt

identice, dar distribuţia

A are mai multă

variabilitate.

Abaterea medie (d de la deviaţie medie)

Dispersia s2 (varianţa)

Abaterea s standard

Coeficientul de variaţie CV

Indicatori sintetici

Abaterea medie

Diferența dintre valoare caracteristicii şi media distribuţiei se numeşte abaterea valorii (xi-m).

Media abaterilor într-o distribuţie este întotdeauna egală cu zero.

Xi Xi – m

5 (5 – 4.5) = 0.5

8 (8 – 4.5) = 3.5

3 (3 – 4.5) = -1.5

2 (2 – 4.5) = -2.5

5 (5 – 4.5) = 0.5

4 (4 – 4.5) = -0.5

X = 27 (Xi-m) = 0

N = 6

m = 4.5

Xi (Xi – m)

5 │5 – 4.5│ = 0 .5

8 │8 – 4.5│ = 3.5

3 │3 – 4.5│ = 1.5

2 │2 – 4.5│ = 2.5

5 │5 – 4.5│ = 0.5

4 │4 – 4.5│ = 0.5

X = 27 |Xi-m| = 9

N = 6

m = 4.5

N

mXd

i

||

0/)( NmX i

Abaterea medie

Dispersia (varianţa)

Notaţii uzuale:

s2 (când se calculează pentru eşantion)

2 (când se calculează pentru întreaga populaţie)

Se măsoară în unități de măsură la pătrat

Dispersia - formule de calcul

Pentru eșantioane mai mici

Funcția VAR Compatibilitate: Estimează varianța pe

baza unui eșantion

Funcția VAR.P Calculează varianța pe baza întregii populații

Funcția VAR.S Estimează varianța pe baza unui eșantion

Funcția VARA Estimează varianța pe baza unui eșantion,

incluzând numere, text și valori logice

Funcția VARP Compatibilitate: Calculează varianța pe

baza întregii populații

Funcția VARPA Calculează varianța pe baza întregii

populații, incluzând numere, text și valori

logice

𝜎2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖

2

𝑛

𝑠2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖

2

𝑛 − 1

X (Xi – m) (Xi – m) 2

5 (5 – 4.5) = 0 .5 0.25

8 (8 – 4.5) = 3.5 12.25

3 (3 – 4.5) = -1.5 2.25

2 (2 – 4.5) = -2.5 6.25

5 (5 – 4.5) = 0 .5 0.25

4 (4 – 4.5) = -0.5 0.25

X = 27 (Xi-m) = 0 (X-m)2 = 21.5

N = 6

M = 4.5

Pentru a elimina inconvenientul abaterilor

de la medie de a avea suma egală cu zero, se

operează ridicarea la pătrat a abaterilor

valorilor individuale.

n-1

mXs

i

2

2)(

Abaterea standard (deviația standard)

Abaterea standard este indicatorul principal al împrăştierii utilizat în diverse proceduri statistice avansate.

Notaţii uzuale:

s (pentru eşantioane)

(pentru populaţie)

SD (Standard Deviation)

ab.std.

Se măsoară în unitățile de măsură ale caracteristicii.

Abaterea standard

Funcția STDEV Compatibilitate: Estimează

abaterea standard pe baza unui

eșantion

Funcția STDEV.P Calculează abaterea standard pe baza

întregii populații

Funcția STDEV.S Estimează abaterea standard pe baza

unui eșantion

Funcția STDEVA Estimează abaterea standard pe baza

unui eșantion, incluzând numere, text

sau valori logice

Funcția STDEVP Compatibilitate: Calculează abaterea

standard pe baza întregii populații

Funcția STDEVPA Calculează abaterea standard pe baza

întregii populații, incluzând numere,

text sau valori logice

𝜎 = 𝜎2 =σ𝑖=1𝑛 𝑥𝑖 −𝑚𝑖

2

𝑛

Coeficientul de variaţie (%)

100*m

scv

Cu cât este mai mare, cu atât media putem spune că media este mai puţin „reprezentativă” pentru distribuţia respectivă, dată fiind ponderea ridicată a împrăştierii.

Coeficientul de variaţie este cel mai utilizat şi mai

semnificativ indicator pentru analiza variaţiei.

CV=0, seria este perfect omogenă, toți termenii seriei sunt egali între ei și sunt egali cu media: în acest caz nu există variație

cv<15%, împrăştierea este mică şi, deci, media este reprezentativă

15%<cv<30%, împrăştierea este mijlocie şi media este suficient de reprezentativă

cv > 30%, împrăştierea este mare şi media are o reprezentativitate redusă

Cv=70-75%, seria este eterogenă, variaţia este foarte mare, media nu este reprezentativă, iar gruparea trebuie refăcută.

Alegerea indicatorului împrăştierii

Abaterea standard este cea mai utilizată pentru scale de măsurare interval/raport.

Amplitudinea este un indicator nesigur şi care nici nu poate fi calculat în cazul scalelor nominale

Indicatori ai împrăştierii.

(rezumat) Cei mai importanţi, sunt:

dispersia (varianța) (𝑠2, 𝜎2), (se măsoară în unități de

măsură ale caracteristicii la pătrat)

abaterea standard (deviația standard) (𝑠, 𝜎) (se

măsoară în unități de măsură ale caracteristicii )

coeficientul de variaţie (cv %). (se măsoară în %)

Coeficientul de variaţie este cel mai utilizat şi mai

semnificativ indicator pentru analiza variaţiei.