Diagrama boxplot

2
Valori extreme (excesive) ale distribuţiei. Reprezentarea Box-and- Whisker-Plot (boxplot). [20,p.61-62] Valorile extreme reprezintă valori neobişnuit de mari sau mici faţă de celelalte valori ale unei distribuţii. Identificarea lor este necesară pentru a se evita efectul pe care îl au asupra valorilor tendinţei centrale, în primul rând asupra mediei. Una din metodele de identificare este analiza grafică de tip Box-and-Whisker-Plot (boxplot). Reprezentarea boxplot este constituită dintr-o casetă (dreptunghi) a cărei limită inferioară este plasată în dreptul percentilei 25, iar limita superioară în dreptul percentilei 75. Deci, caseta cuprinde 50% din valorile distribuţiei. Distanţa dintre valorile limită ale casetei se notează cu H. . Linia din interiorul casetei marchează valoarea mediană . “Mustăţile” care pornesc de la limitele superioară şi inferioară ale casetei au o lungime maximă egală cu 1,5H. În acel punct se plasează ultimele valori „normale” ale distribuţiei. Orice valoare mai mică sau mai mare decât acestea sunt definite ca extreme (outliers). Modul de reprezentare a boxplot-ului poate fi urmărit pe baza exemplului de mai jos. În tabel este dată distribuţia scorurilor IQ pentru 52 de persoane.

description

g

Transcript of Diagrama boxplot

Valori Q1

Valori extreme (excesive) ale distribuiei. Reprezentarea Box-and-Whisker-Plot (boxplot).

[20,p.61-62] Valorile extreme reprezint valori neobinuit de mari sau mici fa de celelalte valori ale unei distribuii. Identificarea lor este necesar pentru a se evita efectul pe care l au asupra valorilor tendinei centrale, n primul rnd asupra mediei. Una din metodele de identificare este analiza grafic de tip Box-and-Whisker-Plot (boxplot). Reprezentarea boxplot este constituit dintr-o caset (dreptunghi) a crei limit inferioar este plasat n dreptul percentilei 25, iar limita superioar n dreptul percentilei 75. Deci, caseta cuprinde 50% din valorile distribuiei. Distana dintre valorile limit ale casetei se noteaz cu H. . Linia din interiorul casetei marcheaz valoarea median . Mustile care pornesc de la limitele superioar i inferioar ale casetei au o lungime maxim egal cu 1,5H. n acel punct se plaseaz ultimele valori normale ale distribuiei. Orice valoare mai mic sau mai mare dect acestea sunt definite ca extreme (outliers). Modul de reprezentare a boxplot-ului poate fi urmrit pe baza exemplului de mai jos. n tabel este dat distribuia scorurilor IQ pentru 52 de persoane.Valori QIfafr%Frc%

Rang percentil

14211,9100

13511,998,1

12511,996,2

12411,994,2

12311,992,3

12111,990,4

11823,888,5

11711,984,6

11623,882,7

11523,878,8

11435,875,0

11323,869,2

11211,965,4

11011,963,5

10947,761,5

10835,853,8

10735,848,1

10623,842,3

10511,938,5

10411,936,5

10235,834,6

10147,728,8

9811,921,2

9723,819,2

9611,915,4

9411,913,5

9223,811,5

9111,97,7

8911,95,8

8711,93,8

8611,91,9

Total52100

Ilustrarea modului de construire a reprezentrii boxplot

Punctele marcate dincolo de limitele orizontale ale reprezentarii marcheaza valorile marginale ale distributiei (O=Outliers) si valorile extreme (E).

142 este valoare extrem Limita de sus a boxplot-ului

135 este valoare extrem poate urca pn la valoarea 128

Se fixeaz 125 pentru c 133,5 nu exist, iar celelalte

valori sunt mai

114+13x1,5=133,5 mari de 133,5

114 Percentila 75 este valoarea 114

Mediana = apr.107

H=114-101=13

101 Percentila 25 este valoarea 101, pentru c 28,8 este rangul percentil cel mai apropiat de 25

Limita de jos a

101-13 x 1,5=81,5 boxplotului

poate cobor pn la valoarea 81,5

Se fixeaz la 86, care este valoarea minim a distribuiei

142 este valoarea extrem

135 este valoarea extrem

107

107

_1284376219.unknown

_1284376286.unknown