Tipuri de Indicatori

12
Tipuri de indicatori Indicatori ai tendinţei centrale : Aceştia sunt valori tipice, reprezentative, care descriu distribuţia în întregul ei; Indicatori ai variabilitătii : Sunt valori care descriu caracteristica de împrăştiere a distribuţiei. O distribuţie care conţine aceeaşi valoare, ori de câte ori s-ar repeta ea, are o variabilitate zero. Indicatori ai formei distribuţiei : Sunt valori care se referă la forma curbei de reprezentare grafică a distribuţiei, prin comparaţie cu o curbă normală (oblicitate, aplatizare)

description

statistica

Transcript of Tipuri de Indicatori

  • Tipuri de indicatoriIndicatori ai tendinei centrale: Acetia sunt valori tipice, reprezentative, care descriu distribuia n ntregul ei;Indicatori ai variabilittii: Sunt valori care descriu caracteristica de mprtiere a distribuiei. O distribuie care conine aceeai valoare, ori de cte ori s-ar repeta ea, are o variabilitate zero.Indicatori ai formei distribuiei: Sunt valori care se refer la forma curbei de reprezentare grafic a distribuiei, prin comparaie cu o curb normal (oblicitate, aplatizare)

  • MEDIA ARITMETIC (m)Adugarea\scderea unei constante la fiecare valoare a distribuiei,mrete\scade media cu acea valoare nmulirea\mprirea fiecrei valori a distribuiei cu o constanta,multiplic\divide media cu acea constant Suma abaterii valorilor de la medie este ntotdeauna egal cu zero o Suma ptratului abaterilor de la medie va fi ntotdeauna mai mic dect suma ptratelor abaterilor n raport cu oricare alt punct al distribuiei

  • MEDIANA (Me)Este valoarea din mijlocul" unei distribuii, adic aceea care are 50% din valori deasupra ei i 50% dintre valori dedesubtul ei (cu alte cuvinte, percentila 50).Se gsete prin alctuirea tabelei de frecvene, n coloana frecvenelor relative procentuale cumulate, i corespunde valorii de 50%.In cazul distribuiilor cu numr impar de valori, Me este chiar valoare^ respectiv.In cazul distribuiilor pare, Me se calculeaz ca medie a celor dou valori dini mijlocul distribuieiExemplu: In seria de valori 5, 8, 3, 2, 5, 4, ordonat cresctor (2, 3, 4, 5, 5, 8), Me = 4,5 (ca medie a valorilor 4 i 5 aflate n mijlocul unei distribuii pare). Dac distribuia noastr ar fi avut 5 valori (far 2, de exemplu), Me = 5

  • MODUL (Mo)Este expresia ce mai direct a valorii tipice (reprezentative)In cazul unei distribuii simple, este valoarea cu frecvena cea mai mare de apariieIn cazul unei distribuii de frecvene grupate, este clasa de interval cu frecvena cea mai mare de apariieSe afl prin alctuirea tabelei de frecvene (simple sau grupate) i este valoarea creia i corespunde frecvena absolut cea mai ridicat.-Distribuiile pot avea un singur mod (unimodale), dou moduri (bimodale mai multe (multimodale)Exemplu: n seria de valori 5, 8, 3, 2, 5, 4, Mo = 5 (apare de cele mai multe \ri)

  • Avantajele i dezavantajele indicatorilor tendinei centrale

  • Valorile extremeValorile extreme reprezint valori excesive ale unei distribuii. Identificarea lor este necesar pentru a evita efectul pe care l au asupra valorilor tendinei centrale n primul rnd asupra mediei. Una dintre metodele de identificare este analiza grafic dep Box-and-Whisker-Plot (pe scurt Box-Plot), elaborat de Tukey.

  • Tratarea valorilor extreme

  • n esen, reprezentarea Box-Plot (vezi imaginea) este constituit dintr-o casu (dreptunghi), a crui limit inferioar este plasat n dreptul percentilei 25, limita superioar fiind plasat n dreptul percentilei 75. Cu alte cuvinte, caseta cuprinde 50'1 dintre valorile unei distribuii. Distana dintre valorile limit ale casetei se numete H.Linia din interiorul casetei marcheaz valoarea median (Me)Mustile" care pornesc de la limita superioar i inferioar a casetei, au ca lungime maxim egal cu 1,5 H. n acel punct se plaseaz ultima valoare legitim" al distribuiei. Orice valoare mai mic sau mai mare de acestea, sunt definite ca extreme (Outliers)

  • Tabel de frecvente

  • Pentru a face reprezentarea box plot facem mai nti tabela de frecvene simple, cu scopul calculrii percentilelor. Tabelul de frecvene alturat cuprinde valorile ordonate ale distribuiei, ntre de la valoarea cea mai mic (86) i se cea mai mare (142). Pe coloana frc% se afl frecvenele cumulate procentuale (percentilele). Pentru box plot identificm percentilele 25 i 75. Ele corespund valorilor 101 (este valoarea cea mai apropiat de 25 pe coloana frc%) i, respectiv, 114. Am obinut astfel, limita inferioar i superioar a casetei. Mediana (percentila 50) corespunde valorii 108 (frc% = 53.8, prin aproximare). Diferena dintre valorile corespunztoare percentilelor 25 i 50 este 13 (114101). Astfel putem determina limitele prelungirilor superioar i inferioar ale casetei care sunt: 114 + 13*1.5 = 128 (aproximare) pentru prelungirea superioar i, respectiv 101 - 13*1,5 = 83 (aproximare) pentru cea de jos. Am obinut astfel toate valorile necesare trasrii box plotului.

  • Stabilirea naturii valorilor extreme, care pot fi: erori de nregistrare (tastare);erori de msurare;rezultate influenate de anomalii ale condiiilor experimentale.eantionul a fost extras dintr-o populaie asimetricvalorile respective fac parte din alt populaie de valorieantion prea mic

  • Tratarea lor pe una din cile posibile: eliminare (dac sunt erori necorectabile);b.corectare (dac este posibil);c.utilizarea mediei 5%trim, adic a mediei care nu ine cont de 5% din numrul valorilor de la fiecare din cele dou extremiti ale distribuiei.d.transformare (dac datele sunt corecte i, totui, dorim s evitm efectul lor asupra indicatorilor sintetici). Exist diverse metode de transformare:extragerea radicalului din toate valorile distribuiei, logaritmi* distribuiei, etc.