MA Curs 1 Statistica

download MA Curs 1 Statistica

of 8

description

statistica

Transcript of MA Curs 1 Statistica

  • MA Curs 1 Statistic 1

    STATISTIC

    Statistica se ocup cu colectarea, prelucrarea i interpretarea datelor.

    - Statistica descriptiv - culegerea i nregistrarea datelor asupra unui fenomen

    - Statistica matematic gruparea, analizarea i interpretarea datelor n vederea elaborrii

    unor previziuni privind evoluia viitoare a fenomenului.

    Aplicaii.

    - Fizic, inginerie, biologie, psihologie, economie, sociologie

    - Monitorizarea proceselor industriale

    - Teoria fiabilitii

    - Risc i prognoz

    Definiii.

    - populaie statistic = orice mulime care formeaz obiectul unei analize statistice (mulimea

    studenilor dintr-o serie , populaia unei ri sau a unui ora, o mulime de piese).

    - volumul populaiei statistice = numrul elementelor mulimii.

    - unitate statistic = un element din populaie ( un student, un locuitor, o pies)

    - caracteristic = o trstur comun tuturor unitilor unei populaii care ne intereseaz n

    cadrul analizei statistice ( nota la un examen , vrsta , diametrul piesei, nr ore de funcionare ).

    - selecie = alegerea la ntmplare a unor uniti statistice dintr-o populaie statistic i cercetarea

    lor din punct de vedere al caracteristicii. Selecia poate fi cu sau fr ntoarcere.

    - volumul seleciei = numrul elementelor seleciei

    Analiza se poate face dup una sau mai multe caracteristici (ex: gruparea unor indivizi dup vrst i

    dup venit). O caracteristic poate fi

    o cantitativ, dac se poate msura

    o calitativ, n caz contrar (mult, puin, bun,ru)

    - variabila statistic = valoarea numeric a unei caracteristici cantitative. Ea poate fi

    - discret dac ia un numr finit de valori sau

    - continu dac poate lua orice valoare dintr-un interval.

    Selecia poate fi total (n cazul unui recensmnt) sau parial. n practic, pentru a studia o

    anumit caracteristic a unei populaii statistice nu se examineaz toat populaia, ci numai un numr

    finit de uniti statistice. Se presupune c rezultatele obinute sunt caracteristice pentru toat populaia.

    Metodele de a alege un eantion reprezentativ nu fac obiectul acestui curs.

    Tipuri de probleme practice

    1. Se verific 200 de microcircuite dintr-un lot mai mare. Se gsesc 3 defecte. Putem afirma cu

    probabilitate 95% c 99% dintre microcircuite sunt bune?

    2. O firm produce un tip de piese. Probabilitatea s se produc o defectare n timpul primelor

    1000 de ore de funcionare este 0,02. Prin aplicarea unei tehnologii mbuntite s-au produs 20

  • MA Curs 1 Statistic 2

    de piese care au fost urmrite timp de 1000 de ore i s-a notat numrul defectrilor. Putem

    spune c se produc piese mai fiabile? Cu ce probabilitate?

    Pentru a rezolva probleme practice procedm n modul urmtor:

    - stabilim populaia statistic;

    - stabilim caracteristica (caracteristicile) : cantitativ sau calitativ;

    - realizm o selecie de volum n, adic studiem n uniti statistice i obinem un ir de valori

    n21 x,...,x,x ;

    - analizm aceste valori: le reprezentm grafic, calculm indicatori statistici;

    - modelm fenomenul fizic printr-unul teoretic: pe baza observaiilor statistica matematic ofer

    metode pentru a stabili care variabil aleatoare teoretic X se poate asocia fenomenului studiat.

    Aceast variabil aleatoare (sau repartiie) teoretic are o lege de repartiie (dat de repartiia

    probabilitilor sau de densitatea de repartiie) ce depinde de unul sau mai muli parametrii;

    - statistica matematic ofer metode pentru a estima (a aproxima) parametrii i pentru a verifica

    ipotezele fcute;

    - interpretm rezultatele, eventual realizm predicii.

    1. Elemente de statistica descriptiv

    Gruparea datelor

    Presupunem c n urma a n observaii independente realizate n condiii identice s-a obinut un ir de

    valori. Acestea se ordoneaz i se aeaz ntr-un tablou.

    Exemplul 1. S presupunem c s-a msurat o mrime fizic pentru 20 de piese alese la ntmplare

    dintr-o mulime mai mare i s-a obinut urmtorul ir statistic simplu 33 32 35 34 37 35 36 37 34 36

    33 37 33 35 36 35 35 34 37 33. Se observ c unele valori se repet, deci putem alctui

    urmtorul tablou:

    X 32 33 34 35 36 37

    nr apariii 1 4 3 5 3 4

    Reprezentarea variabilelor statistice discrete

    Printr-un tablou

    X 1x 2x kx

    Frecvene absolute 1

    2

    k

    Frecvene relative n

    1

    n

    2

    n

    k

  • MA Curs 1 Statistic 3

    Frecvene absolute

    cumulate 1

    1 2

    k21

    ...

    Frecvene relative

    cumulate n

    1

    n

    1

    n

    2

    n

    ...nn

    k21

    n care jx , k,1j sunt valorile distincte , n este volumul seleciei , j este frecvena absolut a

    valorii jx , adic numrul de apariii, k21 ...n , iar n/j este frecvena relativ.

    Prin bastoane

    Observaie. Tabelul

    n...

    nn

    x...xx

    k21

    k21

    este asemntor cu o variabil aleatoare

    k21

    k21

    p...pp

    x...xx:X .

    Indicatori statistici

    1. Media de selecie

    Pentru variabil statistic discret

    k

    1j

    jj

    not

    xn

    1X , k este numrul valorilor distincte

    2. Mediana - mparte irul ordonat n dou pri egale ca numr.

    Pentru variabil statistic discret

    dac 1p2n atunci 1pxMe ( valoarea din mijloc)

    - dac p2n atunci 2

    xxMe

    1pp

    3. Modul

    pentru o variabil statistic discret este valoarea cu frecven maxim;

    4. Amplitudinea absolut a unei serii statistice este minmax xxA .

    5. Dispersia 2k

    1j

    j

    2

    j

    k

    1j

    j

    2

    j Xxn

    1Xx

    n

    1XD

    , unde k este numrul valorilor distincte.

    6. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei) D

    O

    y

    x 1x kx

    1

  • MA Curs 1 Statistic 4

    7. Coeficientul de variaie X

    V

    .

    Exemplul 1. Relum exemplul de la pagina 1. S se reprezinte datele ntr-un tablou i s se calculeze

    indicatorii statistici.

    Rezolvare.

    X 32 33 34 35 36 37( )

    N1

    20

    4

    20

    3

    20

    5

    20

    3

    20

    4

    20

    32 33 34 35 36 37

    0.1

    0.2

    N

    X

    - Media este 85,3420

    697

    20

    437336535334433132X

    - Mediana 2

    xxMe 1kk

    , unde 10

    2

    nk . Considernd irul ordonat al valorilor avem

    35x10 , 35x11 35Me .

    - Amplitudinea absolut este 103242A .

    - Dispersia este

    X 32 33 34 35 36 37

    Frecvene

    absolute 1 4 3 5 3 4 20

    Frecvene

    relative 20

    1

    20

    4

    20

    3

    20

    5

    20

    3

    20

    4 1

    Frecvene

    absolute

    cumulate

    1 5 8 13 16 20

    Frecvene

    relative

    cumulate 20

    1

    20

    5

    20

    8

    20

    13

    20

    16 1

  • MA Curs 1 Statistic 5

    328,2X20

    437...334433132D 2

    2222

    - Abaterea medie ptratic 526,1D

    - coeficientul de variaie 043,0X

    V

    Pentru a calcula indicatorii statistici cu programul Mathcad

    Metoda 1. Introducem vectorul Z ce conine toate valorile:

    Z 32 33 33 33 33 34 34 34 35 35 35 35 35 36 36 36 37 37 37 37( )

    media este mean Z( ) 34.85 mediana este median Z( ) 35

    dispersia var Z( ) 2.328

    abaterea medie patratica stdev Z( ) 1.526

    1 3.322 log 20( ) 5.322 histogram 5 Z( )

    32.5

    33.5

    34.5

    35.5

    36.5

    1

    4

    8

    3

    4

    Metoda 2.

    X

    32

    33

    34

    35

    36

    37

    N

    1

    20

    4

    20

    3

    20

    5

    20

    3

    20

    4

    20

    media este m mean X N( ) m 34.85

    dispersia este mean X2

    N m2 2.327

    abaterea medie patratica este 2.327 1.525

    Dac numrul datelor e foarte mare se realizeaz o grupare pe intervale. Se consider cea mai

    mic i cea mai mare valoare ce determin un interval 1k1 x,x ce se mparte ntr-un numr de

    subintervale 21 x,x , 32 x,x ,, 1kk x,x . Lungimile intervalelor se pot calcula cu formula lui

    Sturges

  • MA Curs 1 Statistic 6

    nlg322,31

    xx minmax

    numrul intervalelor fiind nlg322,31 .

    Observaie. Dac avem un ir mare de date pe care dorim s le grupm n intervale cu ajutorul

    programului Mathcad folosim funcia histogram(n,X), n care n este numrul intervalelor, iar X este

    vectorul ce conine datele. Funcia returneaz o matrice n care prima coloan reprezint mijloacele

    intervalelor, iar a doua coloan frecvenele absolute corespunztoare fiecrui interval.

    Reprezentarea variabilelor statistice continue

    Printr-un tablou

    X 21 x,x 32 x,x 1kk x,x

    Frecvene absolute 1

    2

    k

    Frecvene relative n

    1

    n

    2

    n

    k

    Frecvene absolute

    cumulate 1

    1 2

    k21

    ...

    Frecvene relative

    cumulate n

    1

    n

    1

    n

    2

    n

    ...nn

    k21

    Prin histogram: lum pe axa orizontal segmente de lungimi egale ce reprezint amplitudinea

    claselor i construim pe aceste segmente dreptunghiuri cu nlimi proporionale cu frecvenele

    absolute sau relative. Dac din mijlocul fiecrui segment de pe axa orizontal ridicm

    segmente proporionale cu frecvenele i unim printr-o linie poligonal aceste puncte obinem

    poligonul frecvenelor.

    Indicatori statistici

    1. Media de selecie

  • MA Curs 1 Statistic 7

    Pentru variabil statistic continu

    k

    1j

    j

    *

    j

    not

    xn

    1X , unde k este numrul intervalelor, iar *jx

    sunt mijloacele intervalelor.

    2. Modul - pentru o variabil statistic continu este o valoare din intervalul cu frecven maxim

    3. Amplitudinea absolut a unei serii statistice este minmax xxA .

    4. Dispersia

    Pentru variabil aleatoare continu 2k

    1j

    j

    2*

    j

    k

    1j

    j

    2*

    j Xxn

    1Xx

    n

    1XD

    , unde k

    este numrul intervalelor, iar *

    jx sunt mijloacele intervalelor.

    5. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei)

    D

    6. Coeficientul de variaie X

    V

    .

    Exemplul 2. Relum exemplul de la pagina 1. S se mpart datele n intervale, s se reprezinte grafic i

    s se calculeze indicatorii statistici.

    Rezolvare. Numrul intervalelor este 5)20log(322,31 iar lungimea unui interval

    1)20log(322.31

    3237

    . Reprezentm datele ntr-un tabel

    X [32,33) [33,34) [34,35) [35,36) [36,37]

    Frecvene

    absolute 1 4 3 5 7

    Frecvene

    relative 20

    1

    20

    4

    20

    3

    20

    5

    20

    7

    Frecvene

    absolute

    cumulate

    1 5 8 13 20

    Frecvene

    relative

    cumulate 20

    1

    20

    5

    20

    8

    20

    13 1

    *

    jx 32,5 33,5 34,5 35,5 36,5

  • MA Curs 1 Statistic 8

    33 34 35 36 37

    [32,33) 1

    [33,34) 4

    [34,35) 3

    [35,36) 5

    [36,37) 7

    0

    1

    2

    3

    4

    5

    6

    7

    8

    fre

    cve

    nte

    valori

    Histograma

    [32,33)

    [33,34)

    [34,35)

    [35,36)

    [36,37)

    Pentru calculul indicatorilor statistici alctuim urmtorul tabel:

    intervale

    [32,33) 32.5 1 32.5 7.0225

    [33,34) 33.5 4 134 10.89

    [34,35) 34.5 3 103.5 1.2675

    [35,36) 35.5 5 177.5 0.6125

    [36,37] 36.5 7 255.5 12.7575

    20 703 32.55

    media 35.15 abaterea 1.276

    dispersia 1.628

    j2*

    j Xx j*

    jx *

    jx j

    - Media de selecie este 15,3520

    703x

    20

    1X

    5

    1j

    j

    *

    j

    , unde *

    jx sunt mijloacele intervalelor

    - dispersia 628,120

    55,32Xx

    20

    1D

    5

    1j

    j

    2*

    j

    - abaterea medie ptratic 276,1D

    - coeficientul de variaie 036,0X

    V

    .

    Se observ c rezultatele difer uor n cele dou cazuri. Calculele se pot face n Excel sau

    Mathcad.