Problem Ere Gresi e

download Problem Ere Gresi e

of 22

Transcript of Problem Ere Gresi e

  • 7/31/2019 Problem Ere Gresi e

    1/22

    REGRESIA LINIARA UNIFACTORIALA

    Probleme rezolvate1. n tabelul urmtor avem date referitoare la 15 ageni de asigurri angajai ai unei

    companii de asigurri de via i anume: timpul mediu, n minute, petrecut de un agent cu

    un potenial client i numrul de polie ncheiate ntr-o sptmn. Dac X reprezinttimpul mediu, iar Y reprezint numrul de polie, avem datele sistematizate astfel:

    X Y

    2523302520331821

    22302626272920

    10111412

    818

    910

    10151115121411

    Se cere:a) s se estimeze parametrii modelului liniar de regresie;b) s se testeze semnificaia parametrilor modelului pentru un prag de semnificaie

    = 5%;

    c) s se determine erorile reziduale;d) s se testeze validitatea modelului de regresie pentru un nivel de semnificaie =5%;

    e) msurai intensitatea legturii dintre cele dou variabile folosind un indicatoradecvat i testai semnificaia acestuia pentru un nivel de ncredere de 0,5%;

    f) efectuai o previzionare punctual i pe interval de ncredere a numrului depolie ncheiate de un agent care petrece n medie 24 de minute cu un potenialclient.

    Rezolvare:Pentru a determina forma modelului de regresie se va construi corelograma:

  • 7/31/2019 Problem Ere Gresi e

    2/22

    6

    8

    10

    12

    14

    16

    16 18 20 22 24 26 28 30 32 34

    OY

    timpul mediu

    OX

    numar polite

    1 cm OY = 5 polie1 cm OX = 2 minute

    a) i10i xaay +=Parametrii a i b se determin cu ajutorul metodei celor mai mici ptrate:

    ( ) ( ) minxaayminyyi

    2i10i

    i

    2ii

    =+

    =+

    ===

    ==n

    1iii

    n

    1i

    2i1

    n

    1ii0

    n

    1ii

    n

    1ii10

    yxxaxa

    yxana

    15n =

    Pentru a rezolva sistemul vom folosi urmtorul tabel n care sunt prezentate valorileintermediare:

    ix iy 2ix ii yx 2iy ( )2i yy ( )2i xx 25233025203318212230

    2626272920

    10111412

    818

    9101015

    1115121411

    625529900625400

    1089324441484900

    676676729841400

    250253420300160594162210220450

    286390324406220

    10012119614464

    32481

    100100225

    121225144196121

    4140

    16369449

    19041

    04

    250

    25644916

    925

    114

    1625

    375

    x i =180

    y i =9639

    x2i =4645

    yx ii =2262

    y2i = 102 264

  • 7/31/2019 Problem Ere Gresi e

    3/22

    =+=+

    46459639a375a

    180375aa15

    10

    10

    ==

    5492,0a

    73,1a

    1

    0

    Deci:

    ii x5492,073,1y +=

    b) Testarea semnificaiei parametrilor modelului:Ecuaia de regresie la nivelul colectivitii generale este:

    ii10i uxy ++=

    iar la nivelul eantionului este:

    ii10i uxaay ++=

    Testarea semnificaiei parametrului 1:1) se stabilete ipoteza nul:

    H0 : 1 = 02) se stabilete ipoteza alternativ:

    H1 : 1 0, adic 1 este semnificativ diferit de zero, adic 1 estesemnificativ statistic.

    3) se calculeaz testul statistic:deoarece n = 15 < 30 avem eantion de volum redus i pentru testare vom utiliza

    testul t:

    8,608,0

    5492,0

    s

    a

    s

    0a

    s

    at

    111 a

    1

    a

    1

    a

    11 ===

    =

    =

    ( )0064,0

    264

    7199,1

    xx

    ss

    i

    2i

    2u2

    ai==

    =

    ( )

    7199,1215

    35,221kn

    yy

    s i

    2

    ii2u =

    =

    =

    k reprezint numrul variabilelor factoriale (n cazul modelului unifactorial k =1).

    2515

    375

    15

    x

    x

    15

    1ii

    ====

    Pentru un prag de semnificaie de 5% valoarea tabelat a testului este:t0,05/2; 13 = t0,025; 13 = 1,35

    Testarea semnificaiei parametrului 0:1) se stabilete ipoteza nul: H0: 0 = 0;2) se stabilete ipoteza alternativ: H1: 0 0;3) se calculeaz testul statistic:

    84,0096,2

    73,1

    s

    a

    s

    0a

    s

    at

    000 a

    0

    a

    0

    a

    10 =

    ==

    =

    =

  • 7/31/2019 Problem Ere Gresi e

    4/22

    ( )186,4

    264

    25

    15

    171,1

    xx

    x

    n

    1ss

    i

    2i

    22u

    2a0

    =

    +=

    +=

    35,1t84,0t 2n;2/calc =>= se accept ipoteza nul, adic parametrul a0nu este semnificativ statistic.

    c) Erorile reziduale sunt iii yyu = i sunt prezentate n tabelul de mai jos:

    ui -14,99 -27,57 -0,91 18,38 16,58 7,37 5,03-20,62 9,90 27,22 -19,95 -17,48 -5,09 5,42 16,70

    d) Testarea validitii modelului de regresie:1) se stabilete ipoteza nul: H0: mprtierea valorilor ty datorate factorului nu

    difer semnificativ de mprtierea acelorai valori datorate ntmplrii, deci modelul nueste valid.

    2) se stabilete ipoteza alternativ: H1: modelul este valid;3) se calculeaz testul F:

    3,4671,1

    64,79

    s

    sF

    2u

    2x ===

    ( )

    64,79164,79k

    yy

    s i

    2i

    2x ==

    =

    ( )

    71,1215

    35,22

    1kn

    yy

    s i

    2ii

    2u =

    =

    =

    1215

    180

    15

    y

    y

    15

    1ii

    ====

    67,4FFF 13,1;05,01kn;calc === Deoarece Fcalc> Ftab modelul este valid.

    e) Intensitatea legturii dintre cele dou variabile se face cu coeficientul de corelaieliniar:

    ( )[ ] ( )[ ]

    [ ][ ]0188,0

    180226215375963915

    180375464515

    yynxxn

    yxyxnr

    22

    2i

    2i

    2i

    2i

    iiii

    >=

    =

    =

    =

  • 7/31/2019 Problem Ere Gresi e

    5/22

    Rezult c ntre cele dou variabile exist o legtur direct foarte puternic.Testarea semnificaiei coeficientului de corelaie:- se stabilete ipoteza nul: H0: nu este semnificativ statistic;- se stabilete ipoteza alternativ: H1: este semnificativ statistic;- se calculeaz testul t:

    75,688,011388,0

    r12nr

    srt

    22r=

    =

    ==

    16,2ttt 13;05,01kn;calc ==> Coeficientul de corelaie este semnificativ statistic.Msurarea intensitii legturii cu raportul de corelaie R:

    ( )

    ( )

    88,0

    yy

    yy

    Rn

    1i2i

    n

    1i

    2i

    =

    =

    =

    =

    Deoarece R = r = 0,88, apreciem c exist o legtur liniar, puternic i direct ntrecele dou variabile.

    Testarea raportului de corelaie se face cu testul F:

    09,461

    13

    78,01

    78,0

    k

    1kn

    R1

    RF

    2

    2=

    =

    =

    Cum:67,4FF 13;1;05,0calc =>

    R este semnificativ statistic.

    f)12~45,11245492,073,1y 1n =+=+ polie (aceasta este estimarea punctual).

    Pentru estimarea pe interval de ncredere vom avea:

    1n1n y1kn;2/1n1ny1kn;2/1n styysty ++ + +++

    35,1t12y35,1t12 13;025,01n13;025,0 + +

    ( )( )

    82,1264

    )2524(

    15

    1171,1

    xx

    xx

    n

    11ss

    2

    i

    2i

    21n2

    u2y 1n

    =

    ++=

    ++=

    +

    +

    35,1s1ny

    =+

    8225,13y1775,10 1n +

  • 7/31/2019 Problem Ere Gresi e

    6/22

    Intervalul de ncredere pentru numrul de polie ncheiate este:

    14y10 1n +

    Rezolvarea problemei cu ajutorul programului informatic EXCEL :Se selecteaz din meniul principal opiunea Tools, apoi Data Analysis, apoi

    Regression i se deschide urmtoarea fereastr:

    i se obin urmtoarele rezultate:

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R 0.883621R Square 0.780786Adjusted R

    Square

    0.763923

    Standard Error 1.311483Observations 15.000000

    ANOVAdf SS MS F Significance F

    Regression 1.000000 79.640152 79.640152 46.302727 0.000013Residual 13.000000 22.359848 1.719988

  • 7/31/2019 Problem Ere Gresi e

    7/22

    Total 14.000000 102.000000

    Coefficient

    s

    Standard

    Error

    t Stat P-value Lower

    95%

    Upper

    95%

    Intercept -1.731061 2.046120 -0.846021 0.412843 -6.151434 2.689313X Variable 1 0.549242 0.080716 6.804611 0.000013 0.374866 0.723619

    RESIDUAL OUTPUT

    Observation Predicted Y Residuals

    1.000000 12.000000 -2.0000002.000000 10.901515 0.0984853.000000 14.746212 -0.7462124.000000 12.000000 0.0000005.000000 9.253788 -1.2537886.000000 16.393939 1.6060617.000000 8.155303 0.844697

    8.000000 9.803030 0.1969709.000000 10.352273 -0.352273

    10.000000 14.746212 0.25378811.000000 12.549242 -1.54924212.000000 12.549242 2.45075813.000000 13.098485 -1.09848514.000000 14.196970 -0.19697015.000000 9.253788 1.746212

    Explicitarea datelor din tabelele de mai sus:

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R

    Raportul de corelatie (R)0.883621

    ( )

    ( )

    ( )

    ( )

    =

    =

    =

    =

    =

    =n

    1i

    2i

    n

    1i

    2ii

    n

    1i

    2i

    n

    1i

    2i

    yy

    yy

    1

    yy

    yy

    x,Ry

    R Square

    Coeficientul (gradul ) dedeterminaie

    0.780786

    ( )

    ( )

    =

    =

    =

    =

    =

    n

    1i

    2i

    n

    1i

    2i

    2y

    2e

    2y

    2x/y2

    yy

    yy

    1R

    Adjusted R Square

    Valoarea ajustat acoeficientului dedeterminaie

    0.763923

    1n/

    1kn/1R

    2y

    2u2

    =

    Standard Error

    Abaterea medie ptratic aerorilor n eantion

    1.311483( )

    2n

    yy

    2ns

    n

    1i

    2ii2

    uu

    =

    =

    =

  • 7/31/2019 Problem Ere Gresi e

    8/22

    Observations

    Numrul observaiilor (n)15

    Tabel 2.ANOVA

    Sursavariaiei

    df(grade delibertate)

    SS (variana)(suma ptratelor)

    MS =SS/df(media ptratelor)

    (dispersiacorectat)

    F Significance F

    Regression(variaiadatorat

    regresiei)

    1 (k)SSR= ( )

    =

    =n

    1i

    2i

    2x yy =

    79.640152

    ks

    2x2

    x

    = =

    79.640152

    TestulF=46.302727

    F=2

    xs /2us

    0.000013 0,05-6.151434 2.689313

    Timpulmediu

    a1 = 0.549242 1as

    =0.080716

    1at = 6.8046110.000013

    < 0,050.374866 0.723619

    Tabel 4.RESIDUAL OUTPUT

    ObservationPredicted iy

    Numrul de polie

    Residuals

    ii yy 1 338.5796 -14.99862 371.2542 -27.57223 376.1748 -0.91084 332.8525 18.38955 311.8281 16.58896 310.6962 7.37287 325.9235 5.03558 287.8659 -20.62999 310.9763 9.9067

  • 7/31/2019 Problem Ere Gresi e

    9/22

    10 382.3073 27.227711 336.2188 -19.956812 369.2938 -17.487813 338.7504 -5.095414 367.2528 5.426215 346.0917 16.7043

    Interpretare rezultate din tabelul SUMMARY OUTPUT: R= 0.883621 arat c ntre numrul de polie ncheiate i timpul mediu petrecut cu

    un potenial client exist o legtur puternic. R2 =0.780786 arat c 78% din variaia numrului de polie ncheiate este explicat

    de timpul mediu petrecut de un agent cu un potenial client. Abaterea medie patratica a erorilor us = 1.311483. n cazul n care acest

    indicator este zero nseamn c toate punctele sunt pe dreapta de regresie.

    Interpretare rezultate din tabelul ANOVA:

    n acest tabel este calculat testul F pentru validarea modelului de regresie. ntructF=46.302727, iar Significance F (pragul de semnificatie) este 0.000013 (valoare mai micade 0.05) atunci modelul de regresie construit este valid i poate fi utilizat pentru analizadependenei dintre cele dou variabile.

    Interpretarea rezultatelor din tabelul 4: Intercept este termenul liber, deci coeficientul a0 este -1.731061. Termenul liber

    este punctul n care variabila explicativ (factorial) este 0. Deci numrul de polie

    ncheiate, dac timpul petrecut este 0. Deoarece 0at

    = -0.846021iar pragul desemnificaie P-value este 0.412843>0,05 nseamn c acest coeficient estenesemnificativ. De altfel faptul c limita inferioar a intervalului de ncredere(-6.151434 0 2.689313) pentru acest parametru este negativ, iar limitasuperioar este pozitiv arat c parametrul din colectivitatea general esteaproximativ zero.

    Coeficientul a1 este 0.549242, ceea ce nsemn c la creterea timpului petrecut cu

    un minut, numrul de polie ncheiate va crete cu 0,549242. Deoarece 1at =6.804611 iar pragul de semnificaieP-value este 0.000013

  • 7/31/2019 Problem Ere Gresi e

    10/22

    2. n tabelul urmtor avem informaii privind veniturile obinute de 20 de gospodriiselectate aleator i taxele pltite de ctre aceste gospodrii:

    Venitul(mii euro)

    x

    Taxele(euro)

    y

    Venitul(mii euro)

    x

    Taxele(euro)

    y

    17,537,547,525,055,535,015,512,032,042,3

    35,060,588,570,5

    125,063,030,030,065,080,0

    28,022,525,029,565,051,039,333,045,075,0

    75,070,060,065,0

    150,0100,0

    75,040,075,0

    200,0

    Se cere:a) s se specifice modelul econometric ce descrie legtura dintre cele dou

    variabile;b) s se estimeze parametrii modelului;c) s se verifice ipotezele metodei celor mai mici ptrate;d) s se verifice semnificaia parametrilor modelului de regresie pentru = 0,1;e) s se testeze validitatea modelului de regresie;f) s se testeze intensitatea legturii dintre cele dou variabile i s se testeze

    semnificaia indicatorilor utilizai;g) s se estimeze punctual i pe interval de ncredere nivelul taxelor care trebuie

    pltite dac venitul este de 40 mii euro pentru o probabilitate de 95%.

    Rezolvare:a) Se va reprezenta grafic legtura dintre nivelul taxelor i venit pentru cele 20 de

    gospodrii prin corelogram sau diagrama norului de puncte:

    020

    406080

    100120140160180

    200220

    0 10 20 30 40 50 60 70 80

    OY

    xi

    OX

    yi

    1 cm OX = 10 mii euro ; 1 cm OY = 20 euro

    Din grafic se poate observa c distribuia punctelor (xi, yi) poate fi aproximat cu odreapt, deci modelul econometric care descrie legtura dintre cele dou variabile este unmodel liniar:

  • 7/31/2019 Problem Ere Gresi e

    11/22

    uxy 10 ++=

    0, 1 parametrii modelului;1> 0 (panta dreptei) deoarece legtura dintre cele dou variabile este direct.

    b) Pentru estimarea parametrilor modelului de regresie utilizm metoda celor maimici ptrate:

    20,1iuxaay i10i =++=

    i10i xaay +=

    ( ) ( ) minxaayminyyi

    2i10i

    i

    2ii

    =+=+

    6886453,31991a1,733a

    5,1557a1,733a20

    10

    10

    =

    =

    2997,2a

    4201,6a

    1

    0

    Deci, modelul este:

    ii x2997,24201,6y +=

    2997,2

    53,319911,733

    1,73320

    688641,7335,155720

    xx

    xn

    yxxyn

    a

    2ii

    i

    iiii

    1 ===

    4201,6xaya 10 ==c) Ipotezele metodei celor mai mici ptrate:c1) Variabilele observate nu sunt afectate de erori de msur.Aceast ipotez se poate verifica cu ajutorul urmtoarelor relaii:

    xix s3xxs3x +

  • 7/31/2019 Problem Ere Gresi e

    12/22

    07,403875,77y07,403875,77 i +

  • 7/31/2019 Problem Ere Gresi e

    13/22

    Deoarece graficul punctelor prezint o evoluie oscilant putem accepta ipoteza cvariabila factorial i cea rezidual sunt independente.

    c3) Valorile variabilei reziduale nu sunt autocorelate, adic sunt independente ntreele:

    Verificarea acestei ipoteze se poate face prin:-

    metoda grafic (corelograma);- testul Durbin-Warson.Prin metoda grafic se construiete corelograma trecndu-se pe axa OX valorile

    variabilei rezultative yi, iar pe axa OY valorile variabilei reziduale:

    -30

    -25

    -20

    -15

    -10

    -5

    0

    5

    10

    15

    20

    25

    30

    35

    0 20 40 60 80 100 120 140 160 180

    OY

    yi

    OX

    ui

    Distribuia erorilor este oscilant, adic nu avem alternativ sistematic sub form dedini de fierstru, deci putem accepta ipoteza c erorile sunt independente, adic nu suntautocorelate.

    Testarea ipotezei cu ajutorul testului Durbin-Watson:- se stabilete ipoteza nul:

    H0: variabila rezidual nu este autocorelat.- se stabilete ipoteza alternativ:

    H1: variabila rezidual este autocorelat.- se calculeaz testul Durbin-Watson:

    ( )

    48,126,5040

    87,7508

    u

    uu

    dn

    1i

    2i

    n

    1i

    21ii

    calc ==

    =

    =

    =

    Pentru a efectua calculul lui d vom prezenta rezultatele intermediare n urmtorultabel:

    iu 1iu ( )2

    1ii uu 2iu

    1,18-19,32

    -1,18

    -420,19

    1,38373,21

  • 7/31/2019 Problem Ere Gresi e

    14/22

    -14,3219,43

    3,79-11,07

    0,778,82

    -2,17-10,8617,0324,68

    8,933,586,94

    -10,86-8,96

    -29,47-22,0733,94

    -19,32-14,3219,43

    3,79-11,07

    0,77

    8,82-2,17

    -10,8617,0324,68

    8,933,586,94

    -10,86-8,96

    -29,47-22,07

    25,041138,90244,71220,80140,30

    64,86

    120,7975,47

    777,7758,47

    248,1428,6311,29

    317,003,62

    420,6654,81

    3137,41

    204,94377,4314,34

    122,530,60

    77,86

    4,71117,88289,97608,9579,7012,8148,16

    118,0480,25

    868,48486,93

    1152,10

    7508,87 5040,26

    - se compar dcalc cu cele dou valori d1 i d2 din tabelul testului Durbin-Watsonpentru pragul de semnificaie = 0,05 pentru numrul variabilelor exogene k = 1 i pentrun = 20:

    d1 = 1,20 d2 = 1,41

    2calc2 d4dd

  • 7/31/2019 Problem Ere Gresi e

    15/22

    -30

    -25

    -20

    -15

    -10

    -5

    0

    5

    10

    15

    20

    25

    30

    35

    0 20 40 60 80 100 120 140 160 180

    OY

    OX

    ui

    Se observ c valorile reziduale ui se nscriu n banda construit, deci putem acceptaipoteza de normalitate a erorilor pentru un prag de semnificaie de = 0,05.

    d) Testarea semnificaiei parametrilor modeluluiTestarea semnificaiei parametrului 0:- se stabilete ipoteza nul:

    H0: 0 = 0- se stabilete ipoteza alternativ:

    H1: 0 0- se calculeaz testul t:

    15,082,41

    4201,6

    s

    at

    0a

    0 =

    ==

    ( )68,1449

    75,5119

    53,3199101,280

    xx

    xss

    i

    2i

    i2i

    2u

    2a0

    ==

    =

    ( )

    01,28018

    26,5040

    2n

    yy

    s i

    2ii

    2u ==

    =

    - se compar tcalc cu t/2; n-2 = t0,05; 15 = 2,101Deoarece 18;05,0calc tt < este foarte probabil ca estimatorul a0 s provin dintr-o

    colectivitate cu 0 = 0 deci 0 nu este diferit semnificativ de zero.

    Testarea semnificaiei parametrului 1:- se stabilete ipoteza nul: H0: 1 = 0- se stabilete ipoteza alternativ: H1: 1 0- se calculeaz testul t:

    99,923,0

    2997,2

    s

    at

    1a

    1 ===

    + t0,05; 18 su

    - t0,05; 18 su

    iy

  • 7/31/2019 Problem Ere Gresi e

    16/22

    ( )05,0

    75,5119

    01,280

    xx

    ss

    20

    1i

    2i

    2u2

    a1==

    =

    =

    - se compar tcalc cu t/2; n-2 = t0,05; 18 = 2,101

    Deoarece 18;05,0calc tt > apreciem c parametrul 1 este semnificativ statistic.Intervalul de ncredere pentru parametrul 1 este:11 a2n;2/11a2n;2/1 stasta +

    23,0101,22997,223,0101,22997,2 1 +78293,281647,1 1

    e) Testarea validitii modelului de regresie:- se stabilete ipoteza nul: H0: modelul nu este valid.- se stabilete ipoteza alternativ: H1: modelul este valid;- se calculeaz testul F:

    69,9601,280

    18,27076

    s

    sF

    2u

    2x ===

    ( )18,27076

    1

    18,27076

    k

    yy

    s

    20

    1i

    2i

    2x ==

    =

    =

    - se compar Fcalc cu F; k; n-k-1 = F0,1; 1; 18 = 8,2818;1;1,0calc F69,96F >= se respinge ipoteza nul i se accept alternativa, deci

    modelul este valid.f) Intensitatea legturii dintre cele dou variabile se apreciaz cu ajutorul:

    - coeficientului de corelaie;

    - raportului de corelaie.Coeficientul de corelaie:

    918,0

    yynxxn

    yxyxn

    r2

    ii

    i

    2i

    2

    ii

    i

    2i

    ii

    ii

    iii

    x/y =

    =

    Deoarece ry/x = 0,918 1, apreciem c ntre cele dou variabile exist o legturliniar, direct, foarte puternic.

    Testarea semnificaiei coeficientului de corelaie pentru colectivitatea general:

    - se stabilete ipoteza nul: H0: = 0 ( nu este semnificativ statistic);- se stabilete ipoteza alternativ: H1: 0 ( este semnificativ statistic); - coeficientul de corelaie la nivelul colectivitii generale

    - se calculeaz testul t:

    82,9918,01

    18918,0

    r1

    2nrt

    22calc =

    =

    =

    - se compar calct cu 878,2tt 18;1,02n; ==

  • 7/31/2019 Problem Ere Gresi e

    17/22

    Deoarece 18;1,0calc tt > respingem ipoteza nul i acceptm alternativa, decicoeficientul de corelaie este semnificativ statistic.

    Raportul de corelaie R:

    ( )

    ( )918,044,3211626,50401

    yy

    yy

    1R

    1i

    2i

    1i

    2ii

    ==

    =

    =

    =

    Deoarece R = ry/x, apreciem c ntre cele dou variabile exist, ntr-adevr, olegtur liniar.

    Testarea semnificaiei raportului de corelaie:- se stabilete ipoteza nul: H0: R nu este semnificativ statistic;- se stabilete ipoteza alternativ: H1: R este semnificativ statistic;- se calculeaz testul F:

    5,94

    918,01

    918,0

    1

    18

    R1

    R

    k

    1knF

    2

    2

    2

    2

    calc =

    =

    =

    - se compar calcF cu 28,8FF 18;1;1,01kn;k; ==

    Deoarece 18;1;1,0calc FF > se respinge ipoteza nul i se accept alternativa, deciraportul de corelaie este semnificativ statistic.

    g)5679,85402997,24201,6y 1n =+=+ euro (estimarea punctual)

    Pentru estimarea pe interval de ncredere vom avea:

    1n1n y1kn;2/1n1ny1kn;2/1n styysty ++ + +++16,17t5679,85y16,17t5679,85

    552,218;025,01n552,218;025,0+

    =+=

    ( )

    ( )59,294

    75,5119

    )655,3640(

    20

    1101,280

    xx

    xx

    n

    11ss

    2

    n

    1i

    2i

    21n2

    u2y 1n

    =

    ++=

    ++=

    =

    ++

    Deci, intervalul de ncredere pentru taxele pltite pentru un venit de 40 mii euro lanivelul populaiei este:

    )euro(36,129y)euro(77,41 1n +

    Rezolvarea problemei cu ajutorul programului informatic EXCEL:Se selecteaz din meniul principal opiunea Tools, apoi Data Analysis, apoi

    Regression i se va deschide urmtoarea fereastr:

  • 7/31/2019 Problem Ere Gresi e

    18/22

    i se obin urmtoarele rezultate

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R0.91818458

    8

    R Square0.84306293

    7Adjusted R

    Square

    0.83434421

    2StandardError

    16.73363108

    Observations 20

    ANOVA

    df SS MS F

    Significance F

    Regression 1 27076.1781427076.1

    8 96.695661.15588E-

    08

    Residual 18 5040.259363280.014

    4Total 19 32116.4375

    Coefficients

    StandardError t Stat P-value Lower 95%

    Upper95%

    Intercept - 9.353374888 -0.6864 0.501209 - 13.23058

  • 7/31/2019 Problem Ere Gresi e

    19/22

    6.4201424826.0708691

    4X Variable 1(Venitul)

    2.299690151 0.233865325

    9.833395 1.16E-08

    1.808356955 2.791023

    RESIDUAL OUTPUT

    Observation Predicted Y Residuals

    133.8244351

    6 1.17556484

    279.8182381

    8-

    19.31823818

    3102.815139

    7-

    14.31513969

    4

    51.0721112

    9 19.42788871

    5121.212660

    9 3.7873391076 74.0690128 -11.0690128

    729.2250548

    6 0.774945141

    821.1761393

    3 8.823860669

    967.1699423

    5-

    2.16994234810 90.8567509 -10.8567509

    11 57.97118174 17.02881826

    1245.3228859

    1 24.67711409

    1351.0721112

    9 8.927888708

    1461.4207169

    7 3.579283029

    15143.059717

    3 6.940282674

    16

    110.864055

    2

    -

    10.8640552117

    83.95768045

    -8.957680449

    18 69.4696325 -29.4696325

    1997.0659143

    1-

    22.06591431

    20166.056618

    8 33.94338117

  • 7/31/2019 Problem Ere Gresi e

    20/22

    Explicitarea datelor din tabelele de mai sus:

    SUMMARY OUTPUT

    Regression Statistics

    Multiple RRaportul de corelaie (R)

    0.91818458

    8

    ( )

    ( )

    ( )

    ( )

    =

    =

    =

    =

    =

    =n

    1i

    2i

    n

    1i

    2ii

    n

    1i

    2i

    n

    1i

    2i

    yy

    yy

    1

    yy

    yy

    x,Ry

    R SquareCoeficientul (gradul ) dedeterminaie

    0.84306293

    7

    ( )

    ( )

    =

    =

    =

    =

    =

    n

    1i

    2i

    n

    1i

    2i

    2y

    2e

    2y

    2x/y2

    yy

    yy

    1R

    Adjusted R Square

    Valoarea ajustat acoeficientului dedeterminaie

    0.83434421

    21n/

    1kn/1R2y

    2u2

    =

    Standard ErrorAbaterea medie ptratica erorilor n eantion

    16.7336310

    8

    ( )

    2n

    yy

    2ns

    n

    1i

    2ii2

    uu

    =

    =

    =

    ObservationsNumrul observaiilor(n)

    20

    Tabel 2.

    ANOVA

    Sursavariaiei

    df(grade delibertate)

    SS (variana)

    (suma ptratelor)

    MS =SS/df(media ptratelor)

    (dispersiacorectat)

    FSignificance

    F

    Regression(variaia

    datoratregresiei)

    1 (k)SSR= ( ) =

    =

    n

    iix yy

    1

    22 =

    27076.17814

    ks xx

    22 = =

    27076.18

    TestulF=96.69566

    F=2

    xs /2us

    1.15588E-

    08< 0.05(resping H0 model valid)

    Residual(variaia

    rezidual)

    18 (n-k-1)SSE= ( ) =

    =

    n

    iiiu

    yy1

    22 =

    5040.259363

    1

    22

    =

    kns uu =

    280.0144

    Total

    (variaiatotal) 19 (n-1)

    SST= ( ) ==

    n

    1i

    2

    i2y yy =

    32116.4375

    SST=SSR + SSE1

    22

    = ns

    y

    y

    Tabel 3.

    Coefficients(Coeficieni)

    Standard Error(Abaterea medie

    patratic)t Stat P-value Lower 95% Upper 95%

    Limita inf. aintervalului de

    Limita sup.a

  • 7/31/2019 Problem Ere Gresi e

    21/22

    ncredereintervaluluide ncredere

    Intercept(termenulliber)

    a0=

    -6.420142480a

    s=

    9.353374888

    0at

    =-0.6864

    0.501209>0,05 -26.07086914 13.23058

    Venitula1 =

    2.2996901511a

    s=

    0.233865325

    1at =

    9.833395

    1.16E-080,05 nseamn c acest coeficient estenesemnificativ. De altfel faptul c limita inferioar a intervalului de ncredere (-

  • 7/31/2019 Problem Ere Gresi e

    22/22

    26.07086914 0 13.23058) pentru acest parametru este negativ, iar limitasuperioar este pozitiv arat c parametrul din colectivitatea general esteaproximativ zero.

    Coeficientul a1 este 2.299690151, ceea ce nsemn c la creterea venitului cu o mie euro,

    taxele vor crete cu 2,299690151 euro. Deoarece 1at = 9.833395 iar pragul de semnificaieP-value este 1.16E-08