Proiect econometrie FABBV

download Proiect econometrie FABBV

of 20

description

Proiect econometrie FABBV

Transcript of Proiect econometrie FABBV

AN 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

PIB real/locuitor($) -UE 21.993 22.562 22.942 23.522 24.182 24.835 25.798 26.248 26.523 26.809 27.385 27.847

Speranta de viata la nastere(ani) 75.7 75.8 76.1 76.5 76.7 76.7 76.8 76.9 76.9 77.1 77.5 77.4

a) specificarea modelului econometric ce descrie legtura dintre cele dou variabile; Se doreste construirea unui model econometric unifactorial de forma:y = f (x ) + t, care sa releve dependenta celor doua variabile: PIB real/loc si speranta medie de viata la nastere. unde: y = valorile reale ale variabilei dependente; x = valorile reale ale variabilei independente; t = variabila rezidual, reprezentnd influenele celorlali factori ai variabilei y, nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra variabilei y. Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea specificare a variabilelor: y = speranta de viata (endogen/dependenta), la nastere, reprezentnd variabila explicata

x = Produsul Intern Brut (PIB) real/locuitor, calculat ca medie pentru tarile membre ale Uniunii Europene, exprimat in dolari; reprezinta variabila factoriala(exogena), respectiv factorul considerat prin ipoteza de lucru cu influena cea mai puternic asupra variabilei y. In vederea alegerii unei functii matematice f (x ) cu ajutorul creia poate fi descris

legtura dintre cele variabile, apelam la metoda grafica, constand in reprezentarea celor doua variabile in acelasi sistem de axe:

Fig 1-Dependenta dintre PIB real/locuitor($) si speranta de viata la nastere

Din corelograma realizata in Excel se poate observa c distribuia punctelor empirice (xt, yt) poate fi aproximat cu o dreapt. Ca atare, modelul econometric care descrie legtura dintre cele dou variabile se transform ntr-un model liniar unifactorial yt= a + bxt + t(ecuatia de regresie) , a i b reprezentnd parametrii modelului, b 0 ,panta dreptei fiind pozitiv deoarece legtura dintre cele dou variabile este directa(atunci cand x creste, creste si y). b) estimarea parametrilor modelului i calcularea valorilor teoretice ale variabilei endogene In vederea estimarii celor doi parametri reali ai ecuatiei de regresie, a si b, se apeleaza la metoda celor mai mici patrate(M.C.M.M.P).Se incearca gasirea unor estimatori ai parametrilor a si b, notati si b, astfel incat valorile estimate ale variabilei endogene sa se calculeze dupa formula : i=*xi+b. n mod concret, M.C.M.M.P. const n a minimiza funcia: F(,b)=min( 2 2 t-t) )= min( tt) ). Condiia de minim a acestei funcii rezult din: F()=0

F(b)=0 Prin derivare rezulta urmatorul sistem de ecuatii: *+b t= = t+ b unde: n=numarul de observatii (=12) Inlocuind parametrii cunoscuti rezulta:

Rezolvand sistemul de mai sus se obtin urmatoarele valori: =70,13209; b=0,000262 Coeffici ents 70.1320 9 0.00026 2 Stand ard Error 0.738 787 2.91E05 Pvalue 8.1E15 8.56 E-06 Lower 95% 68.46 083 0.000 196 Upper 95% 71.80 334 0.000 328 Lower 95.0% 68.46 083 0.000 196 Upper 95.0% 71.80 334 0.000 328

Interc ept 21993

t Stat 94.92 864 8.997 491

Valorile calculate ale celor doi estimatori se obtin si in tabelul de mai sus generat in Excel. Asadar, ecuatia ajustata este: =70,13209+0,000262*x. Dispunnd de estimaiile parametrilor se pot calcula valorile teoretice (estimate) ale variabilei endogene, cu ajutorul relaiei de mai sus. Valorile ajustate se regasesc in tabelul de mai jos, in coloana 5. PIB real/locuitor (x) 21993 22562 22942 speran ta de viata(y ) 75.7 75.8 76.1

x^2

y y*x ajustat 166487 75.894 483692049 0 26 171020 76.043 509043844 0 33 174588 76.142 526335364 6 89

23522 24182 24835 25798 26248 26523 26809 27385 27847 Total:30064 6

76.5 76.7 76.7 76.8 76.9 76.9 77.1 77.5 77.4 920.1

553284484 584769124 616777225 665536804 688957504 703469529 718722481 749938225 775455409 7575982042

179943 3 185475 9 190484 5 198128 6 201847 1 203961 9 206697 4 212233 8 215535 8 230640 38

76.294 85 76.467 77 76.638 86 76.891 17 77.009 07 77.081 12 77.156 05 77.306 96 77.428 920.35 43

Valorile variabilei reziduale vor rezulta din urmtoarea relaie:

t=

c)Verificarea ipotezelor utilizarii M.C.M.M.P: Estimatorii obinui cu ajutorul M.C.M.M.P. sunt estimatori de maxim verosimilitate dac pot fi acceptate urmtoarele ipoteze: c1) Variabilele observate nu sunt afectate de erori de msur. Aceast condiie se poate verifica cu regula celor trei sigma, regul care const n verificarea urmtoarelor relaii: (E(x)E(x)+ ) yt ,E(y)+ ) E(x)=25053,83dolari/locuitor E(y)=77,4 ani , de unde rezulta Analog , =0.164743x

= 575.0314

Conditiile devin: (25053,83-3*575,0314, 25053,83+3*575,0314)=(23328,736;26778,924) (77,4-3*0.164743;77,4+3*0,164743)=(76,9;77,894) c2) Variabila aleatoare (rezidual) este de medie nul, iar dispersia ei,este constant i independent de X - ipoteza de homoscedasticitate, pe baza creia se poate admite c legtura dintre Y i X este relativ stabil. Pt verificarea acestei conditii apelam la metoda grafica: construirea corelogramei privind valorile variabilei factoriale x i ale variabilei reziduale.

Deoarece graficul punctelor empirice prezint o distribuie oscilant, se poate accepta ipoteza c cele dou variabile sunt independente i nu corelate.

c3) Valorile variabilei reziduale sunt independente, respectiv nu exist fenomenul de autocorelare. Pt verificarea acestei ipoteze folosim testul Durbin Watson.

Asa cum se observa si in tabelul realizat in Eviews, valoarea testului DW=1,035936. Valorile d1 si d2 prealuate din tabelul Durbin Watson pt un prag de semnificatie de 95%, pt n=12 si k=1 sunt d1=1,08 si d2=1,36. Se observa faptul ca 0 tcalc>tcritic=>se respinge H0, deci se accepta H1, deci parametrul a este semnificativ statistic (semnificativ 0); pentru parametrul b: H0:b=0 H1:b0 =2,91*10-5 tcalc=8,997>tcritic =>se respinge H0, deci se accepta H1=>parametrul este semnificativ statistic( semnificativ 0).

d2) Verificarea verosimilitii modelului: Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:y/x

=

=0,948657=>intre cele doua variabile exista o dependenta liniara,

directa, puternica. Pentru testarea verosimilitatii modelului se foloseste tabelul analizei variantei, generat in Excel(ANOVA). ANOVA

df Regressi on Residual Total 1 9 10

SS 2.2907 81 0.2546 73 2.5454 55

MS 2.2907 81 0.0282 97

F 80.954 84

Significa nce F 8.56E-06

H0:model nevalid statistic; H1:model valid statistic;

F calculat se compara cu Fcritic=F0,05;1;10=4,97 Fcalc>Fcritic =>se respinge H0=>se accepta H1=>model valid statistic d3)testarea seminificatiei raportului de corelatie Ry/x H0:Ry/x=0 H1:Ry/x0 Fcalc=(n-2)* =80,954>Fcritic=>R este semnificativ statistic.

Raportul de determinare R2=0,9218 =>92,18% din variatia sperantei de viata se datoreaza PIB real/locuitor. e)aplicarea testului White pentru verificarea ipotezei de homoscedasticitate a erorilor; Construim o regresie auxiliara, bazat pe prespunerea existenei unei relaii de dependen ntre ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia. H0:erorile sunt homoscedastice; H1:erorile sunt heteroscedastice;

Valorile celor trei parametric a,b si c, calculate prin M.C.M.M.P sunt, asa cum se vede si in tabelul de mai sus: a=-1,031299 b=8,86*10-5 c=-1,84*10-9 Raportul de determinare calculat pentru regresia auxiliara R2=0,133608; LM=T*R2=12*0,133608=1,603296 =5,99=>LM< homoscedastice; =>se accepta ipoteza H0=>erorile sunt

f) testul Jarque-Bera pentru verificarea ipotezei de normalitate a reziduurilor;

=> se accepta H0=>poate fi acceptata ipoteza de normalitate a erorilor. Pentru a transforma modelul de regresie simplu intr-unul o variabila exogena x2=rata de alfabetizare. Tabelul devine: An Speranta de PIB viata la nastere real/locuitor 1994 21993 75,7 1995 22562 75,8 1996 22942 76,1 1997 23522 76,5 1998 24182 76,7 1999 24835 76,7 2000 25798 76,8 2001 26248 76,9 2002 26523 76,9 multiplu, adaugam Rata alfabetizare 97,32 97,34 97,99 98,22 98,5 98,63 98,7 99 99,03 de

2003 2004 2005

26809 27385 27847

77,1 77,5 77,4

99,24 99,25 99,37

Fig2-dependenta dintre speranta de viata si rata de alfabetizare

Din corelograma realizata in Excel se poate observa c distribuia punctelor empirice (xt, yt) poate fi aproximat cu o dreapt=>legatura directa, puternica, liniara. a)estimarea parametrilor modelului i calcularea valorilor teoretice ale variabilei endogene; Utilizand M.C.M.M.P, =>=-0.65708, b=0.784715 Stand ard Error 6.951 448 0.070 457 Pvalu e Lower 95.0 Upper % 95.0% 16.38 15.06 23 819 0.625 0.944 331 099

Coeffici ents Interc ept 97.32 -0.65708 0.784715

t Stat 0.094 0.926 52 764 11.13 1.45E755 06

Lower Upper 95% 95% 16.38 15.06 23 819 0.625 0.944 331 099

Dispunnd de estimaiile parametrilor se pot calcula valorile teoretice (estimate) ale variabilei endogene.

Observat ion 1 2 3 4 5 6 7 8 9 10 11

Predicted speranta de viata 75.72709895 76.23716382 76.41764831 76.63736856 76.73938153 76.79431159 77.02972615 77.0532676 77.21805779 77.22590494 77.32007076

Residu als 0.0729 01 0.1371 6 0.0823 52 0.0626 31 0.0393 8 0.0056 88 0.1297 3 0.1532 7 0.1180 6 0.2740 95 0.0799 29

b) Verificarea semnificaiei estimatorilor i a verosimilitii modelului b1) Verificarea semnificaiei estimatorilor pentru parametrul a: H0:=0 H1:0 tcalc=

de unde rezulta, asa cum s-a calculat si in tabelul din Excel, 6.951448

=> tcalc=0.09452estimatorul nu este semnificativ statistic. pentru parametrul b: H0:b=0 H1:b0 =0.070457=>tcalc=11.13755>tcritic=>estimatorul b este semnificativ statistic; b2) Verificarea verosimilitii modelului: Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:y/x

=

=0.965584659=>intre cele doua variabile exista o dependenta

liniara, directa, puternica.

Regression Statistics 0.96558465 Multiple R 9 0.93235373 R Square 4 0.92483748 Adjusted R Square 3 0.13831947 Standard Error 5 Observations 11 Pentru testarea verosimilitatii modelului se foloseste tabelul analizei variantei, generat in Excel(ANOVA). df Regressi 1 SS 2.3732 MS 2.3732 F 124.0 Significa nce F 1.45E-06

on Residual Total H0:model nevalid statistic; H1:model valid statistic; 9 10

64 0.1721 9 2.5454 55

64 0.0191 32

45

F calculat se compara cu Fcritic=F0,05;1;10=4,97 Fcalc>Fcritic =>se respinge H0=>se accepta H1=>model valid statistic

c)aplicarea testului White pentru verificarea ipotezei de homoscedasticitate a erorilor; Construim o regresie auxiliara, bazat pe prespunerea existenei unei relaii de dependen ntre ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia. H0:erorile sunt homoscedastice; H1:erorile sunt heteroscedastice;

Valorile celor trei parametric a,b si c, calculate prin M.C.M.M.P sunt, asa cum se vede si in tabelul de mai sus: a=104.7518 b=-2.142530 c=0.010956 Raportul de determinare calculat pentru regresia auxiliara R2=0,224758; LM=T*R2=12*0,224758=2,697096 =5,99=>LM< homoscedastice; d) testul Jarque-Bera pentru verificarea ipotezei de normalitate a reziduurilor; =>se accepta ipoteza H0=>erorile sunt

=> se accepta H0=>poate fi acceptata ipoteza de normalitate a erorilor.

In continuare, vom studia validitatea modelului multiplu de regresie: a) estimarea parametrilor modelului multiplu i calcularea valorilor teoretice ale variabilei endogene; In vederea estimarii celor trei parametri reali ai ecuatiei de regresie, se apeleaza la metoda celor mai mici patrate(M.C.M.M.P), ca si in cazul modelului simplu. Asa cum rezulta si din tabelul generat in Excel, cei trei parametri estimati sunt:17.13358 0.585325 7.42E-05 Standa rd Error

Coefficie nts

t Stat

Pvalue

Lower 95%

Upper 95%

Lower 95.0%

Upper 95.0%

Interce pt X Variabl e1 X Variabl e2

17.1335 8 0.58532 5 7.42E-05

19.781 24 0.2198 44 7.81E05

0.8661 53 2.6624 57 0.9501 55

0.4089 02 0.0259 41 0.3668 5

27.614 7 0.0880 03 0.0001

61.881 85 1.0826 47 0.0002 51

27.614 7 0.0880 03 0.0001

61.881 85 1.0826 47 0.0002 51

Ecuatia de regresie este, asadar : SV=17.13358+0.585325*RA+7.42E-05*PIB unde SA=speranta de viata; RA=rata de alfabetizare;Regression Statistics 0.9779 Multiple R 04 0.9562 R Square 96 Adjusted R 0.9465 Square 84 Standard 0.1318 Error 96 Observation s 12

Dispunnd de estimaiile parametrilor se pot calcula valorile teoretice (estimate) ale variabilei endogene, cu ajutorul relaiei de mai sus.Observat ion 1 2 3 4 5 6 Predict ed Y 75.728 53 75.782 44 76.191 08 76.368 72 76.581 56 76.706 08 Residu als 0.0285 3 0.0175 64 0.0910 8 0.1312 79 0.1184 38 0.0060 8

7 8 9 10 11 12

76.818 48 77.027 45 77.065 41 77.209 53 77.258 11 77.362 61

0.0184 8 0.1274 5 0.1654 1 0.1095 3 0.2418 93 0.0373 89

Valorile variabilei reziduale vor rezulta din urmtoarea relaie: regasindu-se in coloana 3 a tabelului de mai sus.

t=

,

b) Verificarea semnificaiei estimatorilor i a verosimilitii modelului b1) Verificarea semnificaiei estimatorilor: pentru parametrul a1: H0:1=0 H1:10

tcalc=

=

=0.866153accept H0=>parametru nesemnificativ

statistic; pentru parametrul a2: H0:2=0 H1:20

tcalc=

=

=2.662457>ttab=>resping H0, accept H1=>parametru

semnificativ statistic pentru parametrul a3:

H0:3=0 H1:30

tcalc=

accept H0=>parametru nesemnificativ statistic

b2) Verificarea verosimilitii modelului: Pentru a accepta ipoteza de liniaritate se calculeaz matricea coeficientilor de corelaie liniar:y/x

=Colum n1 Colum n2 0.9667 38 1 0.9601 43 Colum n3 0.9756 6 0.9601 43 1

Colum n1 Colum n2 Colum n3

1 0.9667 38 0.9756 6

Din matricea de corelatie rezulta faptul ca intre cele trei variabile exista o legatura puternica, directa, liniara.

Deoarece Fcalc=98.46608>Ftab = > modelul este semnificativ statisticSignifica nce F 7.63E-07

df Regressi on Residual Total 2 9 11

SS 3.4259 31 0.1565 69 3.5825

MS 1.7129 66 0.0173 97

F 98.466 08

c)sa se aleaga dintre cele trei modele pe acela care este cel mai bun Comparam mai intai cele doua modele cu acelasi numar de variabile exogene, respectiv modelul 1 (Care explica variatia sperantei de viata de PIB real/locuitor(euro)) si modelul 2 (care explica variatia sperantei de viata de rata de alfabetizare), pe baza coeficientului de determinatie . 0.9219modelul al doilea este mai bun decat primul.

n cazul n care se compar dou modele al cror numr de variabile exogene este diferit (de exemplu, modelul M2 cu M3) alegerea celui maibun model se face cu ajutorul testului Fisher-Snedecor. Utilizarea acestui test n acest caz const n: - calcularea valorii empirice a functiei Fc= =0.8979a scazut gradul de performanta al modelului=>modelul 2 este cel mai performant.