44657669 Econometrie Aplicata in Finante Model de Regresie Liniara Multipla

Introducere

În cadrul primului proiect la econometria aplicată în finanţe am studiat regresia

liniară multiplă parcurgînd toate etapele necesare în identificarea unui model

econometric. Ca suport economic am studiat dependenţa între S&P 500, rata

şomajului (date SUA) şi rata inflaţiei (date SUA). Am vrut să determin dacă creşterea

indicelui bursier este influenţată de asemeni indicatori, în deosebi acum în criză

economică. Este interesant aceast model acum în cazul cînd veniturile companiilor

(membre S&P) cresc ca rezultat al micşorării cheltuielilor, în special aferente forţei

de muncă, nu a creşterii vînzărilor. Ca sursă a datelor am utilizat

www.miseryindex.us deoarece US Bureau of Labor Statistics nu livrează datele

lunare istorice. Pentru evoluţia S&P am folosit terminalul FXPro.

Datele folosite în model sînt prezentate în tabelul de mai jos:

Figura 1.1 Date utilizate în modelul econometric.

http://www.miseryindex.us/

Capitolul I.

Ecuaţia modelului de regresie liniară multiplă va arăta în felul următor :

Y=β0+β1X1+β2X2

in care :

Y – S&P 500;

X1 - The US Unemployment Rate (%);

X2 - The US Inflation Rate (%);

β0 β1 β2 – parametrii modelului de regresie;

e – variabila eroare;

Dupa ce m-am determinat cu modelul şi am adunat cîte 33 observaţii asupra

variabilelor, am trecut la estimarea parametrilor ecuaţiei utilizînd MS Excel. Cu

ajutorul blocului Data Analisys am obţinut următoarele rezultate :

Figura 1.2 Data Analisys a datelor.

Ca rezultat al aplicarii tehnicii OLS obtinem parametrii estimati ai modelului:

β0 2043,95

β1 -128,42

β2 -8,73

Y = 2043,95 – 128,42X1 – 8,73X2

cu erorile standard :

SE(β0^)=168,98

SE(β1^)=21,58

SE(β2^)=17,84

P-value a β0 β1 sînt ambele subunitarie mai mici ca 0,1 ceea ce va permite respingerea

ipotezei nule şi denotă faptul că parametrii influenţiază S&P, însă P-value a

parametrului β2 este 0,62 ceea ce este destul de mare.

Studiind tabelul ANOVA, celulele F (44,72) şi Sig.F. (9,97E-10) am stabilit că

modelul în ansamblu este destul de bun.

În tabelul Regression Statistics avem R2 = 0,74 şi R2 ajustat = 0,73 ceea ce explică că

aprox. 74% din y sînt determinate de model.

Nu este de ajuns doar să estimăm parametrii, dar şi săelaborez nişte ipoteze care ar

permite să fac inferenţe şi previziuni pe baza modelului studiat. Pe baza unor

proprietăţi ale variabilei dependente y rezultă următoarele caracteristici ale variabilei

eroare :

0. Liniaritatea în parametrii modelului, adică y=Xβ+e

1. Vectorul eroare are parametrul 0, adica E(e)=0

2. Erorile sînt independente statistic şi au aceeaşi varianţă, adică

Var(e)=E(eeT)=δeI

3. E(e|X)=0, nici o informaţie conţinută în vectorul eroare nu este conţinută în

vectorul X.

4. X este o matrice ne-aleatoare avînd rangul maxim, adică rang (X)= k+1<n

5. Erorile sînt repartizate normal, adică e □ N(0, δeI)

Apoi am efectuat prelucrarea datelor prin intermediul Eviews :

Figura 1.3 Prelucrarea datelor în EViews

EQ1 – ecuaţia regresiei;

SP - S&P 500 Close price ($);

UNMPL - The US Unemployment Rate (%);

INF - The US Inflation Rate (%);

Evident se obţin aceleaşi rezultate ca şi cu ajutorul Excel. Utilizind funcţia scat sp inf

unmpl am obţinut graficul Y, X1, X2. Se observă o polarizare a valorilor.

Figura 1.4 Scatterplotul EQ1.

Am aplicat testul de semnificaţie t (Student) asupra coeficienţilor modelului de

regresie. Am utilizat următoarele ipoteze :

H0: βi=0

H1: βi ≠ 0

Pe baza βWWi şi SE(βWWi), Eviews a calculat coefiecienţii t satistica

incadrîndu-le în coloana t-Statistic. Nivelul de semnificaţie este fixat

la 5%, astfel pentru ipoteza bilaterală regiunea critică este tcrt(>30) =

(-∞; -2,042) (∞; 2,042). Reeşind din t^ obtinuţi, concluzionez că β0^,

β1^ sunt statistic diferiţi de 0, deci fiind în zona de respingere a ipotezei nule, însa β2

aparţine zonei de indecizie, nu pot respinge H0 şi nici accepta H1.

Am parcurs şi testul F (Snedecor - Fisher) pentru a analiza varianţa variabilei

independente y şi dependenţei liniare între Y şi k variabile . Toate calculele sînt redate

în tabelul ANOVA în Excel :

SST = Σ(yi-yd ) - varianţa totală asociată valorilor y;

SSE = Σ(yi-yq ) - varianţa neexplicată de regresie;

SSR = Σ(yq -yd ) - varianţa explicată pe baza regresiei;

SST = SSR + SSE

(n-1) (k) n-(k+1) - grade de libertate.

Sumelor SSR, SSE se asociază mediile lor în funcţie de gradele de libertate – MSR,

MSE. Deci, am verificat ipotezele aferente testului F:

H0=β0=β1=β2=0

H1=nu toţi parametrii sînt nuli.

Din tabel Fcrt=3,32<F*(44,72), deci pot respinge H0 acceptînd că există o dependenţă

liniară între Y şi k variabile independente. Significance F din ANOVA semnifică

eroarea care o fac eliminînd ipoteza nulă, deci în modelul analizat este suficient de

mică (9,977E-10).

Astfel coeficientul de determinaţie multiplă (R2)

obţinut prin raportul SSR/SST exprimă partea de

varianţă totală explicată de model. Se gaseşte în

tabelul iniţial în Excel şi în datele generate de

Eviews. Coeficientul ia valori [0,1], 0 ar însemna SSR=0 ceea ce semnifică că X1,

X2 nu influienţiază deloc variabilele Y. Un coeficient mai aproape de 1 semnifică o

dependenţă totală cu reziduuri nule. În modelul studiat R2=0,74 ceea ce ar însemna o

dependenţă relativă a variabilelor.

Ipotezele elaborate si testate în cazul parametrilor ecuaţiei urmează de testat şi în

cazul matricei variabileleor eroare:

0. Liniaritatea în parametrii modelului, adică y=Xβ+e;

1. Vectorul eroare are parametrul 0, adică E(e)=0;

2. Erorile sînt independente statistic şi au aceeaşi varianţă, adică

Var(e)=E(eeT)=δeI;

3. E(e|X)=0, nici o informaţie conţinută în vectorul eroare nu este conţinută în

vectorul X;

4. X este o matrice ne-aleatoare avînd rangul maxim, adică rang(X)= k+1<n;

5. Erorile sînt repartizate normal, adică e □ N(0, δeI);

Parcurg pe rînd ipetezele enunţate anterior :

Ipoteza precum E(e)=0 este adevărată oricînd dacă folosim OLS.

Ipoteza homoscedasticitatii Var(e)=E(eeT)=δeI

Am folosit pentru aceasta testul Durbin-Watson care depistează corelaţia de ordinul I.

Am utilizat expresia :

et=pet-1+vt

et – erori;

et-1 – erori întîrziate;

Ecuaţia exprimă dependenţa liniară cu p parametru între erori. DW foloseşte

următoarele ipoteze :

H0: p=0

H1: p ≠ 0

Mai întîi verific corelarea între reziduuri şi reziduurile întîrziate grafic prin comanda

Eviews: scat R_EQ1(-1) R_EQ1.

Figura 1.5 Scatterplotul reziduurilor.

Mi se pare o oarecare corelare existentă, dar totuşi continui cu estimarea lui p,

utilizînd comanda Eviews: ls R_EQ1 R_EQ1(-1):

Figura 1.6 ls R_EQ1 R_EQ1(-1)

Deci din tabelul obţinut observ că valoarea

lui p^ este foarte mare 0,902.

Verific apoi valoarea DW prin comanda

genr DW=2*(1-C(1)), care îmi returnează

valoarea de 0,19.

Am reprezentat grafic reziduurile prin

comanda Actual,Fitted,Residual,Table.

Figura 1.7 Reprezentarea grafică a reziduurilor Actual,Fitted,Residual,Table.

Apoi View –

Actual,Fitted,Residual,Graph :

Am parcurs apoi la corectarea modelului ajingind la un model dinamic de regresie,

folosind comanda ls LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1). Am obtinut urmatorul

tabel :

1.8 LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1)

1.9 LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1) View Representation.

Am obţinut prin aceasta un model mai bun. Am salvat rezultatele în EQ_Dinamic şi

reziduurile în R_Dinamic. Am efectuat comanda scat r_dinamic(-1) r_dinamic. Deci

după cum se observă vizual din grafic nu există corelaţie.

1.10 Scatterplotul parametrilor EQ_Dinamic.

Pentru a analiza corelaţia de ordin superior aplicăm comanda Eviews: ls sp c unmpl

inf ar(1) ar(2) ar(3) ar(4):

1.11 ls sp c unmpl inf ar(1) ar(2) ar(3) ar(4).

Sau prin testul Breuch-Godfrey (cu 2 întîrzieri) :

1.12 Rezultatele testului Breuch-Godfrey.

Am verificat homoscedasticitatea prin testul White Heteroskedasticity:

1.13 Rezultatele testului White Heteroskedasticity.

Estimaţiile OLS :

SP=-118694,4+50378,76UNMPL-2563,059UNMPL2+16904,16INF-3743,540INF2

H0=β0=β1=β2=0;

H1 măcar unul dintre parametri este diferit de 0;

Cum p-value este 0,000041 adică fac o eroare de 0,0041% dacă resping ipoteza nula,

atunci pot enunţa că este violată homoscedasticitatea şi este prezentă

heteroscedasticitatea.

Am parcurs apoi la verificarea normalităţii :

H0: skewness=0 ; kurtosis=3;

H1: repartiţia nu este normală;

Am obţinut p-value=0,42, deci eroarea pe care aş face-o dacă aş respinge ipoteza nulă

este de 42,19% ceea ce este destul de mare. Afirm dar că accept H1, adica reziduurile

sînt repartizate normal.

Concluzii

Modelul studiat mi-a arătat dependenţa S&P de şomaj şi inflaţie. Însă acest model

pare a fi valabil doar într-o recesiune, deoarece de obicei S&P şi oricare indice

bursier cresc într-o situaţie inversă celei prezente. O inflaţie scăzută şi şomaj înalt

determină o stagnare în creştere economică şi eventual în indici. Dar după cîte constat

din model perioadele de criză se caracterizează prin disproporţii economice.

44657669 Econometrie Aplicata in Finante Model de Regresie Liniara Multipla

Documents

Transcript of 44657669 Econometrie Aplicata in Finante Model de Regresie Liniara Multipla