44657669 Econometrie Aplicata in Finante Model de Regresie Liniara Multipla
-
Upload
cristina-comanici -
Category
Documents
-
view
160 -
download
12
Transcript of 44657669 Econometrie Aplicata in Finante Model de Regresie Liniara Multipla
Introducere
În cadrul primului proiect la econometria aplicată în finanţe am studiat regresia
liniară multiplă parcurgînd toate etapele necesare în identificarea unui model
econometric. Ca suport economic am studiat dependenţa între S&P 500, rata
şomajului (date SUA) şi rata inflaţiei (date SUA). Am vrut să determin dacă creşterea
indicelui bursier este influenţată de asemeni indicatori, în deosebi acum în criză
economică. Este interesant aceast model acum în cazul cînd veniturile companiilor
(membre S&P) cresc ca rezultat al micşorării cheltuielilor, în special aferente forţei
de muncă, nu a creşterii vînzărilor. Ca sursă a datelor am utilizat
www.miseryindex.us deoarece US Bureau of Labor Statistics nu livrează datele
lunare istorice. Pentru evoluţia S&P am folosit terminalul FXPro.
Datele folosite în model sînt prezentate în tabelul de mai jos:
Figura 1.1 Date utilizate în modelul econometric.
Capitolul I.
Ecuaţia modelului de regresie liniară multiplă va arăta în felul următor :
Y=β0+β1X1+β2X2
in care :
Y – S&P 500;
X1 - The US Unemployment Rate (%);
X2 - The US Inflation Rate (%);
β0 β1 β2 – parametrii modelului de regresie;
e – variabila eroare;
Dupa ce m-am determinat cu modelul şi am adunat cîte 33 observaţii asupra
variabilelor, am trecut la estimarea parametrilor ecuaţiei utilizînd MS Excel. Cu
ajutorul blocului Data Analisys am obţinut următoarele rezultate :
Figura 1.2 Data Analisys a datelor.
Ca rezultat al aplicarii tehnicii OLS obtinem parametrii estimati ai modelului:
β0 2043,95
β1 -128,42
β2 -8,73
Y = 2043,95 – 128,42X1 – 8,73X2
cu erorile standard :
SE(β0^)=168,98
SE(β1^)=21,58
SE(β2^)=17,84
P-value a β0 β1 sînt ambele subunitarie mai mici ca 0,1 ceea ce va permite respingerea
ipotezei nule şi denotă faptul că parametrii influenţiază S&P, însă P-value a
parametrului β2 este 0,62 ceea ce este destul de mare.
Studiind tabelul ANOVA, celulele F (44,72) şi Sig.F. (9,97E-10) am stabilit că
modelul în ansamblu este destul de bun.
În tabelul Regression Statistics avem R2 = 0,74 şi R2 ajustat = 0,73 ceea ce explică că
aprox. 74% din y sînt determinate de model.
Nu este de ajuns doar să estimăm parametrii, dar şi săelaborez nişte ipoteze care ar
permite să fac inferenţe şi previziuni pe baza modelului studiat. Pe baza unor
proprietăţi ale variabilei dependente y rezultă următoarele caracteristici ale variabilei
eroare :
0. Liniaritatea în parametrii modelului, adică y=Xβ+e
1. Vectorul eroare are parametrul 0, adica E(e)=0
2. Erorile sînt independente statistic şi au aceeaşi varianţă, adică
Var(e)=E(eeT)=δeI
3. E(e|X)=0, nici o informaţie conţinută în vectorul eroare nu este conţinută în
vectorul X.
4. X este o matrice ne-aleatoare avînd rangul maxim, adică rang (X)= k+1<n
5. Erorile sînt repartizate normal, adică e □ N(0, δeI)
Apoi am efectuat prelucrarea datelor prin intermediul Eviews :
Figura 1.3 Prelucrarea datelor în EViews
EQ1 – ecuaţia regresiei;
SP - S&P 500 Close price ($);
UNMPL - The US Unemployment Rate (%);
INF - The US Inflation Rate (%);
Evident se obţin aceleaşi rezultate ca şi cu ajutorul Excel. Utilizind funcţia scat sp inf
unmpl am obţinut graficul Y, X1, X2. Se observă o polarizare a valorilor.
Figura 1.4 Scatterplotul EQ1.
Am aplicat testul de semnificaţie t (Student) asupra coeficienţilor modelului de
regresie. Am utilizat următoarele ipoteze :
H0: βi=0
H1: βi ≠ 0
Pe baza βWWi şi SE(βWWi), Eviews a calculat coefiecienţii t satistica
incadrîndu-le în coloana t-Statistic. Nivelul de semnificaţie este fixat
la 5%, astfel pentru ipoteza bilaterală regiunea critică este tcrt(>30) =
(-∞; -2,042) (∞; 2,042). Reeşind din t^ obtinuţi, concluzionez că β0^,
β1^ sunt statistic diferiţi de 0, deci fiind în zona de respingere a ipotezei nule, însa β2
aparţine zonei de indecizie, nu pot respinge H0 şi nici accepta H1.
Am parcurs şi testul F (Snedecor - Fisher) pentru a analiza varianţa variabilei
independente y şi dependenţei liniare între Y şi k variabile . Toate calculele sînt redate
în tabelul ANOVA în Excel :
SST = Σ(yi-yd ) - varianţa totală asociată valorilor y;
SSE = Σ(yi-yq ) - varianţa neexplicată de regresie;
SSR = Σ(yq -yd ) - varianţa explicată pe baza regresiei;
SST = SSR + SSE
(n-1) (k) n-(k+1) - grade de libertate.
Sumelor SSR, SSE se asociază mediile lor în funcţie de gradele de libertate – MSR,
MSE. Deci, am verificat ipotezele aferente testului F:
H0=β0=β1=β2=0
H1=nu toţi parametrii sînt nuli.
Din tabel Fcrt=3,32<F*(44,72), deci pot respinge H0 acceptînd că există o dependenţă
liniară între Y şi k variabile independente. Significance F din ANOVA semnifică
eroarea care o fac eliminînd ipoteza nulă, deci în modelul analizat este suficient de
mică (9,977E-10).
Astfel coeficientul de determinaţie multiplă (R2)
obţinut prin raportul SSR/SST exprimă partea de
varianţă totală explicată de model. Se gaseşte în
tabelul iniţial în Excel şi în datele generate de
Eviews. Coeficientul ia valori [0,1], 0 ar însemna SSR=0 ceea ce semnifică că X1,
X2 nu influienţiază deloc variabilele Y. Un coeficient mai aproape de 1 semnifică o
dependenţă totală cu reziduuri nule. În modelul studiat R2=0,74 ceea ce ar însemna o
dependenţă relativă a variabilelor.
Ipotezele elaborate si testate în cazul parametrilor ecuaţiei urmează de testat şi în
cazul matricei variabileleor eroare:
0. Liniaritatea în parametrii modelului, adică y=Xβ+e;
1. Vectorul eroare are parametrul 0, adică E(e)=0;
2. Erorile sînt independente statistic şi au aceeaşi varianţă, adică
Var(e)=E(eeT)=δeI;
3. E(e|X)=0, nici o informaţie conţinută în vectorul eroare nu este conţinută în
vectorul X;
4. X este o matrice ne-aleatoare avînd rangul maxim, adică rang(X)= k+1<n;
5. Erorile sînt repartizate normal, adică e □ N(0, δeI);
Parcurg pe rînd ipetezele enunţate anterior :
Ipoteza precum E(e)=0 este adevărată oricînd dacă folosim OLS.
Ipoteza homoscedasticitatii Var(e)=E(eeT)=δeI
Am folosit pentru aceasta testul Durbin-Watson care depistează corelaţia de ordinul I.
Am utilizat expresia :
et=pet-1+vt
et – erori;
et-1 – erori întîrziate;
Ecuaţia exprimă dependenţa liniară cu p parametru între erori. DW foloseşte
următoarele ipoteze :
H0: p=0
H1: p ≠ 0
Mai întîi verific corelarea între reziduuri şi reziduurile întîrziate grafic prin comanda
Eviews: scat R_EQ1(-1) R_EQ1.
Figura 1.5 Scatterplotul reziduurilor.
Mi se pare o oarecare corelare existentă, dar totuşi continui cu estimarea lui p,
utilizînd comanda Eviews: ls R_EQ1 R_EQ1(-1):
Figura 1.6 ls R_EQ1 R_EQ1(-1)
Deci din tabelul obţinut observ că valoarea
lui p^ este foarte mare 0,902.
Verific apoi valoarea DW prin comanda
genr DW=2*(1-C(1)), care îmi returnează
valoarea de 0,19.
Am reprezentat grafic reziduurile prin
comanda Actual,Fitted,Residual,Table.
Figura 1.7 Reprezentarea grafică a reziduurilor Actual,Fitted,Residual,Table.
Apoi View –
Actual,Fitted,Residual,Graph :
Am parcurs apoi la corectarea modelului ajingind la un model dinamic de regresie,
folosind comanda ls LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1). Am obtinut urmatorul
tabel :
1.8 LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1)
1.9 LS SP C UNMPL INF SP(-1) UNMPL(-1) INF(-1) View Representation.
Am obţinut prin aceasta un model mai bun. Am salvat rezultatele în EQ_Dinamic şi
reziduurile în R_Dinamic. Am efectuat comanda scat r_dinamic(-1) r_dinamic. Deci
după cum se observă vizual din grafic nu există corelaţie.
1.10 Scatterplotul parametrilor EQ_Dinamic.
Pentru a analiza corelaţia de ordin superior aplicăm comanda Eviews: ls sp c unmpl
inf ar(1) ar(2) ar(3) ar(4):
1.11 ls sp c unmpl inf ar(1) ar(2) ar(3) ar(4).
Sau prin testul Breuch-Godfrey (cu 2 întîrzieri) :
1.12 Rezultatele testului Breuch-Godfrey.
Am verificat homoscedasticitatea prin testul White Heteroskedasticity:
1.13 Rezultatele testului White Heteroskedasticity.
Estimaţiile OLS :
SP=-118694,4+50378,76UNMPL-2563,059UNMPL2+16904,16INF-3743,540INF2
H0=β0=β1=β2=0;
H1 măcar unul dintre parametri este diferit de 0;
Cum p-value este 0,000041 adică fac o eroare de 0,0041% dacă resping ipoteza nula,
atunci pot enunţa că este violată homoscedasticitatea şi este prezentă
heteroscedasticitatea.
Am parcurs apoi la verificarea normalităţii :
H0: skewness=0 ; kurtosis=3;
H1: repartiţia nu este normală;
Am obţinut p-value=0,42, deci eroarea pe care aş face-o dacă aş respinge ipoteza nulă
este de 42,19% ceea ce este destul de mare. Afirm dar că accept H1, adica reziduurile
sînt repartizate normal.
Concluzii
Modelul studiat mi-a arătat dependenţa S&P de şomaj şi inflaţie. Însă acest model
pare a fi valabil doar într-o recesiune, deoarece de obicei S&P şi oricare indice
bursier cresc într-o situaţie inversă celei prezente. O inflaţie scăzută şi şomaj înalt
determină o stagnare în creştere economică şi eventual în indici. Dar după cîte constat
din model perioadele de criză se caracterizează prin disproporţii economice.