Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

10
1 Modele staŃionare liniare pentru analiza seriilor de timp Curs 13 Econometrie – 8 ian. 2014 5. Modele autoregresive de medie mobilă (Auto Regressive Moving Average - ARMA(p,q)) Un model de tip ARMA(p,q) are o componentă de tip autoregresiv şi o componentă de tip medie mobilă. Componenta autoregresivă se justifică prin faptul că variabilele economice au în evoluŃie un puternic caracter inerŃial iar componenta de medie mobilă este efectul unor evenimente neaşteptate, nepredictibile, asupra unei variabile economice. Modelul ARMA este cel mai indicat model pentru a se realiza predicŃii în economie. Fie procesul t ε zgomot alb, 0 , q p numere întregi şi coeficienŃii q p θ θ θ φ φ φ . , , , , , , 2 1 2 1 L L R. Un proces stochastic t Y cu valori reale este un proces autoregresiv de medie mobilă de ordin p,q şi se notează ARMA(p,q) dacă satisface o ecuaŃie de forma: q t q t t t p t p t t t y y y y + + + + + + + = ε θ ε θ ε θ ε φ φ φ L L 2 2 1 1 2 2 1 1 . Putem rescrie această ecuaŃie folosind operatorul lag, polinomul autoregresiv de ordin p şi polinomul de medie mobilă de ordin q: t t L y L ε ) ( ) ( Θ = Φ , ) , 0 ( ~ 2 ε σ ε WN t Modelul este staŃionar dacă componenta AR este staŃionară, adică rădăcinile ecuaŃiei 0 ) ( = Φ z sunt în afara cercului unitate. Pentru un model ARMA(p,q) avem condiŃia necesară 1 1 < = p i i φ . Modelul este inversabil dacă componenta MA este inversabilă, adică rădăcinile ecuaŃiei 0 ) ( = Θ z sunt în afara cercului unitate. Caracteristicile unui proces ARMA vor fi o combinaŃie a celor de la componentele AR şi MA. ACF descreşte la zero când decalajul tinde la infinit, scăzând exponenŃial când rădăcinile ecuaŃiei 0 ) ( = Φ z sunt reale şi cu fluctuaŃii când acestea sunt complexe; PACF descreşte la zero, exponenŃial când rădăcinile ecuaŃiei 0 ) ( = Θ z sunt reale şi cu fluctuaŃii când acestea sunt complexe. ObŃinerea celor două funcŃii necesită calcule algebrice complicate. FuncŃia ACF (singură), poate face distincŃia dintre un proces AR pur şi un proces MA pur. FuncŃia PACF este utilă pentru a distinge un proces AR(p) de un proces ARMA(p,q). Astfel, un proces AR(p) are o ACF descrescătoare geometric şi o PACF care scade la 0 după p laguri, în timp ce un proces ARMA(p,q) are ambele funcŃii ACF şi PACF descrescătoare geometric. Un proces stochastic ARMA(p,q) este un proces cauzal dacă procesul t Y are o reprezentare în funcŃie de termenii procesului zgomot alb t s s , ε şi este independent de viitorul dat prin t s s > , ε . Un proces ARMA(p,q) este cauzal dacă există un şir ) ( j ψ , astfel încât < = | | 0 j j ψ şi = = 0 j j t j t y ε ψ , Z j . Un proces ARMA(p,q) este inversabil dacă există un şir ) ( j π , astfel încât < = | | 0 j j π şi = = 0 j j t j t y π ε , Z j . Clasa de procese ARMA este folosită pentru a modela procese stochastice staŃionare. ProprietăŃile de cauzalitate şi inversabilitate depind de zerourile polinoamelor autoregresive şi de medie mobilă, respectiv. Reprezentarea cauzală a unui proces ARMA poate fi utilizată pentru a calcula funcŃia de covarianŃă, care conŃine toate informaŃiile despre structura de dependenŃă. Modele ARMA(1,1) Fie } { t y un proces stochastic de tip ARMA(1,1).

description

econometrie

Transcript of Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

Page 1: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

1

Modele staŃionare liniare pentru analiza seriilor de timp Curs 13 Econometrie – 8 ian. 2014

5. Modele autoregresive de medie mobilă (Auto Regressive Moving Average - ARMA(p,q)) Un model de tip ARMA(p,q) are o componentă de tip autoregresiv şi o componentă de tip medie mobilă. Componenta autoregresivă se justifică prin faptul că variabilele economice au în evoluŃie un puternic caracter inerŃial iar componenta de medie mobilă este efectul unor evenimente neaşteptate, nepredictibile, asupra unei variabile economice. Modelul ARMA este cel mai indicat model pentru a se realiza predicŃii în economie. Fie procesul tε zgomot alb, 0, ≥qp numere întregi şi coeficienŃii ∈qp θθθφφφ .,,,,,, 2121 LL R.

Un proces stochastic tY cu valori reale este un proces autoregresiv de medie mobilă de ordin p,q şi se notează ARMA(p,q) dacă satisface o ecuaŃie de forma:

qtqtttptpttt yyyy −−−−−− +++++++= εθεθεθεφφφ LL 22112211 .

Putem rescrie această ecuaŃie folosind operatorul lag, polinomul autoregresiv de ordin p şi polinomul de medie mobilă de ordin q:

tt LyL ε)()( Θ=Φ , ),0(~ 2εσε WNt

Modelul este staŃionar dacă componenta AR este staŃionară, adică rădăcinile ecuaŃiei 0)( =Φ z

sunt în afara cercului unitate. Pentru un model ARMA(p,q) avem condiŃia necesară 11

<∑=

p

iiφ .

Modelul este inversabil dacă componenta MA este inversabilă, adică rădăcinile ecuaŃiei 0)( =Θ z sunt în afara cercului unitate. Caracteristicile unui proces ARMA vor fi o combinaŃie a celor de la componentele AR şi MA. ACF descreşte la zero când decalajul tinde la infinit, scăzând exponenŃial când rădăcinile ecuaŃiei

0)( =Φ z sunt reale şi cu fluctuaŃii când acestea sunt complexe; PACF descreşte la zero, exponenŃial când rădăcinile ecuaŃiei 0)( =Θ z sunt reale şi cu fluctuaŃii când acestea sunt complexe. ObŃinerea celor două funcŃii necesită calcule algebrice complicate. FuncŃia ACF (singură), poate face distincŃia dintre un proces AR pur şi un proces MA pur. FuncŃia PACF este utilă pentru a distinge un proces AR(p) de un proces ARMA(p,q). Astfel, un proces AR(p) are o ACF descrescătoare geometric şi o PACF care scade la 0 după p laguri, în timp ce un proces ARMA(p,q) are ambele funcŃii ACF şi PACF descrescătoare geometric. Un proces stochastic ARMA(p,q) este un proces cauzal dacă procesul tY are o reprezentare în funcŃie de termenii procesului zgomot alb tss ≤,ε şi este independent de viitorul dat prin tss >,ε .

Un proces ARMA(p,q) este cauzal dacă există un şir )( jψ , astfel încât ∞<∑∞= ||0j jψ şi

∑= ∞= −0j jtjty εψ , Zj∈ .

Un proces ARMA(p,q) este inversabil dacă există un şir )( jπ , astfel încât ∞<∑∞= ||0j jπ şi

∑= ∞= −0j jtjt yπε , Zj∈ .

Clasa de procese ARMA este folosită pentru a modela procese stochastice staŃionare. ProprietăŃile de cauzalitate şi inversabilitate depind de zerourile polinoamelor autoregresive şi de medie mobilă, respectiv. Reprezentarea cauzală a unui proces ARMA poate fi utilizată pentru a calcula funcŃia de covarianŃă, care conŃine toate informaŃiile despre structura de dependenŃă. Modele ARMA(1,1) Fie }{ ty un proces stochastic de tip ARMA(1,1).

Page 2: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

2

11 −− ++= tttt yy εθεφ

a) Să se scrie modelul cu ajutorul operatorului de decalaj L.

11 −− +=− tttt yy εθεφ

tt LyL εθφ )1()1( +=−

b) Să se scrie procesul }{ ty ca un proces MA(∞ )

L++++= −−− 332211 ttttty εψεψεψε

tt LLLy εψψψ )1( 33

221 L++++=

Cum determinăm ponderile ?,,, 321 Lψψψ

tt LyL εθφ )1()1( +=−

tt LLLLL εθεψψψφ )1()1()1( 33

221 +=++++− L

)1()1()1( 33

221 LLLLL θψψψφ +=++++− L

Ponderile jψ se calculează din identitatea )1()1()1( 33

221 LLLLL θψψψφ +=++++− L .

)1()1( 43

33

32

22

211 LLLLLLLL θφψψφψψφψψφ +=+−+−+−+− L

Prin identificarea coeficienŃilor lui jL , se obŃin ponderile: θφψ =−1 ⇒ θφψ +=1

012 =− ψφψ ⇒ )(12 θφφψφψ +==

023 =− ψφψ ⇒ )(223 θφφψφψ +==

ObŃinem ponderile )(11 θφφψφψ +== −

−j

jj , pentru 2>j .

Ponderile sunt convergente dacă 1|| <φ . Aceasta este condiŃia de staŃionaritate.

Rezultă scrierea sub forma L+++++++= −−− 32

21 )()()( ttttty εθφφεθφφεθφε

c) Să se determine autocovarianŃele procesului, apoi săsedetermine autocorelaŃiile procesului. Am obŃinut exprimarea cu ajutorul filtrului liniar:

L+++++++= −−− 32

21 )()()( ttttty εθφφεθφφεθφε

ObŃinem: 2

32

21 )))()()((()( σεθφφεθφφεθφεεε =+++++++= −−− Lttttttt EyE 2

32

2111 )()))()()((()( σθφεθφφεθφφεθφεεε +=+++++++= −−−−− Lttttttt EyE

L+++++++= −−−−− 42

3211 )()()( ttttty εθφφεθφφεθφε

0)))()()((()( 42

3211 =+++++++= −−−−− Lttttttt EyE εθφφεθφφεθφεεε 2

42

321111 )))()()((()( σεθφφεθφφεθφεεε =+++++++= −−−−−−− Lttttttt EyE

0)( 21 =−− tt yE ε

RelaŃia 11 −− +=− tttt yy εθεφ o înmulŃim cu kty −

kttkttkttktt yyyyyy −−−−−− +=− 11 εθεφ

Aplicăm operatorul de medie: )()()()( 11 kttkttkttktt yEyEyyEyyE −−−−−− +=− εθεφ

)()( 11 kttkttkk yEyE −−−− +=− εθεγφγ

Pentru k=0 obŃinem: )()( 110 tttt yEyE −+=− εθεγφγ

22210 ))(1()( σθφθσθφθσγφγ ++=++=−

Page 3: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

3

Pentru k=1 obŃinem: )()( 11101 −−− +=− tttt yEyE εθεγφγ

201 0 σθγφγ +=− ⇒ 2

01 σθγφγ +=

Înlocuim în ecuaŃia obŃinută pentru k=0 şi obŃinem: 22

00 ))(1()( σθφθσθγφφγ ++=+− 222

02 )21())(1()1( σθφθσθφθφθγφ ++=+++=−

22

2

01

21σ

φθφθ

γ−

++=

Dar 22

2222

011

φθφθφθθφφ

σθγφγ−

−+++=+=

22

22

22

11

)1)((

φφθθφ

σφ

φθθφθφγ

++=

+++=

Pentru k=2 obŃinem: 0)()( 21212 =+=− −−− tttt yEyE εθεγφγ

Pentru 2≥k avem 1−= kk γφγ

Determinăm ACF

20

11 21

)1)((

θφθφθθφ

γγ

ρ++

++==

Pentru 2≥k avem 1−= kk ρφρ . Mărimea lui 1ρ depinde atât de φ cât şi de θ .

Dacă 10 << φ , convergenŃa este directă. Dacă 01 <<− φ , autocorelaŃiile vor oscila. FuncŃia ACF a unui model ARMA(1,1) este similară cu cea a unui proces AR(1), fiind o descreştere exponenŃială. DiferenŃa este că descreşterea începe de la 1ρ şi nu de la 10 =ρ ca în

cazul AR(1). FuncŃia PACF pentru un model ARMA(1,1) se comportă ca în cazul MA(1), după valoarea iniŃială

111 ρφ = urmează o descreştere exponenŃială.

21

212

221 ρ

ρρφ

−=

∑∑

= −

= −−

−=

1

1 ,1

1

1 ,1

1k

j jjk

k

j jkjkk

kk

ρφ

ρφρφ , unde 1,...,3,2,1,,1,1 −=−= −−− kjjkkkkjkkj φφφφ .

Exemplu: 11 −− ++= tttt yy εθεφ

11 7,07,0 −− −+−= tttt yy εε ⇒ 7,0−=φ şi 7,0−=θ

a) Să se calculeze ACF:

20

11 21

)1)((

θφθφθθφ

γγ

ρ++

++== ⇒ 8445,0

49,0)49,0(21

)49,01)(7,07,0(1 −=

+++−−

ρ

Pentru 2≥k avem 1−= kk ρφρ

591,0)8445,0)(7,0(12 =−−== ρφρ

414,023 −== ρφρ ; 290,04 =ρ ; 203,05 −=ρ ; 142,06 =ρ , 099,07 −=ρ ; 07,08 =ρ

b) Să se calculeze PACF: 8445,0111 −== ρφ

Page 4: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

4

426,0)8445,0(1

)8445,0(591,0

1 2

2

21

212

22 −=−−

−−=

−=

ρρρ

φ

Pentru a determina 33φ , calculăm 204,111221121 −=−= φφφφ

262,0)591,0)(426,0()8445,0)(204,1(1

)8445,0)(426,0()591,0)(204,1()414,0(

12

1 2

2

1 323

33 −=−−−−−

−−−−−−=

−=

∑∑

=

= −

j jj

j jj

ρφ

ρφρφ

173,01

3

1 3

3

1 434

44 −=−

−=

∑∑

=

= −

j jj

j jj

ρφ

ρφρφ

unde jjj −−= 2,23323 φφφφ ⇒ 315,131 −=φ ; 74,032 −=φ ;

117,055 −=φ ; 081,066 −=φ ; 056,077 −=φ ; 039,088 −=φ

6. Modelele ARIMA şi construirea lor prin metodologia Box-Jenkins Box şi Jenkins(1970) au propus o metodologie pentru previzionarea unei variabile doar pe baza valorii prezente şi a valorilor din trecul ale variabilei.

1. Cum modelăm o serie nestaŃionară, şi ce fel de model putem folosi pentru a descrie comportamentul unei serii staŃionare?

2. Cum folosim modelul ajustat pentru prognoză? Modelele de tip ARMA pot să aproximeze cele mai multe procese staŃionare. Pentru că în economie sunt puŃine serii de timp staŃionare, sunt necesare modele care să fie capabile să reproducă comportamentul nestaŃionar. Modelele ARMA au fost generalizate pentru serii nestationare care devin staŃionare prin diferenŃiere. Modelele rezultate au fost numite modele autoregresive de medie mobilă integrate ARIMA(p,d,q) unde d este ordinul de diferenŃiere necesar pentru staŃionarizarea seriei. Astfel de modele (modele ARMA integrate), se obŃin prin presupunerea că o serie cronologică poate fi reprezentată, după diferenŃiere, printr-un model de tip ARMA. O serie de timp ty este un proces ARIMA(p,1,q) dacă seria tttt yLyyz )1(1 −=−= − , obŃinută

prin aplicarea operatorului de diferenŃă urmează un model ARMA(p,q) staŃionar şi inversabil. Modele ARIMA(AutoRegressive Integrated Moving Average) sunt folosite pentru a analiza dinamica seriilor de timp unidimensionale. Un model ARIMA are trei componente: termenul autoregresiv, termenul privind ordinul de integrare şi termenul de medie mobilă. Ordinul de integrare arată ordinul d, de diferenŃiere al seriei analizate. Valoarea 1=d semnifică faptul că modelul este specificat pentru prima diferenŃă a seriei originale. Valoarea 2=d corespunde diferenŃelor de ordin doi ale seriei originale. Modelele ARIMA sunt utile pentru a reprezenta perturbaŃii în sisteme cu grad mare de inerŃie. Aceste modele sunt foarte performante în a reprezenta serii de timp nestaŃionare omogene. Multe serii de timp din economie sunt nestaŃionare, dar sunt integrate. Dacă o serie de timp este

)(dI , după diferenŃierea seriei de d ori se obŃine o serie staŃionară, adică )0(I . Aplicând un model ARMA acestei serii )0(I , spunem că seria de timp iniŃială este un proces de medie mobilă integrat, autoregresiv, notat ARIMA(p,d,q). Se ştie deja că p indică numărul de termeni autoregresivi, q indică numărul de termeni de medie mobilă, iar d arată de câte ori a fost diferenŃiată seria pentru a deveni staŃionară.

Page 5: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

5

Metodologia Box-Jenkins are ca obiectiv identificarea şi estimarea unui model statistic care poate fi considerat că a generat datele de selecŃie. Acest model estimat va fi utilizat pentru prognoze şi este necesară presupunerea că are caracteristici constante în timp. Selectarea modelului ARIMA potrivit pentru datele observate se realizează printr-o procedură iterativă (metodologia Box-Jenkins), bazată pe mai multe etape. EtapaI. Identificarea. Obiectivul identificării este de a selecta o subclasă a unei familii de modele ARIMA, potrivite pentru a reprezenta o serie de timp, adică un proces economic evolutiv. În etapa de identificare sunt analizate datele observate şi toate informaŃiile disponibile care sunt capabile să sugereze o subclasă de modele ce pot descrie modul de generare a datelor. Elementele de teorie economică pot sugera tipul de model potrivit pentru un anumit proces economic. Astfel, procesele economice inerŃiale (consumul, inflaŃia, plata impozitelor) sau cele dependente de propriile realizări anterioare (exportul, productivitatea, investiŃiile, producŃia din sectorul zootehnic, calitatea producŃiei), se recomandă a fi reprezentate de un model AR, ARI, ARMA sau ARIMA. Procesele economice care pot fi relativ uşor influenŃate de şocuri exterioare, dar care permit măsuri compensatorii în timp (aprovizionarea, producŃia, cotaŃia la bursă) se recomandă a fi reprezentate de un model MA sau care include o componentă MA. Identificarea înseamnă determinarea tipului de model şi a ordinului modelului ce urmează a fi folosit pentru a reproduce caracteristicile dinamice ale datelor. Pentru a determina cea mai bună specificare sunt folosite reprezentări grafice ale datelor şi ale funcŃiilor ACF şi PACF de selecŃie. Se analizează funcŃiile de autocorelaŃie şi autocorelaŃie parŃială de selecŃie. Mai întâi se examinează seria de analizat, pentru a vedea dacă ar fi putut fi generată de un proces staŃionar. De regulă, seriile de timp din economie nu sunt staŃioanare. O astfel de serie poate avea următoarele caracteristici: 1. Seria prezintă o medie care nu este constantă în timp, dar variaŃiile sunt constante de la o perioadă la alta; seria urmează, de regulă, o traiectorie liniară, cu panta pozitivă sau negativă. Se spune că este o serie nestaŃionară de tip omogen. 2. Seria prezintă variaŃii care nu sunt constante de la o perioadă la alta. Se spune că este o serie nestaŃionară de tip neomogen. Folosim reprezentarea grafică a seriei pentru a vedea dacă are varianŃă staŃionară. Dacă dispersia datelor variază cu timpul, seria este nestaŃionară. În acest caz se poate aplica datelor tansformarea Box-Cox: 0,/)1()( ≠−= λλλ λyy şi 0,log)( == λλλy . Urmează analiza staŃionarităŃii în medie. Acest lucru se poate face examinând graficul valorilor seriei, examinând corelogramele de selecŃie sau aplicând un test pentru o rădăcină unitară, precum testul Dickey-Fuller. AutocorelaŃiile de selecŃie sunt estimaŃii consistente ale coeficienŃilor populaŃiei, aşa încât corelograma de selecŃie a unui proces staŃionar tinde la zero pentru lungimi de lag moderate. O serie nestaŃionară are o SACF care nu descreşte. O serie integrată are SACF ce descreşte foarte încet, iar SPACF scade foarte repede, la lag-ul 2=k şi prima valoare este foarte apropiată de 1. Dacă seria arată un model de nestaŃionaritate, se staŃionarizează seria prin aplicarea unor transformări potrivite. De exemplu, se logaritmează valorile iniŃiale ale seriei, apoi se diferenŃiază seria până la obŃinerea staŃionarităŃii. Luăm seria diferenŃelor de ordinul întâi şi analizăm dacă este staŃionară, într-un mod similar. Metodele grafice pot fi însoŃite de teste de rădăcină unitară. Acest proces de a efectua diferenŃele va continua până la obŃinerea unei serii staŃionare. După obŃinerea unei serii staŃionare, se compară SACF şi SPACF ale seriei staŃionare cu diferite modele liniare teoretice ARMA, iar această comparaŃie poate sugera câteva modele plauzibile.

Page 6: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

6

În cazul unui model AR(p) ACF este infinită iar PACF este finită. CoeficienŃii de autocorelaŃie descresc spre 0 geometric sau în alternanŃă, pe măsură ce creşte lag-ul k. CoeficienŃii de autocorelaŃie parŃială descresc brusc la 0 după un anumit număr de decalaje, astfel încât pentru 0, ≈> kkpk φ .

Rezultă că, dacă coeficienŃii kρ̂ scad în progresie geometrică şi coeficienŃii kkφ̂ scad brusc

astfel încât 0ˆ ≈kkφ , pentru pk > , se recomandă un model AR(p). Deci p este cea mai mare

valoare a lui k, pentru care coeficienŃii de autocorelaŃie parŃială estimaŃi, kkφ̂ , se află în afara

intervalului )/96,1( n± . În cazul unui model MA(q), PACF este infinită iar ACF este finită. CoeficienŃii de autocorelaŃie scad brusc la 0 astfel încât pentru 0, ≈> kqk ρ .

CoeficienŃii de autocorelaŃie parŃială descresc spre 0 exponenŃial sau cu fluctuaŃii. Rezultă că, dacă coeficienŃii kρ̂ scad brusc astfel încât 0ˆ ≈kρ pentru qk > şi coeficienŃii kkφ̂ scad în progresie geometrică, se recomandă un model MA(q). Deci q este cea mai mare valoare a lui k, pentru care coeficienŃii de autocorelaŃie estimaŃi, kρ̂ , se află în afara intervalului

)/96,1( n± . Pentru un model ARMA(p,q), atât coeficienŃii de autocorelaŃie cât şi coeficienŃii de autocorelaŃie parŃială descresc spre 0 exponenŃial sau geometric. Ordinul p, al părŃii autoregresive din model, este dat de coeficientul de autocorelaŃie parŃială care prezintă un nivel semnificativ, iar ordinul q, al părŃii de medie mobilă din model, este dat de coeficientul de autocorelaŃie care prezintă un nivel semnificativ. La acest moment, folosirea unui model de tip ARMA(p,q) este doar la stadiul de intenŃie. ObservaŃie: Scăderea coeficienŃilor de autocorelaŃie trebuie înŃeleasă în valoare absolută. Descreştera coeficienŃilor de AC sau PAC poate fi întreruptă de valori mai mari (în valoare absolută) în cazul în care datele prezintă sezonalitate (de ex., în cazul datelor trimestriale, se pot

întâlni valori mari ale coeficienŃilor 4ρ̂ sau 44φ̂ , comparativ cu valorile coeficienŃilor 3ρ̂ , 5ρ̂ , 6ρ̂ .

Se recomandă selectarea mai multor variante de modele, printre care şi o variantă ARMA, pentru a fi estimate şi verificate. - Dacă există o valoare a decalajului, q, după care valoarea funcŃiei de autocorelaŃie scade brusc spre 0 rezultă că, pentru prelucrarea seriei, este indicată folosirea unui proces MA(q) pur sau a unui proces ce conŃine o componentă MA(q).

- Dacă valoarea funcŃiei de autocorelaŃie parŃială kkkk φρ ˆˆ = , scade brusc spre 0 după o valoare a

decalajului egală cu p, rezultă că, pentru prelucrarea seriei, este indicată folosirea unui proces AR(p) pur sau a unui proces ce conŃine o componentă AR(p). Se consideră că valoarea lui

kkkk φρ ˆˆ = diferă semnificativ faŃă de zero dacă nu este conŃinută în intervalul

( )ntnt nn /1;/1 2;2/2;2/ ⋅+⋅− −− αα .

Etapa II. Estimarea parametrilor modelului identificat. Estimarea parametrilor unui model de tip AR(p) se face prin MCMMP, minimizând suma pătratelor reziduurilor sau prin ecuaŃiile Yule-Walker de selecŃie. Dacă în model există termeni de tip MA, minimizarea sumei pătratelor reziduurilor sau maximizarea funcŃiei de verosimilitate necesită metode de estimare neliniare (Newton, Davidson-Fletcher-Powell).

Page 7: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

7

Parametrii unui model ARIMA(p,d,q), se pot estima consistent prin MCMMP sau prin metoda verosimilităŃii maxime. Ambele procedee de estimare sunt bazate pe calculul inovaŃiilor tε din

valorile variabilei staŃionare. Estimarea diverselor variante de modele, care au fost sugerate de corelogramă în etapa de identificare, va fi realizată cu ajutorul unui program ARMA dintr-un pachet de programe (EViews, SAS, SPSS). Vom atribui valori pentru p şi q în diverse combinaŃii şi vom obŃine estimaŃii ale coeficienŃilor modelelor corespunzătoare. Verificarea corectitudinii modelului identificat. După ce modelele ARMA selectate au fost estimate, dorim să ne asigurăm că sunt potrivite. Pentru aceasta se analizează atât reziduurile cât şi parametrii pentru fiecare model. Testarea reziduurilor

Practica standard este de a reprezenta grafic reziduurile modelului estimat. Dacă modelul estimat este adecvat, reziduurile ar trebui să fie aproximativ zgomot alb. Deci, reziduurile obŃinute pentru modelul estimat sunt analizate pentru a stabili dacă provin dintr-un proces de zgomot alb. În caz afirmativ, tipul de model propus este o bună aproximaŃie pentru procesul stochastic de bază. În caz contrar, procesul este reluat, metoda fiind una iterativă. Pentru a controla dacă reziduurile au media zero şi sunt necorelate folosim atât graficul, cât şi ACF şi PACF ale reziduurilor. ACF şi PACF teoretice ale procesului WN iau valoarea zero pentru lagurile 0≠k , aşa că, dacă modelul este potrivit, cei mai mulŃi din coeficienŃii funcŃiilor SACF şi SPACF ar trebui să fie apropiaŃi de zero. În practică, cerem ca 95% din aceşti coeficienŃi să se afle în interiorul unor limite de nesemnificaŃie. Mai mult, statistica Ljung-Box ar trebui să aibe valori mici, deoarece corespunde la variabile necorelate. Un model care conduce la obŃinerea unor coeficienŃi de autocorelaŃie a reziduurilor semnificativi sau la o statistică Q semnificativă la nivelul de semnificaŃie de 10%, trebuie eliminat. Dacă se observă că varianŃa reziduurilor este crescătoare, rezultă că este potrivită o transformare logaritmică. Este foarte important ca reziduurile obŃinute prin estimarea unui model să fie serial necorelate. Deci, orice model care nu produce reziduuri aleatoare ar trebui să nu fie luat în considerare, ci eliminat. Testarea parametrilor

Se pot aplica testele de semnificaŃie clasice t şi F Este important, de asemenea, să fie satisfăcute condiŃiile de staŃionaritate şi inversabilitate. Dacă factorizăm polinoamele AR şi MA şi una din aceste rădăcini este apropiată de 1, aceasta este un semn de absenŃă a staŃionarităŃii sau inversabilităŃii. Departajarea între mai multe modele Presupunând că sunt estimaŃi parametrii pentru mai multe modele identificate ca fiind ARIMA(pi,d,qi), se pot utiliza două tipuri de indicatori: ai calităŃii reziduurilor sau ai teoriei informaŃiei. a) Indicatori ai calităŃii reziduurilor Dintre modele estimate se alege modelul cu cea mai mică varianŃă a reziduurilor, cu cea mai mare valoare a lui 2R şi cu cea mai mare valoare a statisticii F. b) Indicatori ai teoriei informaŃiei Pentru fiecare din modelele estimate se calculează indicatorii AIC(criteriul Akaike) şi BIC

(criteriul Schwarz): AICn

qp ++= 2ˆlog 2

εσ , BICn

nqp

log)(ˆlog 2 ++= εσ .

Se alege modelul cu cea mai mică valoare a indicatorului. Etapa III. Efectuarea de prognoze cu ajutorul modelelor ARIMA.

Page 8: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

8

Obiectivul principal urmărit prin construirea unui model ARMA este de a predicta sau prognoza evoluŃia viitoare a unei variabile economice. Modelul selectat, pentru care s-a verificat corectitudinea, poate fi utilizat pentru prognoză. Modelele ARIMA sunt destul de apreciate pentru succesul în a face predicŃii. Prognozele obŃinute prin aceaste modele sunt considerate mai bune, mai ales pe termen scurt, decât cele obŃinute prin modelarea econometrică tradiŃională, în cazul seriilor cronologice. Prognozarea unei serii de timp constă în încercarea de a previziona valori viitoare ale seriei, Ńinând seama de valorile din trecut ale seriei şi de valorile din trecut ale unui termen eroare. Se pot efectua prognoze punctuale (se previzionază o singură valoare a variabilei) sau prognoze pe interval (se determină un domeniu de valori în care anticipăm că se va afla valoarea viitoare a variabilei, pentru un nivel de semnificaŃie dat). Ipoteza cheie: Stationaritatea seriei -regula de bază care guvernează nu se schimbă -comportamentul viitor poate fi dedus pe baza trecutului -avem suficiente observaŃii din trecut pentru a înŃelege procesul de bază. Considerăm că )( ty este un proces stochastic staŃionar cu media zero. Putem presupune că suntem

la momentul t şi suntem interesaŃi de a prognoza sau previziona valorile acestui proces pentru câteva perioade din viitor, pe baza observaŃiilor din trecut. Istoria acestui proces este conŃinută într-o mulŃime a informaŃiilor iar predicŃia va fi bazată pe această mulŃime de informaŃii. În practică, această mulŃime este o mulŃime finită },...,,{ 1 pttt yyy −− , reprezentând trecutul recent.

Totuşi, în dezvoltarea teoriei predicŃiei, este util a se considera o mulŃime a informaŃiilor infinită ,...},...,,{ 1 ptttt yyyI −−= , reprezentând întregul trecut. Vom nota predicŃia lui hty + , care este făcută

la momentul t, prin )(hyt sau hty +ˆ . Vom spune că t este originea, h este orizontul de timp iar

)(hyt este valoarea previzionată pentru hty + cu h perioade înainte. În general, predictorul

)(hyt ( predictorul lui hty + , construit la timpul t), este o funcŃie de variabilele din mulŃimea tI .

Definim eroarea de previziune (de prognoză) a lui hty + , diferenŃa dintre valoarea reală şi cea

previzionată: hthttht yyhyy +++ −=− ˆ)(

Criteriul folosit în mod obişnuit pentru a aprecia performanŃa unui estimator sau predictor al unei variabile aleatoare este minimizarea pătratului erorii medii condiŃionate, de prognoză, adică:

( )ttht IhyyE |))((min 2−+ .

Vom folosi una din notaŃiile: )()|()( httthtt yEIyEhy ++ == .

Notăm cu htf , o prognoză pentru o serie y, prognoză realizată folosind un model ARMA(p,q), la

momentul t, pentru h perioade în viitor. PredicŃia cu ajutorul modelului MA(q) Un proces MA(q) are o memorie doar de lungime q şi aceasta limitează orizontul de prognoză. De exemplu, presupunem că am estimat un model MA(3):

332211 −−− ++++= ttttty εθεθεθεµ

Deoarece se presupune că parametrii sunt constanŃi în timp, dacă relaŃia anterioară are loc la timpul t, ea va avea loc şi la momentele ,...2,1 ++ tt . Vom putea scrie relaŃiile:

2312111 −−++ ++++= ttttty εθεθεθεµ

1321122 −+++ ++++= ttttty εθεθεθεµ

ttttty εθεθεθεµ 3122133 ++++= ++++

Page 9: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

9

łinem cont că toate informaŃiile până la timpul t, inclusiv cele de la timpul t, sunt cunoscute şi disponibile. Realizarea de prognoze înseamnă a considera mediile condiŃionate de informaŃiile disponibile. PerturbaŃiile ,..., 21 ++ tt εε nu sunt cunoscute la timpul t. Cea mai bună prognoză pentru

media condiŃionată a lui 1+tε este zero, adică 0)|()( 11 == ++ tttt IEE εε , datorită ipotezelor

procesului de zgomot alb. Vom obŃine:

2312123121111, )()( −−−−++ +++=++++== tttttttttt EyEf εθεθεθµεθεθεθεµ

13213211222, )()( −−+++ ++=++++== ttttttttt EyEf εθεθµεθεθεθεµ

ttttttttt EyEf εθµεθεθεθεµ 331221333, )()( +=++++== ++++

µεθεθεθεµ =++++== +++++ )()( 132231444, tttttttt EyEf

4)(,)(, ≥∀== + hyEf httht µ .

Deoarece procesul MA(3) are o memorie de numai 3 perioade, toate predicŃiile pentru 4 sau mai multe perioade în viitor, se reduc la parametrul de interceptare din model. Dacă în model nu există constantă, aceste prognoze vor fi 0.

Am folosit faptul că:

>

≤== +

++0,0

0,)|()(

j

jIEE

jt

tjtjtt

εεε

Pentru 0≤j avem valori cunoscute iar pentru 0>j avem valori viitoare care au media 0. PredicŃia cu ajutorul modelului AR(p) Un proces AR are memorie infinită, spre deosebire de un proces MA(q) care are memorie de numai q perioade. Considerăm că a fost estimat un model AR(2): tttt yyy εφφµ +++= −− 2211

Vom apela, din nou, la presupunerea de stabilitate a parametrilor şi vom putea scrie relaŃiile:

11211 +−+ +++= tttt yyy εφφµ

22112 +++ +++= tttt yyy εφφµ

312213 ++++ +++= tttt yyy εφφµ .

ObŃinerea prognozei pentru o perioadă în viitor este simplă deoarece toate informaŃiile despre y sunt cunoscute la timpul t. Aplicăm operatorul de medie şi considerăm 0)|()( 11 == ++ tttt IEE εε .

121112111, )()( −+−+ ++=+++== ttttttttt yyyyEyEf φφµεφφµ

Aplicăm acelaşi raŃionament pentru a obŃine prognoza pentru două perioade înainte:

ttttttttttttt yfyEyEyyEyEf 21,1211221122, )()()()( φφµφφµεφφµ ++=++=+++== ++++

1,22,112213122133, )()()()( ttttttttttttt ffyEyEyyEyEf φφµφφµεφφµ ++=++=+++== ++++++

2,23,144, )( ttttt ffyEf φφµ ++== +

2,21,1, )( −−+ ++== hththttht ffyEf φφµ

PredicŃia cu ajutorul modelului ARMA(p,q) Prognozele pot fi generate prin aşa numita funcŃie de prognoză:

∑∑ = −+= − +=q

j jhtj

p

i ihtiht ff11 ,, εθφ ,unde 0,, ≤= + hyf htht , 0, ≤= ++ hhtht εε şi 0,0 >=+ hhtε .

PredicŃia folosind modele ARIMA(p,d,q) Presupunem că seria nyyy ,,, 21 K urmează un model general ARIMA(p,d,q), model ce poate fi

rescris în funcŃie de valoarea curentă şi de valorile anterioare ale lui tε :

tttdt LLLL

Ly εψψεε )1()(

)(

)( 2221 L+++=Ψ=

∆Φ

Θ= ∞

Page 10: Curs13 Econometrie Modele ARMA Met.box-Jenkins 8ian.2014 (2)

10

Valoarea viitoare hny + este generată prin model astfel:

L+++= −+−+++ 2211 hnhnhnhny εψεψε

Prognoza optimală a lui hny + este media condiŃionată hnnhnn fIyEhy ,)|()( == + . Termenul de

prognoză optimală este folosit în sensul că minimizează eroarea pătratică medie (MSE). Deşi media condiŃionată poate să nu fie funcŃie liniară de valorile lui y, vom considera prognozele liniare pentru că este mai simplu de lucrat cu acestea. În plus, dacă procesul este normal, prognoza MSE minimă (MMSE) este liniară. Prognoza optimală peste h perioade în viitor este:

=+++=== −+−+++ )()|()( 2211, Lhnhnhnnnhnnhn EIyEhyf εψεψε

L+++= −+−+ 2211 nhnhnh εψεψεψ

Eroarea de prognoză corespunzătoare funcŃiei de prognoză hnf , la originea n este o combinaŃie

liniară de şocuri viitoare care intră în sistem după timpul de origine n:

112211)()( +−−+−+++ ++++=−= nhhnhnhnnhnn hyyhe εψεψεψε L .

Deoarece 0]|)([ =nn IheE , prognoza )(hyn este nedeplasată cu MSE:

)1())(()]([ 221

2hnn heVarhyMSE ψψσ ε +++== L .

Dacă procesul este normal, un interval de încredere )1( α− va fi ]))(()([ 2/ heVarzhy nn α± .

Pentru 1=h avem 11 )1()1( ++ =−= nnnn yye ε , deci 2εσ poate fi interpretat ca varianŃa erorii de

prognoză pentru o perioadă în viitor. Concluzii Metodologia Box-Jenkins se referă la identificarea, estimarea, verificarea şi previzionarea unei serii de timp univariate. Modelele ARMA pot fi văzute ca o clasă specială de ecuaŃii stochastice cu diferenŃe, liniare. Prin definiŃie, un model ARMA este slab staŃionar dacă are media şi covarianŃele finite şi invariante în raport cu timpul. Pentru ca un model să fie staŃionar trebuie ca rădăcinile ecuaŃiei caracteristice să se afle în interiorul cercului unitar. În plus, procesul trebuie să fie totdeauna în echilibru. În etapa de identificare, seria cronologică este reprezentată grafic şi sunt examinaŃi coeficienŃii de autocorelaŃie de selecŃie şi coeficienŃii de autocorelaŃie parŃială de selecŃie. O funcŃie de autocorelaŃie care scade lent spre zero sugerează un comportament nestaŃionar. În această situaŃie, Box şi Jenkins recomandă diferenŃierea datelor. Dacă varianŃa datelor nu este constantă, se recomandă o transformare logaritmică. FuncŃiile SACF şi SPACF ale datelor transformate în mod convenabil, sunt comparate cu cele ale diferitelor procese ARMA teoretice. Sunt estimate toate modelele considerate ca fiind plauzibile şi apoi sunt comparate folosind diferite criterii. O chestiune fundamentală este dacă dorim un model care să dea cea mai bună descriere a datelor sau un model care să dea cele mai bune previziuni. ObŃinem previziuni mai bune dacă optăm pentru un model mai mic, deoarece un astfel de model are intervale de încredere mai mici, în jurul valorilor prognozate. Un model bine estimat: nu este foarte complex (este restrâns); are coeficienŃi care induc staŃionaritatea şi inversabilitatea; aproximează bine datele observate; are reziduuri care aproximează un proces de zgomot alb; are coeficienŃi care nu se modifică pe perioada de selecŃie; are prognoze bune.