Curs 11 Econometrie Spataru 11dec.2013 (1)

11
1 Introducere în MODELAREA SERIILOR de TIMP UNIVARIATE Curs 11 Econometrie – 11 dec. 2013 1. Argumente pentru studiul evoluŃiei proceselor economice în timp Timpul este o coordonată esenŃială a existenŃei umane. Realitatea economică şi socială se localizează în timp şi spaŃiu. Toate procesele economice se desfăşoară în timp şi evoluŃia lor este interpretată în raport cu timpul. Studiul şi analiza unor astfel de procese se face cu ajutorul seriilor de timp sau cronologice. În economie, datele sunt colectate în mod frecvent sub forma seriilor cronologice. Se ştie că acŃiunea unor factori nu afectează instantaneu o variabilă efect, ci după un interval de timp. Este importantă cunoaşterea decalajului (lag-ului) cu care apar modificările asupra variabilei rezultative. 2. NoŃiuni specifice Analizei Seriilor de Timp O serie de timp este o mulŃime de observaŃii efectuate la diferite momente de timp asupra unei variabile aleatoare Y. Fiecare observaŃie va fi indexată prin data efectuării observaŃiei. Pentru a indica dependenŃa de timp, o observaŃie va fi notată cu t y cu n t ,..., 2 , 1 = (sau T t ,..., 2 , 1 = ). O serie de timp univariată constă dintr-o mulŃime de observaŃii, { } n y y y ,..., , 2 1 asupra unei singure variabile Y. Orice serie de timp poate fi gândită ca fiind generată printr-un proces aleator sau stochastic. Un proces stochastic, notat { } −∞ = t t y , este un model care descrie structura probabilistă a unui şir de observaŃii în timp. Fie ] , 0 [ n (sau ] , 0 [ T ) un orizont de timp, ) , , ( P K Ω un spaŃiu de probabilitate şi un proces stochastic { } −∞ = t t y . O serie de timp, { } ] , 0 [ n t t y poate fi privită ca o realizare a procesului stochastic, care este observat numai pentru un număr finit de perioade. Presupunând că s-a observat o selecŃie de volum n, a variabilei aleatoare Y, aceasta reprezintă o mulŃime de n numere şi este doar un rezultat posibil al procesului stochastic care genereză datele. Seria de timp n y y y ,..., , 2 1 , de n observaŃii succesive, este privită ca o realizare de selecŃie dintr-o populaŃie infinită de astfel de serii de timp, care ar putea să fi fost generate printr-un proces stochastic. DistincŃia dintre un proces stochastic şi o realizare a sa este asemănătoare celei dintre populaŃie şi un eşantion extras din acea populaŃie. Aşa cum se foloseşte eşantionul pentru a obŃine informaŃii despre populaŃie, în seriile de timp se foloseşte realizarea pentru a obŃine informaŃii despre procesul stochastic de bază. Lag – întârziere, exprimată în unităŃi de timp, între modificarea variabilei cauzale şi manifestarea efectului. Analiza Seriilor de Timp este o metodă generală de caracterizare a seriei cronologice din perspectiva componentelor sistematice şi aleatoare în vederea măsurării intensităŃii şi continuităŃii lor, astfel încât procesul analizat să devină predictibil. O caracteristică intrinsecă a unei serii de timp este aceea că observaŃiile adiacente sunt dependente. Natura acestei dependenŃe între observaŃiile unei serii de timp este de un deosebit interes practic. Analiza Seriilor de Timp constă în tehnici de analiză a acestei dependenŃe. Principalul instrument în analiza seriilor de timp este modelul stochastic. Se caută şi se foloseşte un model stochastic de un anumit tip, capabil să reproducă comportamentul trecut al unei serii, pe baza structurii sale de autocorelaŃie. Obiectivele Analizei Seriilor de Timp sunt: 1) de a descrie modele de regularitate comportamentală pentru datele de observaŃie; 2) de a prognoza valorile viitoare ale unei variabile în funcŃie de observaŃiile sale din trecut. Dacă se studiază o singură variabilă, se obŃine un model al unei serii de timp univariate. Dacă se studiază interacŃiunea dinamică dintre mai multe variabile economice (de exemplu, dintre cheltuieli de consum, investiŃii şi venit) se obŃin modele pentru serii de timp multivariate. Exemple de Serii de Timp economice -Exportul total înregistrat în luni consecutive; -Veniturile medii în luni consecutive;

description

econometrie

Transcript of Curs 11 Econometrie Spataru 11dec.2013 (1)

Page 1: Curs 11 Econometrie Spataru 11dec.2013 (1)

1

Introducere în MODELAREA SERIILOR de TIMP UNIVARIATE Curs 11 Econometrie – 11 dec. 2013

1. Argumente pentru studiul evoluŃiei proceselor economice în timp Timpul este o coordonată esenŃială a existenŃei umane. Realitatea economică şi socială se localizează în timp şi spaŃiu. Toate procesele economice se desfăşoară în timp şi evoluŃia lor este interpretată în raport cu timpul. Studiul şi analiza unor astfel de procese se face cu ajutorul seriilor de timp sau cronologice. În economie, datele sunt colectate în mod frecvent sub forma seriilor cronologice. Se ştie că acŃiunea unor factori nu afectează instantaneu o variabilă efect, ci după un interval de timp. Este importantă cunoaşterea decalajului (lag-ului) cu care apar modificările asupra variabilei rezultative. 2. NoŃiuni specifice Analizei Seriilor de Timp O serie de timp este o mulŃime de observaŃii efectuate la diferite momente de timp asupra unei variabile aleatoare Y. Fiecare observaŃie va fi indexată prin data efectuării observaŃiei. Pentru a indica dependenŃa de timp, o observaŃie va fi notată cu ty cu nt ,...,2,1= (sau Tt ,...,2,1= ).

O serie de timp univariată constă dintr-o mulŃime de observaŃii, nyyy ,...,, 21 asupra unei singure

variabile Y. Orice serie de timp poate fi gândită ca fiind generată printr-un proces aleator sau stochastic.

Un proces stochastic, notat ∞−∞=tty , este un model care descrie structura probabilistă a unui şir de

observaŃii în timp. Fie ],0[ n (sau ],0[ T ) un orizont de timp, ),,( PKΩ un spaŃiu de probabilitate şi un proces stochastic

∞−∞=tty . O serie de timp, ],0[ ntty ∈ poate fi privită ca o realizare a procesului stochastic, care este

observat numai pentru un număr finit de perioade. Presupunând că s-a observat o selecŃie de volum n, a variabilei aleatoare Y, aceasta reprezintă o mulŃime de n numere şi este doar un rezultat posibil al procesului stochastic care genereză datele. Seria de timp nyyy ,...,, 21 , de n observaŃii succesive, este

privită ca o realizare de selecŃie dintr-o populaŃie infinită de astfel de serii de timp, care ar putea să fi fost generate printr-un proces stochastic. DistincŃia dintre un proces stochastic şi o realizare a sa este asemănătoare celei dintre populaŃie şi un eşantion extras din acea populaŃie. Aşa cum se foloseşte eşantionul pentru a obŃine informaŃii despre populaŃie, în seriile de timp se foloseşte realizarea pentru a obŃine informaŃii despre procesul stochastic de bază. Lag – întârziere, exprimată în unităŃi de timp, între modificarea variabilei cauzale şi manifestarea efectului. Analiza Seriilor de Timp este o metodă generală de caracterizare a seriei cronologice din perspectiva componentelor sistematice şi aleatoare în vederea măsurării intensităŃii şi continuităŃii lor, astfel încât procesul analizat să devină predictibil. O caracteristică intrinsecă a unei serii de timp este aceea că observaŃiile adiacente sunt dependente. Natura acestei dependenŃe între observaŃiile unei serii de timp este de un deosebit interes practic. Analiza Seriilor de Timp constă în tehnici de analiză a acestei dependenŃe. Principalul instrument în analiza seriilor de timp este modelul stochastic. Se caută şi se foloseşte un model stochastic de un anumit tip, capabil să reproducă comportamentul trecut al unei serii, pe baza structurii sale de autocorelaŃie. Obiectivele Analizei Seriilor de Timp sunt: 1) de a descrie modele de regularitate comportamentală pentru datele de observaŃie; 2) de a prognoza valorile viitoare ale unei variabile în funcŃie de observaŃiile sale din trecut. Dacă se studiază o singură variabilă, se obŃine un model al unei serii de timp univariate. Dacă se studiază interacŃiunea dinamică dintre mai multe variabile economice (de exemplu, dintre cheltuieli de consum, investiŃii şi venit) se obŃin modele pentru serii de timp multivariate. Exemple de Serii de Timp economice -Exportul total înregistrat în luni consecutive; -Veniturile medii în luni consecutive;

Page 2: Curs 11 Econometrie Spataru 11dec.2013 (1)

2

-Profitul unei companii în ani consecutivi; -PreŃul mediu zilnic al unui anumit produs; -Valorile vânzărilor în luni consecutive. Componentele unei Serii de Timp. Seriile de timp ale datelor economice prezintă multe caracteristici. Un mod de a începe analiza unei serii cronologice este de a afişa datele prin intermediul unei diagrame în care seria este reprezentată grafic în raport cu timpul - cronograma. Privind cronograma, se văd trăsăturile relevante ale dependenŃei dintre observaŃii sau alte importante caracteristici cum ar fi: -componenta de trend ( Ty ), -componenta de sezonalitate ( Sy ), componenta

ciclică ( Cy ) şi componenta reziduală ( Ry ).

1. Componenta de lungă durată (trendul) ( Ty ), este rezultatul unor factori cu acŃiune constantă şi îndelungată. Se manifestă printr-o direcŃie aproximativ stabilă de evoluŃie a fenomenului studiat. Ex: - Creşterea populaŃiei globului; - PopulaŃia României: o tendinŃă crescătoare între 1980-1989 şi o tendinŃă descrescătoare începând cu 1990. - Diminuarea populaŃiei ocupate în agricultură. 2. Componenta de sezonalitate ( Sy ), este rezultatul acŃiunii unor factori sistematici, sezonieri, care se

manifestă la anumite perioade de timp, mai mici decât anul. Se manifestă sub forma unor valuri (cicluri) trimestriale, lunare sau zilnice. Ex: - Cererea de produse turistice; - Cantitatea realizată şi preŃul de vânzare în cazul unor produse agroalimentare. 3. Componenta ciclică ( Cy ), este rezultatul unor factori sistematici, care acŃionează la intervale de timp,

mai mari de un an. Se manifestă sub forma unor valuri repetitive, care apar la intervale cuprinse între 2 şi 10 ani. Ex: Ciclurile pe termen lung privind cererea unor mărfuri. 4. Componenta reziduală ( Ry ), este rezultatul unor factori întâmplători. Se manifestă sub forma unor abateri (devieri) neregulate. Trendul şi sezonalitatea pot fi studiate în cadrul unor modele de regresie liniară, unde trendul este specificat ca o funcŃie deterministă de timp, în jurul căreia seria este constrânsă să rămână mereu. Multe variabile economice, cum ar fi PIB, nivelul preŃurilor, producŃia industrială, consumul, cheltuielile publice, prezintă un trend crescător în raport cu timpul. 3. Serii de timp staŃionare şi nestaŃionare Este necesar ca ceea ce observăm cu privire la seria de date să fie stabil, aşa încât să putem face afirmaŃii despre viitor. Uneori, graficul unei serii de date pe un orizont de timp ],[ ktt + poate fi foarte asemănător

cu graficul pe un alt orizont de timp ],[ kss + . Intuitiv, aceasta arată că există o omogenitate în timp, în comportamentul seriei, omogenitate numită staŃionaritate. O serie staŃionară nu prezintă trenduri decelabile. Prin contrast, seriile nestaŃionare prezintă trenduri vizibile. Media şi varianŃa variabilelor aleatoare au un rol special în teoria statisticilor. În Analiza Seriilor de Timp, noŃiuni similare acestora sunt funcŃia de medie şi funcŃia de autocovarianŃă. FuncŃia de medie a unei serii de timp este definită ca fiind )()( tyEt =µ .

FuncŃia de autocovarianŃă a unei serii de timp este definită ca fiind ),cov(),( st yyst =γ .

FuncŃiile de medie şi de autocovarianŃă sunt parametri fundamentali şi ar fi util să se obŃină estimaŃiile de selecŃie ale acestor funcŃii. Pentru seriile de timp generale există 2/)1(2 −+ nnn parametri asociaŃi cu

nyyy ,...,, 21 (n medii, n dispersii şi n(n-1)/2 covarianŃe) şi nu este posibil să se estimeze toŃi aceşti

parametri din cele n valori de date. Pentru a putea face estimaŃiile acestor parametri trebuie impuse restricŃii asupra seriei de timp de studiat. Cea mai cunoscută restricŃie este restricŃia de staŃionaritate. Există două definiŃii mai utilizate ale staŃionarităŃii: staŃionaritate strictă şi staŃionaritate în covarianŃă. În termeni generali, o serie cronologică este considerată staŃionară dacă nu prezintă nici o modificare sistematică în medie (nu prezintă tendinŃă pe termen lung) şi nici o modificare sistematică în varianŃă. O serie este staŃionară în medie dacă: ],0[,)( ntyE t ∈∀= µ .

Page 3: Curs 11 Econometrie Spataru 11dec.2013 (1)

3

Graficul unei serii staŃionare

Un proces stochastic temporal este un şir de variabile aleatoare indexate prin indicele timp. Un astfel de proces poate fi notat prin

Ztty ∈ . Elementul şirului la momentul t este )(tyyt = .

DefiniŃie. Considerăm doi vectori de )1( +n elemente consecutive din procesul Ztty ∈ :

),,,( 1 nttt yyy ++ K şi ),,,( 1 nsss yyy ++ K . Procesul Ztty ∈ este numit strict staŃionar dacă funcŃia

densitate de probabilitate a celor doi vectori este aceeaşi pentru orice valori ale lui t şi s, indiferent de mărimea lui n. Cu alte cuvinte, un proces stocastic

Ztty ∈ este proces stochastic strict staŃionar dacă

pentru orice k, distribuŃia lui ),,,( 1 kttt yyy ++ K este aceeaşi pentru toŃi t.

Un proces stochastic poate fi descris prin momentele sale de ordinele 1 şi 2: Media: )()( tyE t µ= ;

VarianŃa: )()()( 22 tyEyVar tt σµ =−= ;

CovarianŃa: ),(),cov( 2121ttyy tt γ= .

Procesul stochastic este strict staŃionar dacă distribuŃia oricărui şir de observaŃii )(),...,(),( 21 ntytyty

este aceeaşi cu a şirului )(),...,(),( 21 ktyktykty n +++ , pentru orice +∈ Rk , unde ∗∈ Nn şi

),...,,( 21 nttt este o mulŃime de n numere întregi pozitive. Această definiŃie spune că distribuŃia şirului

))(),...,(),(( 21 ntytyty este invariantă în timp, adică procesul stochastic are un comportament care nu se

modifică în timp. Dacă seria ty este staŃionară atunci )0()( µµ =t şi )0,(),( stst −= γγ . Astfel, pentru

o serie staŃionară, funcŃia de medie este constantă şi funcŃia de autocovarianŃă depinde numai de decalajul de timp dintre cele două valori pentru care este calculată covarianŃa.

Pentru 1=n obŃinem µµ =)(t şi 22 )( σσ =t , pentru toate valorile lui t.

Pentru 2=n rezultă că distribuŃia lui )( 1ty şi )( 2ty este aceeaşi cu distribuŃia lui )( 1 kty + şi

)( 2 kty + . Se observă că totul depinde de diferenŃa 12 ttk −= , numită defazaj, sau întârziere, sau lag şi

nu depinde de valorile efective ale seriei de date. Vom scrie )()(),(),cov( 122121kttttyy tt γγγ =−== .

Aceste două restricŃii asupra funcŃiilor de medie şi covarianŃă sunt suficiente pentru calculele teoretice. ObservaŃie: CondiŃia de staŃionaritate strictă este o condiŃie greu de verificat empiric. De aceea, în locul staŃionarităŃii stricte este utilizată mai frecvent o definiŃie mai puŃin restrictivă a staŃionarităŃii. Un proces stochastic este slab staŃionar dacă are media şi dispersia constante în timp iar covarianŃa sa între două perioade de timp depinde numai de decalajul dintre cele două perioade şi nu de momentul de timp la care este calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui nivel mediu constant.

O serie de timp este slab staŃionară sau staŃionară în sens larg dacă ∞<2|| tyE , µµ =)(t şi

)0,(),( ktkt γγ =+ , pentru toŃi t şi k. În cazul unei serii de timp Gaussiene, cele două definiŃii ale staŃionarităŃii sunt echivalente. Acest lucru se întâmplă deoarece distribuŃia finit dimensională a seriei de timp este caracterizată complet prin funcŃiile de medie şi covarianŃă.

Page 4: Curs 11 Econometrie Spataru 11dec.2013 (1)

4

Seria de timp ty este slab staŃionară (staŃionară de ordinul 2, staŃionară în covarianŃă), dacă:

Media: µ=)( tyE ;

VarianŃa: 22)()( σµ =−= tt yEyVar ;

CovarianŃa: [ ] kkttktt yyEyy γµµ =−−= ++ ))((),cov( .

O serie de timp care nu este staŃionară în sensul definiŃiei de mai sus, se numeşte serie nestaŃionară. CovarianŃa dintre valorile ty şi kty + , notată kγ , este numită autocovarianŃa la lag-ul k.

AutocovarianŃele determină modul în care ty este legat de valorile sale anterioare şi, în cazul unei serii

staŃionare, ele depind numai de diferenŃa dintre momentele de efectuare a observaŃiei. FuncŃia de autocovarianŃă a unui proces staŃionar este şirul autocovarianŃelor de lag k, kγ , unde

K,3,2,1,0 ±±±=k . CantităŃile precedente, când există, sunt estimate prin cantităŃile empirice corespunzătoare (medie, varianŃă, etc.), calculate pe baza unei serii de observaŃii de lungime suficient de mare. Mai mult, o serie aleatoare este asimptotic staŃionară dacă proprietăŃile indicate sunt verificate asimptotic. ObservaŃie. Atunci când folosim termenul de staŃionaritate, fără a face precizarea de staŃionaritate strictă, vom înŃelege că este vorba de staŃionaritatea în sens slab. Pentru un proces staŃionar covarianŃele depind numai de decalajul (lag-ul) k, nu de t şi nici de valorile

efective ale seriei. Dacă 0=k se obŃine 0γ , care este varianŃa 2σ , a lui Y, iar dacă 1=k se obŃine 1γ ,

autocovarianŃa dintre două valori adiacente ale lui Y, adică la distanŃă de un lag. CondiŃiile de staŃionaritate implică faptul că autocovarianŃele procesului satisfac egalitatea kk −= γγ , pentru toate valorile lui k.

Pe scurt, o serie de timp este staŃionară dacă media, dispersia şi autocovarianŃa (la diferite decalaje) rămân aceleaşi, indiferent de momentul la care sunt măsurate. Procesul este în echilibru statistic. Seriile cronologice staŃionare au proprietatea că media, varianŃa şi covarianŃele (atunci când există), pot fi calculate pe baza unui eşantion. StaŃionaritatea slabă implică faptul că reprezentarea grafică a datelor ar arăta că cele n valori fluctuează cu o variaŃie constantă în jurul unui nivel constant. În condiŃiile de staŃionaritate slabă se presupune că primele două momente ale seriei ty sunt finite. Din

definiŃii, dacă ty este strict staŃionară şi primele sale două momente sunt finite, atunci seria este slab

staŃionară. Reciproca nu este adevărată, în general. Totuşi, dacă seria de timp ty este normal distribuită,

atunci staŃionaritatea slabă este echivalentă cu staŃionaritatea strictă. O serie de timp este numită ergodică dacă 0→kγ când ∞→k .

Exemplu de proces staŃionar Procesul Zgomot Alb (White Noise) este un proces ce descrie o variabilă aleatoare cu media zero şi varianŃa constantă, dar nu are o structură anume.

Dacă tε este un şir de variabile aleatoare necorelate, fiecare cu media zero şi varianŃa constantă 2εσ , atunci,

în mod clar, tε este staŃionar, fiind satisfăcute condiŃiile de staŃionaritate: 0)( =tE ε , 2)( εσε =tVar ,

stst ≠= ,0),cov( εε . FuncŃia de autocovarianŃă este deci 2εσγ =k , dacă 0=k şi 0=kγ , dacă 0≠k .

FuncŃia de autocorelaŃie este 1=kρ pentru 0=k şi 0=kρ pentru 0≠k . Un astfel de şir de variabile

aleatoare necorelate este referit ca proces de zgomot alb sau proces aleator complet şi pentru el se

foloseşte notaŃia ),0(~ 2εσε WNt .

Dacă se presupune, în plus, că tε are distribuŃie normală, atunci coeficienŃii de autocorelaŃie de selecŃie

sunt, de asemenea, aproximativ normal distribuiŃi: 1/n)aprox.N(0,~ˆkρ .

ObservaŃie: Seriile cronologice economice urmează foarte rar modele de zgomot alb, dar acest proces este folosit pentru formularea modelelor mai complexe.

Page 5: Curs 11 Econometrie Spataru 11dec.2013 (1)

5

Analiza de regresie bazată pe serii cronologice presupune că seriile de timp sunt staŃionare. Testele clasice t şi F sunt bazate pe această presupunere. Seria nestaŃionară prezintă tendinŃă de creştere sau descreştere, ceea ce face ca media şirului valorilor ty

să difere, funcŃie de momentul la care considerăm că începe seria. Dispersia şi covarianŃa pot fi, şi ele, dependente de timp. TendinŃa specifică seriei nestaŃionare poate fi de tip determinist sau de tip stochastic. În practică, cele mai multe serii de timp economice sunt nestaŃionare.

Serii nestaŃionare cu trend liniar 4. NestaŃionaritate deterministă şi nestaŃionaritate stochastică În modelare se urmăreşte eliminarea tendinŃei generale în vederea analizei fluctuaŃiilor sistematice. În raport cu procedeul de eliminare a tendinŃei deosebim: a) Serie nestaŃionară de tip TS (Trend Stationarity). O serie nestaŃionară este de tip TS dacă Trendul este de tip determinist şi se elimină prin scădere

)( Ttt yy − sau prin împărŃire )/( Ttt yy . O serie de tip TS se prezintă sub forma

tt ty εβα ++= , nt ,1= cu tε -zgomot alb.

ProprietăŃi: 1) Media unei serii de tip TS nu este constantă deoarece depinde de timp. ttEyE tt βαεβα +=++= )()( .

2) VarianŃa seriei este constantă în timp. 2)()( εσεβα =++= tt tVaryVar .

3) 0,0),cov( ≠∀=+ hyy htt .

Notă: Efectul produs de un şoc aleator este tranzitoriu, deci nu se acumulează în timp. StaŃionarizarea unei

serii de tip TS se realizează prin estimarea trendului şi eliminarea lui din seria iniŃială.

1. Se estimează parametrii modelului tt ty εβα ++= prin MCMMP: tyt βα ˆˆˆ += .

2. Se determină seria staŃionară prin eliminarea trendului estimat la pasul anterior:

)ˆˆ(ˆˆ tyyy tttt βαε +−=−= .

b) Serie nestaŃionară de tip DS (Differency Stationarity). Trendul este de tip stochastic şi se elimină prin calculul diferenŃelor de ordinul 1 sau de ordin 2≥ .

1−−=∆ ttt yyy , 21211112 2)()())( −−−−−−− +−=−−−=∆−∆=−∆=∆ tttttttttttt yyyyyyyyyyyy .

O serie de tip DS se prezintă sub forma ttt yy εβρ ++= −1 . Dacă 1=ρ spunem că seria ty are o

rădăcină unitate.

Atunci: L=++++=++= −−− tttttt yyy εεββεβ )( 111 ∑ =++=

t

j jty10 εβ .

ProprietăŃi: 1) Media seriei este variabilă în timp, deoarece tyyE t β+= 0)( .

2) Dispersia depinde de timp: 2)( εσtyVar t = .

3) CovarianŃa nu este nulă: 2),cov( εσhyy htt =+ .

Page 6: Curs 11 Econometrie Spataru 11dec.2013 (1)

6

Notă: Termenul liber al seriei de tip DS nu este o constantă ci o realizare ( 0y ) a variabilei aleatoare ty . Un

şoc aleator nu are efect tranzitoriu, ci un efect de durată. StaŃionarizarea unei serii de tip DS se realizează prin aplicarea operatorului de diferenŃă.

5. FuncŃia de autocorelaŃie (ACF) Deoarece autocovarianŃele depind de unităŃile de măsură, este mai convenabil să se utilizeze coeficienŃii de autocorelaŃie, care sunt autocorelaŃii normalizate prin împărŃirea la varianŃă. Coeficientul de corelaŃie dintre două variabile aleatoare (v.a.) X şi Y este definit ca:

22,)()(

)])([(),(

YX

YX

YX

yx

YEXE

YXEYXCov

µµ

µµσσ

ρ−−

−−== şi măsoară gradul de dependenŃă liniară dintre cele

două variabile. Avem relaŃiile 11 , ≤≤− yxρ şi xyyx ,, ρρ = . Variabilele X şi Y sunt necorelate dacă

0, =yxρ . Dacă v.a. X şi Y sunt normal distribuite, atunci 0, =yxρ d.ş.n.d. X şi Y sunt independente.

Considerăm o serie de timp staŃionară, ty . Atunci când dorim să determinăm corelaŃia dintre ty şi valorile

sale din trecut kty − , vorbim despre coeficientul de autocorelaŃie. Pentru o serie staŃionară, acest coeficient

de corelaŃie este o funcŃie numai de decalajul k:

0)(

),(

)()(

),(

γγ

ρ k

t

ktt

ktt

kttk

yVar

yyCov

yVaryVar

yyCov=== −

− .

Am folosit faptul că )()( ktt yVaryVar −= în cazul unei serii slab staŃionare.

AutocorelaŃia la lagul k sau coeficientul de autocorelaŃie la lagul k (sau k-deplasat/întârziat) este raportul 0/ γγρ kk = . AutocorelaŃia este o autocovarianŃă standardizată.

FuncŃia de autocorelaŃie (în engleză ACF) a unui proces | Ztyt ∈ este un şir kρ ,

K,3,2,1,0 ±±±=k care verifică relaŃiile: 10 =ρ , kk −= ρρ şi 11 ≤≤− kρ .

O serie staŃionară nu prezintă autocorelaŃii dacă 0=kρ pentru toŃi 0>k .

CoeficienŃii de autocorelaŃie măsoară corelaŃia dintre observaŃii aflate la o anumită distanŃă unele de altele. Ei pot descrie proprietăŃile dinamice ale unui proces stochastic staŃionar. Spre deosebire de varianŃă şi covarianŃă, care depind de unităŃile de măsură ale variabilei, kρ este un

număr între -1 şi 1. Deoarece funcŃia de autocovarianŃe kγ depinde de unităŃile de măsură ale

variabilelor, FuncŃia de autocorelaŃie reprezintă un instrument mai convenabil pentru a reprezenta legătura dintre o variabilă şi valorile ei decalate. Graficul funcŃiei de autocorelaŃie în raport cu decalajul k, se numeşte corelogramă. ProprietăŃile dinamice ale fiecărui model staŃionar determină o anumită formă a corelogramei. Interpretarea corelogramei Analiza coeficienŃilor de autocorelaŃie arată că o serie de timp poate fi: a) Serie aleatoare. O serie complet aleatoare are coeficienŃii de autocorelaŃie 0≅kρ pentru orice 0>k

şi pentru valori mari ale lui n. Pentru o serie aleatoare )/1,0(~ nNkρ şi atunci ne aşteptăm ca o singură

valoare a lui kρ să fie semnificativă.

b) Serie ce prezintă corelaŃie pe termen scurt. O astfel de serie are o valoare mare a lui 1ρ , după care urmează 2 sau 3 coeficienŃi diferiŃi de zero dar valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori ale lui kρ apropiate de 0.

Ex: O serie de timp în care o observaŃie aflată deasupra mediei este urmată de una sau mai multe observaŃii sub medie sau, o observaŃie aflată sub medie este urmată de una sau mai multe observaŃii peste medie. Pentru acest tip de date este potrivit un model autoregresiv.

Page 7: Curs 11 Econometrie Spataru 11dec.2013 (1)

7

c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei, atunci şi coeficienŃii de autocorelaŃie vor alterna. Coeficientul 1ρ va fi negativ. Dacă valoarea observată la lag-ul 2 tinde să fie de

aceeaşi parte a mediei, atunci 2ρ va fi pozitiv. d) Serie nestaŃionară. Dacă o serie conŃine trend, o observaŃie de o anumită parte a mediei tinde să fie urmată de un număr mare de observaŃii de aceeaşi parte a mediei. În acest caz, valorile lui kρ vor tinde la

zero doar pentru valori foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea coeficienŃilor kρ . Cu alte cuvinte, coeficienŃii kρ trebuie calculaŃi numai pentru seriile staŃionare.

e) Serie cu variaŃii de sezonalitate. Într-un astfel de caz, corelograma are aceeaşi formă sinusoidală ca şi seria analizată. Mai întâi, trebuie eliminată sezonalitatea din seria de date iniŃiale. f) Serie ce conŃine una sau mai multe valori extreme(outliers). Dacă există o valoare extremă în datele iniŃiale, reprezentarea grafică a lui ty în raport cu kty + va conŃine două puncte extreme ce vor conduce la

coeficienŃi de corelaŃie aproape nuli. Dacă există două observaŃii extreme, poate să apară o corelaŃie foarte mare. Se recomandă ca, chiar de la început, aceste observaŃii extreme să fie ajustate. 6. FuncŃia de autocorelaŃie de selecŃie (SACF) Determinarea funcŃiei de autocorelaŃie de selecŃie (SACF) este o etapă importantă în faza de identificare a unui model de tip ARMA. Atunci când se cunosc perechile de observaŃii ),( tt yx cu t=1,...,n, corelaŃia

poate fi estimată consistent prin coeficientul de corelaŃie de selecŃie:

[ ][ ]∑∑∑

−−

−−==

22,)()(

))((ˆ

yyxx

yyxxr

tt

tt

xyyxρ .

În problemele practice nu avem din start un model ci avem datele observate nyyy ,,, 21 K . Pentru a estima

gradul de dependenŃă din datele observate şi pentru a selecta un model pentru date, care să reflecte această dependenŃă, vom utiliza un instrument foarte important şi anume funcŃia de autocorelaŃie de selecŃie, corespunzătoare datelor. Dacă noi credem că datele sunt valori realizate ale unei serii de timp staŃionare ty ,

atunci funcŃia de autocorelaŃie de selecŃie ne va da o estimaŃie a funcŃiei de autocorelaŃie a lui ty . Această

estimaŃie ne poate sugera care dintre multele modele de serii de timp staŃionare posibile ar fi potrivit pentru a reprezenta dependenŃa din date. DefiniŃiile următoare sunt, în mod natural, analoage celor pentru funcŃiile de autocovarianŃă şi de autocorelaŃie date mai sus pentru modele serii de timp staŃionare. DefiniŃie. Fie nyyy ,,, 21 K observaŃii ale unei serii de timp. Volumul selecŃiei a fost notat cu n.

Media de selecŃie a valorilor nyyy ,,, 21 K este ∑=

=n

t

tyn

y1

1.

Dispersia (varianŃa) de selecŃie este ∑=

−=n

t

t yyn 1

20 )(

1γ .

CovarianŃa de selecŃie la decalajul k se calculează cu formula: )()(1

ˆ1

yyyyn

kt

kn

t

tk −−= +

=∑γ .

Coeficientul de autocorelaŃie de selecŃie la lag-ul k este ∑∑ =

= + −−−=n

t t

kn

t kttk yyyyyyr1

2

1)(/)))((( .

Se mai poate nota cu kρ . Deoarece în aplicaŃiile practice dispunem doar de o realizare a unui proces

stochastic, se pot calcula doar coeficienŃii de autocorelaŃie de selecŃie de lag k, adică 0ˆˆˆ γγρ kkkr == .

Pentru a obŃine metode de prognoză consistente, este necesar ca structura probabilistă pe care se fundamentează un proces de generare a datelor, să fie stabilă în timp. Dacă o serie de timp este stabilă, media ei, varianŃa şi autocovarianŃele rămân aceleaşi, indiferent la ce moment le măsurăm şi vor rămâne la fel şi în viitor. Din aceste motive este foarte important să ştim dacă o serie este staŃionară sau nu.

Page 8: Curs 11 Econometrie Spataru 11dec.2013 (1)

8

Pentru o mulŃime de n observaŃii asupra seriei ty putem scrie autocorelaŃia de selecŃie de lag 1:

∑∑

=

= −

−−=

n

t t

n

t tt

yy

yyyy

1

2

2 1

1)(

))((ρ .

În anumite condiŃii generale, 1ρ este un estimator consistent al lui 1ρ .

Dacă nyyy ,...,, 21 reprezintă o mulŃime de observaŃii iid şi ∞<)( 2tyE , se poate arăta că estimatorul

1ρ este asimptotic normal, cu media 0 şi varianŃa 1/n. Acest rezultat este folosit în aplicaŃiile practice

pentru a testa ipoteza nulă 0: 10 =ρH faŃă de alternativa 0: 11 ≠ρH . Testul statistic folosit este raportul

t uzual, 1ρn , şi acesta are asimptotic o distribuŃie normală standard.

În general, definim autocorelaŃia de selecŃie de lag k, a lui ty , prin:

∑∑

=

+= −

−−=

n

t t

n

kt ktt

k

yy

yyyy

1

2

1

)(

))((ρ , unde 1,...,0 −= nk .

FuncŃia ˆ kρ este numită funcŃia de autocorelaŃie de selecŃie (SACF) a lui ty .

Estimarea funcŃiei de autocorelaŃie constă în calculul coeficienŃilor de corelaŃie liniară pentru fiecare cuplu de variabile ),( ktt yy − . Pentru cuplul ),( 1−tt yy , avem 1=k şi obŃinem 1ρ . Pentru cuplul ),( 2−tt yy ,

avem 2=k şi obŃinem 2ρ . Pentru cuplul ),( ltt yy − , avem lk = şi obŃinem lρ .

Deoarece este probabil ca estimaŃiile coeficienŃilor de autocorelaŃie să nu fie identic zero, este indicat să folosim teste statistice pentru a fi siguri că o serie apare ca nonautocorelată. Bartlett a determinat următoarea expresie pentru varianŃa estimatorului coeficientului de autocorelaŃie:

)]ˆˆˆ(21[1

)ˆ( 21

22

21 −++++= kk

narV ρρρρ L

)

Pentru n suficient de mare (pentru a putea aproxima repartiŃia Student prin cea normală), pentru varianŃa estimatorului coeficientului de autocorelaŃie se utilizează expresia:

narV k /1)ˆ( =ρ)

.

Dacă ),...,,( 21 nyyy reprezintă o mulŃime de observaŃii iid şi ∞<)( 2tyE , se poate arăta că estimatorul

kρ este asimptotic normal, cu media 0 şi varianŃa n/1 , pentru orice număr întreg pozitiv fixat, k.

Acest rezultat este folosit pentru a efectua teste de semnificaŃie pentru coeficienŃii de autocorelaŃie, construind o regiune de acceptare (cum ar fi un interval de încredere) pentru un coeficient de autocorelaŃie estimat, pentru a determina dacă este semnificativ diferit de zero. Testarea semnificaŃiei coeficientului de autocorelaŃie kρ :

0:0 =kH ρ ( kρ nu este semnificativ statistic)

0:1 ≠kH ρ ( kρ este semnificativ statistic).

Intervalele de încredere 95% (ale coeficienŃilor de autocorelaŃie individuali) sunt reprezentate ca două linii

verticale, bazate pe abaterea standard aproximată nk

/1ˆ ≈ρσ .

O regiune de acceptare 95% pentru ipoteza nulă va fi dată prin intervalul )/1(96,1 n± , pentru 0≠k .

Dacă valoarea coeficientului de autocorelaŃie cade în afara acestui interval, pentru o valoare dată a lui k, atunci ipoteza nulă că 0=kρ este respinsă. Se acceptă ipoteza alternativă: 0≠kρ .

În selecŃiile finite, kρ este un estimator deplasat al lui kρ . Deplasarea este mare în cazul selecŃiilor de

volum redus şi este fără importanŃă în cazul selecŃiilor de volum mare. Testarea ipotezei că mai mulŃi coeficienŃi de autocorelaŃie sunt zero

Page 9: Curs 11 Econometrie Spataru 11dec.2013 (1)

9

În multe aplicaŃii cu date financiare se testează dacă mai mulŃi coeficienŃi de autocorelaŃie sunt simultan egali cu zero. Acesta este un test mai general pentru dependenŃa liniară din seriile de timp. Pentru a testa ipoteza că toŃi coeficienŃii de autocorelaŃie sunt simultan nuli, se foloseşte statistica BPQ

(construită de Box şi Pierce), care are o distribuŃie 2χ cu m grade de libertate, m fiind lungimea decalajului.

0 toti:0 =kH ρ sau mρρρ === L21 (seria este staŃionară)

0exista:1 ≠kH ρ (seria este nestaŃionară)

2

1

2 ~ˆm

m

k

kBP nQ χρ∑=

= .

Dacă BPQ calculat într-o aplicaŃie este mai mare decât valoarea critică obŃinută din tabelul distribuŃiei 2χ , la un nivel de semnificaŃie ales, respingem ipoteza nulă. O altă statistică ce se poate utiliza este statistica Ljung-Box (calculată în EViews):

( ) 2

1

2

2 m

m

k

k

knnnLBQ χ

ρ∑

=

−+== .

Dacă 2crtLBQ χ< ⇒ acceptăm 0H ⇒ seria este staŃionară.

Dacă 2crtLBQ χ> ⇒ respingem 0H ⇒ seria este nestaŃionară.

PerformanŃele statisticii ∗Q depind de mărimea decalajului m. Din diferite studii de simulare, s-a ajuns la

concluzia că cea mai bună mărime a lui m este )ln(nm ≈ .

În selecŃiile de volum mic, statistica LB s-a dovedit a avea proprietăŃi mai bune decât statistica BPQ . Când

∞→n , cele două statistici sunt echivalente. 7. Serii integrate şi serii cointegrate

Spunem că seria ty este integrată de ordinul 1, sau conŃine o rădăcină egală cu 1, dacă ty este

nestaŃionară dar ty∆ este staŃionară. O astfel de serie se notează prin )1(~ Iyt . În general, pentru a deveni

staŃionară, o serie nestaŃionară ar putea necesita diferenŃierea de mai multe ori. Caracterizarea unei serii ca fiind integrată poate fi înŃeleasă în sensul că seria poate fi exprimată prin părŃi (componente) care pot recompune seria originală prin însumare. O serie ty este integrată de ordinul d, sau conŃine d rădăcini egale cu 1, dacă ty este nestaŃionară dar

seria t

d y∆ este staŃionară. O astfel de serie se notează prin )(~ dIyt .

Ordinul de integrare al unei serii este egal cu numărul care arată de câte ori trebuie diferenŃiată seria pentru a deveni staŃionară şi este egal cu numărul de rădăcini egale cu 1. O serie )2(I conŃine două rădăcini egale cu 1 şi astfel, este necesară diferenŃierea de două ori pentru a induce staŃionaritatea. Majoritatea seriilor de date economice conŃin o singură rădăcină egală cu 1. Cele mai multe serii cronologice macroeconomice au tendinŃă şi, în mod specific, ele conŃin trenduri stochastice. Numim Serii cointegrate seriile integrate de acelaşi ordin, ce admit o combinaŃie liniară care este I(0) sau integrată de un ordin mai mic decât ordinul de integrare al seriilor iniŃiale. Regresii aparente. Estimarea unui model de regresie cu serii cronologice nestaŃionare, prin MCMMP, duce la valori foarte mari atât ale coeficientului de determinaŃie, cât şi ale statisticilor t, în vreme ce nu există nici o relaŃie între variabile.

Granger şi Newbold au sugerat următoarea regulă de a stabili regresiile îndoielnice: dacă DWR >2 sau

12 ≈R , atunci regresia este una aparentă, îndoielnică (spurious regression).

Page 10: Curs 11 Econometrie Spataru 11dec.2013 (1)

10

8. Testul pentru staŃionaritate sau pentru o rădăcină unitară (egală cu 1) Majoritatea seriilor din economie sunt nestaŃionare, media sau varianŃa lor nefiind constante în timp. Detectarea nestaŃionarităŃii unei serii se poate face prin: - analiza cronogramei şi a corelogramei - utilizarea unor teste de staŃionaritate. Este necesară aplicarea unui test pentru a vedea dacă există o rădăcină egală cu 1, pentru că distincŃia între modelele staŃionare şi nestaŃionare este crucială. Testarea se face pe etape: 1. Se testează seria ty pentru a vedea dacă este staŃionară. Dacă răspunsul este da, atunci )0(~ Iyt . Dacă

răspunsul este nu, atunci )(~ dIyt , unde 0>d .

2. Mai întâi se consideră diferenŃele lui ty ca 1−−=∆ ttt yyy şi se testează dacă ty∆ este staŃionară. Dacă

da, atunci )0(~ Iyt∆ şi )1(~ Iyt . Dacă nu, atunci )(~ dIyt , unde 0>d .

3. Se consideră diferenŃele de ordinul al doilea pentru ty şi se repetă testul până ce se găseşte o serie care

este )0(I . Se determină imediat ordinul de integrare. În general, dacă )0(~ Iyt

d∆ , atunci )(~ dIyt . În

economie, rareori se întâlnesc serii de timp cu ordinul de integrare mai mare decât 1. Testarea existenŃei unei rădăcini egale cu 1 Considerăm aşa numitul proces de mers la întâmplare: ttt yy ε+= −1 , unde tε este un proces zgomot alb.

Acesta este un model AR(1). Deoarece coeficientul lui 1−ty este 1 avem o rădăcină egală cu 1, adică o

situaŃie de nestaŃionaritate. Dacă în modelul de regresie

ttt yy ερ += −1 (7)

găsim că 1=ρ , spunem că variabila ty are o rădăcină unitară. În econometrie, o serie de timp care are o

rădăcină unitară se numeşte mers la întâmplare. Scriem ec. (7) sub forma:

ttttt yyy εδερ +=+−=∆ −− 11)1( , (8)

Dacă 0=δ putem scrie tttt yyy ε=−=∆ −1 . Ultima relaŃie arată că diferenŃele de ordinul întâi ale unei

serii mers la întâmplare constituie o serie staŃionară deoarece tε este un zgomot alb.

Ipoteza de rădăcină unitară (Unit Root)

0H : seria are rădăcină unitară şi este nestaŃionară

1H : seria este staŃionară Dacă respingem ipoteza nulă, putem accepta staŃionaritatea. Testul Dickey-Fuller (Unit Root Test) Dacă 1=ρ sau 0=δ , atunci seria nu este staŃionară.

Dacă 1>ρ , atunci seria este explozivă (tot nestaŃionară, dar de regulă astfel de comportament nu este regăsit în economie) Dacă 1<ρ , atunci seria este staŃionară.

Testul Dickey-Fuller este testul de bază pentru o rădăcină egală cu 1. Sub ipoteza nulă că 1=ρ sau

0=δ statistica folosită este cunoscută ca statistica τ (tau). Aceasta este definită ca fiind

)ˆ(ˆ δδτ seDF == . Această statistică nu urmează distribuŃia t uzuală, sub ipoteza nulă. Valorile critice sunt obŃinute prin experimente Monte Carlo şi se găsesc în tabele construite de Dickey şi Fuller. Dacă respingem ipoteza nulă că 0=δ sau 1=ρ , rezultă că seria este staŃionară şi putem folosi testul t.

Dacă |||| crtcalc ττ > respingem 0H şi acceptăm că seria este staŃionară.

Dacă |||| crtcalc ττ < acceptăm că seria este nestaŃionară.

Page 11: Curs 11 Econometrie Spataru 11dec.2013 (1)

11

Dickey şi Fuller au propus trei ecuaŃii de regresie diferite, care pot fi folosite pentru a testa prezenŃa unei rădăcini egale cu 1. În fiecare caz se formulează ipoteza nulă şi ipoteza alternativă. i) ttt yyH ε+= −10 : iar 1,: 11 <+= − ρερ ttt yyH . Acesta este un test pentru un proces de mers la

întâmplare, contra unui proces autoregresiv, de ordinul întâi, AR(1), staŃionar. Nu există termen de interceptare şi nu există trend. ii) ttt yyH ε+= −10 : iar 1,: 11 <++= − ρεµρ ttt yyH . Acesta este un test pentru un proces de mers la

întâmplare, contra unui proces AR(1), staŃionar, cu deplasare. Există termen de interceptare şi nu există trend. iii) ttt yyH ε+= −10 : iar 1,: 11 <+++= − ρελµρ ttt tyyH . Acesta este un test pentru un proces de

mers la întâmplare, contra unui proces AR(1), staŃionar, cu deplasare şi trend în timp. DiferenŃa dintre cele trei regresii constă în prezenŃa elementelor deterministe µ şi λ . Cele trei modele alternative pot fi rescrise sub forme echivalente. Vom avea modelele:

⇒+−=− −− tttt yyy ερ 11 )1( ttt yy εδ +=∆ −1

⇒++−=− −− tttt yyy εµρ 11 )1( ttt yy εµδ ++=∆ −1

⇒+++−=− −− tttt tyyy ελµρ 11 )1( ttt tyy ελµδ +++=∆ −1

Parametrul de interes în toate cele trei ecuaŃii de regresie este δ . Dacă o serie este staŃionară, condiŃia 11 <<− ρ este echivalentă cu condiŃia de staŃionaritate: 02 <<− δ . Dacă 0=δ , seria conŃine o

rădăcină egală cu 1. Testul implică estimarea uneia din ecuaŃiile de mai sus prin MCMMP, pentru a obŃine valorile estimate ale lui δ şi eroarea standard asociată. Deoarece termenul eroare este puŃin probabil să fie un proces de zgomot alb, Dickey şi Feller au extins procedura, sugerând o versiune îmbogăŃită, care foloseşte p decalaje ale variabilei dependente. Testul ADF include termeni AR(p) ai termenului ty∆ în cele trei modele alternative. Dacă termenul eroare este

autocorelat, ultimul din cele trei modele va fi: t

p

i

ititt ytyy ηαλµδ +∆++++=∆ ∑=

−−1

1 .

O problemă care apare este determinarea numărului optim de decalaje ale variabilei dependente. Pentru aceasta se folosesc criteriile AIC şi SIC din pachetul Eviews. 9. Operatorul de decalaj sau lag şi operatorul diferenŃă Definim operatorul de întârziere sau de decalaj, sau operatorul lag, notat L, prin relaŃia 1−= tt yLy .

Operatorul lag poate fi ridicat la o putere. Definim puterile operatorului lag prin

212

−− === tttt yLyLLyyL şi, în general ktt

k yyL −= . Avem 10 ≡L şi 11

+− = tt yyL . Aplicat unei

constante, nu o afectează, iar ( ) tt LyyL ⋅= ββ .

Operatorul lag poate fi definit pentru combinaŃii liniare:

11 2121)( −− +=+ tttt yyyyL βαβα

ltktt

lk yyyLL −− +=+ βαβα )(

Cu ajutorul acestor operatori putem scrie polinoame lag de diferite grade.

( ) p

pLLLL φφφ −−−−=Φ L2

211 este numit polinomul autoregresiv (AR) de ordinul p. q

q LLLL θθθ ++++=Θ L2

211)( este numit polinomul de medie mobilă (MA) de ordin q.

Polinoamele lag pot fi înmulŃite. ÎnmulŃirea este comutativă: )()()()( LLLL ΦΘ=ΘΦ . Polinoamele lag pot fi inversate. Putem interpreta un polinom lag ca pe un filtru care, dacă a fost aplicat unei serii, produce o nouă serie. Definim operatorul diferenŃă prin relaŃia: 1)1( −−=−=∆ tttt yyyLy Acest operator este important atunci când avem modele pentru serii de timp nestaŃionare.

2121112 2)()()()( −−−−−− +−=−−−=−∆=∆∆=∆ ttttttttttt yyyyyyyyyyy .