Econometrie Word 2 Iulie 2009 Ultim

105
CAPITOLUL 23 ECONOMETRIE § 23.1 Apariţia, dezvoltarea, conţinutul şi obiectivele Econometriei Econometria este una dintre disciplinele de vârf ale ştiinţei economice, cu na-tură cantitativă, teoretico-aplicativă, care se ocupă cu modelarea economico-mate-matică a relaţiilor spaţiale şi temporale de cauzalitate dintre fenomenele şi proce-sele economice, în scopul descrierii formalizate şi cuantificării acestor relaţii, testării unor ipoteze specifice gândirii economice, analizei cantitative, predicţiei şi simulării comportamentului fenomenelor economice. Apărută la începutul deceniului patru al secolului XX, econometria a cunos-cut, mai ales în ultimele 3-4 decenii, o dezvoltare cu adevărat spectaculoasă. Această dezvoltare a fost determinată, în principal, de necesitatea găsirii unor răs-punsuri cât mai adcvate la problemele decizionale din ce în ce mai complexe pe care le ridică evoluţiile sistemelor economice contemporane, precum şi de dezvol-tarea fără precedent a sistemelor hardware şi software, dezvoltare care a creat posi-bilitatea soluţionării eficiente şi riguroase a numeroase probleme numerice care apar în contextul analizei econometrice. Etimologic, termenul “econometrie1 îşi are originea în limba greacă, prove-nind din combinarea cuvintelor oiconomia” şi “metron”, care înseamnă economie, respectiv 1 În limba engleză “Econometrics”, iar în limba franceză Économétrie”.

Transcript of Econometrie Word 2 Iulie 2009 Ultim

Page 1: Econometrie Word 2 Iulie 2009 Ultim

CAPITOLUL 23ECONOMETRIE

§ 23.1 Apariţia, dezvoltarea, conţinutul şi obiectivele Econometriei

Econometria este una dintre disciplinele de vârf ale ştiinţei economice, cu na-tură cantitativă, teoretico-aplicativă, care se ocupă cu modelarea economico-mate-matică a relaţiilor spaţiale şi temporale de cauzalitate dintre fenomenele şi proce-sele economice, în scopul descrierii formalizate şi cuantificării acestor relaţii, testării unor ipoteze specifice gândirii economice, analizei cantitative, predicţiei şi simulării comportamentului fenomenelor economice.

Apărută la începutul deceniului patru al secolului XX, econometria a cunos-cut, mai ales în ultimele 3-4 decenii, o dezvoltare cu adevărat spectaculoasă. Această dezvoltare a fost determinată, în principal, de necesitatea găsirii unor răs-punsuri cât mai adcvate la problemele decizionale din ce în ce mai complexe pe care le ridică evoluţiile sistemelor economice contemporane, precum şi de dezvol-tarea fără precedent a sistemelor hardware şi software, dezvoltare care a creat posi-bilitatea soluţionării eficiente şi riguroase a numeroase probleme numerice care apar în contextul analizei econometrice.

Etimologic, termenul “econometrie”1 îşi are originea în limba greacă, prove-nind din combinarea cuvintelor “oiconomia” şi “metron”, care înseamnă economie, respectiv măsură. Termenul “econometrie” a fost utilizat pentru prima oară într-o lucrare, relativ obscură, a austriacului Pawel CIOMPA, publicată în Germania, în anul 1910. Accepţiunea dată în 1910 de Pawel Ciompa termenului “econometrie” este o accepţiune restrânsă, asimilată de acesta cu statistica economică.

Literatura de specialitate a domeniului acreditează ideea că termenul de “eco-nometrie” a apărut şi a fost utilizat în accepţiunea sa largă şi consistentă, similară cu sensul în care termenul este utilizat şi astăzi, la începutul anilor ‘30 ai secolului trecut, odată cu apariţia primelor preocupări legate, în mod exclusiv, de măsurarea legăturilor în domeniul economic.

Punerea în valoare şi în circulaţie a termenului de “econometrie” datează din jurul anului 1926 şi este atribuită economistului norvegian Ragnar FRISCH (1895-1973), laureat al premiului Nobel pentru economie, în anul 1969, precum şi statisticianului american Irving FISHER (1867-1947).

Într-o încercare de definire a econometriei, Ragnar FRISCH a arătat că econo-metria nu trebuie asimilată, în mod separat, nici cu statistica economică, nici cu teoria economică generală şi nici cu utilizarea metodelor statistico-matematice în

1 În limba engleză “Econometrics”, iar în limba franceză “Économétrie”.

Page 2: Econometrie Word 2 Iulie 2009 Ultim

domeniul economic. În acest context, Ragnar FRISCH defineşte econometria ca reprezentând o unificare, o îmbinare, a celor trei domenii, această unificare fiind tocmai elementul care conferă econometriei forţă ştiinţifică şi eficienţă aplicativă deosebite.

Un impuls deosebit pentru dezvoltarea econometriei, încă din momentul apariţiei acesteia, a fost reprezentat de înfiinţarea Societăţii de Econometrie (Eco-nometric Society), la Cleveland, în Ohio, în anul 1930, la iniţiativa statisticianului Irving FISHER, care a fost primul său preşedinte, şi a economistului Ragnar FRISCH. Primele două reuniuni ştiinţifice ale acestui for econometric au avut loc în septembrie 1931, la Universitatea din Lausanne, respectiv în decembrie 1931, la Washington D.C.. Impulsul dat dezvoltării econometriei prin înfiinţarea Societăţii de Econometrie a fost amplificat prin apariţia în 1933, a celei mai prestigioase reviste din domeniu, revista Econometrica, care a ajuns în prezent la peste 75 de ani de apariţie neîntreruptă. Colegiul de conducere al revistei Econometrica este localizat în prezent la Universitatea Princeton şi include cele mai prestigioase nume ştiinţifice şi universitare din domeniu, cum ar fi Stephen MORRIS (Princeton University), Larry SAMUELSON (Yale University), Whitney NEWEY (MIT), Daron ACEMOGLU (MIT), Steven BERRY (Yale University), David LEVINE (Washington University, St. Louis), Harald UHLIG (University of Chicago).

În prezent, există în lume sute şi sute de reviste cu profil econometric, iar numărul de articole, studii şi cărţi pe acest profil este de ordinul zecilor sau chiar sutelor de mii2. De asemenea, econometria este predată, ca disciplină economică fundamentală şi cu pondere foarte mare în procesul de pregătire universitară, la toate universităţile economice de prestigiu din lume.

Tot ca semn al importanţei, valorii ştiinţifice şi utilităţii econometriei în contextul ştiinţei economice contemporane, poate fi menţionat şi numărul mare de premii Nobel acordate pentru contribuţii ştiinţifice în domeniul econometriei. Pentru exemplificare, menţionăm premiile Nobel pentru economie, acordate unor personalităţi marcante din domeniul econometriei, cum ar fi: Jan TINBERGEN şi Ragnar FRISCH - în anul 1969, pentru dezvoltarea şi aplicarea modelelor econometrice dinamice la analiza proceselor economice; Lawrence KLEIN - în anul 1980, pentru modelarea econometrică cu ajutorul calculatorului în domeniul proceselor macroeconomice; Trygve HAAVELMO - în anul 1989, pentru nume-roasele lucrări publicate în domeniul econometriei şi pentru rezultatele obţinute în domeniul fundamentării probabilistice a econometriei; Daniel McFADDEN şi James HECKMAN - în anul 2000, pentru cercetările şi contribuţiile din domeniul microeconometriei; Robert ENGLE and Clive GRANGER - în anul 2003, pentru realizările spectaculoase din domeniul analizei seriilor de timp, reprezentate de modelele de tip ARCH şi metodele de identificare a fenomenului de cointegrare a seriilor de timp. În plus faţă de aceste premii Nobel acordate pe problematica econometriei, alte premii Nobel pentru economie au fost acordate pentru preo-cupări legate, mai mult sau mai puţin direct, tot de domeniul econometriei.

2 De exemplu, o simplă căutare pe Internet, doar după cuvintele cheie engleze “Econometrics” şi “Econometric Analysis”, listează peste 5 milioane de lucrări.

Page 3: Econometrie Word 2 Iulie 2009 Ultim

Dezvoltarea explozivă a econometriei şi modelării econometrice, ca instru-mente de cunoaştere ştiinţifică, de simplificare a complexităţii şi de sintetizare a cauzalităţii din diverse domenii de activitate, a fost stimulată şi de dezvoltarea mijloacelor electronice de calcul. Apariţia calculatoarelor bazate pe micropro-cesoare şi larga accesibilitate a acestora din punct de vedere al preţului şi software-ului aplicativ au făcut ca, în prezent, să nu existe domeniu de cercetare în care calculatorul electronic să nu fie instrumentul cel mai frecvent folosit pentru rezolvarea celor mai diverse probleme. Calculatorul electronic a devenit instru-mentul predilect şi de neînlocuit în procesul de analiză econometrică, în activitatea de predicţie şi, în general, în orice activitate ştiinţifică bazată pe modelarea mate-matică. Prelucrarea unui volum uriaş de informaţii, pe baza unor algoritmi de o complexitate deosebită şi în condiţii de precizie ridicată, nu se poate realiza decât cu ajutorul calculatorului electronic.

O utilizare, relativ recentă şi în acelaşi timp spectaculoasă, a calculatorului electronic este cea legată de analiza, prelucrarea şi sintetizarea grafică a infor-maţiei, ca activităţi importante ale demersului econometric. Posibilităţile extraor-dinare pe care le oferă tehnica de calcul actuală în acest domeniu reprezintă un motiv care face ca utilizarea calculatorului electronic să devină indispensabilă în orice problemă de analiză econometrică.

În prezent, există zeci şi zeci de produse software dedicate soluţionării proble-melor din domeniul econometriei, produse apărute şi dezvoltate în ultimele 3-4 decenii, pe măsura dezvoltării tehnicii de calcul şi ca răspuns la dezvoltarea extraordinară a abordărilor econometrice. O inventariere pe care am făcut-o recent, şi care nu este nici pe departe exhaustivă, ci doar minimală, cu privire la instru-mentele software existente în lume la acest moment și dedicate domeniului econo-metric, a condus la identificarea a peste 100 de astfel de instrumente software. Acest număr este cu atât mai semnificativ, cu cât aceste produse software sunt de notorietate mondială, având o largă utilizare în practica econometrică. Prin comple-xitatea lor, prin multitudinea de facilităţi pe care le oferă şi prin uşurinţa cu care pot fi folosite, produsele software elaborate pentru domeniul econometriei pot fi considerate ca fiind adevărate medii informatice pentru desfăşurarea activităţilor de cercetare ştiinţifică din acest domeniu.

Printre cele mai noi şi mai performante instrumente software existente în prezent, destinate, total sau parţial, activităţilor legate de conţinutul econometriei, putem menţiona: • EVIEWS 6.0, Quantitative Micro Software, Irvine, CA, USA, 2008; • SPSS 17.0, SPSS Inc., Chicago, IL, USA, 2009; • STATISTICA 8.0, Stat-Soft Inc., Tulsa, OK, USA, 2008; • S-PLUS 8.0, MathSoft Inc., Seattle, Washing-ton, USA, 2008;• SAS 9.2, SAS Institute Inc., Cary, NC, USA, 2008; • SYSTAT 12.02, SPSS Inc., Chicago, IL, USA, 2007; • RATS 7.2, Estima Evanston, IL, USA, 2009; • R - Project 2.9, 2009; • JMP 8.0, SAS Institute Inc., Cary, NC, USA, 2008; • SPAD 7.0, CISIA, Saint Mande, France, 2007; • STATA MP 10.1, Stata Corp., Texas, USA, 2009; • GAUSS 9.0, Aptech System Inc., 2008; • MATHEMA-TICA 7.0, Wolfram Research, Champaign, IL, USA, 2009.

Page 4: Econometrie Word 2 Iulie 2009 Ultim

Pe lângă instrumentele software menţionate anterior, mai există o mare varie-tate de produse informatice nespecializate pe domeniul econometric, care includ însă proceduri software dedicate exclusiv soluţionării unor probleme din domeniul econometriei, cum ar fi EXCEL, MATLAB, MATCAD etc.

În contextul dezvoltării deosebite a instrumentelor software dedicate analizei econometrice, econometria poate fi privită ca reprezentând o combinare eficientă a statisticii economice, teoriei economice generale, teoriei probabilităţilor statisticii matematice şi informaticii.

În România, primele preocupări mai relevante în domeniul econometriei au apărut după anul 1965, odată cu înfiinţarea Facultăţii de Calcul Economic şi Cibernetică Economică3, în cadrul Academiei de Studii Economice din Bucu-reşti, cu înfiinţarea Laboratoarelor de Cercetare ale Catedrei de Cibernetică Economică şi cu apariţia revistelor ştiinţifice “Studii şi Cercetări de Calcul Eco-nomic şi Cibernetică Economică” şi “Economic Computation and Economic Cybernetics Studies and Research”. Profilul facultăţii, al laboratoarelor de cer-cetare şi al celor două reviste ştiinţifice, natura cantitativă a majorităţii disciplinelor predate în facultate, preocupările ştiinţifice ale cadrelor universitare, precum şi proiectele de cercetare şi lucrările publicate de acestea, au reprezentat elemente stimulatorii pentru dezvoltarea econometriei în România şi pentru extinderea apli-caţiilor acesteia în economia românească, încă din perioada anilor 1965-1970. În acest context, merită a fi menţionate contribuţiile şi rezultatele remarcabile obţi-nute în acest domeniu de profesorii universitari: Ludovic TÖVISSI, Corneliu CUŞA, Eugen PECICAN, Gheorghe RUXANDA, Vergil VOINEAGU, Cons-tantin MITRUŢ, Tudorel ANDREI etc.

Un element important al contribuţiei Facultăţii de Calcul Economic şi Ciber-netică Economică, la promovarea şi dezvoltarea econometriei în ţara noastră, este reprezentat de instrumentul software EMI - Limbaj pentru Analiză şi Predicţie, instrument dezvoltat de prof. dr. Gheorghe RUXANDA şi utilizat de generaţii întregi de studenţi din Academia de Studii Economice din Bucureşti.

Deşi iniţial obiectul econometriei a fost legat în mod exclusiv de domeniul economic, ulterior, utilizarea metodelor şi tehnicilor econometrice a fost extinsă şi în afara domeniului economic, ele fiind folosite în prezent şi în alte domenii, cum ar fi: sociologia, psihologia, medicina, biologia, ştiinţa politică etc.

În general, se poate spune că econometria este o ramură a ştiinţei economice, care se ocupă cu estimarea empirică şi testarea relaţiilor sau legăturilor care se manifestă între fenomene şi procese din realitatea economică.

Econometria este disciplina care se ocupă cu identificarea, estimarea empirică şi testarea unor relaţii economice, prin intermediul construirii unor modele mate-matice specifice, numite modele econometrice, în scopul analizei, simulării şi predicţiei comportamentului fenomenelor economice reale.

Econometria are ca principal obiectiv aplicarea unor metode şi tehnici ale teo-riei probabilităţilor şi statisticii matematice la date economice obţinute prin obser-vare statistică, în scopul:

3 În prezent, Facultatea de Cibernetică, Statistică şi Informatică Economică

Page 5: Econometrie Word 2 Iulie 2009 Ultim

• identificării, măsurării şi formalizării unor legături dintre diferite fenomene sau procese din realitatea economică, sub forma modelelor econometrice;• estimării parametrilor modelelor econometrice care descriu legături cauzale semnificative pentru domeniul economic;• cuantificării influenţelor exercitate de anumite fenomene şi verificării sem-nificaţiei acestor influenţe;• verificării unor ipoteze sau idei teoretice formulate cu privire la natura şi semnificaţia unor legături dintre fenomene şi procese economice;• utilizării modelelor econometrice pentru efectuarea de analize, evaluări, simulări şi predicţii.Econometria utilizează o serie de elemente fundamentale, reprezentate de

teorii economice, fapte exprimate prin intermediul unor date relevante şi metode statistice, numite tehnici econometrice, în scopul construirii unor modele care să descrie o serie de relaţii de interes existente în realitatea economică. Econometria utilizează datele existente pentru a estima legături manifestate în lumea reală şi pentru a verifica anumite ipoteze cu privire la aceste legături.

Obiectul de studiu al econometriei include, ca elemente de importanţă mai semnificativă, analiza corelaţiei, analiza regresiei, analiza varianţei şi analiza seriilor de timp. Produsul final şi semnificativ al demersului econometric este reprezentat de modelul econometric estimat şi validat, model care poate fi utilizat pentru analiză, simulare sau predicţie.

Având în vedere natura, conţinutul şi derularea oricărui demers econometric, etapele cele mai relevante ale acestui demers pot fi sintetizate sub forma următoare:

a. formularea unui principiu, unei teorii sau a unei ipoteze, referitoare fie la natura comportamentului unuia sau mai multor fenomene economice, fie la existenţa uneia sau mai multor legături de cauzalitate din realitatea economică;b. culegerea datelor necesare, verificarea calităţii acestora şi construirea bazei informaţionale ce va fi utilizată pentru identificarea, estimarea şi validarea modelului econometric;c. efectuarea unor analize preliminare, cu natură exploratorie, în scopul suma-rizării datelor, identificării principalelor caracteristici şi tendinţe evidenţiate de date, detectării eventualelor erori prezente în date şi inventarierii factorilor semnificativi care trebuie reţinuţi în analiza econometrică;d. specificarea unui model econometric adecvat, compatibil cu postulatele teoriei economice şi cu datele disponibile, şi formularea ipotezelor statistice care stau la baza specificării modelului econometric;e. alegerea metodei de estimare, a instrumentului software adecvat şi utilizarea acestora şi a bazei informaţionale existente, pentru estimarea parametrilor modelului econometric;f. testarea modului în care sunt îndeplinite ipotezele statistice care stau la baza specificării modelului econometric şi aplicarea procedurilor de corecţie adec-vate, în condiţiile în care anumite ipoteze nu sunt verificate;g. validarea modelului econometric, pe baza unor indicatori, criterii, proceduri şi teste referitoare la calitatea acestuia;

Page 6: Econometrie Word 2 Iulie 2009 Ultim

h. respecificarea modelului econometric, în situaţia în care acesta nu înde-plineşte cerinţele necesare pentru validare sau se dovedeşte a nu fi în concor-danţă cu teoria economică și cu realitatea economică evidenţiată de datele disponibile;i. utilizarea modelului econometric, estimat şi validat, pentru analize şi eva-luări cantitative, pentru simulare şi pentru predicţie;j. formularea unor concluzii şi propuneri pentru fundamentarea unor decizii şi măsuri de politică economică.Având în vedere etapele şi modul în care are loc derularea unui demers econo-

metric general, se poate spune că acesta are o natură extrem de laborioasă, cu o pronunţată tentă de iterativitate, implică o multitudine de activităţi şi presupune utilizarea unei game variate de instrumente statistico-matematice.

Orice demers econometric complet, care conduce aproape totdeauna la obţi-nerea unui model econometric estimat şi validat, se finalizează prin utilizarea mo-delului econometric în trei scopuri principale: analiza, simularea şi predicţia. Cele trei activităţi care reprezintă obiectivele finale ale demersului econometric, sunt activităţi foarte importante pentru fundamentarea proceselor decizionale din dome-niul economic.

Analiza efectuată pe baza modelelor econometrice este o analiză de tip structu-ral, care are ca scop validarea unor puncte de vedere teoretice cu privire la com-portamentul unor fenomene şi unor legături cauzale, testarea semnificaţiei pe care o are influenţa anumitor factori cauzali şi cuantificarea acestei influenţe, măsurarea senzitivităţii unor fenomene de tip efect, în raport cu o serie de fenomene de tip cauză, astfel încât analiza pe baza modelului econometric poate conduce la o mai bună înţelegere a manifestării fenomenelor economice reale şi a legăturilor dintre acestea, îmbogăţind în acest fel cunoaşterea economică.

Într-o accepţiune restrânsă şi simplificată, activitatea de analiză econometrică poate fi privită ca fiind activitatea care vizează: explicarea şi înţelegerea compor-tamentului fenomenelor economice şi legăturilor dintre acestea, obţinerea unor noi cunoştinţe economice şi adâncirea cunoaşterii realităţii economice, identificarea unor noi legităţi, care guvernează comportamentul fenomenelor economice.

Predicţiile efectuate cu ajutorul modelelor econometrice, au scopul de a antici-pa viitoarele manifestări ale unor fenomene economice sau ale unor legături dintre aceste fenomene, asigurând în acest fel creşterea eficienţei deciziilor şi acţiunilor umane din domeniul economic.

Activitatea de predicţie economică presupune utilizarea modelelor econome-trice în scopul determinării celor mai probabile stări şi evoluţii pe care le vor înre-gistra în viitor fenomenele şi procesele economice.

În afară de utilizarea sa în scopuri de analiză şi predicţie, modelul econometric poate fi utilizat şi în scopul simulării comportamentului unor fenomene sau pro-cese, sau în scopul evaluării impactului unor alternative decizionale, în vederea alegerii celei mai bune decizii.

Page 7: Econometrie Word 2 Iulie 2009 Ultim

Prin intermediul simulării, se încearcă să se determine modul în care se schimbă comportamentul fenomenelor, în condiţiile modificării împrejurărilor care condiţionează manifestarea acestuia.

Simularea reprezintă totalitatea activităţilor ştiinţifice prin intermediul cărora se încearcă să se reproducă, într-o manieră artificială, pe bază de calcule şi cu ajutorul modelului econometric, modul în care se poate schimba comportamentul unui fenomen, în raport cu o serie de modificări ipotetice ale condiţiilor care deter-mină acest comportament.

§ 23.2 Concepte fundamentale ale Econometriei

Teoria şi practica econometrică se bazează pe o serie de concepte fundamen-tale, a căror cunoaştere condiţionează modul în care sunt înţelese numeroase aspecte importante, cum ar fi cele legate de: esenţa şi scopurile demersului ştiinţific întreprins în contextul econometric, modalităţile concrete de desfăşurare a unui studiu econometric eficient, cerinţele pe care trebuie să le îndeplinească datele utilizate în activitatea de analiză econometrică, facilităţile pe care le oferă instru-mentele econometrice, modalităţile de alegere şi de utilizare a celor mai adecvate metode, tehnici sau proceduri econometrice, posibilităţile de interpretare a rezulta-telor obţinute, modurile în care pot fi formulate concluziile studiului econometric.

Pe lângă conceptele proprii, cu natură specifică, cum ar fi, de exemplu, modelul econometric sau predicţia bazată pe modelul econometric, în econometrie sunt frecvent utilizate şi concepte care ţin de alte domenii ştiinţifice, cum ar fi: teoria probabilităţilor şi statistica matematică, teoria economică, statistica eco-nomică etc. Din acest motiv, mulţimea conceptelor cu care se operează în econo-metrie este extrem de cuprinzătoare şi extrem de variată.

Necesitatea definirii clare şi riguroase a conceptelor care intervin în econo-metrie decurge, pe de o parte, din faptul că aplicarea metodelor şi tehnicilor specifice acestui domeniu devine posibilă şi se poate desfăşura în condiţii de eficienţă, numai dacă noţiunile şi conceptele care stau la baza fundamentării acestor metode şi tehnici sunt cunoscute riguros şi profund, chiar până la nivel de subtilitate teoretică. Pe de altă parte, cunoaşterea profundă a conceptelor utilizate în econometrie este cu atât mai necesară, cu cât demersul econometric este mai complex şi implică utilizarea unor metode şi tehnici extrem de rafinate din punct de vedere ştiinţific, care depăşesc cu mult nivelul intuitiv sau nivelul obişnuit de înțelegere.

Relaţii economice modelate econometric şi tipurile acestoraRelaţiile dintre fenomenele şi procesele din lumea economică reală sunt

importante în econometrie din mai multe puncte de vedere. În primul rând, aceste relaţii reprezintă obiectul intrinsec al modelării econometrice. În al doilea rând, natura şi tipul relaţiilor care fac obiectul econometriei determină în mod direct atât natura datelor utilizate ca “materie primă” în econometrie, cât și tipurile de modele şi proceduri care pot fi utilizate pentru descrierea respectivelor relaţii.

Page 8: Econometrie Word 2 Iulie 2009 Ultim

Fenomenele economice nu se manifestă niciodată într-o manieră de strictă independenţă, în care manifestarea unui fenomen să fie total izolată sau total separată de manifestarea altor fenomene sau procese economice, iar evoluţia acestuia să fie total independentă atât în raport cu evoluţia altor fenomene, cât şi în raport cu propria evoluţie anterioară. Dimpotrivă, ceea ce este specific domeniului economic, este faptul că mişcarea şi evoluţia oricărui fenomen din acest domeniu se manifestă totdeauna sub forma unui angrenaj extrem de complex, în cadrul căruia fenomenele şi procesele interacţionează unele cu altele, se condiţionează reciproc şi se influenţează unele pe altele. Din acest punct de vedere, realitatea economică poate fi privită ca un ansamblu format dintr-o mulţime de fenomene şi procese, pe de o parte, şi dintr-o mulţime de relaţii sau legături între aceste fenemene şi procese, pe de altă parte.

Atât evoluţia de ansamblu a realităţii economice, cât şi mişcarea fiecăruia dintre fenomenele sau procesele care aparţin acestei realităţi, sunt determinate, în cea mai mare parte a lor, de legăturile sau de relaţiile care se manifestă între aceste fenomene sau procese. Relaţiile existente la un moment dat între fenomenele sau procesele din realitate sunt extrem de importante, deoarece aceste relaţii sunt, de fapt, cele care determină sau care influenţează în mod semnificativ atât nivelul, structura şi evoluţia respectivelor fenomene sau procese, cât şi forma sau inten-sitatea cu care aceste relaţii se vor manifesta ulterior, într-un viitor mai mult sau mai puţin îndepărtat.

Relaţiile dintre fenomenele sau procesele din lumea înconjurătoare se concre-tizează sub forma unei multitudini de legături, interacţiuni, influenţe, condiţionări sau conexiuni, care au forme extrem de variate, care se pot manifesta atât între fenomene sau procese individuale, cât şi între clase de fenomene sau procese, şi care cunosc numeroase modificări în timp şi spaţiu.

Modificările în timp sau în spaţiu ale relaţiilor dintre fenomene determină o continuă schimbare spaţio-temporală a configuraţiei mulţimii acestor relaţii şi constau din manifestarea relaţiilor cu o intensitate mai mare sau mai mică, în mod direct, indirect sau chiar inversat, pe unul sau mai multe planuri sau pentru o perioadă mai scurtă sau mai lungă de timp.

În econometrie, de cele mai multe ori, existenţa unei legături dintre două sau dintre mai multe fenomene este presupusă a fi cunoscută aprioric, pe baza cu-noştinţelor teoretice şi practice existente în domeniul respectiv. Ceea ce însă nu se cunoaşte dinainte, însă este necesar a fi cunoscut, este forma sau tipul şi forţa sau intensitatea cu care această legătură se manifestă.

Deducerea unei dimensiuni cantitative, exprimată sub o formă numerică con-cretă, pentru intensitatea cu care se manifestă o anumită legătură, precum şi stabi-lirea tipului sau formei respectivei legături, constituie două dintre obiectivele importante ale econometriei. Construirea unei măsuri numerice, care să cuantifice intensitatea şi sensul unei anumite legături dintre fenomene, presupune utilizarea unor instrumente statistico-matematice adecvate şi face obiectul unui capitol spe-cial al econometriei, cunoscut sub numele de analiza corelaţiei.

Page 9: Econometrie Word 2 Iulie 2009 Ultim

În cazul special al relaţiilor de cauzalitate, de exemplu, problema econometrică cea mai importantă este aceea a construirii unui model statistico-matematic, numit şi model econometric, cu ajutorul căruia să poată fi descrisă, într-o manieră sin-tetică şi relevantă, o anumită relaţie de cauzalitate. În general, activităţile legate de construirea modelelor econometrice fac obiectul altor capitole ale econometriei, cunoscute sub numele de analiza regresiei şi analiza seriilor de timp.

Construirea unui model adecvat pentru descrierea unei relaţii de cauzalitate, în care unul sau mai multe fenomene, determină nivelul sau evoluţia unuia sau mai multor alte fenomene, presupune, cu necesitate, cunoaşterea apriorică a sensului relaţiei de cauzalitate.

Sensul în care se manifestă o relaţie de cauzalitate, direct sau invers, este dedus pe baza cunoştinţelor existente în domeniul respectiv. De altfel, nu există niciun instrument şi nicio metodă statistico-matematică, cu ajutorul cărora să se poată identifica cu precizie sensul unei relaţii de cauzalitate, respectiv să se poată stabili care este fenomenul efect şi care este fenomenul cauză. Stabilirea sensului unei relaţii de cauzalitate se face totdeauna într-o manieră exogenă, în afara contextului econometric propriu-zis.

Descrierea relațiilor de cauzalitate cu ajutorul unor modele econometrice pune în evidenţă atât legăturile existente, cât şi direcţiile în care se manifestă influenţele exercitate în contextul acestor legături. În orice descriere de acest fel se precizează, în mod explicit, atât fenomenul sau fenomenele de tip efect, cât şi fenomenul sau fenomenele de tip cauză, care determină nivelul, variabilitatea şi evoluţia efectului.

În domeniul economic, legăturile sau relaţiile dintre fenomene şi procese cu-nosc o mare varietate de forme de manifestare, astfel încât apare necesitatea unei diferenţieri a acestora pe categorii sau clase, în funcţie de mai multe criterii specifice. Această diferenţiere este importantă în econometrie, deoarece natura şi tipul metodelor, tehnicilor şi modelelor utilizate pentru descrierea legăturilor dintre fenomene, este strict dependentă de natura şi tipul relaţiilor supuse investigării.

În econometrie prezintă interes clasificarea relaţiilor sau legăturilor în funcție de câteva criterii importante, cum ar fi: impactul pe care existenţa unei legături îl are asupra unora dintre fenomenele implicate în manifestarea acestei legături, precizia cu care se manifestă o legătură, contextul manifestarii legăturii şi forma sub care se manifestă respectiva legătură.

Din punct de vedere al impactului pe care relaţiile economice îl pot exercita asupra unor fenomene angrenate într-o astfel de legătură, relaţiile pot să fie de două tipuri: relaţii circumstanţiale şi relaţii cauzale. Din punct de vedere al preciziei cu care se manifestă relaţiile economice, există două tipuri de relaţii: relaţii deter-ministe şi relaţii stohastice. În funcție de contextul manifestării lor, relațiile sunt de două tipuri: spatiale și temporale. În sfârşit, din punct de vedere al formelor parti-culare sub care se pot manifesta relaţiile economice, pot fi deosebite alte două categorii importante de relaţii: relaţii liniare şi relaţii neliniare.

După cum se poate presupune, atât relaţiile circumstanţiale, cât şi relaţiile cauzale, se pot manifesta atât sub forma unor relaţii de tip liniar, cât şi sub forma

Page 10: Econometrie Word 2 Iulie 2009 Ultim

unor relaţii de tip neliniar, în funcţie de forma particulară a fiecăreia dintre cele două tipuri de relaţii.

• a. Relaţii circumstanţiale şi relaţii cauzaleRelaţiile dintre fenomenele şi procesele economice se pot manifesta fie ca

simple corelări simetrice ale nivelurilor sau ale evoluţiile fenomenelor, fie ca mecanisme de tip cauzal, în cadrul cărora variabilitatea în timp şi spaţiu a unui fenomen, este determinată de variabilitatea în timp şi spaţiu a unor alte fenomene. Din punct de vedere al existenţei posibilităţii reale ca anumite fenomene econo-mice să determine sau să influenţeze alte fenomene economice, relaţiile pot fi de două feluri: relaţii circumstanţiale şi relaţii cauzale.

Relaţiile circumstanţiale se manifestă în situaţiile în care fenomenele angre-nate într-o astfel de relaţie tind să se mişte în mod corelat şi simetric, fie în acelaşi sens, fie în sensuri diferite, fără ca manifestarea vreunuia dintre aceste fenomene să poată fi calificată ca fiind determinantă cauzal pentru manifestarea celorlalte fenomene.

Relaţiile circumstanţiale sunt relaţii non-cauzale, de tip pasiv, în care niciunul dintre fenomenele în raport cu care se manifestă o astfel de relaţie, nu influenţează celelalte fenomene şi, la rândul său, niciunul dintre fenomenele respective nu este influenţat, în mod direct, sistematic şi semnificativ, de către celelalte fenomene. Altfel spus, relaţiile circumstanţiale sunt relaţii nedirecţionate, pentru care nu se poate identifica cu precizie niciun sens de influenţă cauzală de la un fenomen la altul, respectiv relaţiile pentru care nu se poate stabili nici o legătură semnificativă de tip cauză-efect.

Ceea ce este specific relațiilor de tip circumstanţial, cel puţin din punct de vedere teoretic, este faptul că acestea nu se pretează la descrierea cu ajutorul unor relaţii funcţionale, adică nu pot fi formalizate cu ajutorul unui model econometric propriu-zis. Din acest motiv, singurele probleme importante care se pun în mod efectiv în legătură cu relaţiile de tip circumstanţial, sunt doar cele legate de evalu-area intensităţii şi de stabilirea tipului şi sensului relaţiilor din această categorie. Problemele specifice relaţiilor de tip circumstanţial constituie obiectul de studiu al analizei corelaţiei.

Relaţiile de cauzalitate sunt definite ca fiind acele legături în cadrul cărora unul sau mai multe fenomene, numite cauze sau factori de influenţă, determină, în mod semnificativ şi stabil, mişcarea unor fenomene de tip efect. Relaţiile cauzale sunt relaţii de dependenţă, de tip activ, direcţionate foarte precis.

Spre deosebire de relaţiile circumstanţiale, în a căror analiză prezintă interes doar modul în care pot fi evaluate intensitatea, sensul şi tipul manifestării acestora, în investigarea relaţiilor de tip cauzal, obiectivul cel mai important este acela al descrierii formale a acestor relaţii, cu ajutorul unui model econometric. Descrierea relaţiilor de cauzalitate cu ajutorul modelelor econometrice, constituie obiectul de studiul al analizei regresiei şi analizei seriilor de timp.

Prima şi cea mai importantă problemă care se pune în legătură cu descrierea formalizată a unei relaţii de cauzalitate este aceea a identificării sau stabilirii aprio-

Page 11: Econometrie Word 2 Iulie 2009 Ultim

rice a rolului pe care îl are fiecare fenomen angrenat în relaţia cauzală respectivă. Această identificare se referă la cunoaşterea apriorică şi precisă, de manieră exo-genă, a fenomenului care joacă rolul de efect şi a fenomenului sau fenomenelor care joacă rolul de cauze sau de factori de influenţă.

În econometrie, fenomenele sau procesele implicate în manifestarea unei relaţii, indiferent dacă această relaţie este sau nu de tip cauzal, sunt reprezentate prin intermediul unor variabile. Dacă în cazul relaţiilor circumstanţiale, variabilele care definesc fenomenele implicate sunt notate, de obicei, cu , în cazul

relaţiilor de cauzalitate, variabilele care definesc efecte sau rezultate se numesc variabile dependente și sunt notate cu , iar variabilele care definesc

cauze sau factori de influenţă se numesc variabile independente și sunt notate cu

. De regulă, variabilele care descriu fenomene supuse investigaţiei

econometrice sunt considerate a fi variabile aleatoare. Există însă o excepţie de la această regulă, reprezentată de contextul econometric în care este introdus con-ceptul de condiţionare statistică, context în care variabilele care descriu fenomene de tip cauză sunt considerate a fi de tip determinist.

În funcţie de numărul de variabile de tip efect implicate într-o relaţie de cauza-litate, există două categorii de modele econometrice: modele unidimensionale sau scalare, corespunzătoare situaţiei în care există o singură variabilă de tip efect, respectiv modele multidimensionale, vectoriale sau structurale, în cazul în care există mai multe variabile de tip efect.

Modelele econometrice din contextul analizei regresiei, cum sunt modelele de regresie simplă şi modelele de regresie multiplă, precum şi o serie de modele din domeniul seriilor de timp, cum ar fi modelele de tip autoregresiv (AR), de tip medie mobilă (MA), de tip mixt autoregresiv-medie mobilă (ARMA) sau modelele cu corecţie de erori (ECM), sunt modele unidimensionale. Anumite clase de mode-le din domeniul seriilor de timp, cum ar fi modelele cu ecuaţii simultane, modelele de tip vectori autoregresivi (VAR), de tip vectori medie mobilă (VMA) sau de tip vectori cu corecţie de erori (VECM), sunt modele multidimensionale.

Factorii de influenţă implicaţi într-o relaţie de cauzalitate, pot reprezenta fie fenomene complet diferite de fenomenele de tip cauză din această relaţie, aşa cum se întâmplă în cazul abordărilor din domeniul analizei de regresie, fie stări anterioare ale fenomenelor de tip cauză, de forma simbolică ,

aşa cum se întâmplă în cazul abordărilor din domeniul analizei seriilor de timp, fie combinaţii ale ale acestor două categorii de tipuri de factori de influenţă. Relaţiile de dependenţă cauzală pot fi exprimate prin intermediul unui model matematic, în care comportamentul fenomenului efect este descris cu ajutorul unei funcţii, ale cărei argumente sunt exprimări simbolice ale fenemenului sau feno-menelor care joacă rolul de cauze, respectiv variabile independente. În condiţiile simbolurilor utilizate în mod uzual în econometrie, relaţiile de cauzalitate pot fi descrise, într-o manieră simplificată, prin intermediul unor modele de formele:

sau

Page 12: Econometrie Word 2 Iulie 2009 Ultim

,

unde prima formă de model este specifică analizei de regresie, iar ultimele două forme de modele sunt specifice analizei seriilor de timp.

• b. Relaţii deterministe şi relaţii stohasticeDin punct de vedere al preciziei cu care se manifestă, relaţiile dintre fenomene

pot fi clasificate în două mari categorii: relaţii deterministe şi relaţii stohastice sau statistice. Deşi această clasificare se referă la relaţii în general, în cele ce urmează vom lua în considerare clasificarea în funcție de acest criteriu doar pentru cazul particular al relaţiilor de cauzalitate, doarece această clasificare are o semnificaţie mai ridicată numai în cazul acestui tip de relaţii.

Modul specific în care se manifestă fenomenele economice reale face ca formele particulare de manifestare a acestora să aibă natura realizărilor ale unor variabile aleatoare, motiv pentru care fenomenele sunt formalizate prin intermediul conceptului de variabilă aleatoare. Aceasta înseamnă că relaţiile dintre fenomenele economice pot fi privite ca fiind similare cu relaţiile dintre variabilele aleatoare.

În contextul în care se presupune că între două variabile aleatoare există o anu-mită relaţie de cauzalitate, numită relaţie de dependenţă funcţională, valorile uneia dintre cele două variabile aleatoare apar ca fiind transformări, după reguli de transformare unice şi exacte, ale valorilor celeilalte variabile. Dacă între două va-riabile aleatoare există o relaţie de acest tip, atunci această relaţie se numeşte relaţie deterministă sau relaţie exactă, chiar dacă variabilele angrenate într-o astfel de relaţie au natură de variabile aleatoare.

În condiţiile în care între două variabile aleatoare există o relaţie de tip deter-minist, realizările uneia dintre cele două variabile aleatoare pot fi determinate în mod direct și exact, pe baza cunoaşterii realizărilor celeilalte variabile aleatoare. Astfel, dacă se ştie că între variabilele aleatoare Y şi X există o relaţie deterministă de forma , iar variabila aleatoare X ia valoarea x, atunci, cu siguranță,

variabila aleatoare Y va lua valoarea . Mai mult decât atât, dacă între două

variabile aleatoare există o relaţie de tip determinist, atunci raportul de determinaţie R2 are valoarea egală cu unitatea, fapt care evidenţiază existenţa unei legături per-fecte între cele două variabile aleatoare.

Din cauza rigidităţii lor, relaţiile de tip determinist nu întrunesc condiţiile nece-sare pentru a fi modelate cu ajutorul modelelor de tip econometric, astfel încât ele prezintă un interes redus din punct de vedere al econometriei.

În cele mai multe situaţii economice reale, relaţia de cauzalitate dintre două fenomene economice se manifestă în aşa manieră încât, unor niveluri bine deter-minate ale fenomenului de tip cauză, le corespund mai multe niveluri posibile ale fenomenului efect. Acest comportament de tip multivoc se datorează în principiu faptului că, pe lângă fenomenul sau fenomenele de tip cauză semnificativă, feno-menul efect poate fi influenţat şi de numeroase alte fenomene, care au o natură accidentală și neobservabilă, a căror influenţă are un caracter aleator şi este relativ nesemnificativă, în raport cu influenţa exercitată de fenomenul sau de fenomenele

Page 13: Econometrie Word 2 Iulie 2009 Ultim

cauză. Relaţiile ce corespund acestui tip de comportament se numesc relaţii sto-hastice sau statistice, şi sunt de forma:

unde ε este o variabilă aleatoare neobservabilă, care sintetizează influenţele factorilor aleatori, cu natură accidentală şi nesemnificativă, precum și influențele erorilor de măsurare asociate cu fenomenul efect.

După cum se poate observa din forma relaţiei precedente, relaţiile de depen-denţă stohastică au natura unor relaţii deterministe distorsionate sau perturbate, în care distorsionarea sau perturbarea sunt cuantificate prin prezența în model a variabilei aleatoare ε. Din acest punct de vedere, relaţiile de dependenţă stohastică apar ca fiind relaţii care au o natură aproximativă, spre deosebire de relaţiile deter-ministe, care sunt relaţii cu natură exactă.

În cazul în care între o variabilă aleatoare de tip efect Y şi mai multe variabile aleatoare de tip cauză , există o relaţie de tip stohastic, adică o relaţie

de forma:

raportul de determinaţie multiplă R2 are valoarea strict mai mică decât unitatea, ca semn al faptului că variabilitatea variabilei efect Y nu se formează doar sub influenţa factorilor semnificativi, ci și sub influenţa factorilor accidentali.

Prin felul particular în care se manifestă, relaţiile de cauzalitate dintre feno-menele şi procesele din economie au natura unor relaţii stohastice. Din aceste motiv, modelele econometrice, indiferent de natura şi forma lor, vizează în exclu-sivitate descrierea relaţiilor cauzale de tip stohastic.

• c. Relaţii spaţiale şi relaţii temporaleRelaţiile de cauzalitate dintre fenomenele economice, se manifestă sub forma a

două categorii distincte de sensuri: sensul temporal şi sensul spaţial. Relaţiile de cauzalitate spaţiale sunt relaţii care se manifestă într-o manieră de

strictă autonomie sau independenţă în raport cu evoluţia timpului, respectiv relaţii care se manifestă la nivelul acelor colectivităţi care includ unităţi observaţionale cu natură diferită de cea a momentelor sau intervalelor de timp, cum ar fi unităţile observaţionale reprezentate de obiecte, indivizi, firme, zone geografice etc.

Specificul relaţiilor de cauzalitate spaţiale este determinat de faptul că varia-bilitatea fenomenului efect, de-a lungul elementelor colectivităţii, este strict inde-pendentă de timp, ea fiind determinată, în mod exclusiv, de variabilitatea pe care o înregistrează fenomenele cauză, de-a lungul aceloraşi unităţi observaţionale. De exemplu, relaţia de cauzalitate dintre consum şi venit, în care mărimea consumului unei familii este influenţată, în mod direct şi semnificativ, de mărimea venitului respectivei familii, este o relaţie de cauzalitate spaţială, în care consumul este fenomenul de tip efect, iar venitul este fenomenul de tip cauză. Diferenţele dintre consumurile unor familii diferite sunt determinate atât de diferenţele dintre veniturile familiilor respective, cât şi de diferenţele induse de influenţa unor factori cu caracter accidental, aleator, cu precizarea că influenţa factorilor accidentali asupra consumului este presupusă a fi relativ nesemnificativă, în comparație cu

Page 14: Econometrie Word 2 Iulie 2009 Ultim

influenţa venitului. Influenţele induse de factori accidentali, cum ar fi, de exemplu, obiectivele urmărite în viitor, nivelul de instruire, comportamentul anterior în do-meniul consumului etc., sunt cele care determină comportamentul diferit şi impre-dictibil pe care îl au în consum familiile cu venituri diferite.

În principiu, relaţiile de cauzalitate spaţiale apar în analizele econometrice care vizează date de tip profil sau de tip secvenţă, iar modelele econometrice utilizate pentru descrierea acestor relaţii se numesc modele de regresie și sunt de forma:

(23.1)

Relaţiile de cauzalitate temporale sunt relaţii a căror manifestare este semni-ficativ influenţată, în mod implicit sau explicit, de evoluţia timpului, respectiv rela-ţii dintre fenomene care se manifestă şi sunt observate în timp, adică la nivelul colectivităţilor care includ unităţi observaţionale cu natură temporală, de tipul momentelor sau intervalelor de timp, cum ar fi unităţile observaţionale reprezentate de zile, săptămâni, luni, trimestre, ani etc.

Într-o relaţie de cauzalitate temporală, variabilitatea fenomenului efect este privită ca manifestându-se de-a lungul unor momente sau intervale de timp şi este presupusă a se forma atât ca urmare a variabilităţii înregistrate în timp de o serie de fenomene de tip cauză, cât şi ca urmare a influenţei pe care o exercită timpul. De exemplu, legătura cauzală dintre evoluţia în timp a produsului intern brut şi evoluţia în timp a capitalului fix dintr-o economie, este o legătură cauzală de tip temporal.

Influenţa pe care o exercită timpul în contextul relaţiilor de cauzalitate tempo-rale poate fi de natură explicită, atunci când timpul apare în relaţia de cauzalitate ca un factor cauzal distinct, sau de natură implicită, atunci când influenţa timpului este exercitată fie prin intermediul unor factori cauzali, observabili sau neobser-vabili, care depind de timp, fie prin intermediul unor factori cauzali reprezentaţi de stări anterioare ale fenomenului efect, fie prin intermediul unor fenomene cauză cu natură sezonieră.

Legăturile de cauzalitate temporale apar în investigaţiile econometrice care vizează date de tip cronologic sau de tip serii de timp. Modelele econometrice utilizate pentru descrierea relaţiilor temporale sunt modele de tip serii de timp, care au forma generală: ,

unde descrie factori semnificativi și observabili, descrie factori obser-

vabili cu natură sezonieră, iar descrie factori neobservabili, numiţi şocuri sau

inovaţii.În situaţiile în care mulţimea factorilor cauzali angrenaţi în relaţiile de cauza-

litate temporale include doar timpul, factori cauzali observabili şi factori sezonieri, modelele utilizate pentru descrierea acestor relaţii capătă forma generală:

,

astfel încât aceste modele pot fi perfect asimilate modelelor de regresie clasice.

Page 15: Econometrie Word 2 Iulie 2009 Ultim

• d. Relaţii liniare şi relaţii neliniareDin punct de vedere al formei lor, respectiv al modului în care fenomenele de

tip efect reacţionează la variaţiile înregistrate de fenomenele de tip cauză, relațiile sau legăturile dintre fenomene pot să fie de două feluri: relații de tip liniar şi relații de tip neliniar.

Relaţiile de tip liniar corespund situaţiilor în care variaţiile unuia dintre feno-mene tind să manifeste o proporţionalitate constantă, directă sau inversă, în raport cu variaţiile celuilalt fenomen. Relaţiile de tip neliniar corespund situaţiilor în care raportul dintre variaţiile celor două fenomene nu mai este constant, modificându-se continuu în timp sau în spaţiu, în diferite sensuri. Relaţiile sau legăturile de tip neliniar apar în mod frecvent în domeniul economic, ele fiind rezultatul direct al complexităţii interacţiunilor care se manifestă între fenomenele sau procesele din acest domeniu.

Măsurarea intensităţii şi tipului relațiilor dintre fenomenele economice se face în mod diferit, în funcţie de natura liniară sau neliniară a acestora. În cazul relațiilor de tip liniar măsurarea intensităţii şi tipului legături se poate face cu ajutorul coefi-cienţilor de corelaţie simplă, în timp ce în cazul relațiilor de tip neliniar, măsurarea intensităţii şi tipului relației este ceva mai dificilă şi se poate face numai în con-textul analizei de regresie, prin intermediul raportului de determinaţie R2.

În funcţie de natura liniară sau neliniară a relaţiilor economice pe care le modelează, modelele econometrice sunt de două tipuri: modele liniare şi modele neliniare. Această clasificare a modelelor econometrice corespunde modului con-cret în care variabilele care definesc fenomene de tip cauză intervin în cadrul mo-delului econometric. În acest context, de exemplu, un model econometric de forma:

apare ca fiind un model liniar, în timp ce modelul econometric de forma:

apare ca fiind un model neliniar. Cu toate acestea, în econometrie, liniaritatea sau neliniaritatea unui model econometric sunt judecate nu în raport cu variabilele cauzale, ci în raport cu parametrii modelului. Din această perspectivă, modelul precedent este un model liniar, în timp ce modelul:

,

este un model neliniar.

Factori semnificativi şi factori accidentali în modelarea econometricăObiectivul general al analizei econometrice este acela de a descrie şi de a ex-

plica relaţiile de cauzalitate, adică mecanismele de formare a nivelului, variabili-tăţii sau evoluţiei unor fenomene de tip efect, ca rezultat al influenţei unei multi-tudini de factori sau de cauze. Natura foarte diferită pe care o au cauzele care deter-mină un anumit efect face ca aceste mecanisme să nu fie strict deterministe, ci să aibă un pronunţat caracter stohastic.

Page 16: Econometrie Word 2 Iulie 2009 Ultim

De cele mai multe ori, în manifestarea unei relaţii de cauzalitate intervin numeroşi factori cauzali, a căror influenţă asupra fenomenului efect este mai mult sau mai puţin semnificativă, mai mult sau mai puţin stabilă. Din acest punct de vedere, factorii care influenţează, în contextul unui mecanism cauzal, un anumit fenomen efect, pot fi clasificați în două categorii: factori semnificativi şi factori accidentali sau factori cu influenţă aleatoare.

Fiecare dintre cele două categorii de factori are importanţa şi semnificaţia sa în contextul analizei econometrice, pentru fiecare categorie de factori utilizându-se modalităţi statistico-matematice diferite de includere a acestora în modelele econo-metrice. În cadrul modelării econometrice, cea mai mare importanţă o au factorii semnificativi, a căror influenţă asupra fenomenelor efect are un caracter general, semnificativ şi stabil, fiind considerată a fi determinantă pentru evoluţia feno-menelor efect.

Factorii semnificativi sunt factorii a căror influenţă asupra manifestării unui fenomen efect este caracterizată prin consistenţă şi prin repetabilitate sau, altfel spus, prin influenţă cu caracter relevant şi sistematic.

Influenţa factorilor semnificativi asupra fenomenului efect diferă de la o enti-tate individuală a colectivităţii la alta, în funcţie de valorile înregistrate de factorii respectivi la nivelul acestor entităţi. Această influenţă se exercită în mod identic numai la nivelul acelor entităţi observaționale, cărora le corespund valori identice ale factorilor semnificativi.

Proprietatea pe care o au factorii semnificativi de a-şi exercita influenţele în mod repetabil, trebuie privită atât în contextul sensului temporal, cât şi în contextul sensului spaţial ale manifestării relaţiilor de cauzalitate. În contextul sensului tem-poral, caracterul de repetabilitate a influenţei factorilor sistematici presupune, în mod implicit, existenţa şi manifestarea factorilor semnificativi pe o perioadă mai îndelungată. În contextul sensului spaţial, repetabilitatea se referă la existenţa şi manifestarea factorilor sistematici într-o manieră care se regăseşte multiplicată la nivelul tuturor elementelor unei colectivităţi.

O ipoteză fundamentală referitoare la factorii semnificativi, este aceea conform căreia factorii semnificativi au o natură observabilă, ceea ce înseamnă că nive-lurile şi evoluţiile acestora pot fi supuse unui proces de observare şi de măsurare.

Deşi din punct de vedere teoretic se poate considera că valorile posibile ale fiecăruia dintre factorii semnificativi reprezintă realizări ale unei variabile alea-toare, în analiza de regresie se consideră, în mod uzual, că variabilele explicative ce cuantifică factorii semnificativi sunt variabile deterministe, de tip nestohastic, ale căror valori sunt certe şi cunoscute aprioric.

În cadrul econometriei, influenţa cumulată a factorilor semnificativi este cuan-tificată prin intermediul funcţiei de regresie, funcţie ale cărei argumente se referă în mod explicit la factorii semnificativi şi care include câte un argument separat pentru fiecare factor de influenţă considerat a fi semnificativ. Aceasta înseamnă că factorii semnificativi sunt incluşi în structura modelelor de regresie în mod individual, sub o formă explicită şi distinctă, prin intermediul unor variabile numite variabile explicative sau regresori. Din acest punct de vedere, se poate spune că,

Page 17: Econometrie Word 2 Iulie 2009 Ultim

totdeauna, un model de regresie include un număr de variabile explicative egal cu numărul de factori semnificativi.

Considerând, de exemplu, cazul legăturii dintre consumul familiilor şi venitul acestora, diferenţele dintre veniturile unor familii, se vor concretiza în diferenţe corespunzătoare între consumuri. În mod invers, în ipoteza conform căreia mări-mea consumului este considerată a fi determinată în mod exclusiv de mărimea venitului, pentru familiile cu venituri egale, este de aşteptat să existe consumuri egale. Conţinutul acestei afirmaţii stă la baza ideii conform căreia influenţa facto-rilor semnificativi determină formarea nivelului mediu al fenomenului efect, iar abaterile nivelurilor individuale faţă de acest nivel mediu sunt determinate de influenţa factorilor cu natură accidentală.

Influenţa factorilor semnificativi determină aşa-numita tendinţă centrală sau sistematică a evoluţiei fenomenului efect şi defineşte partea stabilă şi robustă a acestei evoluţii. În contextul modelelor econometrice, această parte este sintetizată prin intermediul unei mărimi cu natură de medie, considerându-se în acest fel că influenţa factorilor semnificativi determină formarea unui anumit nivel al fenome-nului efect, care este un nivel mediu sau o valoare aşteptată. Această valoare poate fi interpretată ca reprezentând acel nivel teoretic al fenomenului efect, care rezultă din influenţa exclusivă a factorilor semnificativi.

Ca rezultat al presupunerii de mai sus, funcţia care cuantifică influenţa facto-rilor semnificativi, adică funcţia de regresie, este considerată a fi o funcţie care descrie nu valorile individuale ale fenomenului efect, ci nivelul mediu sau valoarea aşteptată a acestuia, respectiv:

,

unde reprezintă funcţia de regresie. În acest context, menţionăm faptul că, în

econometrie, prin intermediul funcţiei de regresie este modelată valoarea aşteptată a variabilei asociate cu fenomenul efect.

Factorii accidentali sunt factorii a căror influenţă asupra fenomenului efect este considerată a fi nesemnificativă şi întâmplătoare, având o pondere redusă în formarea nivelului fenomenului efect, astfel încât influenţa acestor factori, face ca manifestările individuale ale fenomenului efect să fie diferite, chiar în situația în care factorii cu natură sistematică au acelaşi nivel. De asemenea, numărul factorilor accidentali este considerat a fi foarte mare, iar influenţele acestora pot avea sensuri contrarii, astfel încât, pe medie, aceste influenţe tind să se anihileze. Rezultă că influenţa factorilor accidentali asupra fenomenului efect face ca manifestarea în timp sau în spaţiu a acestuia să înregistreze o serie de abateri de la tendinţa sa centrală, tendinţă determinată de influenţa factorilor semnificativi. Din acest motiv, se consideră că influenţa factorilor aleatori asupra fenomenului efect are doar o natură perturbatorie.

Natura întămplătoare a influenţelor pe care factorii accidentali le au asupra formării nivelului fenomenului efect, precum şi tendinţa de anihilare reciprocă a influenţelor acestor factori, conduce la ideea modelării influenţelor cumulate ale

Page 18: Econometrie Word 2 Iulie 2009 Ultim

acestor factori cu ajutorul unei variabile aleatoare speciale, numită termen eroare sau perturbaţie și care are o serie de proprietăţi stohastice specifice. Una dintre aceste proprietăţi este cea conform căreia, ca urmare a anihilării reciproce a influ-ențelor factorilor accidentali, media acestei variabile aleatoare este nulă.

Influenţa factorilor accidentali asupra unui fenomen efect este cea care conferă fenomenelor economice proprietatea de comportament impredictibil. Factorii acci-dentali induc la nivelul fenomenului efect o serie de abateri, cu natură aleatoare şi cu magnitudine redusă, ale manifestărilor individuale ale acestuia faţă de un presu-pus comportament aşteptat (mediu) al său:

Spre deosebire de factorii semnificativi, factorii aleatori au caracter neobser-vabil, astfel încât singurele informaţii care pot exista cu privire la aceşti factori, sunt informaţiile referitoare la repartiţia statistică a influenței cumulate a acestora. Mai mult decât atât, manifestarea factorilor aleatori şi exercitatea influenţei aces-tora asupra fenomenului efect au o natură impredictibilă.

Datorită faptului că influenţele factorilor aleatori asupra fenomenului efect sunt presupuse a fi accidentale şi neglijabile, includerea acestora în structura mode-lelor econometrice se face la comun, prin intermediul unei singure variabile alea-toare, care este perturbaţia sau termenul eroare şi care se notează uzual cu ε. Aceasta înseamnă că funcţia de mai sus, este considerată a avea următoarea

formă particulară:

,

unde ε este variabila aleatoare care modelează influenţa comună a factorilor accidentali asupra efectului.

În ciuda unei aparente lipse de importanţă în cadrul modelului econometric, sugerată de faptul că ea cuantifică influenţa factorilor accidentali, cu influenţă nesemnificativă, variabila perturbaţie ε are un rol fundamental în modelarea econo-metrică. De exemplu, ipotezele fundamentale ale modelelor econometrice sunt formulate, aproape exclusiv, în raport cu această variabilă sau în raport cu formele condiţionate ale acesteia. De asemenea, reziduurile asociate cu variantele de selec-ţie ale modelelor econometrice, care au natură de variabile aleatoare și care stau la baza construirii multor teste statistice, sunt definite tot în raport cu această variabilă aleatoare şi cu formele sale condiţionate.

Numărul şi natura factorilor accidentali care influenţează un fenomen efect sunt strâns legate de particularităţile fiecărei entităţi informaţionale care intră în alcătuirea unei colectivităţi. Aceasta înseamnă că, la nivelul individual al fiecărei entităţi informaţionale, nivelul fenomenului efect se formează atât sub influenţa factorilor semnificativi, cât şi sub influenţa unor factori accidentali care sunt speci-fici respectivei entităţi informaţionale. Mai mult decât atât, chiar în condiţiile în care influenţa factorilor sistematici este identică pentru mai multe entităţi informa-ţionale, din cauza influenţei factorilor accidentali, manifestările particulare ale

Page 19: Econometrie Word 2 Iulie 2009 Ultim

fenomenului efect la nivelul acestor entităţi informaţionale vor fi diferite. În acest fel, chiar pentru unități observaționale la care se înregistrează aceleaşi niveluri ale factorilor sistematici, fenomenul efect poate să înregistreze valori individuale diferite. Cu alte cuvinte, spre deosebire de factorii semnificativi, care sunt presu-puşi a fi comuni tuturor unităţilor observaţionale la nivelul cărora se manifestă legătura modelată, factorii accidentali sunt factori specifici fiecărei unităţi sau unui număr redus de unităţi similare. Din acest motiv, atât numărul şi natura factorilor accidentali, cât şi modul în care se exercită influenţa lor asupra fenomenului efect, diferă, într-o măsură mai mare sau mai mică, de la o unitate observațională la alta sau de la un grup de unităţi observaționale la altul.

Ca urmare a acţiunii factorilor cu natură aleatoare, la influenţe de mărime şi sens identice ale factorilor semnificativi, nivelul fenomenului efect va lua valori diferite de la o unitate observațională la alta sau de la un grup de unităţi observa-ționale asemănătoare la altul, astfel încât, pentru fiecare combinaţie dată de niveluri ale factorilor sistematici, există o întreagă mulţime de valori posibile ale nivelurilor fenomenului efect. Deoarece valorile din această mulțime se formează sub influ-enţa unor factori de natură aleatoare, putem vorbi de câte o distribuţie de proba-bilitate a valorilor fenomenului efect, pentru fiecare combinaţie de niveluri ale factorilor semnificativi.

Distribuţiile de probabilitate ale valorilor fenomenului efect, formate sub influ-ența factorilor accidentali și diferențiate în funcție de valorile factorilor semnifi-cativi, pot fi privite ca distribuţii condiţionate de probabilitate, pentru care condi-ţionarea este exercitată de valorile înregistrate de factorii semnificativi.

Prezenţa influenţelor factorilor aleatori asupra fenomenului efect, influenţe cuantificate prin intermediul unei singure variabile aleatoare ɛ, face ca relaţia de cauzalitate descrisă cu ajutorul modelului de regresie să fie privită ca o relaţie de natură statistică, iar modelul de regresie să aibă natură stohastică:

Având în vedere cele menționate anterior, nivelul fenomenului efect poate fi descompus în două componente:

• componenta sistematică, determinată de influenţa factorilor cu natură semni-ficativă, este sintetizată prin intermediul mediei şi este descrisă cu ajutorul funcţiei de regresie, respectiv:

;

• componenta accidentală, care este rezultatul influenţei factorilor aleatori, este reprezentată de abaterile față de medie și este sintetizată prin intermediul per-turbației ε:

Page 20: Econometrie Word 2 Iulie 2009 Ultim

.

Ca urmare a existenţei celor două componente ale valorilor individuale ale nivelului fenomenului efect, variabilitatea acestuia de-a lungul unităţilor colectivi-tății poate fi descompusă, în mod corespunzător, astfel:

.

Această modalitate de descompunere a variabilităţii fenomenului efect expri-mă rezultatul aşa-numitei teoreme de descompunere a varianţei, teoremă care oferă justificarea teoretică pentru descompunerea sumei pătratelor abaterilor variabilei dependente pe două componente: suma pătratelor abaterilor explicate de regresie şi suma pătratelor abaterilor reziduale (sau neexplicate), componente care stau la baza definirii raportului de determinaţie multiplă R2.

Colectivitate, populaţie şi eşantionEste foarte important ca în orice analiză econometrică să se facă o distincţie

foarte clară între conceptul empiric de colectivitate şi conceptul teoretic de po-pulaţie statistică. Acesta din urmă constituie o generalizare a conceptului de colec-tivitate şi are implicaţii teoretice de profunzime pentru logica econometrică.

Colectivitatea este un ansamblu de entităţi individuale, numite unităţi elemen-tare, unităţi observaţionale, obiecte, indivizi, cazuri etc., care au o existenţă reală, concretă, şi care au una sau mai multe proprietăţi empirice comune, numite caracteristici sau atribute.

Populaţia statistică este un ansamblu de entităţi informaţionale abstracte, virtuale, numite generic observaţii, constând din mulţimea tuturor valorilor posi-bile, efective sau virtuale, pe care le pot lua caracteristicile elementelor unei colec-tivităţi, ansamblu care reprezintă o generalizare a valorilor particulare ale respecti-velor caracteristici. O populaţie statistică are natura unei mulţimi de valori, de regulă reale, ale uneia sau mai multor variabile aleatoare, numite şi dimensiuni ale populaţiei statistice, în funcţie de numărul de caracteristici de interes ale colec-tivităţii pe care populaţia statistică o generalizează.

Orice caracteristică de interes a unei colectivităţi este generalizată la nivel de populaţie statistică prin intermediul conceptului de variabilă aleatoare, care repre-zintă o dimensiune a populaţiei statistice. Din acest punct de vedere, valorile efec-tive ale caracteristicilor elementelor unei colectivităţi apar ca o submulţime a valorilor populaţiei statistice. Mai mult decât atât, mulţimile de valori efective ale caracteristicilor elementelor unei colectivităţi sunt totdeauna mulţimi finite, în timp ce populaţiile statistice sunt, de cele mai multe ori, mulţimi infinite. De exemplu, în cazul particular al consumului familiilor, deşi valorile individuale ale consumurilor familiilor reprezintă o mulţime finită, cu un cardinal de ordinul milioanelor, din punct de vedere al econometriei, consumul este privit ca fiind o variabilă aleatoare,

Page 21: Econometrie Word 2 Iulie 2009 Ultim

care ia valori într-un interval continuu de forma [cmin, cmax], interval care defineşte populaţia statistică şi care are cardinalul egal cu puterea continuului, adică infinit.

Populaţiile statistice pot fi mulţimi finite numai în cazul particular în care caracteristicile unităţilor care intră în alcătuirea colectivităţilor investigate sunt de tip nominal (discret), adică au o mulţime finită de valori posibile.

În cazul în care elementele colectivităţii studiate au un număr de n carac-teristici, cu valori de tip continuu (reale), populaţia statistică asociată are tot un număr de n dimensiuni (variabile) şi poate fi privită ca reprezând o submulţime a spaţiului Euclidian real n-dimensional, respectiv:

{Populaţie statistică} ⊆ ℝ×ℝ×...×ℝ = ℝn..În această situație, populaţia statistică apare ca fiind mulţimea tuturor valorilor

posibile ale unui vector real, ale cărui elemente sunt reprezentate de n variabile aleatoare reale, asociate cu cele n caracteristici de interes ale colectivităţii.

În cadrul figurii (23.1) este ilustrată ideea raportului în care se află colec-tivitatea şi populaţia statistică asociată acesteia.

De regulă, datele disponibile pentru o analiză econometrică nu au un caracter exhaustiv, ci un caracter parţial, ele reprezentând doar o submulţime a populaţiei statistice, submulţime cunoscută sub numele de eşantion.

Eşantionul reprezintă o porţiune informaţională, o parte sau o submulţime a populaţiei statistice, respectiv acea parte care este asociată doar cu acele unităţi ale colectivităţii, de la care sunt colectate în mod efectiv datele de interes. Numărul de observaţii dintr-un eşantion se numeşte volum al eşantionului şi se notează cu T.

Eşantionul este o entitate informaţională parţială, prin intermediul căruia se urmăreşte cunoaşterea întregului din care acesta face parte, întreg reprezentat în sens concret de colectivitatea investigată, iar în sens abstract de populaţia statistică.

Cel puţin din punct de vedere teoretic, eşantionul are menirea de a reprezenta populaţia statistică vizată de analiză, de a reproduce într-o măsură cât mai mare caracteristicile esenţiale ale acesteia. Proprietatea unui eşantion de a reproduce,

Figura 23.1: Raportul dintre colectivitate şi populaţie statistică

Page 22: Econometrie Word 2 Iulie 2009 Ultim

într-o anumită măsură, caracteristicile esenţiale ale populaţiei statistice la care se referă, este cunoscută sub numele de reprezentativitate a eşantionului.

Există mai multe accepţiuni ale conceptului de eşantion: eşantionul fizic, care reprezintă o simplă listă de unităţi extrase la întâmplare din colectivitatea supusă

studiului, de forma , eşantionul informaţional

sau de observaţii, care reprezintă o mulţime de valori numerice observate ale carac-teristicii sau caracteristicilor colectivităţii, de formele:

sau ,

în funcţie de numărul de caracteristici de interes pe care le posedă unităţile colec-tivităţii analizate, respectiv eşantionul aleator, care este o listă de variabile alea-toare, identic şi independent distribuite (iid), de formele următoare:

sau .

Deoarece orice eşantion informaţional (de observaţii) poate fi privit ca repre-zentând o realizare particulară a variabilelor din eşantionul aleator asociat, se poate spune că eşantionul aleator constituie o generalizare a tuturor eşantioanelor infor-maţionale de volum dat, motiv pentru care eşantionul aleator se mai numeşte şi model de selecţie.

De regulă, variabilele aleatoare care intră în alcătuirea eşantionului aleator sunt utilizate pentru definirea estimatorilor parametrilor modelelor econometrice, iar datele care intră în alcătuirea eşantionului informaţional sunt utilizate pentru esti-marea efectivă a parametrilor modelelor econometrice.

Justificarea teoretică a folosirii informaţiilor parţiale conţinute în eşantionul de observaţii, pentru a caracteriza populaţia statistică din care provine eşantionul, este asigurată de legea numerelor mari. În virtutea acestei legi, informaţiile din eşantion pot fi utilizate în mod eficient pentru a obţine aproximări suficient de bune ale valorilor parametrilor populaţiilor statistice şi modelelor econometrice. Calitatea aproximărilor obținute cu ajutorul estimatorilor, depinde de proprietăţile calitative pe care pot să le aibă sau nu estimatorii respectivi.

Parametri, estimatori şi estimaţii Populaţiile statistice au o serie de proprietăţi şi caracteristici fundamentale, sintetizabile şi exprimabile prin intermediul unor mărimi numerice bine deter-minate şi importante din punct de vedere al cunoaşterii ştiinţifice, dar care nu sunt cunoscute aprioric, nu pot fi observate în mod direct şi nu pot fi măsurate cu precizie. Mărimile numerice care exprimă într-o manieră sintetizatoare aspecte şi trăsături fundamentale ale populaţiilor statistice au natura unor constante şi sunt cunoscute în statistică sub numele de parametri sau mărimi teoretice.

Parametrii sunt mărimi numerice cu valoare constantă şi necunoscută, specifice populaţiilor statistice şi modelelor econometrice, care exprimă caracte-ristici fundamentale şi de interes, a căror valoare nu poate fi obţinută pe calea observării directe.

În econometrie apare în mod frecvent necesitatea de a obţine aproximaţii pentru parametrii necunoscuţi ai populaţiilor statistice sau ai modelelor econo-

Page 23: Econometrie Word 2 Iulie 2009 Ultim

metrice. Procesul de obţinere a acestor aproximaţii se numeşte estimare, iar aproxi-maţiile ca atare se numesc estimaţii.

În general, procesul de estimare a parametrilor presupune: • existenţa unei baze informaţionale corespunzătoare, reprezentată de eşantionul de observaţii; • defini-rea unor funcţii numite estimatori, ale căror valori servesc ca aproximări ale parametrilor; • utilizarea unor metode şi tehnici de estimare adecvate, astfel încât, prin evaluarea estimatorilor pe mulţimea de observaţii, se se obţină estimaţii care să aproximeze cât mai bine valorile necunoscute ale parametrilor.

Estimatorii sau statisticile sunt funcţii definite în raport cu variabilele care alcătuiesc eşantionul aleator, respectiv funcţii de forma:

,

unde este un estimator al unui parametru oarecare θ.

Fiind definiţi ca funcţii de T variabile aleatoare, estimatorii au natură de varia-bile aleatoare, astfel încât are sens să se vorbească de distribuţie statistică a aces-tora, care se numeşte distribuţie de selecţie. Ca exemple de estimatori mai impor-tanţi şi mai frecvent întâlniţi în econometrie, putem menţiona: media de selecţie:

şi varianţa de selecţie:

,

care sunt estimatori pentru media şi varianţa unei populaţii statistice.Ca funcţii de elementele eşantionului aleator, estimatorii pot fi evaluaţi în

raport cu orice eşantion dat de observaţii. Valoarea obţinută din evaluarea unui estimator pe un eşantion particular de observaţii, se numeşte estimaţie.

Estimaţia este o valoare numerică, rezultată din evaluarea unui estimator pe mulţimea de observaţii reprezentate de un eşantion, respectiv o valoare reală defi-nită sub forma:

,

unde reprezintă valorile numerice din eşantionul de observaţii.

Calitatea estimaţiilor obţinute pentru anumiţi parametri, adică măsura în care acestea reuşesc să aproximeze parametrii populaţiei, depinde de trei factori impor-tanţi: calitatea datelor disponibile la nivel de eşantion, proprietăţile statistice ale estimatorilor şi calitatea metodei de estimare utilizată.

Printre cele mai importante proprietăţi calitative ale estimatorilor, de care depinde măsura în care aceştia pot aproxima valorile adevărate ale parametrilor, menţionăm: nedeplasarea, consistenţa, liniaritatea şi eficienţa.

Caracteristici şi variabileEconometria are ca scop modelarea legăturilor cauzale manifestate la nivelul

unor fenomene sau caracteristici pe care le posedă unitățile sau elementele unei colectivităţi, numite generic unităţi observaţionale.

Page 24: Econometrie Word 2 Iulie 2009 Ultim

Din perspectiva informaţiei statistice, o colectivitate prezintă interes direct nu din punct de vedere al elementelor sale ca atare, ci din punct de vedere al trăsă-turilor, al proprietăţilor pe care le au aceste elemente. Proprietăţile specifice pe care le pot avea elementele aparţinând unei colectivităţi oarecare, sunt numite caracteristici sau atribute, fiecare caracteristică de interes a elementelor unei colectivităţi, definind o dimensiune a colectivităţii respective.

Este important să precizăm că orice caracteristică luată în considerare în ana-liza econometrică trebuie să fie comună tuturor unităţilor colectivităţii analizate, existând doar diferenţe de valoare ale acestei caracteristici de la o unitate a colec-tivităţii la alta. Aceste diferenţe definesc aşa-numita variabilitate a caracteristicii respective, peste mulţimea de unităţi observaţionale.

Caracteristicile sau atributele unităţilor elementare ce alcătuiesc o anumită colectivitate, sunt elemente ale unei realităţi date, de natură empirică. De regulă, în activitatea ştiinţifică nu se operează cu elementele acestei realităţii ca atare, ci cu simboluri, care sunt reprezentări abstracte ale realităţii. În econometrie reprezen-tarea simbolică a caracteristicilor empirice ale elementelor unei colectivităţi, este asigurată prin intermediul conceptului de variabilă (aleatoare).

În cadrul demersurilor ştiinţifice care au ca scop investigarea fenomenelor şi proceselor din lumea reală, caracteristicile unităţilor unei colectivităţi sunt reflec-tate prin intermediul conceptului de variabilă, tocmai pentru a sugera natura schim-bătoare a acestora, variabilitatea lor în timp şi spaţiu.

Variabila reprezintă o abstractizare a mulţimii de valori posibile pe care le poate înregistra o caracteristică, de-a lungul tuturor unităţilor unei colectivităţi.

Natura variabilelor implicate într-o analiză econometrică este determinată în mod direct de natura caracteristicilor pe care le au obiectele supuse analizei. Din acest punct de vedere, variabilele care intervin într-o analiză econometrică pot fi structurate sub forma unor tipuri diferite, în funcţie de anumite criterii de diferen-ţiere. Tipul variabilelor este foarte important, deoarece atât procedurile de analiză econometrică, cât şi posibilităţile de interpretare a rezultatelor obţinute, sunt substanţial diferite în raport cu natura variabilelor implicate în analiză.

Printre cele mai importante categorii de variabile întâlnite în econometrie se numără variabilele de tip cantitativ şi calitativ, variabilele de tip discret şi conti-nuu, variabilele endogene şi exogene etc. Clasificarea variabilelor în aceste catego-rii, corespunde unor criterii specifice de clasificare, cum ar fi: natura valorilor variabilelor, natura mulţimilor de valori ale variabilelor, rolul pe care îl au varia-bilele în cadrul modelelor etc.

Ca şi caracteristicile unităților la care se referă, variabilele pot fi de împărţite, în funcţie de natura valorilor pe care acestea le iau, în două mari categorii: varia-bile calitative şi variabile cantitative.

Variabilele calitative sunt variabile care diferă prin tip, care se referă la proprietăţi nenumerice ale unităţilor elementare aparţinând unei colectivităţi şi care nu pot fi exprimate sub o formă numerică semnificativă. Valorile variabilelor de tip calitativ se numesc alternative, variante, modalităţi sau categorii, motiv pentru care variabilele calitative se mai numesc şi variabile categoriale. În funcţie de

Page 25: Econometrie Word 2 Iulie 2009 Ultim

numărul de valori posibile pe care le pot lua, variabilele categoriale sunt de două tipuri: variabile bicategoriale şi variabile multicategoriale. Ca exemple de varia-bile calitative putem menţiona: sexul, opţiunea cumpărătorului, opţiunea alegăto-rului, profesia, starea civilă etc. Variabilele cantitative sunt variabile care diferă prin mărime, care se referă la proprietăţi numerice ale unităţilor elementare dintr-o colectivitate şi care sunt exprimate în unităţi numerice de lungime, de frecvenţă, de volum, de greutate, de valoare etc. Ca exemple de variabile cantitative putem menţiona: preţul unui produs, cheltuielile lunare ale unei familii, salariul mediu lunar, venitul naţional, volumul fizic al producţiei etc.

Un alt criteriu de clasificare a variabilelor este cel al naturii mulţimii în care acestea pot lua valori. Din acest punct de vedere, variabilele se împart în două categorii: variabile de tip discret şi variabile de tip continuu.

Variabilele de tip discret sunt variabile care pot lua valori într-o mulţime finită, indiferent de natura calitativă sau cantitativă a acestora. Variabilele de tip discret pot să fie atât variabile calitative, cât şi variabile cantitative, cu condiţia ca în cazul ultimelor, numărul de valori posibile să fie finit. Ca exemple de variabile de tip discret putem menţiona: categoria de venit, nivelul de instruire, vârsta, numărul de salariaţi, numărul de cumpărători, numărul de piese defecte, numărul de firme falimentare, numărul de tranzacţii la bursă etc. Variabilele de tip continuu sunt variabile numerice pentru care mulţimea de valori posibile este o mulțime de numere reale, care are puterea continuului.Ca exemple de variabile de tip continuu putem menționa: masa monetară dintr-o economie, prețul unui bun economic, rata inflației, rata șomajului, cursul de schimb al monedei naționale etc.

Un alt criteriu de clasificare a variabilelor este cel reprezentat de rolul acestora în contextul relaţiilor de cauzalitate şi, implicit, în cadrul modelelor care descriu relaţii de acest fel. Din acest punct de vedere, variabilele se împart în trei categorii: variabile endogene, variabile exogene şi variabile fictive.

Variabilele endogene sunt variabile care exprimă fenomene de tip efect sau rezultat, considerate a se forma sub influenţa unor alte fenomene şi apar în cadrul modelelor econometrice ca variabile dependente. Variabilele exogene sunt varia-bile care simbolizează fenomene de tip cauze, care, prin modul lor de manifestare, determină comportamentul unui fenomen de tip efect. Atât variabilele endogene, cât şi variabilele exogene, pot să fie variabile de tip calitativ sau variabile de tip cantitativ. Variabilele fictive sunt variabile artificiale, care sunt utilizate în con-strucția modelelor econometrice cu scopul de a asigura flexibilizarea modelelor sau cu scopul de a cuantifica influențe de tip sezonier. De regulă, variabilele fictive sunt variabile de tip binar, adică variabile care pot lua două valori posibile. În cazul în care varibilele fictive sunt incluse într-un model cu scopul de a descrie sezo-nalitatea, numărul acestora şi valorile lor posibile sunt determinate de numărul de perioade din intervalul de ciclitate.

Variabilele pot fi clasificate şi în funcţie de tipul scalelor pe care sunt măsurate valorile acestor variabile. Din acest punct de vedere, există patru tipuri de variabile, respectiv variabile nominale sau categoriale, variabile ordinale, variabile de tip

Page 26: Econometrie Word 2 Iulie 2009 Ultim

interval şi variabile de tip raport, tipuri ce corespund scalelor nominală, ordinală, interval sau raport.

§ 23.3 Baza informaţională utilizată în econometrie

Elementele care constituie intrările pentru orice metodă, tehnică sau procedură econometrică, respectiv “materia primă” a econometriei, sunt reprezentate de datele (primare) referitoare la starea şi evoluţia fenomenelor din economia reală.

Datele reprezintă expresii cantitative sau calitative ale manifestării unor feno-mene din realitatea înconjurătoare, rezultate în urma unor procese de observare, măsurare şi înregistrare specifice. Eterogenitatea fenomenelor economice şi a ma-nifestării lor face ca datele referitoare la aceste fenomene să fie extrem de variate.

Conceptul de dată este totdeauna asociat cu fenomenele care au natură obser-vabilă, adică cu fenomenele ale căror manifestări au un anumit grad de “vizibi-litate” şi care pot fi supuse unor procese de măsurare adecvate. Fenomenul obser-vabil este acel fenomen ale cărui manifestări directe sunt vizibile şi pot fi supuse unui proces direct de măsurare. Concret, conceptul de fenomen observabil este asociat cu ideea de caracteristică măsurabilă.

Datele pot fi privite ca reprezentând semnale sau mesaje provenite din rea-litatea înconjurătoare, exprimate sub o formă numerică sau nenumerică, pe baza cărora receptorul acestora îşi poate forma o anumită imagine despre respectiva realitate şi poate ajunge la un anumit grad de cunoaştere a acelei realităţi. Imaginea formată este cu atât mai fidelă în raport cu realitatea, cu cât cantitatea semnalelor sau mesajelor este mai mare şi cu cât calitatea acestora este mai ridicată, respectiv cu cât acestea sunt mai puţin afectate de erori, perturbaţii şi distorsiuni.

Datele se referă la diferite aspecte informaţionale legate de existenţa şi mani-festarea fenomenelor şi proceselor reale, cunosc o mare varietate de tipuri şi pot fi obţinute din surse diferite. Datele exprimă, într-o formă brută, o mulţime de stări şi evoluţii concrete din realitatea economică investigată şi sunt rezultatul unui labo-rios proces de observare, măsurare şi evaluare, proces în care intervin o serie de norme, principii, metodologii şi instrumente.

Datele pot să difere în funcţie de mai mulţi factori, cum ar fi: sursa care le-a generat, contextul în care sunt obținute, tipul şi natura lor. În primul rând, indi-ferent de varietatea lor, datele pot fi grupate în trei categorii fundamentale: date cantitative, date calitative şi date mixte. Deşi datele calitative sunt de tip nenume-ric, aceastea pot fi însă transformate şi exprimate sub formă numerică, cantitativă, prin codificări adecvate.

Din punct de vedere al naturii contextului în care datele sunt obţinute, al modului în care investigatorul controlează sau nu procesul de obţinere a datelor, datele pot fi grupate în două categorii: date experimentale şi date observaţionale sau date non-experimentale.

Datele experimentale sunt datele obţinute prin organizarea unor experimente de tip controlat, desfăşurate în condiţii bine determinate şi prestabilite. Contextul obţinerii datelor de tip experimental este restricţionat prin impunerea unor reguli

Page 27: Econometrie Word 2 Iulie 2009 Ultim

specifice. În general, organizarea unui experiment controlat presupune, în primul rând, izolarea fenomenelor şi proceselor studiate, precum şi eliminarea, în cât mai mare măsură, a influenţelor externe, cu natură accidentală, care nu prezintă interes pentru analiză. Datele experimentale sunt caracteristice doar anumitor domenii de cercetare, şi anume acelor domenii în care pot fi organizate experimente cu caracter controlat. Spre deosebire de aceste domenii, în domeniul economic experimentarea poate fi efectuată foarte rar şi numai în situaţii excepţionale.

Datele observaţionale, care se mai numesc şi date non-experimentale, sunt datele obţinute prin “observarea” fenomenelor şi proceselor în mişcarea lor natu-rală, liberă, fără impunerea unor restricţii și fără a se exercita un control de un anumit fel asupra fenomenelor şi proceselor investigate. Obţinerea datelor de tip non-experimental, reprezintă rezultatul observării pasive, constatării. Intervenţia observatorului, a celui care face observarea şi măsurătorile, este de tip ex-post și are loc după ce desfăşurarea fenomenelor şi proceselor reale a avut loc. Datele de tip observaţional sau non-experimental sunt datele specifice domeniului economic, domeniu în care organizarea de experimente este fie dificilă, fie imposibilă.

În funcţie de natura pe care o au, datele pot fi grupate în trei categorii: date de tip profil, date de tip serii de timp şi date de tip panel. Datele de tip profil, numite şi date spaţiale sau date de tip secvenţă, sunt date cu natură statică şi reprezintă rezultate ale unor măsurători efectuate la un moment dat asupra caracteristicilor mai multor unităţi ale colectivităţii studiate. Datele de tip serii de timp, numite şi serii cronologice sau, pur şi simplu, serii de timp, reprezintă rezultate ale unor măsurători efectuate asupra caracteristicilor unui singur element al colectivităţii studiate, de-a lungul axei timpului, la mai multe momente sau intervale de timp succesive. De cele mai multe ori, momentele sau intervalele de timp ale observării sunt echidistante şi pot fi reprezentate de: zile, săptămâni, luni, trimestre, ani. Date-le de tip panel, numite şi date longitudinale, reprezintă combinaţii sau mixturi ale datelor de tip profil şi de tip serii de timp. Datele de tip panel sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor mai multor elemente ale unei colec-tivităţi, la mai multe momente sau intervale succesive de timp.

Rezolvarea problemelor specifice demersului econometric, probleme legate de estimarea parametrilor modelelor, de testarea semnificaţiei unor elemente specifice ale modelelor sau de validarea calităţii modelelor, presupune existenţa unei baze informaţionale adecvate, care să conţină toate informaţiile necesare.

Baza informaţională utilizată în analiza econometrică are natura unui eşantion de observaţii şi este reprezentată de o mulţime de măsurători (observaţii) efectuate asupra caracteristicilor unor unităţi obsevaţionale extrase din colectivitatea investi-gată, pe baza unor principii riguroase de eşantionare. Din punct de vedere empiric, baza informaţională utilizată în econometrie este reprezentată de eşantionul de observaţii de volum T, eşantion care are următoarea structură generală:

Page 28: Econometrie Word 2 Iulie 2009 Ultim

Din punct de vedere teoretic, strict necesar pentru înţelegerea logicii modelării econometrice şi pentru fundamentarea procedurilor de construire a estimatorilor pentru parametrii modelelor econometrice, baza informaţională utilizată în econo-metrie este privită și într-un sens generalizant, ca eşantion aleator de volum T, eşantion care are următoarea structură generală:

unde cele T observaţii sunt presupuse a fi identic şi independent distribuite (iid), iar elementele sale sunt variabile aleatoare.

În cazul special al modelelor de regresie multiplă, eşantionul de observaţii şi eşantionul aleator sunt privite ca fiind structurate sub forma a câte două entităţi informaţionale distincte, respectiv vectorul de observaţii ale variabilei dependente Y şi matricea de observaţii ale variabilelor independente , adică:

Eşantion de observaţii: Eşantion aleator:

În cazul în care modelele de regresie includ un termen liber, matricea de obser-vaţii X este extinsă cu o coloană suplimentară, corespunzătoare unei variabile inde-pendente fictive, care are toate “observaţiile” egale cu unitatea, astfel încât formele pe care le capătă această matrice în contextul celor două accepţiuni ale eşantio-nului, sunt următoarele:

;

În afară de condiţia generală de reprezentativitate impusă pentru orice eşantion, în scopul asigurării unei semnificaţii cât mai ridicate a rezultatelor obţinute, este necesar ca volumul T al eşantionului de observaţii să fie suficient de mare. Din acest punct de vedere, o condiţie esenţială referitoare la eşantionului de observații este aceea ca volumul eşantionului să fie cel puţin egal cu numărul de parametri ai modelului de regresie, respectiv:

Page 29: Econometrie Word 2 Iulie 2009 Ultim

.

În cazul analizei regresiei liniare, îndeplinirea acestei condiţii asigură posibili-tatea estimării parametrilor, ea fiind asociată cu cerinţa ca matricea de observaţii X să aibă rangul n, astfel încât matricea , utilizată în definirea estimatorilor

pentru parametrii modelului, să fie o matrice inversabilă.Una dintre ipotezele importante ale modelării econometrice, este cea conform

căreia variabilele explicative , sunt variabile nestohastice, ceea ce în-

seamnă că numărul valorilor posibile ale acestor variabile este finit, iar respectivele valori sunt fixate şi cunoscute aprioric, astfel încât acestea joacă rolul unor mărimi care condiţionează (statistic) valorile variabilei dependente Y. În acest context, se consideră că există un număr finit de combinaţii ale valorilor variabilelor indepen-dente, iar pentru fiecare combinaţie dată, variabila dependentă poate lua o mulţime de valori posibile, mulţime care are natura suportului unei distribuţii de proba-bilitate. Această ipoteză este echivalentă cu presupunerea că valorile variabilelor explicative apar în mod repetat și identic în toate eşantioanele posibile de volum T, de la un eşantion la altul diferind doar valorile variabilei dependente.

În condiţiile introducerii ipotezei de condiţionare, adică a presupunerii că valo-rile variabilelor independente sunt fixate şi cunoscute aprioric, baza informaţională în sens generalizant este reprezentată de un eşantion aleator degenerat, de forma:

eşantion care poate fi reprezentat prin intermediul vectorului aleator Y şi matricii de constante X următoare:

În accepţiunea sa empirică, de eşantion de observaţii, baza informaţională disponibilă în analiza econometrică este utilizată în mod efectiv pentru estimarea parametrilor modelelor econometrice şi pentru estimarea reziduurilor acestor modele. În accepţiunea sa teoretică, de eşantion aleator, baza informaţională este utilizată pentru definirea estimatorilor parametrilor din modelele econometrice, pentru definirea și pentru verificarea proprietăţilor calitative ale estimatorilor şi pentru construirea testelor de semnificaţie.

§ 23.4 Analiza regresiei şi modelul de regresie

Page 30: Econometrie Word 2 Iulie 2009 Ultim

Descrierea formalizată a relaţiilor de cauzalitate de tip spaţial, adică a relaţiilor dintre un fenomen de tip efect şi o mulţime de fenomene de tip cauze, constituie obiectul unui tip specific de modelare econometrică, cunoscut sub numele de analiza regresiei.

Analiza regresiei are ca scop studierea naturii relaţiilor de cauzalitate care se manifestă între diferite fenomene sau procese, precum şi identificarea formei respectivelor relaţii, astfel încât aceste relații să poată fi reprezentate prin interme-diul unui model matematic, numit model de regresie.

Termenul de regresie a fost utilizat pentru prima dată în lucrările statistici-anului Francis Galton1, în contextul cercetărilor efectuate de acesta cu privire la legătura dintre înălţimea părinților şi înălţimea fiilor familiilor engleze. Ulterior termenul de regresie a fost utilizat în lucrările lui Karl Pearson2, care a fundamen-tat multe dintre instrumentele statistico-matematice utilizate în analiza de regresie.

Elementul fundamental al analizei de regresie îl reprezintă modelul de regre-sie, care este o structură funcţională complexă ce include: variabile, parametri, forme funcţionale, restricţii şi ipoteze.

Modelul de regresie reprezintă o descriere formalizată şi esenţializată, de tip statistico-matematic, a unei legături dintre un fenomen efect şi o mulţime de feno-mene de tip cauze. Un model de regresie poate fi privit ca o structură formală alcătuită din următoarele elemente:

• o variabilă aleatoare Y, care defineşte un fenomen de tip efect şi care se nu-meşte variabilă dependentă, rezultativă, explicată, endogenă, regresand, răspuns, criteriu sau efect;• o structură cauzală semnificativă şi observabilă, reprezentată de un ansamblu de n variabile, stohastice sau nestohastice, notate cu şi numite va-

riabile independente, cauzale, explicative, exogene, regresori, predictori, factori, covariaţii sau cauze;• o structură cauzală nesemnificativă şi neobservabilă, reprezentată de o varia-bilă aleatoare ɛ, numită perturbaţie sau termen eroare;• o structură parametrică, reprezentată de coeficienţii sau parametrii mode-lului, notaţi cu , ale căror valori sunt constante şi necunoscute;

• o formă funcţională, reprezentată de o funcţie reală f(.), de una sau mai multe variabile, liniară sau neliniară, care descrie legătura funcţională dintre variabila dependentă şi variabilele explicative şi care se numeşte funcţie de regresie;• un set de ipoteze statistice, referitoare la perturbaţia ε şi care asigură validi-tatea şi operaţionalitatea modelului de regresie.Forma cea mai generală a unui model de regresie multiplă, este următoarea:

(23.1)

1 Galton Francis (1822-1911), medic englez, autorul a numeroase studii de statistică, psihologie, antropologie etc.

2 Pearson Karl (1857-1936), statistician englez, profesor la King’s College din Londra, a avut numeroase şi importante contribuţii teoretice la dezvoltarea statisticii moderene.

Page 31: Econometrie Word 2 Iulie 2009 Ultim

Atât variabila dependentă Y, cât şi variabilele independente sunt

considerate a fi variabile aleatoare observabile, adică variabile ale căror realizări pot fi cunoscute pe calea observării directe, iar perturbaţia ε este o variabilă alea-toare neobservabilă, cu proprietăți distribuționale speciale.

În funcţie de numărul de variabile independente incluse în mode-

lul de regresie (23.1), acesta se numeşte model de regresie simplă, în cazul în care include o singură variabilă independentă, respectiv model de regresie multiplă, în cazul în care include două sau mai multe variabile independente.

De asemenea, în funcţie de forma pe care o are funcţia de regresie f(.), în raport cu parametrii , respectiv formă liniară sau formă neliniară, mo-

delul de regresie (23.1) se numeşte model de regresie liniar sau model de regresie neliniar.

Condiţionarea statistică şi analiza regresieiDeşi în general este accepată ideea că variabilele independente

sunt variabile stohastice, caz în care modelul de regresie are forma (23.1) și se numeşte model de regresie cu regresori stohastici, în cele mai multe dintre situaţii se presupune că aceste variabile au o natură deterministă, adică valorile acestora sunt presupuse a fi fixate și cunoscute aprioric. În acest fel, se introduce proprietatea de condiţionare statistică, care crează multiple posibilităţi de abordare şi de interpretare econometrică. În acest context, valorile variabilei dependente Y apar ca fiind condiţionate de valorile cunoscute ale variabilelor independente

, iar modelul (23.1) capătă forma:

(23.2)

formă cunoscută sub numele de model cu regresori nestohastici sau determinişti, unde şi  sunt versiunile con-

diţionate ale variabilei dependente Y şi perturbaţiei ε, pentru care valorile de con-diţionare sunt reprezentate de combinaţia de valori .

Page 32: Econometrie Word 2 Iulie 2009 Ultim

În cadrul figurii (23.2) este ilustrată interpretarea pe care o are media condi-ţionată în contextul analizei regresiei, pentru cazul particular al unei relaţii de tip liniar şi al existenţei unei singure variabile independente.

Deoarece baza informaţională disponibilă în analiza econometrică este presu-pusă a include un număr total de T observaţii, în care observațiile variabilelor independente au rolul de valori de condiţionare, există un număr de T versiuni condiţionate ale variabilelor aleatoare Y şi ε, de formele:

,

numite variabile dependente condiţionate, respectiv perturbaţii condiţionate. În această situaţie, se acceptă implicit ideea că funţia de regresie f(.) descrie media condiţionată a variabilei aleatoare Y, şi nu valorile individiale ale acesteia. Într-adevăr, presupunând că perturbaţia condiţionată 

are proprietatea că este de medie nulă, adică:

unde este operatorul de medie, şi având în vedere că primul termen din partea

dreaptă a modelului (23.2) este strict determinist, prin aplicarea operatorului de medie asupra celor doi membri ai modelului (23.2), vom obţine:

(23.3)

unde  este o constantă, care reprezintă media varia-

bilei dependente condiţionate , numită şi medie condiţio-

nată a variabilei dependente Y. Pe baza rezultatului anterior, modelul de regresie cu regresori nestohastici poate fi rescris sub forma:

Figura 23.2: Ilustrarea grafică a interpretării mediei condiţionate în analiza regresiei liniare simple

Page 33: Econometrie Word 2 Iulie 2009 Ultim

(23.4)

care evidenţiază atât faptul că funcţia de regresie descrie media condiţionată a variabilei dependente Y, cât şi faptul că perturbaţiile condiţionate descriu abaterile simple ale valorilor variabilei dependente condiţionate  ,

faţă de media acesteia, deoarece perturbația condiționată poate fi scrisă sub forma:

O altă consecinţă importantă şi utilă a introducerii ipotezei de condiţionare,

este aceea că variabilele dependente condiţionate  , au

distribuţiile de probabilitate de o formă identică cu cea a distribuţiilor de proba-bilitate ale perturbaţiilor condiţionate  . De exemplu, dacă

perturbaţia condiţionată  este distribuită după legea nor-

mală, de medie nulă şi varianţă constantă  , adică:

,

atunci și variabila dependentă condiţionată  este distri-

buită tot după legea normală, cu media şi varian-ţa 

, adică:

.

Aceasta înseamnă că orice ipoteză impusă asupra distribuţiilor de probabi-litate ale perturbaţiilor condiţionate este perfect echivalentă cu o ipoteză impusă asupra distribuţiilor de probabilitate ale variabilelor dependente condiţionate.

Relaţia (23.3) arată că media condiţionată a variabilei aleatoare Y este o funcţie de valorile variabilelor aleatoare , ceea ce înseamnă că dacă renunţăm

la presupunerea că valorile acestor variabile aleatoare sunt cunoscute, media condiţionată a variabilei aleatoare Y apare ca fiind o funcţie de variabilele aleatoare

, funcţie care în teoria probabilităţilor se numeşte regresie, adică ea

însăși este o variabilă aleatoare, de forma:

cu media şi varianţa date de relaţiile:

unde prima relaţie defineşte aşa-numita proprietate de iterativitate a mediei condi-ţionate, reprezintă media necondiţionată a variabilei aleatoare Y, iar notaţia

evidenţiază faptul că operaţia de mediere este definită în raport cu distribuţia

de probabilitate multidimensională a variabilelor aleatoare .

Page 34: Econometrie Word 2 Iulie 2009 Ultim

Având în vedere un rezultat fundamental al teoriei probabilităţilor, cunoscut sub numele de teorema de descompunere a varianţei totale, în conformitate cu care varianţa totală (necondiţionată) a unei variabile aleatoare Y, poate fi scrisă ca fiind suma dintre varianţa mediei condiţionate şi media varianţei condiţionate, respectiv:

, (23.5)

unde este o constantă numită varianță condiționată, care

reprezintă varianţa variabilei dependente condiționate Y, definită de relația:

Ca şi în cazul mediei condiţionate, varianţa condiţionată poate fi privită ca fiind o funcţie de variabilele aleatoare , de forma:

;

astfel încât și varianța condiționată are tot natură de variabilă aleatoare. În teoria probabilităților, varianța condiționată privită ca funcție de variabilele care condițio-nează, este numită funcţie scedastică.

Dacă variabilele aleatoare sunt distribuite după legea de proba-

bilitate normală (n+1)-dimensională, atunci media condiţionată a variabilei alea-toare Y este o funcţie liniară de variabilele aleatoare , respectiv:

funcţie a cărei reprezentare grafică se numeşte curbă de regresie. În aceeaşi situaţie, varianţa condiţionată (funcţia scedastică) este constantă, respectiv:

Proprietatea de constanţă a varianţei condiţionate, este cunoscută în econo-metrie sub numele de proprietate de homoscedasticitate.

Primul termen din descompunerea varianței (23.5) este o măsură a părţii din varianţa totală a variabilei aleatoare Y, care poate fi atribuită influenţei factorilor semnificativi , iar cel de-al doilea termen al descompunerii este o mă-

sură a părţii din varianţa totală a variabilei aleatoare Y, care care poate fi atribuită influenţei factorilor accidentali. Pe baza descompunerii (23.5), poate fi construită una dintre cele mai importante mărimi din econometrie, respectiv mărimea:

cunoscută sub numele de raport (coeficient) de determinaţie multiplă, care arată proporţia din varianţa variabilei aleatoare Y, care poate fi explicată prin intermediul influenţei factorilor semnificativi .

Rădăcina pătrată a raportului de determinaţie multiplă este cunoscută sub

numele de coeficient de corelaţie multiplă, care este o măsură a intensităţii legă-

Page 35: Econometrie Word 2 Iulie 2009 Ultim

turii dintre variabila aleatoare Y, pe de o parte, şi variabilele aleatoare ,

pe de altă parte, indiferent dacă respectiva legătură este de tip liniar sau neliniar.Având în vedere avantajele oferite de introducerea ipotezei de condiţionare

statistică, în cele ce urmează ne vom referi doar la modelele de regresie cu regre-sori determinişti, adică la modelele în care variabilele independente sunt considerate a fi de tip determinist.

Estimarea parametrilor modelului de regresieCea mai importantă şi cea mai dificilă problemă care se pune în legătură cu

modelul de regresie de forma:

(23.7)

care se numeşte model teoretic sau model al populaţiei statistice, este aceea a estimării parametrilor săi  .

Presupunând că forma funcţiei de regresie f(.) este cunoscută şi că baza infor-maţională disponibilă pentru estimarea parametrilor modelului este reprezentată de eşantionul aleator (degenerat) având forma următoare:

unde  , reprezintă variabilele dependente condiţionate, adică:

iar cele T linii ale matricii X definesc cele T niveluri de condiţionare pentru varia-bila dependentă Y. Similar, cele T perturbaţii condiţionate, corespunzătoare celor T niveluri de condiţionare reprezentate de valorile variabilelor , pot fi

notate sub forma:

iar modelul teoretic (23.7) poate fi scris la nivel de eșantion sub forma următoare:

În aceste condiţii, problema estimării parametrilor modelului de regresie teore-tic (23.7) constă în utilizarea datelor disponibile pentru obținerea unor aproximări cât mai bune pentru valorile necunoscute ale parametrilor , astfel

încât, pentru aceste aproximări, modelul să reproducă într-o măsură cât mai adecvată relaţia de cauzalitate evidenţiată la nivelul datelor existente.

Utilizând notaţiile definite anterior şi notând cu , valorile necu-

noscute ale parametrilor , putem defini o formă de selecţie a mode-

lului teoretic de regresie (23.7), reprezentată de modelul:

Page 36: Econometrie Word 2 Iulie 2009 Ultim

unde mărimile se numesc estimatori ai parametrilor   şi

au natură de variabile aleatoare, iar mărimile , sunt variabile alea-

toare numite reziduuri condiționate și au rolul de estimatori pentru perturbaţiile condiţionate din modelul teoretic.

Modelul (23.10) se numește model estimator al modelului teoretic (23.7) și are o importanță crucială în analiza de regresie.

În raport cu modelul estimator (23.10), problema estimării parametrilor mode-lului de regresie (23.7), constă utilizarea eşantionului de observaţii pentru determi-narea valorilor estimatorilor  , valori care se numesc estimaţii şi care

sunt notate cu astfel încât suma pătratelor reziduurilor să fie minimă.

În acest scop, estimatorii sunt definiţi ca soluţii ale următoarei proble-

me de minimizare:

,

unde funcţia:

,

se numeşte suma pătratelor abaterilor sau suma pătratelor reziduurilor. Concret, estimatorii parametrilor modelului de regresie (23.7) se determină ca soluţii ale sistemului de ecuaţii:

numit şi sistem de ecuaţii normale, ceea ce înseamnă că estimatorii parametrilor sunt funcţii de forma:

adică variabile aleatoare.Estimatorii determinaţi după metoda descrisă anterior se numesc estimatori de

cele mai mici pătrate sau estimatori OLS (Ordinary Least Square), iar metoda de estimare se numeşte metoda celor mai mici pătrate.

În cazul regresiei liniare şi cu condiţia ca toate ipotezele fundamentale ale modelului de regresie liniară să fie îndeplinite, estimatorii de cele mai mici pătrate au proprietatea că sunt nedeplasaţi, liniari şi consistenţi. În plus, dintre toţi esti-matorii parametrilor unui model de regresie liniară, care au proprietatea că sunt nedeplasaţi şi liniari, estimatorii de cele mai mici pătrate au varianţă minimă, adică sunt eficienți, motiv pentru care se mai numesc şi estimatori BLUE (Best Linear Unbiased Estimators).

Există şi alte metode de estimare a parametrilor modelelor de regresie, dintre care menţionăm: metoda verosimilităţii maxime, metoda momentelor şi metoda analizei Bayesiene. În general, metoda verosimilităţii maxime produce estimatori eficienţi, dar deplasaţi, iar metoda momentelor produce estimatori consistenţi.

Modelul de regresie liniară multiplă

Page 37: Econometrie Word 2 Iulie 2009 Ultim

Deşi cele mai multe relaţii dintre fenomenele economice reale sunt de natură neliniară, modelele econometrice utilizate cel mai frecvent pentru descrierea aces-tor legături sunt modelele de tip liniar, adică modelele pentru care funcția de regre-sie este liniară în raport cu parametrii.

Faptul că în cele mai multe aplicaţii econometrice, chiar în cele care au ca scop modelarea unor fenomene cu comportament neliniar, sunt preferate modelele liniare, este justificat, în principal, de existența dificultăţilor de natură teoretică şi numerică ce apar în cazul modelelor de tip neliniar.

Spre deosebire de modelele de tip neliniar, modelele liniare dispun de o serie de avantaje care fac utilizarea acestora simplă, comodă şi chiar eficientă, cum ar fi: pentru modelele de tip liniar există un suport teoretic complet şi foarte bine fundamentat din punct de vedere ştiinţific; algoritmii de estimare a modelelor de tip liniar sunt foarte simpli şi există numeroase implementări software ale acestora; pentru cazul liniar există numeroase teste de verificare a semnificaţiei rezultatelor obţinute; interpretarea rezultatelor utilizării modelelor de tip liniar este simplă şi naturală; în numeroase situaţii, aproximarea neliniarităţilor cu ajutorul modelelor liniare este suficient de satisfăcătoare.

Caracteristica principală a modelului de regresie liniară (cu regresori determi-nişti) constă în aceea că funcţia de regresie a modelului, privită însă în raport cu parametrii modelului de regresie, este o funcţie liniară, respectiv o funcție de forma următoare:

,

unde parametrul reprezintă termenul liber sau interceptul modelului de regresie.

În aceste condiţii, modelul teoretic de regresie liniară (cu regresori determinişti) are următoarea formă generală:

.

Reprezentarea grafică a funcţiei de regresie din acest model de regresie liniară se numeşte dreaptă de regresie a populației sau dreaptă de regresie teoretică.

În raport cu eşantionul aleator (degenerat) reprezentat de relaţiile (23.8), mode-lul teoretic de regresie liniară are forma următoare:

(23.11)

unde reprezentă forma condiţionată a variabilei dependente Y, iar reprezintă

forma condiţionată a variabilei perturbaţie , forme corespunzătoare celui de-al t-

lea nivel de condiţionare , iar modelul estimator al modelului de

regresie liniară (23.11) are forma următoare:

unde  reprezintă estimatorii parametrilor , iar repre-

zintă reziduul condiționat, corespunzătoar celui de-al t-lea nivel de condiţionare al variabilelor independente.

Page 38: Econometrie Word 2 Iulie 2009 Ultim

Ideea legăturii dintre modelul teoretic de regresie (al populaţiei) şi modelul estimator (al eşantionului) al acestuia, este ilustrată în cadrul figurii (23.3), pentru cazul particular al unui model de regresie liniară simplă, care include o singură variabilă independentă.

P r o p r i e t a t e a c o n f o r m c ă r e i a , s u b i p o t e z a d e m e d i e n u l ă a p e r t u r b a ţ i e i

,

funcţia de regresie este o funcţie liniară, este echivalentă cu presupunerea că variabila dependentă și variabilele independente sunt distribuite (simultan) după legea nor-mală multidimensională.

Dacă vom face notaţiile următoare:

atunci modelul teoretic de regresie liniară multiplă şi modelul estimator al acestuia, pot fi scrise sub formele matriciale următoare:

Pe baza modelului estimator și utilizând metoda celor mai mici pătrate, esti-matorii pentru parametrii modelului de regresie liniară multiplă, în măsura în care aceştia există, sunt definiţi de relaţia:

Ca variabile aleatoare, estimatorii de cele mai mici pătrate au mediile egale cu valorile parametrilor pe care îi aproximează, adică:

Figura 23.3: Ilustrarea grafică a legăturii dintre modelul teoretic şi modelul estimator

Page 39: Econometrie Word 2 Iulie 2009 Ultim

şi matricea de covarianţă definită de relaţia:

unde  reprezintă varianţa, constantă şi identică, a perturbaţiilor condiţionate. Mai

mult decât atât, dacă perturbaţiile condiţionate sunt distribuite după legea normală, atunci şi estimatorii parametrilor sunt distribuiţi după legea normală (n+1)-dimen-sională, respectiv:

Proprietatea de normalitate a estimatorilor este foarte utilă pentru construirea şi utilizarea statisticilor t şi F, în scopul testării semnificaţiei statistice a parametrior modelului de regresie liniară multiplă. Pe această bază, pot fi construite intervale de încredere pentru parametrii modelului econometric. Astfel, intervalul de încre-dere pentru cel de-al i-lea parametru al modelului de regresie liniară multiplă, este de forma:

unde reprezintă estimatorul pentru abaterea standard a estimatorului  , respec-

tiv rădăcina pătrată a celui de-al i-lea element de pe diagonala principală a matricii

estimator pentru matricea , reprezintă cuantila de ordinul 1 a

distribuţiei Student, corespunzătoare unui număr de T-n-1 grade de libertate, iar 

reprezintă probabilitatea cu care se garantează apartenenţa la respectivul

interval de încredere.Proprietatea de normalitate a estimatorilor este foarte utilă pentru construirea

şi utilizarea statisticilor t şi F, în scopul testării semnificaţiei statistice a parame-trior modelului de regresie liniară multiplă. În condiţiile în care această proprietate este verificată, se poate arăta că statistica:

este repartizată după legea Student, cu T-n-1 grade de libertate, respectiv:

Pe baza statisticii  , evaluată în raport cu estimaţiile și , este testată o

ipoteză nulă de forma:,

referitoare la semnificaţia statistică a parametrului  . Procedura de testare bazată

pe testul t-Student, constă în următoarele: se stabileşte un prag de semnificaţie   ,

de regulă egal cu 0,05 sau 0,01; se evaluează mărimea:

Page 40: Econometrie Word 2 Iulie 2009 Ultim

numită şi valoare calculată a testului t; se compară valoarea calculată  cu

cuantila de ordinul a distribuţiei Student, corespunzătoare unui număr de T-

n-1 grade de libertate, notată .

În situaţia în care  , se respinge ipoteza nulă , acceptân-

du-se ideea că parametrul diferă semnificativ de 0, ceea ce echivalează cu ideea

că variabila independentă poate fi considerată a având o influenţă semnificativă

asupra variabilei dependente Y. În cazul contrar, în care  , se

acceptă ipoteza nulă , adică ideea că parametrul nu diferă semnificativ de 0.

În această situaţie, variabila independentă poate fi considerată ca fiind nesemni-

ficativă şi trebuie să se procedeze la o respecificare a modelului econometric, astfel încât acesta să nu mai includă variabila independentă 

Cel de-al doilea test de semnificaţie, cunoscut sub numele de testul F-Fisher, este utilizat pentru testarea simultană a semnificaţiei statistice a tuturor para-metrilor modelului de regresie liniară multiplă, cu excepţia parametrului intercept  

, respectiv pentru testarea unei ipoteze nule de forma:

Logica testului F se bazează pe rezultatul furnizat de teorema de descompnere a varianţei. În condiţiile în care funcţia de regresie descrie media condiţionată şi în care este verificată ipoteza de homoscedasticitate a perturbaţiilor condiţionate, res-

pectiv ipoteza conform căreia , rezultatul (23.5) al acestei teoreme

poate fi scris sub forma relaţiei:

Considerând estimatorii pentru cele trei elemente ale acestei descompuneri, vom obţine următoarea relaţie estimator a descompunerii varianţei:

unde , şi  reprezintă estimatorii pentru varianţa variabilei

aleatoare Y, varianţa mediei condiţionate  , respectiv varianţa

perturbaţiilor condiţionate, estimatori definiţi de relaţiile:

;

Page 41: Econometrie Word 2 Iulie 2009 Ultim

unde este variabila aleatoare definită de relația:

Pe baza acestor estimatori, relaţia estimator a descompunerii varianţei poate fi rescrisă sub forma:

,

cunoscută sub numele de relaţie de descompunere a sumei pătratelor abaterilor.Termenul din primul membru al acestei relaţii se numeşte suma totală a pătra-

telor abaterilor (SPT), iar cei doi termeni din cel de-al doilea membru se numesc suma pătratelor abaterilor explicate de regresie (SPE), respectiv suma pătratelor abaterilor reziduale sau neexplicate de regresie (SPR), astfel încât putem scrie:

Relaţia estimator a descompunerii varianţei totale a variabilei dependente Y poate fi utilizată şi pentru construirea unui estimator al raportului de determinaţie

multiplă , pe baza relaţiei:

Estimatorul pentru raportul de determinaţie multiplă poate fi construit şi pe

baza relaţiei de descompunere a sumei totale a pătratelor abaterilor, sub forma:

Valoarea raportului de determinaţie multiplă  este cu atât mai mare, cu cât

suma pătratelor abaterilor explicate de regresie este mai mare, respectiv suma pătratelor abaterilor reziduale mai mică. Din acest motiv, un model econometric poate fi considerat a fi cu atât mai bun, cu cât valoarea raportului de determinaţie

multiplă , va fi mai apropiată de 1. Se poate arăta că, în condiţiile în care ipoteza

nulă  este adevărată, statistica:

este repartizată după legea de probabilitate Fisher, cu un număr de n, respectiv T-n-1 grade de libertate, adică:

Procedura de testare bazată pe testul F-Fisher, constă în următoarele: se stabi-leşte un prag de semnificaţie , de regulă egal cu 0,05 sau 0,01; pe baza modelului

estimat şi a datelor existente, se evaluează mărimea:

Page 42: Econometrie Word 2 Iulie 2009 Ultim

numită şi valoare calculată a testului F, unde:

;

se compară valoarea calculată cu cuantila de ordinul  a distribuţiei

Fisher, corespunzătoare unui număr de n, respectiv T-n-1 grade de libertate, notată

cu  . În situaţia în care , se respinge ipote-

za nulă  , acceptându-se ideea că cel puţin unul dintre parametrii

diferă semnificativ de 0. În cazul contrar, în care  , se

acceptă ipoteza nulă , adică ideea că niciunul dintre parametrii  nu

diferă semnificativ de 0, fiind necesară respecificarea modelului econometric. Deoarece X este o matrice de constante, iar Y este vectorul formelor condi-ţionate ale variabilei aleatoare Y, elementele vectorului estimator b, respectiv esti-matorii , au natură de variabile aleatoare, definite sub forma unor com-

binaţii liniare de variabilele dependente condiţionate .

Estimaţiile pentru parametrii modelului de regresie sunt obţinute prin evalua-rea estimatorului b, în raport cu observaţiile disponibile pentru variabila depen-dentă Y, respectiv:

(23.13)

unde  .

Construcţia modelului de regresie liniară multiplă, se bazează pe o serie de ipoteze privind mecanismul aleator care generează datele, numite ipoteze funda-mentale ale modelului de regresie liniară. Impunerea acestor ipoteze vizează două lucruri foarte importante: asigurarea posibilităţii de estimare a parametrilor mode-lului, pe baza datelor existente, respectiv asigurarea contextului necesar pentru con-struirea unor teste de semnificaţie pentru mărimile care intervin în model.

Ipotezele fundamentale ale modelului de regresie liniară multiplă, în varianta sa generală, în care include termen liber şi regresori stohastici, sunt următoarele:

a. perturbaţiile condiţionate εt au mediile nule, respectiv:;

b. perturbaţiile condiţionate εt sunt homoscedastice, adică au varianţă cons-tantă, respectiv:

;

c. perturbaţiile condiţionate εt sunt necorelate două câte două (necorelare serială), respectiv:

;

d. perturbaţiile condiţionate εt sunt distribuite după legea normală, respectiv:

;

Page 43: Econometrie Word 2 Iulie 2009 Ultim

e. perturbaţiile condiţionate εt sunt necorelate cu regresorii propriu-ziși, respectiv:

;

f. matricea de observaţii X are rang complet, respectiv:

;

g. atunci când volumul eşantionului creşte nelimitat, matricea   tinde

către o matrice finită şi nesingulară, respectiv:

. Îndeplinirea ipotezelor fundamentale ale modelului de regresie liniară multiplă este importantă din punct de vedere al asigurării existenţei estimatorilor, cum este cazul ipotezei (vi), al obţinerii de estimatori cu proprietăţi calitative adecvate, cum este cazul ipotezelor (i), (ii), (iii), (v) şi (vii) și al creării posibilității de construire a unor teste de semnificaţie (testul t sau testul F) , cum este cazul ipotezei (iv), referitoare la normalitatea perturbaţiilor condiţionate.

Deoarece verificarea îndeplinirii celor mai multe dintre ipotezele fundamentale ale modelului de regresie liniară se bazează pe reziduurile estimate, definite vecto-rial de relaţia:

această verificare poate fi făcută numai după ce modelul a fost estimat.Pentru verificarea îndeplinirii ipotezelor fundamentale ale modelului de regre-

sie multiplă sunt utilizate o serie de proceduri şi teste, cum ar fi testele Goldfeld-Quandt, Gleisjer şi White, pentru verificarea îndeplinirii ipotezei de homosce-dasticitate a pertubaţiilor condiţionate, testele Durbin-Watson şi Breusch-Godfrey, pentru verificarea îndeplinirii ipotezei de necorelare a pertubaţiilor condiţionate, testele Klein şi Farrar-Glauber pentru verificarea absenţei fenomenului de multi-coliniaritate etc.

O procedură generalizată de definire a estimatorilor, în situaţia în care per-turbaţiile condiţionate se dovedesc a nu verifica ipotezele de homoscedasticitate şi de necorelare serială, adică ipotezele (ii) şi (iii), este cea cunoscută sub numele de metoda celor mai mici pătrate generalizate. Estimatorii obţinuţi prin intermediul acestei metode, numiţi şi estimatori Aitken, sunt definiţi de relaţia:

iar matricea de covarianță a acestora este definită de relația:

unde  este matricea de covarianţă a perturbaţiilor condiţionate, care se estimează

pe baza reziduurilor estimate, utilizând proceduri speciale.În toate cazurile în care una dintre ipoteze nu este îndeplinită, este necesar să

se facă o serie de corecţii asupra modelului de regresie, cu ajutorul unor proceduri

Page 44: Econometrie Word 2 Iulie 2009 Ultim

de corecţie specifice, astfel încât în urma aplicării acestor corecţii, să se asigure îndeplinirea tuturor ipotezelor.

După ce modelul de regresie liniară multiplă a fost estimat şi testat din punct de vedere al îndeplinirii ipotezelor fundamentale ale acestuia, urmează etapa de verificare a calităţii modelului. Aprecierea calităţii unui model de regresie se referă la acurateţea cu care acesta descrie relaţia de cauzalitate, aşa cum este ea reflectată la nivelul datelor utilizate pentru estimarea modelului. În acest scop, sunt utilizaţi o serie de indicatori statistici, dintre care menţionăm: statisticile t şi F, raportul de determinaţie R2, statisticile Akaike şi Schwarz etc.

Dacă în urma verificării calităţii sale, modelul econometric se dovedeşte a nu îndeplini criteriile minime necesare calificării sale ca model valid, este necesar ca întregul demers econometric să fie reluat, de la început, cu specificarea unei alte forme a acestuia. Procesul de respecificare a modelului este reluat succesiv, până când se ajunge la o formă a modelului care, după estimare şi verificarea îndeplinirii ipotezelor, se dovedeşte a îndeplini şi criteriile de calitate minimale.

Predicţia cu ajutorul modelului de regresieDupă ce modelul econometric a fost identificat, estimat şi validat, el poate fi

utilizat pentru efectuarea de predicţii privind manifestarea comportamentului feno-menului efect, în alte condiţii decât cele reprezentate de valorile pe care le au variabilele independente la nivelul eşantionului de observaţii.

În condiţiile în care o variabilă aleatoare Y este privită într-un context unidi-mensional, reprezentat de distribuţia sa marginală, cea mai bună predicţie pentru valorile acestei variabile aleatoare, predicţie pe care o vom nota cu , este repre-

zentată de media respectivei variabile aleatoare, adică:

Într-un context informaţional mai bogat, reprezentat de distribuţia multi-dimensională (simultană) a variabilelor aleatoare şi în condiţiile în

care se presupune că se cunosc valorile variabilelor aleatoare , cea mai

bună predicţie pentru valorile variabilei aleatoare Y, este reprezentată de media condiţionată a respectivei variabile aleatoare, dându-se valorile variabilelor alea-toare  , adică:

Într-adevăr, se poate arăta că predicţia bazată pe media condiţionată are o serie de proprietăţi aproximante mai bune pentru valorile necunoscute ale variabilei predictate Y, cum ar fi proprietatea de eroare medie pătratică minimă.

În cadrul specific al econometriei, problema predicţiei comportamentului variabilei dependente Y, poate fi formulată sub forma următoare: presupunând că se dispune de o informaţie suplimentară privind valorile celor n variabile indepen-

dente , informaţie reprezentată de valorile cunoscute

, care se numesc şi valori de predicţie şi care diferă de valorile din rândurile

Page 45: Econometrie Word 2 Iulie 2009 Ultim

matricii de observaţii , se cere să se determine o aproximaţie  pentru

valoarea corespunzătoare a variabilei dependente Y, aproximare numită valoare predictată.

Dacă vom presupune că relaţia dintre variabila dependentă Y şi variabilele independente este descrisă de modelul teoretic:

atunci mulţimea de valori pe care le poate lua variabila aleatoare Y, dându-se valo-

rile de predicţie , poate fi privită ca fiind mulţimea valori-

lor variabilei condiţionate , al cărei comportament este descris de relaţia:

Am arătat anterior că, în condiţiile ipotezei de medie nulă a perturbaţiilor condiţionate , funcţia de regresie (teoretică) descrie chiar

media condiţionată, ceea ce înseamnă că, din punct de vedere teoretic, valorile necunoscute ale variabilei condiţionate pot fi aproximate cu ajutorul relaţiei:

Tot din punct de vedere teoretic, variabila aleatoare condiționată definită de diferenţa:

descrie eroarea acestei aproximări. În condiţiile îndeplinirii ipotezelor de medie nulă şi de homoscedasticitate, perturbaţia condiţionată este o variabilă alea-

toare, cu media şi varianţa date de relaţiile:

Din nefericire însă, deoarece parametrii sunt mărimi necunos-

cute, mărimea  nu poate fi calculată în mod efectiv, astfel încât această mări-

me nu poate fi utilizată pentru predictarea valorilor variabilei condiţionate .

O modalitate efectivă de predictare a valorilor variabilei condiţionate , pe

baza mediei condiţionate, poate fi definită pornind de la forma modelului estima-tor, în conformitate cu care valorile variabilei condiţionate , corespunzătoare

valorilor de predicţie , sunt descrise de relaţia:

În acest context, predicţia pentru valorile variabilei condiţionate  , capătă

natura unei variabile aleatoare numită predicție și definită de relaţia:

Variabila predicţie apare ca având natura unui estimator pentru valorile

variabilei condiţionate  , iar diferenţa:

Page 46: Econometrie Word 2 Iulie 2009 Ultim

care reprezintă tot o variabilă aleatoare, se numeşte eroare de predicţie. În calitatea sa de reziduu, eroarea de predicţie  are media nulă, respectiv , de

unde rezultă că:

Această proprietate evidenţiază faptul că, pe medie, predicţia bazată pe media condiţionată este exactă, respectiv că această predicţie este nedeplasată. De aseme-nea, în condiţiile în care estimatorii sunt obținuți cu ajutorul metodei

celor mai mici pătrate, varianţa erorii de predicţie  este definită de relația:

măsoară gradul de “imprecizie” al predicţiei bazate pe media condiţionată și are proprietatea că este minimală.

Prin evaluarea variabilei predicţie  , în raport cu estimaţiile parametrilor

, se obţine valoarea predictată a variabilei condiţionate, respectiv

valoarea definită de relația:

În cazul modelului de regresie liniară multiplă, variabila predicţie şi va-

loarea predictată sunt definite de relaţiile:

,

iar eroarea de predicţie este definită de relaţia:

unde  este vectorul valorilor de predicţie. Ca

urmare a faptului că:

media şi varianţa erorii de predicţie sunt următoarele:

Mai mult decât atât, dacă perturbaţiile condiţionate ,

sunt repartizate după legea normală, de medie nulă şi varianţă constantă , atunci

și eroarea de predicție este repartizată tot după legea normală, respectiv:

Pe această bază, pot fi construite intervale de încredere pentru valorile varia-bilei predictate  , intervale care sunt de forma:

Page 47: Econometrie Word 2 Iulie 2009 Ultim

unde reprezintă cuantila de ordinul a distribuţiei Student, cores-

punzătoare unui număr de T-n-1 grade de libertate, iar reprezintă proba-

bilitatea cu care se garantează apartenenţa valorilor variabilei la respectivul

interval de încredere.

§ 23.5 Analiza seriilor de timp

Analiza seriilor de timp este un alt capitol important al econometriei, care are ca scop descrierea relaţiilor cauzale temporale dintre fenomenele economice. De-mersul econometric întreprins în scopul descrierii relaţiilor cauzale temporale este un demers complex şi dificil, care presupune parcurgerea mai multor etape.

Cea mai importantă şi consistentă modalitate de abordare în analiza seriilor de timp este cea cunoscută sub numele de metodologia Box şi Jenkins. Conform aces-tei metodologii, procesul econometric de analiză a seriilor de timp poate fi sinte-tizat prin intermediul parcurgerii următoarelor etape: analiza grafică a seriei de timp şi a autocorelogramelor acesteia; analiza sezonalităţii şi desezonalizarea seriei de timp, în situaţia în care aceasta evidenţiază influenţe sezoniere, cu ajutorul unor filtre de desezonalizare adecvate; verificarea staţionarităţii seriei de timp, cu ajutorul testelor de tip ‘unit root’; staţionarizarea seriei de timp, în cazul în care aceasta se dovedeşte a fi nestaţionară, utilizând metode adecvate de staţionarizare, în funcţie de natura nestaţionarităţii; alegerea modelului adecvat pentru seria de timp staţionarizată, precum şi a ordinului de întârziere corespunzător, pe baza analizei autocorelogramelor (simplă şi parţială) şi pe baza unor statistici speciale, cum ar fi statisticile Akaike şi Schwarz; estimarea parametrilor modelului ales; verificarea îndeplinirii ipotezelor fundamentale şi validarea modelului, cu ajutorul unor teste statistice şi unor indicatori de calitate adecvaţi; utilizarea modelului pentru efectuarea de predicţii.

Baza informaţională pentru modelarea econometrică din acest domeniu, este reprezentată de datele de tip cronologic, numite serii de timp, obţinute din obser-varea evoluţiei în timp a fenomenelor economice. În general, datele de tip serii de timp reprezintă mulţimi de valori reale, de forma:

numite serii de timp unidimensionale, unde indicii  indexează momen-

te sau intervale de timp şi verifică relaţia . De cele mai multe ori,

în special în domeniul economic, aceşti indici sunt consideraţi a reprezenta numere naturale, respectiv , astfel încât seria de timp precedentă

Page 48: Econometrie Word 2 Iulie 2009 Ultim

poate fi reprezentată sub forma . În situaţia în care datele au o

structură vectorială, formată din două sau mai multe serii de timp unidimensionale, de forma:

respectiva structură vectorială se numeşte serie de timp multidimensională. Valori-le numerice , specifice seriei unidimensionale, respectiv valorile nu-

merice speci-

fice seriei multidimensionale, pot fi privite ca descriind stările unui fenomen sau unor fenomene economice la diferite momente succesive de timp şi pot fi con-siderate ca fiind un eşantion special de observaţii, pentru care modelul de selecţie este reprezentat tot de o listă de variabile aleatoare de forma: sau

, în funcţie de

tipul seriei de timp, dar a cărui natură este fundamental deosebită accepţiunea clasică dată eşantionului de observaţii.

În accepţiunea clasică a modelului de selecţie, cunoscută sub numele de eşan-tion aleator şi specifică mai ales regresiei, variabilele aleatoare din

modelul de selecţie, sunt presupuse a fi identic şi independent distribuite. În cazul econometriei seriilor de timp, variabilele din modelul de selecţie  nu

mai pot fi considerate nici independente şi, de cele mai multe ori, nici identic distribuite, motiv pentru care lista de variabile aleatoare , se mai

numeşte şi eşantion non-aleator.În numeroase situaţii, în analiza seriilor de timp se consideră că starea unui

fenomen la un moment dat t, simbolizată prin intermediul variabilei aleatoare , este influenţată de stările anterioare ale aceluiaşi fenomen, simbolizate prin

intermediul variabilelor aleatoare  , astfel încât variabilele din

modelul de selecţie apar ca fiind strict dependente. De fapt, proprie-

tatea de dependenţă a acestor variabile aleatoare este tocmai cea care oferă posibi-litatea modelării comportamentului pe care îl au în timp fenomenele economice. Pe baza acestei proprietăţi, comportamentul în timp al fenomenului Y poate fi descris, de exemplu, cu ajutorul unui model de forma:

În ceea ce priveşte proprietatea de non-identic distribuire a variabilelor alea-toare din modelul de selecţie specific analizei seriilor de timp, această proprietate se referă la faptul că, cel puţin în principiu, fiecare variabilă aleatoare are

propria sa lege de probabilitate, adică:

Page 49: Econometrie Word 2 Iulie 2009 Ultim

unde atât forma f a legii de probabilitate, cât şi valorile parametrilor acestei legi, depind de indicele t, care indexează timpul.

Proprietatea de non-identic distribuire a variabilelor aleatoare  ,

ridică o serie de dificultăţi, teoretice şi practice, în domeniul modelării seriilor de timp. În scopul atenuării sau eliminării acestor dificultăţi, apare necesitatea de a impune o serie de restricţii asupra distribuţiilor de probabilitate ale variabilelor aleatoare , cele mai multe dintre aceste restricţii fiind asociate cu con-

ceptul de staţionaritate.Seria de timp reprezentată generic prin intermediul listei de variabile aleatoare

, poate fi privită ca fiind o subsecvenţă compactă şi reindexată,

dintr-o listă infinită de variabile aleatoare, de forma:

listă cunoscută sub numele generic de proces stohastic (discret). În acest fel, seria de timp apare ca fiind o sub-secvenţă continuă şi observabilă a unui proces sto-hastic, motiv pentru care baza teoretică a modelării seriilor de timp este reprezen-tată de teoria proceselor stohastice.

Procese stohastice: definire, indicatori şi tipuriProcesele stohastice sau procesele aleatoare sunt construcţii statistice specia-

le, reprezentate de mulţimi de variabile aleatoare, indexate cu indici reprezentând momente sau intervale de timp. Pe baza conceptului de proces stohastic, pot fi construite modele matematice adecvate pentru descrierea stărilor şi evoluţiilor celor mai variate şi mai complexe fenomene din economie. Din acest punct de vedere, procesul stohastic poate fi considerat ca reprezentând modelul cel mai general pentru clase foarte variate de fenomene din economie, cum ar fi: produsul intern brut, rata inflaţiei, rata şomajului, cursul de schimb al monedelor, cotaţiile bursiere zilnice ale unui titlu de valoare etc.

Conceptul matematic de proces stohastic datează din perioada anilor 1930, cu toate că o serie de elemente care ţin de logica proceselor stohastice au fost utilizate şi anterior pentru modelarea unor fenomene cu caracter stohastic.

Înainte de anii 1930, cele mai multe utilizări ale conceptelor stohastice au fost mai ales în domeniul modelelor din fizică. În ceea ce priveşte domeniul economic, prima utilizare a conceptelor stohastice datează din anul 1900, când francezul Bachelier a încercat să modeleze comportamentul preţurilor acţiunilor tranzacţio-nate la bursa din Paris.

Considerând un câmp de probabilitate , o mulţime de variabile

aleatoare reale, definite pe mulţimea evenimentelor elementare , precum şi o mulţime T, numită mulţime de parametri sau mulţime de indici, se numeşte proces stohastic, cu mulţimea de parametri T, orice aplicaţie de forma:

În modelarea fenomenelor reale, mulţimea de parametri T reprezintă timpul, iar variabilele aleatoare din mulţimea  descriu stările unui sistem dinamic sau

Page 50: Econometrie Word 2 Iulie 2009 Ultim

evolutiv la diferite momente de timp , stări notate sub forma

, în cazul continuu, sau sub forma  , în cazul discret. Aceasta

înseamnă că stările unui sistem dinamic, la diferite momente de timp, sunt presu-puse a nu fi perfect determinate, ci a avea o natură aleatoare. În cadrul figurii următoare, este ilustrată grafic ideea asocierii dintre evoluţia în timp a unui fenomen economic şi conceptul de proces stohastic.

M u l ţ i m e a d e p a r a m e t r i

reprezentată de intervale ale dreptei reale ℝ, sau o mulţime numărabilă de valori de tip discret, cum ar fi mulţimea numerelor întregi

, sau mulţimea numerelor naturale

. În cazul în care mulţimea T este de tip continuu, procesul

stohastic se numeşte proces stohastic continuu şi se notează cu , iar în cazul în

care mulţimea T este de tip discret, procesul sto-hastic se numeşte proces stohastic

discret sau lanţ stohastic şi se notează cu . Prin natura lor, seriile de timp din

domeniul economic sunt asociate cu procesele stohastice de tip discret, astfel că în cele ce urmează ne vom referi doar la această clasă de procese stohastice.

Ca mulţime de variabile aleatoare, un proces stohastic poate fi caracterizat printr-o mulţime de indicatori numerici specifici, reprezentaţi de momentele varia-bilelor aleatoare care îl compun, momente cum ar fi: media, varianţa, covarianţa și corelaţia. Cea mai importantă caracteristică numerică a unui proces stohastic este reprezentată de speranţa matematică sau de media procesului stohastic. Fiind dat procesul stohastic , se numeşte medie sau speranţă matematică funcţia:

Figura 23.4: Ilustrarea naturii stohastice a evoluţiei unui fenomen economic

Page 51: Econometrie Word 2 Iulie 2009 Ultim

unde  reprezintă densitatea de probabilitate a variabilei aleatoare .

O altă caracteristică numerică importantă a unui proces stohastic este repre-zentată de varianţă, definită de funcţia:

Cea de-a treia caracteristică numerică importantă a unui proces stohastic este reprezentată de covarianţă sau autocovarianţă, definită de funcţia:

numită şi funcţie de autocovarianţă, unde reprezintă densitatea de pro-

babilitate bidimensională a variabilelor aleatoare şi . După cum se poate

observa, pentru , covarianţa procesului stohastic coincide cu varianţa sa, res-

pectiv  .

Din punct de vedere al modelării econometrice, cea mai importantă caracte-ristică numerică a unui proces stohastic este reprezentată de corelaţie sau auto-corelaţie, definită de funcţia:

unde diferenţa de indici , se numeşte ordin al corelaţiei sau autocorelaţiei.

În multe situaţii, funcţia de corelaţie a unui proces stohastic, mai este numită şi funcţie de autocorelaţie a procesului stohastic.

Din felul în care sunt definite, rezultă că funcţia de autocovarianţă şi funcţia de autocorelaţie sunt funcţii simetrice, respectiv:

În funcţie de deosebirile care pot exista între distribuţiile de probabilitate ale variabilelor aleatoare care compun un proces stohastic, acesta din urmă poate fi de două feluri: staţionar şi nestaţionar.

Procesul stohastic se numeşte strict (tare) staţionar, dacă distribuţiile

de probabilitate n-dimensionale ale oricărui n-uplu de variabile aleatoare , sunt invariante la orice translatare a indicilor , adică dacă:

.

unde  reprezintă densitatea de probabilitate n-dimensională.

În analiza econometrică a seriilor de timp, proprietatea de staţionaritate strictă a proceselor stohastice este considerată a fi prea restrictivă în raport cu scopurile concrete ale modelării din acest domeniu, astfel încât este utilizată o proprietate de

Page 52: Econometrie Word 2 Iulie 2009 Ultim

-12

-8

-4

0

4

8

12

10 20 30 40 50 60 70 80 90 100

staţionaritate mai slabă, numită staţionaritate slabăsau de ordinul II. Procesul sto-hastic se numeşte slab staţionar, staţionar în sens larg, staţionar de

ordinul II sau staţionar în covarianţă, dacă ele verifică următoarele condiţii:

Cu alte cuvinte, procesul stohastic se numeşte slab staţionar, dacă

media şi varianţa acestuia sunt constante, iar covarianţa nu depinde de indicii t şi t’, ci doar de diferenţa . Un proces stohastic care nu este staţionar de ordinul II,

deci nici strict staţionar, se numeşte proces stohastic nestaţionar.Cel mai important proces stohastic de tip staţionar (de ordinul II), este

reprezentat de procesul numit ‘zgomot alb’ (white noise). Procesul stohastic

, se numeşte ‘zgomot alb’ dacă variabilele aleatoare care îl compun sunt

identic distribuite şi verifică următoarele trei condiţii:

După cum se poate observa, procesul de tip ‘zgomot alb” verifică cele trei condiţii de slabă staţionaritate. Mai mult decât atât, el are covarianţele, şi deci şi corelaţiile, nule, motiv pentru care se mai numeşte şi proces fără memorie.

O variantă importantă a procesului aleator de tip ‘zgomot alb’ este cea cunos-cută sub numele proces Gaussian. Procesul stohastic , se numeşte proces

Gaussian, dacă el este un proces de tip ‘zgomot alb’ şi, în plus, variabilele care îl compun sunt repartizate după legea normală, respectiv:

În cadrul figurii următoare, sunt reprezentate 100 de observaţii, efectuate asupra unui proces stohastic staţionar, de tip ‘zgomot alb’.

Ca

urmare a faptului că nu sunt autocorelate, procesele de tip ‘zgomot alb’ se mai numesc

Page 53: Econometrie Word 2 Iulie 2009 Ultim

0

10

20

30

40

50

60

70

10 20 30 40 50 60 70 80 90 100

procese non-informative şi nu fac obiectul modelării econometrice. Acest tip de procese stohastice, este specific evoluţiilor din pieţele de capitaluri, în condiţiile în care aceste pieţe au proprietatea cunoscută sub numele de eficienţă informaţională perfectă.

Pentru a verifica dacă un anumit proces stohastic staţionar, are natură de ‘zgo-mot alb’, sunt utilizate o serie de teste statistice, care vizează testarea semnifica-ţiilor coeficienţilor de autocorelaţie de diferite ordine. Cele mai importante dintre aceste teste sunt cele bazate pe statisticile Q ale lui Ljung-Box și Box-Pierce.

Cel mai important proces stohastic de tip nestaţionar, este reprezentat de pro-cesul numit ‘mers aleator’ sau ‘mers la întâmplare’ (random walk). Procesul stohastic , se numeşte ‘mers aleator simplu’, dacă variabilele aleatoare

care îl compun sunt legate între ele prin relaţia de recurenţă:

respectiv ‘mers aleator cu derivă’, dacă variabilele aleatoare care îl compun sunt legate între ele prin relaţia de recurenţă:

unde  defineşte un proces aleator de tip ‘zgomot alb’, iar c este o constantă.

Se poate arăta că media procesului de tip ‘mers aleator simplu’ este constantă, deci nu depinde de timp, însă varianţa acestuia depinde de timp, respectiv:

Procesele stohastice de tip ‘mers aleator’ se mai numesc şi procese cu ‘rădă-cină unitate’ (‘unit root’) sau procese cu trend de tip stohastic. În cadrul figurii următoare, sunt reprezentate 100 de observaţii, efectuate asupra unui proces stohas-tic nestaţionar, de tip ‘mers aleator simplu’.

Figura 23.5: Reprezentarea grafică a observaţiilor unui proces stohastic de tip ‘zgomot alb’

Page 54: Econometrie Word 2 Iulie 2009 Ultim

Împărţirea proceselor stohastice pe cele două categorii, staţionare (slab) şi nestaţionare, este extrem de importantă pentru întregul demers întreprins în contextul modelării seriilor de timp.

Baza teoretică pentru modelarea seriilor de timp este reprezentată de un rezultat important din teoria proceselor stohastice, cunoscut sub numele de teorema de descompunere Wold (1938), care asigură premisele teoretice necesare pentru construirea unei reprezentări formalizate pentru procesele stohastice, reprezentare care este chiar modelul econometric. Din nefericire însă, teorema oferă baza teoretica doar pentru reprezentarea proceselor stohastice slab staţionare. Conform acestei teoreme, orice proces stohastic slab staţionar, admite o reprezentare formalizată, de tip medie mobilă (MA-Moving Average). Astfel, dacă este

un proces stohastic slab staţionar, atunci el poate fi reprezentat sub forma:

,

numită reprezentare de tip medie mobilă infinită (MA(∞)), unde este o mărime

deterministă, sunt variabile aleatoare numite şocuri, inovaţii sau perturbaţii,

având natura proceselor stohastice de tip ‘zgomot alb’, cu mediile, varianţele şi covarianţele verificând condiţiile:

iar sunt parametri ai reprezentării, care verifică următoarele condiţii:

R,

Variabila aleatoare se numeşte inovaţie curentă sau inovaţie contemporană

şi are acelaşi rol cu cel pe care îl au perturbaţiile în modelele econometrice, iar

variabilele aleatoare , se numesc inovaţii trecute sau inovaţii

istorice şi au rol de “factori explicativi”.Utilizând un operator specific proceselor stohastice, respectiv operatorul de

întârziere L, definit sub forma:,

decompunerea Wold poate fi rescrisă sub forma:

,

sau sub forma:

Figura 23.6: Reprezentarea grafică a observaţiilor unui proces stohastic de tip ‘mers aleator simplu’

Page 55: Econometrie Word 2 Iulie 2009 Ultim

unde:

se numeşte polinom de întârziere de grad infinit.Posibilitatea efectivă de reprezentare sau de modelare a proceselor stohastice

staţionare, care rezultă din teorema de descompunere Wold, se referă la faptul că orice astfel de proces stohastic poate fi “aproximat” prin trunchierea reprezentării Wold, sub forma următoare:

formă care poate fi considerată a reprezenta un model econometric operaţional al procesului stohastic respectiv şi care se numeşte medie mobilă de ordinul p. Utili-zând polinomul de întârzieri, reprezentarea anterioară poate fi rescrisă sub forma:

unde:

Din nefericire însă, utilizarea acestui rezultat fundamental este foarte limitată, deoarece în cele mai multe dintre situaţii fenomenele din economia reală au evo-luţii pentru care nu se verifică decât foarte rar proprietatea de staţionaritate, nici măcar în varianta slabă a acesteia. Din acest motiv, pentru a putea descrie în mod adecvat evoluţiile de acest tip, apare necesitatea ca procesele stohastice sau seriile de timp să fie supuse unor operaţii preliminare de staţionarizare, în urma cărora se obţin procese stohastice sau serii de timp staționare.

După cum se poate observa, deşi descompunerea Wold asigură existenţa unui model econometric pentru orice proces stohastic slab staţionar, forma acestui model apare ca fiind oarecum nenaturală. Această lipsa de naturaleţe este dată de faptul că, într-un astfel de model, variabila dependentă este explicată prin inter-

mediul unor factori care par relativ “ciudaţi”, reprezentaţi de şocurile sau ino-vaţiile  , care definesc un proces de tip ‘zgomot alb’ şi care au o natură

neobservabilă. Cu toate acestea, în anumite condiţii se poate trece de la repre-zentarea Wold de tip medie mobilă, la o altă reprezentare a procesului stohastic staţionar, cu mult mai naturală, care este reprezentarea de tip autoregresiv.

Clase de modele pentru serii de timp unidimensionaleExistă mai multe modalităţi de reprezentare sau modele pentru procesele

stohastice sau pentru seriile de timp, dintre care cele mai importante sunt următoarele:

a. Reprezentarea de tip medie mobilă (MA)Un proces stohastic admite o reprezentare de tip medie mobilă de

ordinul p (numit ordin de întârziere), notată cu  şi numită model de tip

medie mobilă de ordinul p, dacă şi numai dacă el poate fi scris sub forma:

Page 56: Econometrie Word 2 Iulie 2009 Ultim

unde , iar celelalte elemente au semnificaţiile prezentate anterior. Folo-

sind scrierea bazată pe polinomul de întârzieri, reprezentarea capătă forma

condensată următoare:

unde:

se numeşte polinom de întârzieri al reprezentării de tip medie mobilă.Aşa cum am menţionat anterior, existenţa acestei reprezentări este garantată de

rezultatul teoremei lui Wold. De fapt, se poate arăta că orice proces stohastic care admite o astfel de reprezentare este un proces stohastic staţionar. Mai mult decât atât, se poate arăta că dacă toate rădăcinile polinomului de întârzieri

au modulul strict mai mare decât unitatea, atunci se poate trece de la repre-

zentarea de tip , la o reprezentare de tip autoregresiv . Această pro-

prietate este cunoscută sub numele de proprietate de inversabilitate a reprezentării de tip medie mobilă.

b. Reprezentarea de tip autoregresiv (AR)Un proces stohastic admite o reprezentare de tip autoregresiv de

ordinul q (numit ordin de întârziere), notată cu şi numită model autore-

gresiv de ordinul q, dacă şi numai dacă el poate fi scris sub forma:

Folosind scrierea bazată pe polinomul de întârzieri, reprezentarea

capătă forma condensată următoare:

unde:

se numeşte polinom de întârzieri al reprezentării de tip autoregresiv.Un proces aleator care admite o reprezentare de tip autoregresiv, poate fi

staţionar sau nestaţionar, în funcţie de natura rădăcinilor polinomului său de

întârzieri. Astfel, dacă toate rădăcinile polinomului de întârzieri au modulul

strict mai mare decât unitatea, procesul respectiv este staționar. De asemenea,

indiferent de natura rădăcinilor polinomului de întârzieri , se poate trece de la

reprezentarea de tip autoregresiv, la reprezentarea de tip medie mobilă, ceea ce înseamnă că un astfel de proces este totdeauna inversabil.

c. Reprezentarea de tip autoregresiv-medie mobilă (ARMA)Un proces stohastic admite o reprezentare mixtă de tip autore-

gresiv-medie mobilă de ordinele q şi p, notată cu şi numită model

Page 57: Econometrie Word 2 Iulie 2009 Ultim

(mixt) autoregresiv-medie mobilă de ordinele q şi p, dacă şi numai dacă el poate fi scris sub forma:

Folosind scrierea bazată pe polinoamele de întârzieri ale celor două repre-zentări anterioare, reprezentarea capătă forma condensată următoare:

unde  şi sunt polinoamele de întârzieri corespunzătoare.

Staţionarizarea seriilor de timpAşa cum am menţionat anterior, teorema de descompunere Wold asigură fun-

damentarea posibilităţilor de modelare doar pentru procesele aleatoare de tip staţio-nar, procese care pot fi modelate cu ajutorul modelelor econometrice aparţinând oricăreia dintre cele trei clase de modele menţionate anterior. În cazul în care seria de timp, concretizată prin datele disponibile pentru analiză, evidenţiază existenţa unui proces aleator nestaţionar, apare necesitatea staţionarizării procesului stohastic sau seriei de timp, cu ajutorul unor metode specifice.

Metodele de staţionarizare a seriilor de timp nestaţionare diferă în funcţie de natura nestaţionarităţii respectivelor serii de timp. De obicei, nestaţionaritatea pe care o poate evidenţia o serie de timp, este determinată de două cauze importante: existenţa unui trend de tip determinist, respectiv existenţa unui trend stohastic.

Procesele stohastice nestaţionare din motive de existenţă a unui trend deter-minist se numesc procese de tip TS (Trend Stationary) şi includ o componentă care poate fi descrisă cu ajutorul unei funcţii de timp, de regulă o funcţie polinomială, pe care o vom nota cu . Totdeauna, staţionarizarea proceselor stohastice sau

seriilor de timp de tip TS se face prin metoda cunoscută sub numele de detrendare, care constă în operaţia de eliminare a trendului estimat din elementele seriei de timp. Teoretic, dacă seria de timp este reprezentată de lista de variabile aleatoare 

, operaţia de detrendare este descrisă de relaţia:

unde  reprezintă un element generic al seriei de timp detrendate.

Procesele stohastice nestaţionare din motive de existenţă a unui trend stohas-tic, se numesc procese de tip DS (Diferency Stationary), procese integrate sau procese cu rădăcină unitate (‘unit root’) şi includ o componentă de natura proce-sului de tip ‘mers aleator’. Totdeauna, staţionarizarea seriilor de timp de tip DS, se face prin metoda cunoscută sub numele de diferenţiere şi bazată pe operatorul de diferenţă Δ, definit sub forma:

.

Pentru staţionarizarea unei serii de timp nestaţionare, pot fi necesare mai multe operaţii succesive de diferenţiere. Numărul de operaţii de diferenţiere nece-sar pentru a staţionariza o serie de timp nestaţionară se numeşte ordin de integrare

Page 58: Econometrie Word 2 Iulie 2009 Ultim

al seriei de timp. Astfel, dacă seria de timp este o serie nestaţionară de tip DS,

însă poate fi staţionarizată prin efectuarea unui număr de d diferenţieri succesive, atunci ea se numeşte serie de timp integrată de ordinul d şi se notează sub forma:

.

În acest context, este evident că dacă seria de timp este staţionară, atunci ea

este integrată de ordinul d=0, adică . De asemenea, dacă seria de timp 

este integrată de ordinul d, adică , atunci:

Studiile econometrice efectuate până în prezent evidenţiază faptul că evoluţiile în timp ale celor mai multe dintre fenomenele economice, au natura unor procese integrate de ordinul 1 şi cel mult 2, ceea ce înseamnă că staţionaritatea acestora este obţinută după cel mult două diferenţieri.

Având în vedere că procesele stohastice care admit o reprezentare de tip  sunt procese staţionare, problema existenţei unor procese de tip DS sau cu

‘rădăcină unitate’ apare numai în legătură cu procesele stohastice care admit repre-zentări în care apare o componentă autoregresivă, cum ar fi procesele de tip 

şi . De fapt, problema existenţei rădăcinilor unitate vizează

polinomul de întârzieri asociat acestor reprezentări.

Dacă polinomul de întârzieri  dintr-o astfel de reprezentare a unui proces

stohastic are una sau mai multe rădăcini egale cu unitatea, atunci procesul este de tip DS sau cu ‘rădăcină unitate’, iar ordinul său de integrare este dat de numărul rădăcinilor egale cu unitatea. De exemplu, procesul stohastic de tip ‘mers aleator simplu’, care are o reprezentare de tip , respectiv:

este un proces nestaţionar, a cărui nestaţionaritate este determinată de existenţa unui trend de tip stohastic. Aceasta înseamnă că ‘mersul aleator simplu’ este un proces de tip DS sau cu o ‘rădăcină unitate’, care poate fi staţionarizat printr-o singură diferenţiere, adică  . Într-adevăr, din rescrierea reprezentării acestui

proces sub forma:

rezultă că diferenţa de ordinul întâi a acestuia este staţionară, deoarece variabila aleatoare  defineşte un proces de tip ‘zgomot alb’, care este un proces staţionar.

Mai mult decât atât, utilizând operatorul de întârziere L, obţinem următoarea repre-zentare a procesului ‘mers aleator simplu’:

pentru care polinomul de întârzieri este de forma , adică de gradul

întâi şi cu rădăcina egală cu unitatea.

Page 59: Econometrie Word 2 Iulie 2009 Ultim

Deoarece metoda de staţionarizare a unei serii de timp este strict dependentă de natura nestaţionarităţii respectivei serii, cea mai importantă şi mai dificilă pro-blemă a staţionarizării unei serii de timp este legată de modul în care poate fi detectat tipul de nestaţionaritate, respectiv natura TS sau DS a seriei de timp.

Un rol fundamental în detectarea tipului de nonstaţionaritate a unei serii de timp, respectiv în stabilirea naturii TS sau DS a acesteia, îl au aşa-numitele teste de tip ‘rădăcină unitate’ sau ‘unit root’, cele mai reprezentative dintre acestea fiind de testele Dickey-Fuller, Phillips-Perron și KPSS.

O altă clasă de reprezentări sau modele econometrice pentru seriile de timp unidimensionale este cea specifică proceselor de tip DS integrate de ordinul d, care după un număr de d diferenţieri devin staţionare şi admit o reprezentare de tip

. Modelele din această categorie sunt cunoscute sub numele de modele

şi au forma generală:

Pentru situaţia în care procesele din categoria precedentă includ şi o compo-nentă sezonieră, există o altă clasă de modele econometrice, cunoscută sub numele de modele şi care au reprezentarea generală:

unde s reprezintă periodicitatea sezonalităţii, care ia valorile 4, 12, 52 etc., pentru sezonalitate trimestrială, lunară sau săptămânală, iar reprezintă operatorul

de diferenţiere sezonieră, a cărui utilizare are ca scop desezonalizarea seriei de timp respective.

După ce seria de timp a fost staţionarizată, urmează etapa de alegere a mode-lului econometric adecvat, dintr-una din clasele de modele specifice, etapă cunos-cută sub numele de identificare a modelului.

Identificarea modelelor pentru seriile de timp unidimenionaleSeria de timp staţionarizată, prin detrendare - în cazul seriilor de timp de tip

TS, sau prin diferenţiere de un anumit ordin - în cazul seriilor de timp de tip DS, poate fi modelată cu ajutorul unui model de tip , în

funcţie de proprietăţile numerice pe care aceasta le evidenţiază.Cele mai importante și eficiente instrumente care pot fi utilizate pentru alege-

rea modelului econometric adecvat pentru o serie de timp staţionară sunt repre-zentate de graficele estimaţiilor funcţiilor de autocorelaţie simplă şi parţială, cu-noscute sub numele de autocorelograma simplă şi autocorelorama parţială. Esti-maţiile pentru funcţia de autocorelaţie simplă pot fi calculate pe baza relaţiei:

Page 60: Econometrie Word 2 Iulie 2009 Ultim

unde k se numeşte ordinul coeficientului de autocorelaţie estimat,

reprezintă valorile observate ale seriei de timp, iar reprezintă media aritmetică a

acestor observaţii. Calculul estimaţiilor pentru funcţia de autocorelaţie parţială se bazează pe estimarea unui model autoregresiv de forma:

,

Pornind de la varianta estimată a acestui model autoregresiv, estimaţia pentru coeficientul corelaţie parţială de ordinul k se poate determina ca estimaţie a coeficientului de autocorelaţie simplă dintre variabila aleatoare de tip reziduu

, pe de o parte, şi variabila aleatoare

, pe de altă parte, respectiv ca estimație definită sub forma:

Identificarea modelului econometric adecvat pentru o serie de timp, cu ajutorul autocorelogramelor simplă şi parţială, se bazează pe următoarele idei:

• dacă autocorelograma simplă evidenţiază o descreştere rapidă, de tip sinusoidal sau de tip exponenţial, a valorilor estimaţiilor coeficienţilor de autoco-relaţie simplă , atunci modelul este de tip , cu ordinul de

întârziere q dat de numărul de coeficienţi de corelaţie parţială pentru care esti-

maţiile sugerează o semnificaţie statistică diferită de 0;

• dacă autocorelograma parţială evidenţiază o descreştere rapidă, de tip sinusoidal sau de tip exponenţial, a valorilor estimaţiilor coeficienţilor de autoco-relaţie parţială , atunci modelul este de tip , cu ordinul de

întârziere p dat de numărul de coeficienţi de corelaţie parţială pentru care esti-

maţiile sugerează o semnificaţie statistică diferită de 0;

• dacă autocorelograma simplă şi autocorelograma parţială evidenţiază o descreştere rapidă, de tip sinusoidal sau de tip exponenţial, atât a valorilor esti-maţiilor coeficienţilor de autocorelaţie simplă , cât şi a valorilor

estimaţiilor coeficienţilor de autocorelaţie parţială , atunci mode-

lul este de tip  , iar ordinele de întârziere p şi q pot fi determinate pe

baza valorilor statisticilor Akaike şi Schwarz.Pentru determinarea ordinelor corespunzătoare de întârziere ale modelelor de

tip , se poate proceda în felul următor: se estimea-

ză modelele respective pentru ordine succesive de întârziere, începând de la ordinul 1 şi până la un ordin suficient de mare; se calculează valorile statisticilor Akaike şi Schwarz; se alege modelul cu ordinul de întârziere pentru care valorile acestor statistici sunt cele mai mici.

Estimarea parametrilor modelelor pentru seriile de timp unidimensionale, poate fi făcută cu ajutorul metodei celor mai mici pătrate sau metodei verosi-

Page 61: Econometrie Word 2 Iulie 2009 Ultim

milităţii maxime, în cazul modelelor de tip , sau cu ajutorul unor proceduri

de estimare speciale, în cazul modelelor de tip .

După ce modelul econometric al o seriei de timp a fost identificat, estimat şi validat, acesta urmează a fi utilizat pentru efectuarea de predicţii, referitoare la evoluţia viitoare a fenomenului economic reprezentat de variabila dependentă. În cazul specific al modelelor de tip , cu forma generală:

efectuarea predicţiilor este bazată tot pe media condiţionată a variabilei depen-dente, ca şi în cazul regresiei liniare multiple, cu menţiunea că valorile de condi-ţionare sunt reprezate de valorile cunoscute ale stărilor anterioare ale variabilei dependente. De exemplu, presupunând că T reprezintă momentul curent sau “prezentul” şi că se cunosc realizările ,

unde , predicţia pentru valorile variabilei condiţionate este repre-

zentată de variabila aleatoare , ca estimator pentru valorile variabilei condi-

ţionate  , definită de relaţia:

unde  sunt estimatorii pentru parametrii . De asemenea,

eroarea de predicţie este definită de variabila aleatoare:

iar varianţa acesteia şi intervalul de încredere pentru predicţie se determină într-o manieră similară cu cea din contextul regresiei liniare multiple.

Clase de modele pentru serii de timp multidimensionaleAbordarea econometrică unidimensională a seriilor de timp, bazată pe clasele

de modele de tip , este o abordare are o natură

excesiv simplificatorie şi nestructurală, în care evoluţia unui fenomen de tip efect, este privită în mod izolat, fără a lua în considerare legăturile sale cu alte fenomene de tip efect şi fără a ţine seama de o serie de restricţionări determinate de evoluţia economică de ansamblu. De exemplu, în modelarea econometrică unidimensională a comportamentului unui anumit tip de piaţă, cele două fenomene specifice acestei pieţe, cererea (D) şi oferta (S), sunt privite şi descrise în mod izolat, prin modele econometrice de forma:

fără a lua în considerare restricţionarea pe care tendinţa generală a pieţelor către echilibrul dintre cerere şi ofertă, o impune asupra evoluţiei celor două fenomene, astfel încât .

Faptul că evoluţia unor fenomene economice de tip efect este restricţionată de manifestarea unor multiple condiţionări şi legături cu alte fenomene de tip efect, necesită un alt tip de abordare econometrică, de natură structurală, care să ia în

Page 62: Econometrie Word 2 Iulie 2009 Ultim

considerare, într-o manieră de simultaneitate, comportamentul mai multor fenome-ne de tip efect, între care se manifestă respectivele condiţionări şi legături.

Modelele econometrice pe care se bazează o astfel de abordare, sunt modele cu natură multidimensională, vectorială sau structurală, respectiv sisteme de modele, care includ descrieri simultane ale comportamentului “legat” al mai multor varia-bile dependente.

Dintre cele mai cunoscute clase de modele econometrice de tip multidimen-sional, menţionăm:

• modelele cu ecuaţii simultane, care sunt modele n-dimensionale de forma: (23.15)

cunoscută sub numele de formă structurală, unde Y este vectorul n-dimensional al variabilelor endogene , X este vectorul m-dimensional al variabilelor

exogene , unele dintre aceste variabile putând fi forme “întârziate” ale

variabilelor dependente, de tipul , este vecto-

rul n-dimensional al perturbaţiilor , iar A şi B sunt matrici de parametri

ai modelului, de dimensiune  , respectiv ; o altă formă a modelului cu

ecuaţii simultane, utilizabilă în procedurile de estimare, este următoarea:

, (23.16)

cunoscută şi sub numele de formă redusă a modelului cu ecuaţii simultane.

• modelele de tip Vectori Autoregresivi (VAR), care sunt modele n-dimen-sionale, generalizări ale modelelor autoregresive unidimensionale, de forma:

numită model VAR n-dimensional de ordinul q şi notată , unde este

vectorul n-dimensional al variabilelor endogene, sunt vectorii

n-dimensionali ai variabilelor exogene, care reprezintă variante “întârziate” ale variabilelor endogene, este vectorul n-dimensional al perturbaţiilor “contem-

porane”, iar sunt matrici de parametri ai modelului, de dimen-

siune  ;

• modelele de tip Vectori Medie Mobilă (VMA), care sunt modele n-dimen-sionale, generalizări ale modelelor de tip medie mobilă unidimensionale, de forma:

numită model VMA n-dimensional de ordinul p şi notată , unde este

vectorul n-dimensional al variabilelor endogene, sunt vectorii n-

dimensionali ai inovaţiilor sau şocurilor trecute, cu rol de variabile exogene, este

Page 63: Econometrie Word 2 Iulie 2009 Ultim

vectorul n-dimensional al perturbaţiilor “contemporane”, iar

sunt matrici de parametri ai modelului, de dimensiune ;

• modelele de tip Vectori cu Corecţie de Erori (VECM), care sunt modele n-dimensionale, cu natură de modele de tip VAR restricţionate, de forma:

numită model VECM n-dimensional de ordinul p şi notată , unde 

∆ este operatorul n-dimensional de diferenţă de ordinul întâi, termenul ,

defineşte aşa-numitele relaţii de cointegrare sau relaţii de echilibru pe termen lung, este o matrice de parametri, de dimensiune  , numită matrice de cointe-

grare, sunt alte matrici de parametri ai modelului, de dimensiu-

ne  , iar celelalte elementele componente au semnificaţii similare cu cele de la

modelul de tip VAR.Modelarea structurală a fenomenelor economice, cu ajutorul modelelor econo-

metrice multidimensionale, se confruntă cu o serie de dificultăţi teoretice şi prac-tice, mai ales în cazul special al modelelor cu ecuaţii simultane. În contextul modelelor de acest tip, cea mai importantă dificultate este legată de aşa-numita proprietate de identificabilitate a acestor modele.

Concret, problema identificabilităţii unui model cu ecuaţii simultane, se referă la faptul că nu există totdeauna posibilitatea de a reconstitui toate estimaţiile para-metrilor din forma structurală (23.15) a modelului, pornind de la estimaţiile obţinute pentru forma redusă (23.16) a acestui model. Din acest punct de vedere, modelele cu ecuaţii simultane pot fi de trei tipuri: subidentificate, identificate şi supraidentificate. Exceptând modelele subidentificate, care nu pot fi estimate, celelalte două categorii de modele cu ecuații simultane pot fi estimate cu ajutorul unor metode de estimare specifice.

În afara metodelor de estimare menţionate anterior pentru clasele de modele unidimensionale, pentru estimarea claselor de modele multidimensionale ante-rioare, sunt utilizate şi o serie de metode specifice, cum ar fi metoda indirectă a celor mai mici pătrate – utilizată în cazul modelelor cu ecuații simultane identificate sau metoda celor mai mici în două faze – utilizată în cazul modelelor cu ecuații simultane identificate și supraidentificate.

Bibliografie

[ 1] Bourbonnais R. (2009), Économétrie, 7e Édition, Dunod, Paris, 2009

Page 64: Econometrie Word 2 Iulie 2009 Ultim

[ 2] Bourbonnais R., Terraza M. (2008), Analyse des Séries Temporelles: Appli-cations à l'économie et à la gestion, 2e Édition, Dunod, Paris, 2008[ 3] Box G. E. P., Jenkins G. M. (1970), Time Series Analysis. Forecasting and Control, Holden Day Inc., San Francisco, USA, 1970 [ 4] Clements M. P., Hendry, D. F. (1998), Forecasting Economic Time Series, Cambridge University Press, Cambridge, 1998[ 5] Davidson, R., MacKinnon J. G. (2004), Econometric Theory and Methods, Oxford University Press, Oxford, 2004[ 6] Enders, Walter, (2004), Applied Econometric Time Series, 2nd edition, John Wiley & Sons Inc, 2004 [ 7] Engle R. F., Granger C. W. J. (1987), Co-integration and Error Correction: Representation, Estimation and Testing, Econometrica, Volume 55, Issue 2, Pages 251-276, 1987[ 8] Gouriéroux, C., Monfort A. (1995), Statistics and Econometric Models, Volumes 1 and 2, Cambridge University Press, Cambridge, U.K. 1995[ 9] Granger C.W.J. (1978), Forecasting Economic Time Series, Academic Press, New York, 1978[10] Greene, William H., (2007), Econometric Analysis, 6th Edition, Prentice-Hall International, New Jersey, USA, 2007[11] Gujarati D. N. (1998), Essentials of Econometrics, Mc Graw-Hill, New York, 1998[12] Hamilton J. D. (1994), Time Series Analysis, Princeton University Press, 1994Johnston J. (1984), Econometric Methods, 2nd Edition, McGraw-Hill Book Inc., New York, 1984[13] Intriligator M., Bodkin R., Hsiao C. (2007), Econometric Models Techniques and Applications, 2nd Edition, Prentice-Hall International Inc., New Jersey, USA, 1996[14] Maddala, G. S. (2001), Introduction to econometrics, 3rd Edition, John Wiley & Sons, Chichester, England, 2001 [15] Pindyck R. S., Rubinfeld D. L. (1998), Econometric Models and Economic Forecasts, 4th edition, McGraw-Hill Publishing, New York, USA, 1998[16] Ruxanda Gh., Botezatu A. (2008), Spurious Regression and Cointegration. Numerical example: Romania's M2 Money Demand, Journal for Economic Forecasting, no. 3/2008, The Institute for Economic Forecasting, Bucharest, 2008[17] Ruxanda Gh. (1997), An interpretation of the regression techniques, în Computer Science, Editura INFOREC Printing House, Bucharest, Romania, 1997[18] Ruxanda Gh. (2006), Measuring the stochastic dependence relationships strength, în Economic Computation and Economic Cybernetics Studies and Research, nr. 3-4/2006, Vol. 41, ASE, Bucharest, 2006

Page 65: Econometrie Word 2 Iulie 2009 Ultim

[19] Ruxanda Gh. (1998), Problems of interdependences measures, Economic Computation and Economic Cybernetics Studies and Research, nr. 1-4/1998, Anul XXXII, ASE, Bucharest, 1998;[20] Thomas R. L. (1997), Modern Econometrics, Addison Wesley, Longman Limited, Essex, England, 1997[21] Wooldridge J. M. (2000), Introductory Econometrics: A Modern Approach, 3rd Edition, South-Western College, 2006