Econometrie

5
Econometrie - Seminar 4 – (23- 25oct.2012) Ex1. Consumul unei familii în funcŃie de Venitul Disponibil (Continuare Exemplul de la Seminarul 2) În scopul evaluării influenŃei pe care variaŃia venitului disponibil o are asupra cheltuielilor de consum ale unei familii, au fost înregistrate, pentru 10 familii, valorile următoarelor variabile: Y – cheltuielile de Consum ale familiei; X – Venitul Disponibil al familiei. Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 Fiecare familie a fost selectată, la întâmplare, dintr-un grup de familii cu un venit net disponibil fixat. Valorile celor două variabile sunt exprimate în 1000 unităŃi monetare (u.m.), astfel încât prima familie câştigă 80000 u.m. şi consumă 70000 u.m. anual. a) Să se reprezinte grafic datele de observaŃie şi să se comenteze legătura dintre cele două variabile. b) Pe baza datelor de la nivelul eşantionului, să se determine ecuaŃia de regresie liniară care modelează legătura dintre cele două variabile. După estimarea parametrilor modelului, să se interpreteze rezultatele obŃinute. c) Să se verifice dacă modelul de regresie identificat este valid statistic (valoare tabelară:5,32 pentru un nivel de semnificaŃie de 0,05). d) Să se testeze semnificaŃia statistică a parametrilor modelului şi să se determine intervalele de încredere pentru parametrii modelului (valoare tabelară: 2,306 pentru un nivel de semnificaŃie de 0,05). e Să se măsoare intensitatea legăturii dintre cele două variabile cu ajutorul coeficientului de corelaŃie şi al raportului de corelaŃie; să se testeze semnificaŃia indicatorilor utilizaŃi. f În ce măsură, variaŃia cheltuielilor de consum este influenŃată de venitul disponibil al familiei, pe baza modelului de regresie determinat? g Să se previzioneze cheltuielile medii de consum ale unei familii, în ipoteza că venitul disponibil este 100. h Să se previzioneze cheltuielile de consum ale unei familii, în ipoteza că venitul disponibil este 100. e Coeficientul de corelaŃie de selecŃie Coeficientul de corelaŃie de selecŃie este un indicator ce caracterizează direcŃia şi intensitatea legăturii liniare dintre două variabile. Semnul acestui coeficient indică direcŃia legături iar valoarea sa indică intensitatea legăturii. [ ] [ ] = = = 2 2 ) ( ) ( ) )( ( ) , cov( y y x x y y x x S S S S S y x r i i i i y x xy y x xy sau ( ) [ ] ( ) [ ] = 2 2 2 2 i i i i i i i i xy y y n x x n y x y x n r Valoarea coeficientului de corelaŃie este între -1 şi 1. O valoare apropiată de 1 arată o legătură directă puternică O valoare apropiată de -1 arată o legătură inversă puternică. 2 2 ) ( ) )( ( ˆ x xy i i i S S x x y y x x b = = = β rezultă y x xy S S r β ˆ = .

description

Econometrie

Transcript of Econometrie

Page 1: Econometrie

Econometrie - Seminar 4 – (23- 25oct.2012) Ex1. Consumul unei familii în funcŃie de Venitul Disponibil (Continuare Exemplul de la Seminarul 2) În scopul evaluării influenŃei pe care variaŃia venitului disponibil o are asupra cheltuielilor de consum ale unei familii, au fost înregistrate, pentru 10 familii, valorile următoarelor variabile: Y – cheltuielile de Consum ale familiei; X – Venitul Disponibil al familiei.

Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260

Fiecare familie a fost selectată, la întâmplare, dintr-un grup de familii cu un venit net disponibil fixat. Valorile celor două variabile sunt exprimate în 1000 unităŃi monetare (u.m.), astfel încât prima familie câştigă 80000 u.m. şi consumă 70000 u.m. anual. a) Să se reprezinte grafic datele de observaŃie şi să se comenteze legătura dintre cele două variabile. b) Pe baza datelor de la nivelul eşantionului, să se determine ecuaŃia de regresie liniară care modelează legătura dintre cele două variabile. După estimarea parametrilor modelului, să se interpreteze rezultatele obŃinute. c) Să se verifice dacă modelul de regresie identificat este valid statistic (valoare tabelară:5,32 pentru un nivel de semnificaŃie de 0,05). d) Să se testeze semnificaŃia statistică a parametrilor modelului şi să se determine intervalele de încredere pentru parametrii modelului (valoare tabelară: 2,306 pentru un nivel de semnificaŃie de 0,05).

e Să se măsoare intensitatea legăturii dintre cele două variabile cu ajutorul coeficientului de corelaŃie şi al raportului de corelaŃie; să se testeze semnificaŃia indicatorilor utilizaŃi. f În ce măsură, variaŃia cheltuielilor de consum este influenŃată de venitul disponibil al familiei, pe baza modelului de regresie determinat?

g Să se previzioneze cheltuielile medii de consum ale unei familii, în ipoteza că venitul disponibil este 100.

h Să se previzioneze cheltuielile de consum ale unei familii, în ipoteza că venitul disponibil este 100.

e Coeficientul de corelaŃie de selecŃie

Coeficientul de corelaŃie de selecŃie este un indicator ce caracterizează direcŃia şi intensitatea legăturii liniare dintre două variabile. Semnul acestui coeficient indică direcŃia legături iar valoarea sa indică intensitatea legăturii.

[ ] [ ]∑∑∑

−−

−−===

22 )()(

))((),cov(

yyxx

yyxx

SS

S

SS

yxr

ii

ii

yx

xy

yx

xy sau

( )[ ] ( )[ ]∑ ∑∑ ∑∑∑∑

−−

−=

2222iiii

iiii

xy

yynxxn

yxyxnr

Valoarea coeficientului de corelaŃie este între -1 şi 1. O valoare apropiată de 1 arată o legătură directă puternică O valoare apropiată de -1 arată o legătură inversă puternică.

22)(

))((ˆ

x

xy

i

ii

S

S

xx

yyxxb =

−−==

∑∑β rezultă

y

xxy

S

Sr β= .

Page 2: Econometrie

Rezultă că xyr are acelaşi semn cu coeficientul de regresie pantă, β .

Am obŃinut 980847,0=xyr , ceea ce arată că există o legătură directă şi foarte puternică

între cele două variabile analizate. Testarea semnificaŃiei coeficientului de corelaŃie liniară se face utilizând testul t. Se testează următoarele ipoteze:

0:0 =ρH ( coeficientul de corelaŃie ρ nu este semnificativ statistic)

0:1 ≠ρH ( coeficientul de corelaŃie ρ este semnificativ statistic). Statistica testului urmează o distribuŃie Student cu (n-2) grade de libertate.

21)(

0

2−⋅

−=

−= n

r

r

rse

rt

xy

xy

xy

xy .

Dacă criticcalculat tt > , respingem 0H şi acceptăm 1H , adică ρ este semnificativ statistic.

25039,14210)980847,0(1

980847,02

calculat =−⋅−

=t

Deoarece 306,225039,14 > , deci avem criticcalculat tt > rezultă că vom respinge 0H şi

vom accepta 1H ; coeficientul de corelaŃie ρ este semnificativ statistic. Calitatea ajustării După ce dreapta de regresie a fost estimată, este important să se evalueze rezultatele, să se ştie cât de bine ajustează sau aproximează această dreaptă datele de selecŃie.

Utilizarea MCMMP asigură faptul că valorile găsite pentru β şi α sunt cele care aproximează cel mai bine datele de observaŃie, în sensul specific de minimizare a

sumei pătratelor reziduurilor. Nu există nici o garanŃie că β şi α corespund exact cu parametrii necunoscuŃi β şi α şi nici dacă dreapta de regresie, determinată ca fiind cea mai bună sau cea mai potrivită, aproximează corect datele observate. Un indicator ce poate descrie calitatea reprezentării, adică a liniei de regresie estimată, este coeficientul de determinaŃie, notat 2R .

∑ −= 2)( yySST i suma pătratelor abaterilor valorilor reale ale variabilei y de la

media lor de selecŃie, y . Suma SST se numeşte variaŃia totală a valorilor variabilei y.

∑∑∑ −=−=−= 2222 )(ˆ)ˆˆ()ˆ( xxyyyySSR iii β suma pătratelor abaterilor valorilor

ajustate ale variabilei y de la media lor de selecŃie sau variaŃia datorată regresiei.

∑∑ =−= 22)ˆ( iii eyySSE suma pătratelor reziduurilor (abaterilor valorilor reale ale

variabilei y de la valoarile ajustate) sau variaŃia datorată erorilor. Avem SST=SSR+SSE Raportul de corelaŃie dintre cele două variabile este:

∑∑

−==

2

2

)(

)ˆ(

yy

yy

SST

SSRR

i

i sau ∑∑

−−=−=

2

2

)(

)ˆ(11

yy

yy

SST

SSER

i

ii

Valoarea calculată este 9808,0≈R Coeficientul de determinaŃie arată proporŃia din variaŃia totală a variabilei dependente Y, explicată de variaŃia variabilei independente X, deci prin modelul de regresie estimat.

∑∑

−==

2

22

)(

)ˆ(

yy

yy

SST

SSRR

i

i sau ∑∑

−−=−=

2

22

)(

)ˆ(11

yy

yy

SST

SSER

i

ii

Page 3: Econometrie

Testarea semnificaŃiei Raportului de corelaŃie se face utilizând statistica

2,1;2

2

~)2(1

−−−

= nFnR

RF α

Cele două ipoteze ale testului sunt: 0: 2

0 =RH ( modelul nu este corect specificat, adică variabila X nu are efect asupra variabilei Y)

0: 21 >RH (modelul este corect specificat, adică variabila X are efect asupra

variabilei Y) Se compară valoarea calculată a lui F cu valoarea critică obŃinută din tabelele repartiŃiei F. Se aplică regula de decizie: dacă 2,1;calc −> nFF α se respinge ipoteza nulă

în favoarea ipotezei alternative. Deoarece 202calc ≈F şi 32,52,1; =−nFα se respinge H0 şi se acceptă H1, adică modelul

este corect specificat.

f Valoarea obŃinută, 9621,02 ≈R , arată că aproximativ 96% din variaŃia

cheltuielilor de consum (var. Y) este explicată prin variaŃia venitului disponibil

(var. X). Deoarece 2R poate fi cel mult 1, valoarea obŃinută sugerează că dreapta de regresie estimată aproximează (ajustează) foarte bine datele de observaŃie.

g Să se previzioneze cheltuielile medii de consum ale unei familii, în ipoteza că venitul disponibil este 1000 =x . Trebuie să estimăm valoarea medie a variabilei dependente, condiŃionat de valorile variabilei independente. Suntem în situaŃia de a prognoza 00 )|( xxXYE βα +== Putem obŃine estimaŃii punctuale sau pe intervale de încredere Folosim ecuaŃia de regresie estimată: iii xbxay ⋅+=+= 5091,04545,24ˆ O estimaŃie punctuală a previziunii mediei este

3645,751005091,04545,24ˆ 00 =⋅+=+= bxay

0y este un estimator al mediei condiŃionate )|( 0xXYE = . Cea mai bună estimaŃie a valorii medii reale este estimaŃia punctuală 75,3645. Determinarea Intervalului de încredere pentru media de răspuns necesită cunoaşterea distribuŃiei şi a varianŃei estimatorului 0y .

Avem:

−−

+=∑ 2

202

0 )(

)(1)ˆ(

xx

xx

nsyVar

i

e.

Eroarea standard a estimatorului 0y este

−+=∑ 2

202

0)(

)(1)ˆ(

xx

xx

nsyse

i

e .

2366,34759,1033000

)170100(

10

1159,42)ˆ(

2

0 ==

−+=yse

Un interval de încredere pentru valoarea reală 00 )|( xxXYE βα +== este dat de )ˆ(ˆ)|()ˆ(ˆ 0

2,2

0002,

2

0 ysetyxXYEysetynn

⋅+≤=≤⋅−−−

αα

)2366,3()306,2(3645,75)100|()2366,3()306,2(3645,75 0 ⋅+≤=≤⋅− xYE 8381,82)100|(9010,67 0 ≤=≤ xYE

Astfel, dacă luăm 1000 =x în selecŃii repetate, 95 de intervale din 100, vor conŃine valoarea reală a mediei.

Page 4: Econometrie

Dacă obŃinem, intervale de încredere 95% pentru fiecare X dat, vom obŃine ca interval de încredere o bandă de încredere pentru funcŃia de regresie a populaŃiei.

h Să se previzioneze cheltuielile de consum ale unei familii, în ipoteza că venitul disponibil este 100. Se doreşte predicŃia unei valori individuale

3645,751005091,04545,24ˆ 00 =⋅+=+= bxay va fi, de asemenea, cea mai bună

estimaŃie a valorii individuale 000 εβα ++= xy

Determinarea Intervalului de încredere pentru un răspuns individual necesită cunoaşterea distribuŃiei şi a varianŃei erorii de previzionare 00 yy − . Pentru nivelul de semnificaŃie fixat, ( 05,0=α ), se poate construi un interval de

încredere )%1( α− pentru predicŃia individuală 0y , de forma:

)ˆ(ˆ)ˆ(ˆ 002,

2

00002,

2

0 yysetyyyysetynn

−⋅+≤≤−⋅−−−

αα

−++=−∑ 2

202

00)(

)(11)ˆ(

xx

xx

nsyyVar

i

e iar eroarea standard va fi:

−++=−∑ 2

202

00)(

)(11)ˆ(

xx

xx

nsyyse

i

e .

După efectuarea calculelor, am obŃinut valorile 6349,52)ˆ( 00 =− yyVar şi

255,76349,52)ˆ( 00 ≈=− yyse 0945,92)100|6345,58 00 ≤=≤ xy

ObservaŃie: Trebuie remarcat faptul că se obŃine un interval de lungime mai mare pentru 0y decât pentru )( 0yE . Banda de încredere este mai mică atunci când valoarea

lui 0x se apropie de media de selecŃie x .

Previzionarea valorilor variabilei dependente Y utilizând Eviews 1) Deschidem fişierul de tip workfile 2) Pentru a extinde domeniul fişierului selectăm Procs/Change Workfile Range din workfile menu bar şi modificăm End date de la 10 la 11 (sau 12, sau 13). 3) Pentru a extinde eşantionul de date selectăm Sample din workfile menu bar şi modificăm al doilea număr din fereastră din 10 în 11 (sau 12, sau 13), apoi clic OK. 4) Deschidem un grup cu variabilele X şi Y, selectăm Show pentru a verifica datele şi apoi clic OK. 5) Pentru a introduce valori pentru X, clic edit+/- pe meniul grupului şi înlocuim literele NA cu valorile dorite pentru X. Clic Enter după fiecare valoare introdusă şi clic edit+/- pe meniul grupului pentru a salva modificările efectuate. 6) Selectăm Objects/New Object/Equation de pe workfile menu bar, introducem variabilele X şi Y în fereastra “Equation Specification” , schimbăm Sample de la 1 la 10; clic OK. 7) Selectăm Name de pe equation menu bar, introducem eq01 pentru a identifica ecuaŃia, apoi clic OK. 8) Selectăm Forecast de pe fereastra ecuaŃiei, introducem un nume în fereastra Forecast name, (yif), punem Sample range to forecast de la 1 la 11 (sau 12, sau 13) şi apoi OK. 9) Deschidem seriile yif şi yi într-un grup. Selectăm Show din workfile menu bar, apoi OK. 10) Selectăm Save din workfile menu bar pentru a salva modificările efectuate.

Page 5: Econometrie

SemnificaŃia indicatorilor pe care îi calculează pachetul Eviews Prob (p-value) Probabilitatea asociată coeficienŃilor b şi a O valoare apropiată de 0 indică o semnificaŃie ridicată a parametrului respectiv. O valoare mare a lui p indică faptul că parametrul respectiv nu este semnificativ. Adjusted R-squared

)1/(

)1/(12

−−−=

nSST

knSSER ;

2R este folosit pentru a evidenŃia numărul de variabile explicative şi numărul de observaŃii pe baza cărora au fost estimaŃi parametrii. Totdeauna avem 22 RR < . Log-likelihood Reprezintă logaritmul funcŃiei de verosimilitate (presupunând că erorile sunt normal distribuite), funcŃie care este determinată Ńinând seama de valorile estimate ale parametrilor. RelaŃia de calcul a acestui indicator , folosită de pachetul Eviews este:

++= ∑

n

enL

i2

ln)2ln(12

π

Acest indicator este folosit în elaborarea unor teste statistice destinate depistării variabilelor omise dintr-un model econometric şi pentru teste destinate depistării variabilelor redundante dintr-un model econometric. Media variabilei dependente ( y ) Abaterea standard corespunzătoare variabilei dependente

1

)( 2

−= ∑

n

yys

i

y

AIC (Akaike info criterion) este utilizat în cazul comparării a două sau mai multe modele econometrice. RelaŃia de calcul utilizată în pachetul EViews este:

n

k

n

LAIC

22+−=

Se alege modelul pentru care se obŃine cea mai mică valoare. SC (Schwarz criterion) se foloseşte pentru a compara modele econometrice. RelaŃia de calcul utilizată în pachetul Eviews este:

n

nk

n

LSC

ln2+−=

Prob(F-statistic) reprezintă probabilitatea asociată statisticii F O valoare apropiată de 0 va indica o semnificaŃie ridicată a rezultatelor estimării modelului.