Econometrie - Capitolul 6 - Variabile Calitative

Post on 30-Jun-2015

241 views 3 download

Transcript of Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6 Variabile calitative

Prof. dr. Stelian STANCU

� �

Dac� pân� acum variabilele analizate erau presupuse continue, în continuare referirea se va face la cazul când variabilele ecua�iei de regresie sunt considerate variabilele explicative calitative �i variabilele trunchiate �i arat� modul în care pot fi folosite, �inându-se cont de diferen�ele de interceptare a coeficien�ilor, de estimarea ecua�iilor cu restric�ii încruci�ate �i de testele de stabilitate a coeficien�ilor de regresie. Analiza se va face asupra variabilelor explicative calitative �i respective a variabilelor dependente calitative. Variabilele explicative calitative pot fi folosite în diverse scopuri precum:

- permit diferen�ele de interceptare a termenilor; - permit diferen�ierea pantelor; - permit testarea stabilita�ii coeficien�ilor regresiei.

6.1. Variabile calitative ce eviden�iaz� modificarea termenului intercept Fie rela�ia dintre venitul y �i anii de �coala x pentru dou� grupe, 1 �i 2. Pantele liniilor de regresie pentru ambele grupuri sunt aproximativ la fel. Prin urmare, ecua�ia de regresie va fi: εβα ++= xy 1 , pentru grupa 1; �i respectiv εβα ++= xy 2 , pentru grupa 2; putând fi grupate într-o singur� ecua�ie: εβααα ++−+= xDy )( 121 unde: 0=D pentru grupa 1, respectiv 1=D pentru grupa 2, D reprezentând variabila calitativ�. Observa�ie: Coeficientul acestei variabile m�soar� diferen�ele dintre cei doi termeni ai intercept�rii.

Capitolul 6. Variabile calitative

135

Grupa 1 • • • • Grupa 2 • � � � • • � � � � � � � Figura 6.1. Obsera�ie: În cazul existen�ei mai multor grupuri se impune introducerea mai multor variabile. Astfel, pentru trei grupuri avem: εβα ++= xy 1 , pentru grupa 1; εβα ++= xy 2 , pentru grupa 2; �i respectiv εβα ++= xy 3 , pentru grupa 3 putând fi grupate într-o singur� ecua�ie: εβααααα ++−+−+= xDDy 2131121 )()( unde: 11 =D pentru grupa 2 �i 01 =D pentru grupele 1 �i 3, respectiv 12 =D pentru grupa 3 �i 02 =D pentru grupele 1 �i 2, 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Prin substituirea valorilor lui 1D �i 2D în cadrul ecua�iei, putem ob�ine valorile 321 ,, ααα pentru cele trei grupe. 2. Prin combinarea celor trei ecua�ii, se presupune c� panta( β ) este aceea�i, în timp ce eroarea ε are aceea�i distribu�ie pentru toate grupele.

ECONOMETRIE. Teorie �i aplica�ii

136

3. În cazul existen�ei unui termen constant în ecua�ia de regresie, num�rul variabilelor calitative trebuie s� fie întotdeauna cu o unitate mai mic decât num�rul grupelor pe categorii, deoarece termenul constant este în acelasi timp termenul de interceptare al grupului de baz�, iar coeficien�ii variabilei calitative m�soar� diferen�e de interceptare. Exemplul 6.1. Presupunem c� avem date despre consumul C �i venitul Y pentru un anumit num�r de gospodarii, �i de asemenea, se cunosc:

S: sexul capului familiei; A: vârsta capului familiei, care este dat� pe trei categorii: < 25 de ani; între 25 �i 50 de ani; > 50 de ani. E: tipul educa�iei capului familiei: - liceu; - între liceu �i diploma de absolvire; - cel pu�in diploma de absolvire a unei facult��i.

Se vor include aceste variabile prezentate mai sus sub forma variabilelor calitative, astfel: 11 =D pentru sex masculin �i 01 =D pentru sex feminin ; 12 =D pentru vârsta < 25 de ani �i 02 =D pentru vârsta cuprins� în alt interval; 13 =D pentru vârsta între 25 �i 50 de ani, �i 03 =D pentru vârsta în alt interval; 14 =D pentru studii < liceu �i 04 =D pentru alte studii; 15 =D pentru studii între liceu �i diploma de absolvire �i 05 =D pentru alt tip de studii. Se observ� astfel c� pentru fiecare categorie, num�rul variabilelor calitative este mai mic cu o unitate decât cel al clasificarilor. Se poate scrie ecua�ia de regresie astfel: εγγγγγβα +++++++= 5544332211 DDDDDYC Observa�ii: 1. În cadrul acestei metode s-a mers pe presupunerea c� doar inter- ceptarea se schimb� pentru fiecare grup în parte �i nu coeficien�ii de pant�; 2. Termenul interceptarii pentru fiecare entitate în parte este ob�inut prin substituirea valorilor apropiate de 1D cu 5D .

Capitolul 6. Variabile calitative

137

Spre exemplu, pentru un b�rbat cu vârsta < 25 de ani, cu diploma de absolvire a facult��ii, se ob�ine 11 =D , 12 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� interceptarea este 21 γγα ++ . Pentru o femeie cu vârsta > 50 de ani, cu diploma de absolvire a facult��ii, se ob�ine 01 =D , 02 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� intercep-tarea este α . Este de remarcat faptul c� metoda variabilei calitative este folosit� �i pentru aranjarea factorilor de sezonalitate. Spre exemplu, dac� avem datele trimestriale despre consumul C �i venitul Y, cu ecua�ia de regresie: ελλλλβα ++++++= 44332211 DDDDYC unde 1D , 2D , 3D �i 4D reprezint� variabile calitative(dummy), definite astfel: 11 =D pentru primul trimestru �i 01 =D pentru celelalte trimestre; 12 =D pentru al doilea trimestru �i 02 =D pentru celelalte trimestre; 13 =D pentru al treilea trimestru �i 03 =D pentru celelalte trimestre; 14 =D pentru al patrulea trimestru �i 04 =D pentru celelalte trimestre. În ceea ce prive�te sezonalitatea la nivel de luni ale anului, avem 11 variabile calitative(dummy), definite astfel: 11 =D pentru luna ianuarie �i 01 =D pentru celelalte luni ale anului; 12 =D pentru luna februarie �i 02 =D pentru celelalte luni ale anului; ......................................... 112 =D pentru luna decembrie �i 012 =D pentru celelalte luni ale anului. 6.2. Variabile calitative ce eviden�iaz� modificarea pantei În cazul în care pentru primul grup ecua�ia de regresie este: 11111 εβα ++= xy , iar pentru cel de-al doilea grup avem 22222 εβα ++= xy , acestea se pot scrie astfel: 112111211 0)(0)( εβββααα +⋅−++⋅−+= xy 2212211212 )(1)( εβββααα +⋅−++⋅−+= xxy sau: εβββααα +−++−+= 21211121 )()( DxDy unde: 01 =D pentru toate observa�iile din grupa 1 �i 11 =D pentru toate observa�iile din al doilea grup; 02 =D pentru toate observa�iile din primul grup �i 22 xD = , adic� valoarea respectiv� a lui x pentru toate observa�iile din al doilea grup

ECONOMETRIE. Teorie �i aplica�ii

138

cu 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Coeficientul lui 1D m�soar� diferen�a de interceptare, iar coeficie- ntul lui 2D m�soar� diferen�a de pant�; 2. Estimarea ecua�iei se reduce la estimarea celor dou� ecua�ii de regresie pentru care erorile au o distribu�ie identic�. Fie pentru exemplificare datele pentru trei perioade, iar în cea de-a doua perioad� se schimba doar interceptarea. De asemenea, se presupune c� în cea de-a treia perioad� se schimb� �i interceptarea �i panta. Vom avea astfel: 11111 εβα ++= xy pentru prima perioad�; 22122 εβα ++= xy pentru a doua perioad�; 33233 εβα ++= xy pentru a treia perioad�. Ecua�iile se vor combina �i va rezulta modelul: εβββααααα +−++−+−+= 31212131121 )()()( DxDDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din celelalte perioade; 12 =D pentru observa�iile din perioada a treia �i 02 =D pentru observa�iile din celelalte perioade; 03 =D pentru observa�iile din perioadele 1 �i 2 �i 33 xD = sau valoarea res- pectiv� a lui x pentru toate observa�iile din perioada 3 cu 1D , 2D �i 3D reprezentând variabile calitative. O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:

���

���

+���

���

+���

���

+���

���

+���

���

+���

���

=���

���

3

2

1

3

22

1

1321

3

2

1

00

0100

010

001

εεε

ββαααx

x

x

y

y

y

sau echivalent

33213213

22213212

12113211

0100

0010

0001

εββαααεββαααεββααα

+×+×+×+×+×=+×+×+×+×+×=+×+×+×+×+×=

xy

xy

xy

Ecua�ia se poate scrie echivalent: εββααα +++++= 5241332211 DDDDDy unde: 12 =D pentru observa�iile din perioada adoua �i 02 =D pentru observa�iile din celelalte perioade; ixD =4 corespunde valorii lui x pentru perioadele 1 �i 2, �i 04 =D pentru observa�iile perioadei 3

Capitolul 6. Variabile calitative

139

6.3. Variabile calitative pentru restric�iile ecua�iilor încruci�ate

Pentru a în�elege aceast� situa�ie, se apeleaz� la un model al dependen�elor dintre pre�ul c�rnii de porc, vit�, pui �i pe�te, dat de ecua�iile urm�toare:

4444433422411434

3343433322311333

2242432322211222

1141431321211111

εηββββαεηββββαεηββββα

εηββββα

++++++=++++++=++++++=

++++++=

yxxxxp

yxxxxp

yxxxxp

yxxxxp

unde: 1p - pre�ul cu am�nuntul al c�rnii de porc; 2p - pre�ul unitar pe kg carne de vit�; 3p - pre�ul unitar pe kg carne de pui; 4p - pre�ul unitar pe kg carne de pe�te; 1x - consumul de carne de porc pe cap de locuitor; 2x - consumul de carne de vit� pe cap de locuitor; 3x - consumul de carne de pui pe cap de locuitor; 4x - consumul de carne de pe�te pe cap de locuitor; y - venitul disponibil pe cap de locuitor. Observa�ie: În cadrul sistemului de ecua�ii, se poate observa simetria în ceea ce prive�te coeficien�ii β , adic�:

141

4

4

1

131

3

3

1

121

2

2

1

β

β

β

==

==

==

dxdp

dxdp

dxdp

dxdp

dxdp

dxdp

343

4

4

3

242

4

4

2

232

3

3

2

β

β

β

==

==

==

dxdp

dxdp

dxdp

dxdp

dxdp

dxdp

O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

=

�����

�����

1

4

141

3

131

2

12

1

11321

4

3

2

1

00

0

0

00

000

0100

0010

0001

x

x

x

x

x

xx

p

p

p

p

ββββααα

ECONOMETRIE. Teorie �i aplica�ii

140

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

4

3

2

1

4

44

3

434

333

2

424

2

323

222 0

00

00

0

00

0

0

0

0

00

0

εεεε

ββββββ

xx

xx

x

x

x

xx

6.4. Testarea stabilit��ii coeficien�ilor de regresie corespun- z�tori variabilelor calitative Deosebit de important� este �i testarea stabilit��ii coeficien�ilor variabilelor calitative. Pentru exemplificare, vom presupune ecua�iile: 1111111 εηβα +++= zxy pentru prima perioad�; 2222222 εηβα +++= zxy pentru a doua perioad�. Se poate demonstra ipoteza potrivit c�reia nici unul dintre coeficien�i nu s-a schimbat de-a lungul perioadei, ci doar interceptarea �i coeficientul variabilei x. Ca urmare, ecua�ia pentru dou� perioade poate fi astfel scris� astfel: ( ) ( ) ( ) εηηηβββααα +−++−++−+= 312121211121 DzDxDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din perioada 1; 22 xD = pentru observa�iile din perioada a doua �i 02 =D pentru observa- �iile din perioada 1; 23 zD = pentru observa�iile asupra variabilei z din perioada 2 �i 03 =D

pentru observa�iile din perioada 1 cu 1D , 2D �i 3D reprezentând variabile calitative. Observa�ie: Se pot înlatura variabile calitative, în func�ie de ipotezele luate în calcul, �i anume: Ipoteze Variabile inlaturate

(1) to�i coeficien�ii au valori egale 1D , 2D , 3D

212121 ,, ηηββαα ===

(2) se schimb� doar interceptarea 2D , 3D

2121 , ηηββ ==

(3) se shimb� interceptarea �i coeficien�ii lui z 2D 21 ββ =

Capitolul 6. Variabile calitative

141

Pentru testarea stabilit��ii coeficien�ilor variabilelor calitative, având 21 nn + observa�ii, se aplic� testul Chow, folosind formula:

11

1

2

1

−−

=

mnSPVR

nSPVRSPVR

F

unde: SPVR - reprezint� suma p�tratelor erorilor, cu 21 nn + observa�ii; 1SPVR - reprezint� suma p�tratelor erorilor, cu 1n observa�ii. 2n - reprezint� num�rul variabilelor calitative; 1n - reprezint� num�rul variabilelor calitative; Observa�ie: Imperfec�iunea testului F const� în faptul c� nu indic� care dintre cele 2n observa�ii duce la instabilitatea coeficien�ilor. Ca urmare:

- se va defini un set de 2n variabile calitative, unde 1=iD pentru in +1

observa�ii, cu 2,1 ni = �i 0=iD pentru celelalte observa�ii; - se va testa dac� coeficien�ii varibilelor calitative sunt nuli �i se va vedea

astfel care dintre observa�ii sunt semnificativ în afara liniei regresiei estimat� pentru primele 1n observa�ii.

Observa�ie: Parametrii comuni regresiei vor fi estima�i pentru primele 1n observa�ii, iar coeficientul variabilei calitative “i”, 21 ,...,1 nni += va masura eroarea previzionat� pentru predic�ia observa�iei bazat� pe coeficien�ii estima�i din primele 1n observa�ii, iar abaterea standard a acestui coeficient va m�sura abaterea standard a erorii predictive. Exemplul 6.3. Fie modelul dat de:

εββα +++= 2211 xxY pentru primele 1n observa�ii; εηββα ++++= 12211 xxY pentru a 11 +n observa�ie; εηββα ++++= 22211 xxY pentru a 21 +n observa�ie.

Minimiz�m suma p�tratelor: � ++=

++

1

211

21

21

2n

inni uuu , cu 21 ,, ββα

��

� ob�inute din

minimizarea expresiei � =11

2ni iu �i jjjj xxY 2211 ββαγ

��

�� −−−= pentru 11 += nj �i

21 +n . În continuare vom prezenta cum putem folosi metoda variabilelor calitative pentru a genera predic�ii în afara modelului �i abaterilelor standard. Presupunem pentru aceasta c� avem n observa�ii asupra lui Y , 1x �i 2x , �i se furnizeaz� observa�ia cu num�rul 1+n asupra lui 1x �i 2x �i se cere valoarea

ECONOMETRIE. Teorie �i aplica�ii

142

previzionat� pentru Y �i abaterea standard a previzion�rii. Pa�ii necesari rezolv�rii cerin�ei sunt urm�torii: Pasul 1: Se va egala cu zero valoarea lui Y pentru observa�ia cu num�rul 1+n . Pasul 2: Variabila calitativ� D se va defini astfel: 0 pentru primele n observa�ii �i -1 pentru a 1+n -a observa�ie. Pasul 3: Se va scrie regresia pentru Y , 1x �i 2x �i D, folosind cele 1+n

observa�ii. Comentariu: Coeficientul lui D reprezint� valoarea previzionat� 1+nY , iar abaterea sa standard este eroarea standard a valorii previzionate. Pentru exemplificare, vom utiliza modelul εββα +++= 2211 xxY pentru primele n observa�ii �i εγββα +−++= 22110 xx pentru urm�toarea observa-�ie(a 1+n -a). Prin minimizarea sumei p�tratelor erorilor, se ob�ine: 2211 xx ββαγ

��

�� ++= pentru a 1+n -a observa�ie. Astfel, 1+= nY

�γ . Acest� metod� a fost extins� de c�tre Pagan �i Nicholls pentru modelele neliniare �i modelele cu ecua�ii simultane. 6.5. Heteroscedasticitatea �i autocorelarea variabilelor calitative Variabilele calitative trebuie folosite cu mult� precau�ie atunci când este vorba de heteroscedasticitate �i autocorelare. Cazul heteroscedasticitatii Fie dou� ecua�ii: 1111 εβα ++= xy pentru primul grup; 2122 εβα ++= xy pentru a doua grup�; Se consider�, de asemenea, c� ( ) ( ) 2

22211 var,var σεσε == .

Observa�ii: 1. În estimarea de ecua�ii, se presupune natural c� 22

21 σσ = .

2. Dac� 22

21 σσ ≠ , chiar dac� 2α nu este semnificativ diferit de 1α �i

2β nu este semnificativ diferit de 1β , coeficien�ii variabilelor calitative sunt reprezentativi. Cazul autocorel�rii Presupunând c� erorile din ecua�iile celor dou� grupuri sunt ordonate autoregresiv, vom avea:

1

*

1*

−=

−=

ttt

ttt

xxx

yyy

ρρ

Întrebarea: Ce se întampl� cu varibilele calitative?

Capitolul 6. Variabile calitative

143

R�spunsul: Se va considera cazul cu 1n observa�ii pentru primul grup �i 2n observa�ii pentru al doilea grup. Se va introduce �i variabila timp t pentru fiecare observa�ie. Vom avea:

( )( )ραα

ραα−=

−=

1

1

2*2

1*1 care pot fi rescrise ca:

( ) ( ) teDxDy +−++−+= 212

*11

*1

*2

*1

* βββααα unde te reprezint� erorile, definite prin rela�ia: 1−−= ttte ρεε . Pentru aceast� observa�ie, ecua�ia diferen�iat� în func�ie de ρ ia forma:

( )

( ) ( ) tttt

ttttt

exxy

exxyy

+−++−−

+=

+−+−=− −−

12*

1*2

*1

*1

*

112121

11 βββαα

ρα

ρββρααρ

Aceasta înseamn� c� variabilele calitative 1D �i 2D trebuie astfel definite:

01 =D pentru observa�iile primului grup �i ρ−

=1

11D pentru observa�ii-

le celui de-al doilea grup; 02 =D pentru toate observa�iile din primul grup, txD =2 pentru prima

observa�ie din cel de-al doilea grup, �i *2 txD = pentru celelalte

observa�ii ale celui de-al doilea grup. 6.6. Variabile dependente calitative Dac� pân� acum s-au luat în considerare numai cazurile în care variabilele explicative erau �i calitative, în continuare se va pune problema studiului modelelor în care variabila explicat� este cea calitativ�. Observa�ii: 1. Aceasta poate lua dou� sau mai multe valori, în continuare fiind tratat doar cazul în care ia doar dou� valori: 0 sau 1. 2. Deoarece aceast� variabil� ia doar dou� valori, se va numi variabil� dihotomic�. Exist� numeroase exemple de variabile explicate dichotomice, cum ar fi: y = 1 dac� o persoan� se încadreaz� în for�a de munc� �i y = 0 dac� nu sau y = 1 dac� o persoan� de�ine o cas� y = 0 dac� nu.

ECONOMETRIE. Teorie �i aplica�ii

144

Exist� numeroase metode de analiz� a modelelor de regresie pentru care variabila dependent� este 0 sau 1. Cea mai simpl� metod� este OLS, caz în care se va numi modelul probabilit��ii liniare. O alt� metod�, numit� func�ia discriminant liniar�, este în strans� legatur� cu modelul probabilita�ii liniare. Modelele care rezolv� astfel de probleme sunt cunoscute ca modele1 logit, probit �i.totodat� tobit.

1 a se vedea Madala G.S., Introduction to Econometrics, Prentice Hall, Inc., 2001, pg. 322-338