Econometrie - Capitolul 6 - Variabile Calitative

11
Capitolul 6 Variabile calitative Prof. dr. Stelian STANCU Dac pân acum variabilele analizate erau presupuse continue, în continuare referirea se va face la cazul când variabilele ecuaiei de regresie sunt considerate variabilele explicative calitative i variabilele trunchiate i arat modul în care pot fi folosite, inându-se cont de diferenele de interceptare a coeficienilor, de estimarea ecuaiilor cu restricii încruciate i de testele de stabilitate a coeficienilor de regresie. Analiza se va face asupra variabilelor explicative calitative i respective a variabilelor dependente calitative. Variabilele explicative calitative pot fi folosite în diverse scopuri precum: - permit diferenele de interceptare a termenilor; - permit diferenierea pantelor; - permit testarea stabilitaii coeficienilor regresiei. 6.1. Variabile calitative ce evideniaz modificarea termenului intercept Fie relaia dintre venitul y i anii de coala x pentru dou grupe, 1 i 2. Pantele liniilor de regresie pentru ambele grupuri sunt aproximativ la fel. Prin urmare, ecuaia de regresie va fi: ε β α + + = x y 1 , pentru grupa 1; i respectiv ε β α + + = x y 2 , pentru grupa 2; putând fi grupate într-o singur ecuaie: ε β α α α + + - + = x D y ) ( 1 2 1 unde: 0 = D pentru grupa 1, respectiv 1 = D pentru grupa 2, D reprezentând variabila calitativ. Observaie: Coeficientul acestei variabile msoar diferenele dintre cei doi termeni ai interceptrii.

Transcript of Econometrie - Capitolul 6 - Variabile Calitative

Page 1: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6 Variabile calitative

Prof. dr. Stelian STANCU

� �

Dac� pân� acum variabilele analizate erau presupuse continue, în continuare referirea se va face la cazul când variabilele ecua�iei de regresie sunt considerate variabilele explicative calitative �i variabilele trunchiate �i arat� modul în care pot fi folosite, �inându-se cont de diferen�ele de interceptare a coeficien�ilor, de estimarea ecua�iilor cu restric�ii încruci�ate �i de testele de stabilitate a coeficien�ilor de regresie. Analiza se va face asupra variabilelor explicative calitative �i respective a variabilelor dependente calitative. Variabilele explicative calitative pot fi folosite în diverse scopuri precum:

- permit diferen�ele de interceptare a termenilor; - permit diferen�ierea pantelor; - permit testarea stabilita�ii coeficien�ilor regresiei.

6.1. Variabile calitative ce eviden�iaz� modificarea termenului intercept Fie rela�ia dintre venitul y �i anii de �coala x pentru dou� grupe, 1 �i 2. Pantele liniilor de regresie pentru ambele grupuri sunt aproximativ la fel. Prin urmare, ecua�ia de regresie va fi: εβα ++= xy 1 , pentru grupa 1; �i respectiv εβα ++= xy 2 , pentru grupa 2; putând fi grupate într-o singur� ecua�ie: εβααα ++−+= xDy )( 121 unde: 0=D pentru grupa 1, respectiv 1=D pentru grupa 2, D reprezentând variabila calitativ�. Observa�ie: Coeficientul acestei variabile m�soar� diferen�ele dintre cei doi termeni ai intercept�rii.

Page 2: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6. Variabile calitative

135

Grupa 1 • • • • Grupa 2 • � � � • • � � � � � � � Figura 6.1. Obsera�ie: În cazul existen�ei mai multor grupuri se impune introducerea mai multor variabile. Astfel, pentru trei grupuri avem: εβα ++= xy 1 , pentru grupa 1; εβα ++= xy 2 , pentru grupa 2; �i respectiv εβα ++= xy 3 , pentru grupa 3 putând fi grupate într-o singur� ecua�ie: εβααααα ++−+−+= xDDy 2131121 )()( unde: 11 =D pentru grupa 2 �i 01 =D pentru grupele 1 �i 3, respectiv 12 =D pentru grupa 3 �i 02 =D pentru grupele 1 �i 2, 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Prin substituirea valorilor lui 1D �i 2D în cadrul ecua�iei, putem ob�ine valorile 321 ,, ααα pentru cele trei grupe. 2. Prin combinarea celor trei ecua�ii, se presupune c� panta( β ) este aceea�i, în timp ce eroarea ε are aceea�i distribu�ie pentru toate grupele.

Page 3: Econometrie - Capitolul 6 - Variabile Calitative

ECONOMETRIE. Teorie �i aplica�ii

136

3. În cazul existen�ei unui termen constant în ecua�ia de regresie, num�rul variabilelor calitative trebuie s� fie întotdeauna cu o unitate mai mic decât num�rul grupelor pe categorii, deoarece termenul constant este în acelasi timp termenul de interceptare al grupului de baz�, iar coeficien�ii variabilei calitative m�soar� diferen�e de interceptare. Exemplul 6.1. Presupunem c� avem date despre consumul C �i venitul Y pentru un anumit num�r de gospodarii, �i de asemenea, se cunosc:

S: sexul capului familiei; A: vârsta capului familiei, care este dat� pe trei categorii: < 25 de ani; între 25 �i 50 de ani; > 50 de ani. E: tipul educa�iei capului familiei: - liceu; - între liceu �i diploma de absolvire; - cel pu�in diploma de absolvire a unei facult��i.

Se vor include aceste variabile prezentate mai sus sub forma variabilelor calitative, astfel: 11 =D pentru sex masculin �i 01 =D pentru sex feminin ; 12 =D pentru vârsta < 25 de ani �i 02 =D pentru vârsta cuprins� în alt interval; 13 =D pentru vârsta între 25 �i 50 de ani, �i 03 =D pentru vârsta în alt interval; 14 =D pentru studii < liceu �i 04 =D pentru alte studii; 15 =D pentru studii între liceu �i diploma de absolvire �i 05 =D pentru alt tip de studii. Se observ� astfel c� pentru fiecare categorie, num�rul variabilelor calitative este mai mic cu o unitate decât cel al clasificarilor. Se poate scrie ecua�ia de regresie astfel: εγγγγγβα +++++++= 5544332211 DDDDDYC Observa�ii: 1. În cadrul acestei metode s-a mers pe presupunerea c� doar inter- ceptarea se schimb� pentru fiecare grup în parte �i nu coeficien�ii de pant�; 2. Termenul interceptarii pentru fiecare entitate în parte este ob�inut prin substituirea valorilor apropiate de 1D cu 5D .

Page 4: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6. Variabile calitative

137

Spre exemplu, pentru un b�rbat cu vârsta < 25 de ani, cu diploma de absolvire a facult��ii, se ob�ine 11 =D , 12 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� interceptarea este 21 γγα ++ . Pentru o femeie cu vârsta > 50 de ani, cu diploma de absolvire a facult��ii, se ob�ine 01 =D , 02 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� intercep-tarea este α . Este de remarcat faptul c� metoda variabilei calitative este folosit� �i pentru aranjarea factorilor de sezonalitate. Spre exemplu, dac� avem datele trimestriale despre consumul C �i venitul Y, cu ecua�ia de regresie: ελλλλβα ++++++= 44332211 DDDDYC unde 1D , 2D , 3D �i 4D reprezint� variabile calitative(dummy), definite astfel: 11 =D pentru primul trimestru �i 01 =D pentru celelalte trimestre; 12 =D pentru al doilea trimestru �i 02 =D pentru celelalte trimestre; 13 =D pentru al treilea trimestru �i 03 =D pentru celelalte trimestre; 14 =D pentru al patrulea trimestru �i 04 =D pentru celelalte trimestre. În ceea ce prive�te sezonalitatea la nivel de luni ale anului, avem 11 variabile calitative(dummy), definite astfel: 11 =D pentru luna ianuarie �i 01 =D pentru celelalte luni ale anului; 12 =D pentru luna februarie �i 02 =D pentru celelalte luni ale anului; ......................................... 112 =D pentru luna decembrie �i 012 =D pentru celelalte luni ale anului. 6.2. Variabile calitative ce eviden�iaz� modificarea pantei În cazul în care pentru primul grup ecua�ia de regresie este: 11111 εβα ++= xy , iar pentru cel de-al doilea grup avem 22222 εβα ++= xy , acestea se pot scrie astfel: 112111211 0)(0)( εβββααα +⋅−++⋅−+= xy 2212211212 )(1)( εβββααα +⋅−++⋅−+= xxy sau: εβββααα +−++−+= 21211121 )()( DxDy unde: 01 =D pentru toate observa�iile din grupa 1 �i 11 =D pentru toate observa�iile din al doilea grup; 02 =D pentru toate observa�iile din primul grup �i 22 xD = , adic� valoarea respectiv� a lui x pentru toate observa�iile din al doilea grup

Page 5: Econometrie - Capitolul 6 - Variabile Calitative

ECONOMETRIE. Teorie �i aplica�ii

138

cu 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Coeficientul lui 1D m�soar� diferen�a de interceptare, iar coeficie- ntul lui 2D m�soar� diferen�a de pant�; 2. Estimarea ecua�iei se reduce la estimarea celor dou� ecua�ii de regresie pentru care erorile au o distribu�ie identic�. Fie pentru exemplificare datele pentru trei perioade, iar în cea de-a doua perioad� se schimba doar interceptarea. De asemenea, se presupune c� în cea de-a treia perioad� se schimb� �i interceptarea �i panta. Vom avea astfel: 11111 εβα ++= xy pentru prima perioad�; 22122 εβα ++= xy pentru a doua perioad�; 33233 εβα ++= xy pentru a treia perioad�. Ecua�iile se vor combina �i va rezulta modelul: εβββααααα +−++−+−+= 31212131121 )()()( DxDDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din celelalte perioade; 12 =D pentru observa�iile din perioada a treia �i 02 =D pentru observa�iile din celelalte perioade; 03 =D pentru observa�iile din perioadele 1 �i 2 �i 33 xD = sau valoarea res- pectiv� a lui x pentru toate observa�iile din perioada 3 cu 1D , 2D �i 3D reprezentând variabile calitative. O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:

���

���

+���

���

+���

���

+���

���

+���

���

+���

���

=���

���

3

2

1

3

22

1

1321

3

2

1

00

0100

010

001

εεε

ββαααx

x

x

y

y

y

sau echivalent

33213213

22213212

12113211

0100

0010

0001

εββαααεββαααεββααα

+×+×+×+×+×=+×+×+×+×+×=+×+×+×+×+×=

xy

xy

xy

Ecua�ia se poate scrie echivalent: εββααα +++++= 5241332211 DDDDDy unde: 12 =D pentru observa�iile din perioada adoua �i 02 =D pentru observa�iile din celelalte perioade; ixD =4 corespunde valorii lui x pentru perioadele 1 �i 2, �i 04 =D pentru observa�iile perioadei 3

Page 6: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6. Variabile calitative

139

6.3. Variabile calitative pentru restric�iile ecua�iilor încruci�ate

Pentru a în�elege aceast� situa�ie, se apeleaz� la un model al dependen�elor dintre pre�ul c�rnii de porc, vit�, pui �i pe�te, dat de ecua�iile urm�toare:

4444433422411434

3343433322311333

2242432322211222

1141431321211111

εηββββαεηββββαεηββββα

εηββββα

++++++=++++++=++++++=

++++++=

yxxxxp

yxxxxp

yxxxxp

yxxxxp

unde: 1p - pre�ul cu am�nuntul al c�rnii de porc; 2p - pre�ul unitar pe kg carne de vit�; 3p - pre�ul unitar pe kg carne de pui; 4p - pre�ul unitar pe kg carne de pe�te; 1x - consumul de carne de porc pe cap de locuitor; 2x - consumul de carne de vit� pe cap de locuitor; 3x - consumul de carne de pui pe cap de locuitor; 4x - consumul de carne de pe�te pe cap de locuitor; y - venitul disponibil pe cap de locuitor. Observa�ie: În cadrul sistemului de ecua�ii, se poate observa simetria în ceea ce prive�te coeficien�ii β , adic�:

141

4

4

1

131

3

3

1

121

2

2

1

β

β

β

==

==

==

dxdp

dxdp

dxdp

dxdp

dxdp

dxdp

343

4

4

3

242

4

4

2

232

3

3

2

β

β

β

==

==

==

dxdp

dxdp

dxdp

dxdp

dxdp

dxdp

O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

=

�����

�����

1

4

141

3

131

2

12

1

11321

4

3

2

1

00

0

0

00

000

0100

0010

0001

x

x

x

x

x

xx

p

p

p

p

ββββααα

Page 7: Econometrie - Capitolul 6 - Variabile Calitative

ECONOMETRIE. Teorie �i aplica�ii

140

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

�����

�����

+

4

3

2

1

4

44

3

434

333

2

424

2

323

222 0

00

00

0

00

0

0

0

0

00

0

εεεε

ββββββ

xx

xx

x

x

x

xx

6.4. Testarea stabilit��ii coeficien�ilor de regresie corespun- z�tori variabilelor calitative Deosebit de important� este �i testarea stabilit��ii coeficien�ilor variabilelor calitative. Pentru exemplificare, vom presupune ecua�iile: 1111111 εηβα +++= zxy pentru prima perioad�; 2222222 εηβα +++= zxy pentru a doua perioad�. Se poate demonstra ipoteza potrivit c�reia nici unul dintre coeficien�i nu s-a schimbat de-a lungul perioadei, ci doar interceptarea �i coeficientul variabilei x. Ca urmare, ecua�ia pentru dou� perioade poate fi astfel scris� astfel: ( ) ( ) ( ) εηηηβββααα +−++−++−+= 312121211121 DzDxDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din perioada 1; 22 xD = pentru observa�iile din perioada a doua �i 02 =D pentru observa- �iile din perioada 1; 23 zD = pentru observa�iile asupra variabilei z din perioada 2 �i 03 =D

pentru observa�iile din perioada 1 cu 1D , 2D �i 3D reprezentând variabile calitative. Observa�ie: Se pot înlatura variabile calitative, în func�ie de ipotezele luate în calcul, �i anume: Ipoteze Variabile inlaturate

(1) to�i coeficien�ii au valori egale 1D , 2D , 3D

212121 ,, ηηββαα ===

(2) se schimb� doar interceptarea 2D , 3D

2121 , ηηββ ==

(3) se shimb� interceptarea �i coeficien�ii lui z 2D 21 ββ =

Page 8: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6. Variabile calitative

141

Pentru testarea stabilit��ii coeficien�ilor variabilelor calitative, având 21 nn + observa�ii, se aplic� testul Chow, folosind formula:

11

1

2

1

−−

=

mnSPVR

nSPVRSPVR

F

unde: SPVR - reprezint� suma p�tratelor erorilor, cu 21 nn + observa�ii; 1SPVR - reprezint� suma p�tratelor erorilor, cu 1n observa�ii. 2n - reprezint� num�rul variabilelor calitative; 1n - reprezint� num�rul variabilelor calitative; Observa�ie: Imperfec�iunea testului F const� în faptul c� nu indic� care dintre cele 2n observa�ii duce la instabilitatea coeficien�ilor. Ca urmare:

- se va defini un set de 2n variabile calitative, unde 1=iD pentru in +1

observa�ii, cu 2,1 ni = �i 0=iD pentru celelalte observa�ii; - se va testa dac� coeficien�ii varibilelor calitative sunt nuli �i se va vedea

astfel care dintre observa�ii sunt semnificativ în afara liniei regresiei estimat� pentru primele 1n observa�ii.

Observa�ie: Parametrii comuni regresiei vor fi estima�i pentru primele 1n observa�ii, iar coeficientul variabilei calitative “i”, 21 ,...,1 nni += va masura eroarea previzionat� pentru predic�ia observa�iei bazat� pe coeficien�ii estima�i din primele 1n observa�ii, iar abaterea standard a acestui coeficient va m�sura abaterea standard a erorii predictive. Exemplul 6.3. Fie modelul dat de:

εββα +++= 2211 xxY pentru primele 1n observa�ii; εηββα ++++= 12211 xxY pentru a 11 +n observa�ie; εηββα ++++= 22211 xxY pentru a 21 +n observa�ie.

Minimiz�m suma p�tratelor: � ++=

++

1

211

21

21

2n

inni uuu , cu 21 ,, ββα

��

� ob�inute din

minimizarea expresiei � =11

2ni iu �i jjjj xxY 2211 ββαγ

��

�� −−−= pentru 11 += nj �i

21 +n . În continuare vom prezenta cum putem folosi metoda variabilelor calitative pentru a genera predic�ii în afara modelului �i abaterilelor standard. Presupunem pentru aceasta c� avem n observa�ii asupra lui Y , 1x �i 2x , �i se furnizeaz� observa�ia cu num�rul 1+n asupra lui 1x �i 2x �i se cere valoarea

Page 9: Econometrie - Capitolul 6 - Variabile Calitative

ECONOMETRIE. Teorie �i aplica�ii

142

previzionat� pentru Y �i abaterea standard a previzion�rii. Pa�ii necesari rezolv�rii cerin�ei sunt urm�torii: Pasul 1: Se va egala cu zero valoarea lui Y pentru observa�ia cu num�rul 1+n . Pasul 2: Variabila calitativ� D se va defini astfel: 0 pentru primele n observa�ii �i -1 pentru a 1+n -a observa�ie. Pasul 3: Se va scrie regresia pentru Y , 1x �i 2x �i D, folosind cele 1+n

observa�ii. Comentariu: Coeficientul lui D reprezint� valoarea previzionat� 1+nY , iar abaterea sa standard este eroarea standard a valorii previzionate. Pentru exemplificare, vom utiliza modelul εββα +++= 2211 xxY pentru primele n observa�ii �i εγββα +−++= 22110 xx pentru urm�toarea observa-�ie(a 1+n -a). Prin minimizarea sumei p�tratelor erorilor, se ob�ine: 2211 xx ββαγ

��

�� ++= pentru a 1+n -a observa�ie. Astfel, 1+= nY

�γ . Acest� metod� a fost extins� de c�tre Pagan �i Nicholls pentru modelele neliniare �i modelele cu ecua�ii simultane. 6.5. Heteroscedasticitatea �i autocorelarea variabilelor calitative Variabilele calitative trebuie folosite cu mult� precau�ie atunci când este vorba de heteroscedasticitate �i autocorelare. Cazul heteroscedasticitatii Fie dou� ecua�ii: 1111 εβα ++= xy pentru primul grup; 2122 εβα ++= xy pentru a doua grup�; Se consider�, de asemenea, c� ( ) ( ) 2

22211 var,var σεσε == .

Observa�ii: 1. În estimarea de ecua�ii, se presupune natural c� 22

21 σσ = .

2. Dac� 22

21 σσ ≠ , chiar dac� 2α nu este semnificativ diferit de 1α �i

2β nu este semnificativ diferit de 1β , coeficien�ii variabilelor calitative sunt reprezentativi. Cazul autocorel�rii Presupunând c� erorile din ecua�iile celor dou� grupuri sunt ordonate autoregresiv, vom avea:

1

*

1*

−=

−=

ttt

ttt

xxx

yyy

ρρ

Întrebarea: Ce se întampl� cu varibilele calitative?

Page 10: Econometrie - Capitolul 6 - Variabile Calitative

Capitolul 6. Variabile calitative

143

R�spunsul: Se va considera cazul cu 1n observa�ii pentru primul grup �i 2n observa�ii pentru al doilea grup. Se va introduce �i variabila timp t pentru fiecare observa�ie. Vom avea:

( )( )ραα

ραα−=

−=

1

1

2*2

1*1 care pot fi rescrise ca:

( ) ( ) teDxDy +−++−+= 212

*11

*1

*2

*1

* βββααα unde te reprezint� erorile, definite prin rela�ia: 1−−= ttte ρεε . Pentru aceast� observa�ie, ecua�ia diferen�iat� în func�ie de ρ ia forma:

( )

( ) ( ) tttt

ttttt

exxy

exxyy

+−++−−

+=

+−+−=− −−

12*

1*2

*1

*1

*

112121

11 βββαα

ρα

ρββρααρ

Aceasta înseamn� c� variabilele calitative 1D �i 2D trebuie astfel definite:

01 =D pentru observa�iile primului grup �i ρ−

=1

11D pentru observa�ii-

le celui de-al doilea grup; 02 =D pentru toate observa�iile din primul grup, txD =2 pentru prima

observa�ie din cel de-al doilea grup, �i *2 txD = pentru celelalte

observa�ii ale celui de-al doilea grup. 6.6. Variabile dependente calitative Dac� pân� acum s-au luat în considerare numai cazurile în care variabilele explicative erau �i calitative, în continuare se va pune problema studiului modelelor în care variabila explicat� este cea calitativ�. Observa�ii: 1. Aceasta poate lua dou� sau mai multe valori, în continuare fiind tratat doar cazul în care ia doar dou� valori: 0 sau 1. 2. Deoarece aceast� variabil� ia doar dou� valori, se va numi variabil� dihotomic�. Exist� numeroase exemple de variabile explicate dichotomice, cum ar fi: y = 1 dac� o persoan� se încadreaz� în for�a de munc� �i y = 0 dac� nu sau y = 1 dac� o persoan� de�ine o cas� y = 0 dac� nu.

Page 11: Econometrie - Capitolul 6 - Variabile Calitative

ECONOMETRIE. Teorie �i aplica�ii

144

Exist� numeroase metode de analiz� a modelelor de regresie pentru care variabila dependent� este 0 sau 1. Cea mai simpl� metod� este OLS, caz în care se va numi modelul probabilit��ii liniare. O alt� metod�, numit� func�ia discriminant liniar�, este în strans� legatur� cu modelul probabilita�ii liniare. Modelele care rezolv� astfel de probleme sunt cunoscute ca modele1 logit, probit �i.totodat� tobit.

1 a se vedea Madala G.S., Introduction to Econometrics, Prentice Hall, Inc., 2001, pg. 322-338