Econometrie - Capitolul 6 - Variabile Calitative
-
Upload
galin-markov -
Category
Documents
-
view
240 -
download
3
Transcript of Econometrie - Capitolul 6 - Variabile Calitative
�
Capitolul 6 Variabile calitative
Prof. dr. Stelian STANCU
� �
Dac� pân� acum variabilele analizate erau presupuse continue, în continuare referirea se va face la cazul când variabilele ecua�iei de regresie sunt considerate variabilele explicative calitative �i variabilele trunchiate �i arat� modul în care pot fi folosite, �inându-se cont de diferen�ele de interceptare a coeficien�ilor, de estimarea ecua�iilor cu restric�ii încruci�ate �i de testele de stabilitate a coeficien�ilor de regresie. Analiza se va face asupra variabilelor explicative calitative �i respective a variabilelor dependente calitative. Variabilele explicative calitative pot fi folosite în diverse scopuri precum:
- permit diferen�ele de interceptare a termenilor; - permit diferen�ierea pantelor; - permit testarea stabilita�ii coeficien�ilor regresiei.
6.1. Variabile calitative ce eviden�iaz� modificarea termenului intercept Fie rela�ia dintre venitul y �i anii de �coala x pentru dou� grupe, 1 �i 2. Pantele liniilor de regresie pentru ambele grupuri sunt aproximativ la fel. Prin urmare, ecua�ia de regresie va fi: εβα ++= xy 1 , pentru grupa 1; �i respectiv εβα ++= xy 2 , pentru grupa 2; putând fi grupate într-o singur� ecua�ie: εβααα ++−+= xDy )( 121 unde: 0=D pentru grupa 1, respectiv 1=D pentru grupa 2, D reprezentând variabila calitativ�. Observa�ie: Coeficientul acestei variabile m�soar� diferen�ele dintre cei doi termeni ai intercept�rii.
Capitolul 6. Variabile calitative
135
Grupa 1 • • • • Grupa 2 • � � � • • � � � � � � � Figura 6.1. Obsera�ie: În cazul existen�ei mai multor grupuri se impune introducerea mai multor variabile. Astfel, pentru trei grupuri avem: εβα ++= xy 1 , pentru grupa 1; εβα ++= xy 2 , pentru grupa 2; �i respectiv εβα ++= xy 3 , pentru grupa 3 putând fi grupate într-o singur� ecua�ie: εβααααα ++−+−+= xDDy 2131121 )()( unde: 11 =D pentru grupa 2 �i 01 =D pentru grupele 1 �i 3, respectiv 12 =D pentru grupa 3 �i 02 =D pentru grupele 1 �i 2, 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Prin substituirea valorilor lui 1D �i 2D în cadrul ecua�iei, putem ob�ine valorile 321 ,, ααα pentru cele trei grupe. 2. Prin combinarea celor trei ecua�ii, se presupune c� panta( β ) este aceea�i, în timp ce eroarea ε are aceea�i distribu�ie pentru toate grupele.
ECONOMETRIE. Teorie �i aplica�ii
136
3. În cazul existen�ei unui termen constant în ecua�ia de regresie, num�rul variabilelor calitative trebuie s� fie întotdeauna cu o unitate mai mic decât num�rul grupelor pe categorii, deoarece termenul constant este în acelasi timp termenul de interceptare al grupului de baz�, iar coeficien�ii variabilei calitative m�soar� diferen�e de interceptare. Exemplul 6.1. Presupunem c� avem date despre consumul C �i venitul Y pentru un anumit num�r de gospodarii, �i de asemenea, se cunosc:
S: sexul capului familiei; A: vârsta capului familiei, care este dat� pe trei categorii: < 25 de ani; între 25 �i 50 de ani; > 50 de ani. E: tipul educa�iei capului familiei: - liceu; - între liceu �i diploma de absolvire; - cel pu�in diploma de absolvire a unei facult��i.
Se vor include aceste variabile prezentate mai sus sub forma variabilelor calitative, astfel: 11 =D pentru sex masculin �i 01 =D pentru sex feminin ; 12 =D pentru vârsta < 25 de ani �i 02 =D pentru vârsta cuprins� în alt interval; 13 =D pentru vârsta între 25 �i 50 de ani, �i 03 =D pentru vârsta în alt interval; 14 =D pentru studii < liceu �i 04 =D pentru alte studii; 15 =D pentru studii între liceu �i diploma de absolvire �i 05 =D pentru alt tip de studii. Se observ� astfel c� pentru fiecare categorie, num�rul variabilelor calitative este mai mic cu o unitate decât cel al clasificarilor. Se poate scrie ecua�ia de regresie astfel: εγγγγγβα +++++++= 5544332211 DDDDDYC Observa�ii: 1. În cadrul acestei metode s-a mers pe presupunerea c� doar inter- ceptarea se schimb� pentru fiecare grup în parte �i nu coeficien�ii de pant�; 2. Termenul interceptarii pentru fiecare entitate în parte este ob�inut prin substituirea valorilor apropiate de 1D cu 5D .
Capitolul 6. Variabile calitative
137
Spre exemplu, pentru un b�rbat cu vârsta < 25 de ani, cu diploma de absolvire a facult��ii, se ob�ine 11 =D , 12 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� interceptarea este 21 γγα ++ . Pentru o femeie cu vârsta > 50 de ani, cu diploma de absolvire a facult��ii, se ob�ine 01 =D , 02 =D , 03 =D , 04 =D , 05 =D , de unde rezult� c� intercep-tarea este α . Este de remarcat faptul c� metoda variabilei calitative este folosit� �i pentru aranjarea factorilor de sezonalitate. Spre exemplu, dac� avem datele trimestriale despre consumul C �i venitul Y, cu ecua�ia de regresie: ελλλλβα ++++++= 44332211 DDDDYC unde 1D , 2D , 3D �i 4D reprezint� variabile calitative(dummy), definite astfel: 11 =D pentru primul trimestru �i 01 =D pentru celelalte trimestre; 12 =D pentru al doilea trimestru �i 02 =D pentru celelalte trimestre; 13 =D pentru al treilea trimestru �i 03 =D pentru celelalte trimestre; 14 =D pentru al patrulea trimestru �i 04 =D pentru celelalte trimestre. În ceea ce prive�te sezonalitatea la nivel de luni ale anului, avem 11 variabile calitative(dummy), definite astfel: 11 =D pentru luna ianuarie �i 01 =D pentru celelalte luni ale anului; 12 =D pentru luna februarie �i 02 =D pentru celelalte luni ale anului; ......................................... 112 =D pentru luna decembrie �i 012 =D pentru celelalte luni ale anului. 6.2. Variabile calitative ce eviden�iaz� modificarea pantei În cazul în care pentru primul grup ecua�ia de regresie este: 11111 εβα ++= xy , iar pentru cel de-al doilea grup avem 22222 εβα ++= xy , acestea se pot scrie astfel: 112111211 0)(0)( εβββααα +⋅−++⋅−+= xy 2212211212 )(1)( εβββααα +⋅−++⋅−+= xxy sau: εβββααα +−++−+= 21211121 )()( DxDy unde: 01 =D pentru toate observa�iile din grupa 1 �i 11 =D pentru toate observa�iile din al doilea grup; 02 =D pentru toate observa�iile din primul grup �i 22 xD = , adic� valoarea respectiv� a lui x pentru toate observa�iile din al doilea grup
ECONOMETRIE. Teorie �i aplica�ii
138
cu 1D , 2D reprezentând variabile calitative. Observa�ii: 1. Coeficientul lui 1D m�soar� diferen�a de interceptare, iar coeficie- ntul lui 2D m�soar� diferen�a de pant�; 2. Estimarea ecua�iei se reduce la estimarea celor dou� ecua�ii de regresie pentru care erorile au o distribu�ie identic�. Fie pentru exemplificare datele pentru trei perioade, iar în cea de-a doua perioad� se schimba doar interceptarea. De asemenea, se presupune c� în cea de-a treia perioad� se schimb� �i interceptarea �i panta. Vom avea astfel: 11111 εβα ++= xy pentru prima perioad�; 22122 εβα ++= xy pentru a doua perioad�; 33233 εβα ++= xy pentru a treia perioad�. Ecua�iile se vor combina �i va rezulta modelul: εβββααααα +−++−+−+= 31212131121 )()()( DxDDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din celelalte perioade; 12 =D pentru observa�iile din perioada a treia �i 02 =D pentru observa�iile din celelalte perioade; 03 =D pentru observa�iile din perioadele 1 �i 2 �i 33 xD = sau valoarea res- pectiv� a lui x pentru toate observa�iile din perioada 3 cu 1D , 2D �i 3D reprezentând variabile calitative. O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:
���
�
�
���
�
�
+���
�
�
���
�
�
+���
�
�
���
�
�
+���
�
�
���
�
�
+���
�
�
���
�
�
+���
�
�
���
�
�
=���
�
�
���
�
�
3
2
1
3
22
1
1321
3
2
1
00
0100
010
001
εεε
ββαααx
x
x
y
y
y
sau echivalent
33213213
22213212
12113211
0100
0010
0001
εββαααεββαααεββααα
+×+×+×+×+×=+×+×+×+×+×=+×+×+×+×+×=
xy
xy
xy
Ecua�ia se poate scrie echivalent: εββααα +++++= 5241332211 DDDDDy unde: 12 =D pentru observa�iile din perioada adoua �i 02 =D pentru observa�iile din celelalte perioade; ixD =4 corespunde valorii lui x pentru perioadele 1 �i 2, �i 04 =D pentru observa�iile perioadei 3
Capitolul 6. Variabile calitative
139
6.3. Variabile calitative pentru restric�iile ecua�iilor încruci�ate
Pentru a în�elege aceast� situa�ie, se apeleaz� la un model al dependen�elor dintre pre�ul c�rnii de porc, vit�, pui �i pe�te, dat de ecua�iile urm�toare:
4444433422411434
3343433322311333
2242432322211222
1141431321211111
εηββββαεηββββαεηββββα
εηββββα
++++++=++++++=++++++=
++++++=
yxxxxp
yxxxxp
yxxxxp
yxxxxp
unde: 1p - pre�ul cu am�nuntul al c�rnii de porc; 2p - pre�ul unitar pe kg carne de vit�; 3p - pre�ul unitar pe kg carne de pui; 4p - pre�ul unitar pe kg carne de pe�te; 1x - consumul de carne de porc pe cap de locuitor; 2x - consumul de carne de vit� pe cap de locuitor; 3x - consumul de carne de pui pe cap de locuitor; 4x - consumul de carne de pe�te pe cap de locuitor; y - venitul disponibil pe cap de locuitor. Observa�ie: În cadrul sistemului de ecua�ii, se poate observa simetria în ceea ce prive�te coeficien�ii β , adic�:
141
4
4
1
131
3
3
1
121
2
2
1
β
β
β
==
==
==
dxdp
dxdp
dxdp
dxdp
dxdp
dxdp
343
4
4
3
242
4
4
2
232
3
3
2
β
β
β
==
==
==
dxdp
dxdp
dxdp
dxdp
dxdp
dxdp
O form� echivalent� de scriere a ecua�iei de mai sus, este aceea de a aranja termenii pe coloane:
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
=
�����
�
�
�����
�
�
1
4
141
3
131
2
12
1
11321
4
3
2
1
00
0
0
00
000
0100
0010
0001
x
x
x
x
x
xx
p
p
p
p
ββββααα
ECONOMETRIE. Teorie �i aplica�ii
140
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
�����
�
�
�����
�
�
+
4
3
2
1
4
44
3
434
333
2
424
2
323
222 0
00
00
0
00
0
0
0
0
00
0
εεεε
ββββββ
xx
xx
x
x
x
xx
6.4. Testarea stabilit��ii coeficien�ilor de regresie corespun- z�tori variabilelor calitative Deosebit de important� este �i testarea stabilit��ii coeficien�ilor variabilelor calitative. Pentru exemplificare, vom presupune ecua�iile: 1111111 εηβα +++= zxy pentru prima perioad�; 2222222 εηβα +++= zxy pentru a doua perioad�. Se poate demonstra ipoteza potrivit c�reia nici unul dintre coeficien�i nu s-a schimbat de-a lungul perioadei, ci doar interceptarea �i coeficientul variabilei x. Ca urmare, ecua�ia pentru dou� perioade poate fi astfel scris� astfel: ( ) ( ) ( ) εηηηβββααα +−++−++−+= 312121211121 DzDxDy unde: 11 =D pentru observa�iile din perioada a doua �i 01 =D pentru observa�iile din perioada 1; 22 xD = pentru observa�iile din perioada a doua �i 02 =D pentru observa- �iile din perioada 1; 23 zD = pentru observa�iile asupra variabilei z din perioada 2 �i 03 =D
pentru observa�iile din perioada 1 cu 1D , 2D �i 3D reprezentând variabile calitative. Observa�ie: Se pot înlatura variabile calitative, în func�ie de ipotezele luate în calcul, �i anume: Ipoteze Variabile inlaturate
(1) to�i coeficien�ii au valori egale 1D , 2D , 3D
212121 ,, ηηββαα ===
(2) se schimb� doar interceptarea 2D , 3D
2121 , ηηββ ==
(3) se shimb� interceptarea �i coeficien�ii lui z 2D 21 ββ =
Capitolul 6. Variabile calitative
141
Pentru testarea stabilit��ii coeficien�ilor variabilelor calitative, având 21 nn + observa�ii, se aplic� testul Chow, folosind formula:
11
1
2
1
−−
−
=
mnSPVR
nSPVRSPVR
F
unde: SPVR - reprezint� suma p�tratelor erorilor, cu 21 nn + observa�ii; 1SPVR - reprezint� suma p�tratelor erorilor, cu 1n observa�ii. 2n - reprezint� num�rul variabilelor calitative; 1n - reprezint� num�rul variabilelor calitative; Observa�ie: Imperfec�iunea testului F const� în faptul c� nu indic� care dintre cele 2n observa�ii duce la instabilitatea coeficien�ilor. Ca urmare:
- se va defini un set de 2n variabile calitative, unde 1=iD pentru in +1
observa�ii, cu 2,1 ni = �i 0=iD pentru celelalte observa�ii; - se va testa dac� coeficien�ii varibilelor calitative sunt nuli �i se va vedea
astfel care dintre observa�ii sunt semnificativ în afara liniei regresiei estimat� pentru primele 1n observa�ii.
Observa�ie: Parametrii comuni regresiei vor fi estima�i pentru primele 1n observa�ii, iar coeficientul variabilei calitative “i”, 21 ,...,1 nni += va masura eroarea previzionat� pentru predic�ia observa�iei bazat� pe coeficien�ii estima�i din primele 1n observa�ii, iar abaterea standard a acestui coeficient va m�sura abaterea standard a erorii predictive. Exemplul 6.3. Fie modelul dat de:
εββα +++= 2211 xxY pentru primele 1n observa�ii; εηββα ++++= 12211 xxY pentru a 11 +n observa�ie; εηββα ++++= 22211 xxY pentru a 21 +n observa�ie.
Minimiz�m suma p�tratelor: � ++=
++
1
211
21
21
2n
inni uuu , cu 21 ,, ββα
��
� ob�inute din
minimizarea expresiei � =11
2ni iu �i jjjj xxY 2211 ββαγ
��
�� −−−= pentru 11 += nj �i
21 +n . În continuare vom prezenta cum putem folosi metoda variabilelor calitative pentru a genera predic�ii în afara modelului �i abaterilelor standard. Presupunem pentru aceasta c� avem n observa�ii asupra lui Y , 1x �i 2x , �i se furnizeaz� observa�ia cu num�rul 1+n asupra lui 1x �i 2x �i se cere valoarea
ECONOMETRIE. Teorie �i aplica�ii
142
previzionat� pentru Y �i abaterea standard a previzion�rii. Pa�ii necesari rezolv�rii cerin�ei sunt urm�torii: Pasul 1: Se va egala cu zero valoarea lui Y pentru observa�ia cu num�rul 1+n . Pasul 2: Variabila calitativ� D se va defini astfel: 0 pentru primele n observa�ii �i -1 pentru a 1+n -a observa�ie. Pasul 3: Se va scrie regresia pentru Y , 1x �i 2x �i D, folosind cele 1+n
observa�ii. Comentariu: Coeficientul lui D reprezint� valoarea previzionat� 1+nY , iar abaterea sa standard este eroarea standard a valorii previzionate. Pentru exemplificare, vom utiliza modelul εββα +++= 2211 xxY pentru primele n observa�ii �i εγββα +−++= 22110 xx pentru urm�toarea observa-�ie(a 1+n -a). Prin minimizarea sumei p�tratelor erorilor, se ob�ine: 2211 xx ββαγ
��
�� ++= pentru a 1+n -a observa�ie. Astfel, 1+= nY
�
�γ . Acest� metod� a fost extins� de c�tre Pagan �i Nicholls pentru modelele neliniare �i modelele cu ecua�ii simultane. 6.5. Heteroscedasticitatea �i autocorelarea variabilelor calitative Variabilele calitative trebuie folosite cu mult� precau�ie atunci când este vorba de heteroscedasticitate �i autocorelare. Cazul heteroscedasticitatii Fie dou� ecua�ii: 1111 εβα ++= xy pentru primul grup; 2122 εβα ++= xy pentru a doua grup�; Se consider�, de asemenea, c� ( ) ( ) 2
22211 var,var σεσε == .
Observa�ii: 1. În estimarea de ecua�ii, se presupune natural c� 22
21 σσ = .
2. Dac� 22
21 σσ ≠ , chiar dac� 2α nu este semnificativ diferit de 1α �i
2β nu este semnificativ diferit de 1β , coeficien�ii variabilelor calitative sunt reprezentativi. Cazul autocorel�rii Presupunând c� erorile din ecua�iile celor dou� grupuri sunt ordonate autoregresiv, vom avea:
1
*
1*
−
−
−=
−=
ttt
ttt
xxx
yyy
ρρ
Întrebarea: Ce se întampl� cu varibilele calitative?
Capitolul 6. Variabile calitative
143
R�spunsul: Se va considera cazul cu 1n observa�ii pentru primul grup �i 2n observa�ii pentru al doilea grup. Se va introduce �i variabila timp t pentru fiecare observa�ie. Vom avea:
( )( )ραα
ραα−=
−=
1
1
2*2
1*1 care pot fi rescrise ca:
( ) ( ) teDxDy +−++−+= 212
*11
*1
*2
*1
* βββααα unde te reprezint� erorile, definite prin rela�ia: 1−−= ttte ρεε . Pentru aceast� observa�ie, ecua�ia diferen�iat� în func�ie de ρ ia forma:
( )
( ) ( ) tttt
ttttt
exxy
exxyy
+−++−−
+=
+−+−=− −−
12*
1*2
*1
*1
*
112121
11 βββαα
ρα
ρββρααρ
Aceasta înseamn� c� variabilele calitative 1D �i 2D trebuie astfel definite:
01 =D pentru observa�iile primului grup �i ρ−
=1
11D pentru observa�ii-
le celui de-al doilea grup; 02 =D pentru toate observa�iile din primul grup, txD =2 pentru prima
observa�ie din cel de-al doilea grup, �i *2 txD = pentru celelalte
observa�ii ale celui de-al doilea grup. 6.6. Variabile dependente calitative Dac� pân� acum s-au luat în considerare numai cazurile în care variabilele explicative erau �i calitative, în continuare se va pune problema studiului modelelor în care variabila explicat� este cea calitativ�. Observa�ii: 1. Aceasta poate lua dou� sau mai multe valori, în continuare fiind tratat doar cazul în care ia doar dou� valori: 0 sau 1. 2. Deoarece aceast� variabil� ia doar dou� valori, se va numi variabil� dihotomic�. Exist� numeroase exemple de variabile explicate dichotomice, cum ar fi: y = 1 dac� o persoan� se încadreaz� în for�a de munc� �i y = 0 dac� nu sau y = 1 dac� o persoan� de�ine o cas� y = 0 dac� nu.
ECONOMETRIE. Teorie �i aplica�ii
144
Exist� numeroase metode de analiz� a modelelor de regresie pentru care variabila dependent� este 0 sau 1. Cea mai simpl� metod� este OLS, caz în care se va numi modelul probabilit��ii liniare. O alt� metod�, numit� func�ia discriminant liniar�, este în strans� legatur� cu modelul probabilita�ii liniare. Modelele care rezolv� astfel de probleme sunt cunoscute ca modele1 logit, probit �i.totodat� tobit.
1 a se vedea Madala G.S., Introduction to Econometrics, Prentice Hall, Inc., 2001, pg. 322-338