05. ti de Includere a Variabilelor Calitative in Modelul Eco No Metric

download 05. ti de Includere a Variabilelor Calitative in Modelul Eco No Metric

of 9

Transcript of 05. ti de Includere a Variabilelor Calitative in Modelul Eco No Metric

5

Modaliti de includere a variabilelor calitative n modelul econometric

ntr-un model econometric, de regul, att variabilele endogene, ct i variabilele exogene sunt variabile economice cuantificabile, exprimate n uniti de msur specifice naturii lor. Dar, n anumite situaii, ambele grupe de variabile, endogene i exogene, pot fi de natur calitativ (nenumerice), variantele lor prezentnduse prin cuvinte i nu prin numere. Variabilele calitative sau variabilele dummy se refer deci la nsuiri, caliti, categorii etc. a cror dimensiune este exprimat prin atribute sau denumiri. Aceste variabile, denumite i variabile atributive, se mpart n dou categorii: variabile dihotomice (binare sau alternative) i variabile polihotomice (nealternative). De exemplu, referindu-ne la consumul populaiei, acesta, ca variabil endogen, poate fi analizat att ca variabil numeric: cheltuieli efectuate de o familie pentru consumarea sau procurarea unui anumit produs, sau nivelul/volumul consumului unui anumit produs pe familie sau pe membru de familie, dar i ca variabil calitativ alternativ, dac se caut rspunsul la ntrebri de genul: de la ce venit pe membru de familie sau pe familie, familiile consum sau dispun de un anumit produs? De la ce venit pe membru de familie consumul familiilor este mai mare sau mai mic fa de media consumului pe familie ? Se pot formula numeroase ntrebri de genul celor de mai sus, tiind c orice variabil cantitativ poate fi tranformat ntr-o variabil alternativ prin raportarea variantelor ei la o anumit mrime, care poate fi media ei sau o mrime standard.

Modele econometrice

La rndul lor, variabilele exogene pot fi att cantitative, ct i calitative. n cazul consumului populaiei, factorii explicativi ai acestuia pot fi: venitul pe membru de familie sau pe familie, numrul membrilor de familie, preul sau tariful bunurilor materiale sau al serviciilor, dar i sexul, mediul de provenien, categoria socio-profesional, naionalitatea (tradiii) etc. n cazul variabilelor exogene calitative se pot ntlni dou situaii: - variabila prezint numai dou variante, x1 sau x2, cum ar fi: sexul sau mediul de provenien, denumite i variabile dihotomice sau binare; - variabila prezint mai multe variante nenumerice, cum ar fi: categoria socio-profesional sau naionalitatea. Pe baza celor spuse mai sus, utilizarea variabilelor calitative ntr-un model econometric poate fi sintetizat prin trei cazuri: variabila endogen Y este de natur calitativ binar; variabila exogen X este de natur calitativ alternativ (binar sau dihotomic) sau nealternativ (polihotomic). - Cazul 1: variabil endogen binar Fie modelul econometric:

y i = a + bx i + u iunde:

(5.1)

n = numrul unitilor statistice din eantion, respectiv numrul familiilor, i = 1, n ;1, dac familia i consu m (utilizeaz ) produsul H sau y i > y , yi = 0, dac familia i nu cnsum (nu utilizeaz ) produsul H sau y i y

xi = variabila explicativ venitul mediu al familiei i, pe membru de familie; ui = variabila rezidual. Spre deosebire de celelalte modele econometrice, n care variabila explicat este cantitativ, modelul 5.1) prezint dou particulariti.

Modaliti de includere a variabilelor calitative n modelul econometric

Prima se refer la natura variaiei variabilei reziduale ui. Din modelul (5.1) rezult c: u i = y i a bxi tiind c yi este o variabil alternativ (binar) ce poate lua numai dou valori, y {0,1} , pentru orice valoare a variabilei explicative xi, perturbaia ui poate avea numai dou valori distincte (-a - bxi) i (1 a - bxi). Deci variabila rezidual ui nu este distribuit normal, ci are o distribuie discret, de forma: a bxi 1 a bxi ; ui : p 1 p p 0 cu media: M (u i ) = 0 p = 1 a bx i ; i dispersia: M (u i ) = (a + bxi )(1 a bxi ) = M ( yi ) [1 M ( yi )]2

(5.2)

Relaia (5.2) evideniaz faptul c perturbaiile reziduale nu mai sunt homoscedastice, ci heteroscedastice (vezi subcapitolul 3.4.1). Din acest motiv, parametrii modelului (5.1) trebuie estimai cu ajutorul metodei celor mai mici ptrate generalizat sau cu metoda regresiei ponderate, deoarece metoda celor mai mici ptrate obinuit nu conduce la obinerea de estimaii eficiente n cazul existenei fenomenului de heteroscedasticitate. A doua particularitate se refer la interpretarea previziunii efectuate cu modelul (5.1). Admind c pentru momentul (n + v) se cunoate distribuia familiilor dup mrimea venitului mediu pe membru de familie i, n ipoteza caeteris paribus, modelul (5.1) permite s se cunoasc cte familii vor utiliza i cte nu vor utiliza produsul H n momentul (n+v). Folosind modelul (5.1) n acest scop, utilizarea sau neutilizarea produsului H apare ca o probabilitate de nsuire (de posedare) a produsului fiind interpretate n funcie respectiv, previziunile Y * = a + bx( n +v ,i ) ( n +v ,i )

de valorile pe care le va avea Y (*n +v ,i ) n raport cu intervalul [0,1].

Modele econometrice

Deoarece prediciile Y (*n +v ,i ) sunt coliniare, ele vor putea lua valori

i n afara intervalului [0,1]. Exist mai multe procedee de a evita acest inconvenient, cel mai simplu, practic, fiind acela de a lucra cu estimaiile a n funcie de o valoare luat de i b i de a calcula valorile Y **( n +v ,i )

variabila explicativ x ( n + v ,i ) . Acestea sunt definite dup cum urmeaz:

Y(**+ v ,i ) = Y(* + v ,i ) dac 0 < Y (*n +v ,i ) < 1 ; adic, n caz concret, n nfamilia i, avnd venitul x( n + v ,i ) are probabilitatea y ** +v ,i ) de a poseda (a (n consuma) produsul H;

Y(**+ v ,i ) = 1 dac Y(* + v ,i ) 1 , deci familia i, avnd venitul x ( n + v ) , n nposed produsul H;

Y(**+ v ,i ) = 0 dac Y(* + v ,i ) 0 familia i, avnd venitul x ( n + v ,i ) nu n nposed produsul H. Menionm c problemele expuse n acest caz pot fi rezolvate i pe baza distribuiei empirice a variabilei dependente Y, condiionat de variabila exogen X, folosind n acest scop tabelul de corelaie sau tabelul de asociere. Modelul (5.1) prezint avantajul c poate fi folosit ca model de simulare n cazul consumului populaiei este utilizat n vederea estimrii venitului minim pe membru de familie, pentru a consuma (a poseda) un anumit produs sau a utiliza un anumit serviciu. n plus, acest model poate fi generalizat i pentru o dependen multifactorial a variabilei endogene binare Y. - Cazul 2: variabil exogen binar Referindu-ne la consumul populaiei, mediul de provenien rural, urban, sexul etc., acestea reprezint variabile exogene calitative, care nu pot avea dect dou variante. Fie: n = numrul familiilor din eantion, i = 1, n ;

Modaliti de includere a variabilelor calitative n modelul econometric

0, dac familia i posed varianta A, xi = 1, dac familia i posed varianta B n1 = numrul familiilor ce posed varianta A; n2 = numrul familiilor ce posed varianta B, evident c n1 + n2= n; yi = consumul familiei i. Admind c variabila endogen Y (consumul populaiei, de exemplu) urmeaz o distribuie normal, de abatere standard y i cu media egal cu: M ( y / x =0 ) = m1 consumul mediu al familiilor ce posed varianta A; M ( y / x =1 ) = m2 consumul mediu al familiilor ce posed varianta B; atunci modelul econometric al variabilei dependente Y n funcie de variabila exogen binar X este de forma: y i = a + bxi + u i (5.3)

unde: yi = consumul familiei i; xi = variabila binar: xi = 0 dac familia posed varianta A; xi = 1 dac familia posed varianta B; ui = variabila rezidual care satisface toate ipotezele de fundamentare ale unui model econometric vezi subcapitolul 3.4. Valorile medii ale variabilei y condiionate de variabila x rezultate din modelul econometric (5.3) sunt:

M y/

(

x i =0

) = M (a + bx i + u i ) = M (a ) + M (b ) 0 + M (u i ) = a

Observaie: M (u i ) = 0 , conform ipotezei Ii.M y / xi =1 = M (a + bx i + u i ) = M (a ) + M (b ) 1 + M (u i ) = a + b

((

)

Rezult deci c: M ( y / xi = 0 ) = m1 = aM y / xi =0 = m 2 = a + b b = m 2 m1

)

Modele econometrice

adic termenul liber al modelului (5.3) punctul n care dreapta intersecteaz axa Oy - msoar nivelul mediu al caracteristicii y pentru unitile statistice (familiile) care posed varianta A, iar coeficientul unghiular al dreptei (b) msoar diferena dintre nivelul mediu al caracteristicii y pentru unitile statistice care posed varianta B i nivelul mediu al lui y pentru unitile ce posed varianta A. Estimatorii modelului (2.5.3) se obin prin aplicarea M.C.M.M..P. n condiiile aceptrii ipotezelor de fundamentare a modelului econometric cu ajutorul urmtoarelor formule:

b=

( x x )( y y ) (x x )i i 2 i i

a = y bx

tiind c:

xi = n 2 ;i =1n

n

yi =1n i =1

n

i

= n1 y1 + n 2 y 2i

xi =1

2 i

= n2 ;

y xi

= n2 y 2

iar:n 1 n n ( xi x )( y i y ) = y i xi xi y i = n i =1 i =1 i =1 i =1 n

= n2 y 2

n2 (n1 y 1 + n 2 y 2 ) = n1n 2 (y 2 y 1 ) n n

(xi =1

n

i

x) =2

i =1

n

x i2

n 2 n 2 n n n 2 n 2 (n n 2 ) n1 n 2 1 = = xi = n 2 2 = 2 n n n n n i =1

2

Rezult c: nn nn b = 1 2 ( y 2 y1 ) : 1 2 = y 2 y1 ; n n n 1 a = (n1 y1 + n2 y 2 ) ( y 2 y1 ) 2 = n n

Modaliti de includere a variabilelor calitative n modelul econometric

n1 y 1 + n 2 y 1 y 1 ( n1 + n 2 ) = = y1; n n adic estimaia termenului liber, a, este egal cu estimaia lui m1, iar estimaia coeficientului de regresie este egal cu distana dintre estimaiile ( y 2 y1 ) a celor medii pariale (m2 i m1) obinute pe baza eantionului de =

n uniti statistice. n mod corespunztor vezi subcapitolul (2.3), relaiile (2.3.8) i (2.3.9) se vor calcula estimaiile dispersiilor celor doi estimatori ai2 2 parametrilor a i b, s a respectiv s b .

Pentru a verifica dac variabila alternativ exercit o influen sistematic asupra variabilei explicate y n cazul nostru, y este consumul familiilor se testeaz semnificaia coeficientului de regresie b 1. Dac: -

b sb

t variabila calitativ alternativ (x) influeneaz n mod

sistematic caracteristica dependent (y) i, deci, va trebui inclus n pachetul de variabile exogene ale variabilei endogene Y2. b < t variabila calitativ alternativ (x) nu influeneaz n sb mod semnificativ caracteristica dependent (y) i, ca atare, nu trebuie inclus n pachetul de variabile explicative ale variabilei explicate (y). Cazul 3: Variabil exogen calitativ nealternativ (polihotomic) Uneori, anumii factori semnificativi ai unei variabile endogene Y sunt necuantificabili, avnd un anumit numr de variante nenumerice. n domeniul consumului populaiei, aceti factori se refer la categoria socioprofesional, zona geografic, tradiiile generate de naionalitate etc. Testarea semnificaiei coeficientului de regresie b este echivalent cu testarea ipotezei c cele dou medii, m1 i m2, provin sau nu din aceeai populaie. 2 Un alt mod de rezolvare a problemei const n a nu introduce variabila calitativ n pachetul de variabile explicative cantitative ale caracteristicii y, ci de a construi dou modele de corelaie distincte: unul pentru unitile statistice ce posed varianta A (familii din mediul rural), iar altul pentru unitile ce posed varianta B (familii din mediul urban).1

Modele econometrice

O manier de cuantificare a unor astfel de variabile exogene const n a codifica variantele lor cu numerele: x1 = 0, x2 = 1, x3 = 2, ., xk = k - 1. Modelul econometric constituit n aceast ipotez este: (5.4) y i = a + bx ij + u i unde:i = 1, n j = 0, k 1

;

y i = consumul familiei i;

x ij

0, dac familia face parte din categoria socio - profesional x 1 ; 1, dac familia face parte din categoria socio - profesional x 2 ; = 2 , dac familia face parte din categoria socio - profesional x 3 ; k 1, dac familia face parte din categoria socio - profesional x k

n acest caz, mediile variabilei endogene Y, condiionate de variabila explicativ (x), calculate pe baza modelului (5.4) sunt: M ( y / xi =0 ) = a = y1 M ( y / xi =1 ) = a + b = y 2 M ( y / xi = 2 ) = a + 2b = y 3 . M ( y / xi = k 2 ) = a + (k 2)b = y k 1 M ( y / xi = k 1 ) = a + (k 1)b = y k Din relaiile de mai sus rezult c nivelul mediu al consumului unei familii crete n mod constant cu mrimea b, pe msur ce se trece de la o categorie social-economic la alta, sau c diferena dintre consumul mediu a dou familii ce fac parte din dou categorii social-economice succesive este constant i egal cu coeficientul de regresie b: y 2 y1 = y 3 y 2 = ... = y k y k 1 = b Acordarea de valori echidistante variantelor unei variabile exogene calitative nealternative nu poate fi folosit dect ntr-un caz particular, atunci cnd i mediile condiionate ale variabilei exogene sunt echidistante.

Modaliti de includere a variabilelor calitative n modelul econometric

Pentru a evita aceast restricie ntr-un model econometric, variabila explicativ calitativ nealternativ se introduce prin (k-1) variabile binare, dac ea prezint k variante relative. Astfel, dac o variabil explicativ prezint trei variante calitative (A, B, C), modelul econometric va fi de forma: y i = a 0 + a1 x1i + a 2 x 2i + u i ; (5.5) unde: yi = consumul familiei i; = 1, dac familia i posed varianta B, x1 = = 0, dac familia i nu posed varianta B, = 1, dac familia i posed varianta C, x2 = = 0, dac familia i nu posed varianta C. De reinut c, dac: - x1 = 1 x2 = 0 - x2 = 1 x1 = 0 - x1 = x2= 0 familia i posed varianta A. n acest caz, modelul (5.5) devine echivalent cu modelul (5.3): M ( y / x0 = 1; x1 = x 2 = 0 ) = a0 = y 0 M ( y / x1 = 1; x 2 = 0) = a 0 + a1 = y1 M ( y / x 2 = 1; x1 = 0) = a 0 + a 2 = y 2 Rezult c parametrii modelului sunt egali cu: a0 = y 0 a1 = y1 y 0 a2 = y2 y0 unde: y 0 , y1 i y 2 reprezint nivelul mediu al consumului pentrufamiliile care posed varianta A, respectiv B, respectiv C. Din acest punct de vedere, modelul urmeaz s fie discutat i intrepretat pe baza criteriilor expuse n subcapitolele 3.3 i 3.4.