Analiza Econometrica a Unui Model Liniar_Din M. A

download Analiza Econometrica a Unui Model Liniar_Din M. A

of 48

Transcript of Analiza Econometrica a Unui Model Liniar_Din M. A

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    1/48

    Obiective i competene Iniierea studenilor n parcurgerea teoretic i aplicat a etapelor de analiz econometric a unuimodel liniar unifactorial i n utilizarea Excel pentru calculele specifice de aplicare a metodelor devalidare a unui model econometric.

    Teme de studiu, exemple, probleme rezolvate i propuse:

    4.1. Specificarea, definirea i identificarea modelului liniar unifactorialSpecificarea i definirea modelului;Identificarea modelului liniar unifactorial;Tipuri de erori.

    4.2. Ipoteze fundamentale asupra modelului, pentru estimatorii B.L.U.E.

    Ipoteze de liniaritate;Ipoteze asupra variabilelor;Ipoteze asupra erorilor.

    4.3. Estimarea parametrilor modeluluiReprezentarea grafic a unei diagrame a mprtierii (scatter diagram);Metoda celor mai mici ptrate; sistemul de ecuaii normale;Proprieti ale estimatorilor obinui prin MCMMP;Interpretarea economic a parametrilor estimai;Intervale de ncredere pentru estimatorii obinui prin MCMMP.

    4.4. Verificarea modelului econometricVerificarea ipotezelor de estimare a parametrilor (testul dDurbin Watson );Verificarea semnificaiei estimatorilor parametrilor (testul t); Verificarea similitudinii modelului econometric (testul F).

    4.5. Previziuni cu modelul regresiei simpleEstimarea valorilor variabilei explicate de model;Construirea intervalului de ncredere pentru valorile de previziune.

    4.6.Utilizarea Excel pentru calculele de regresie:Statisticile de regresie; Estimatorii coeficienilor; Tabelul ANOVA.Interpretarea economic a rezultatelor numerice tabelate

    *

    Teme de studiu:

    4.1. Specificarea, definirea i identificarea modelului unifactorial

    Elaborarea unui model econometric presupune parcurgerea urmtoarelor etape:

    Specificarea i definirea modelului unifactorial Identificarea modelului

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    2/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Estimarea (calculul) parametrilor modelului Verificarea i validarea modelului Utilizarea modelului pentru realizarea de previziuni.

    Specificarea i definirea modelului unifactorial se refer la precizarea variabilei endogene i avariabilei exogene, restul factorilor fiind presupui a forma variabila aleatoare, ipotez care urmeaz a validat printr-un experiment statistic.

    Specificarea unui model econometric se face pe baza teoriei economice a fenomenului observat prin prisma cauz efect i const n a specifica:

    - variabila rezultativ, care exprim efectul (notat y) i- variabila explicativ, factorul presupus cauzal (notat x).

    n astfel de modele unifactoriale x este factorul de influen a fenomenului y, presupus ca principal ide aceea, restul factorilor considerai neeseniali ca influent cauzal, sunt specificai n model cu ajutoru

    variabilei aleatoareu.Modelul are expresia matematic:

    ( ) u x f y += unde:

    y - valorile variabilelor dependente (variabile efect, endogene, de exemplu salariile lunare); x - valorile variabilelor independente (variabile factor, exogene, factorul esenial ce determin

    variaia lui y, de exemplu producia medie);u - variabila rezidual (variabil aleatoare, ce sintetizeaz efectul unor factori ntmpltori,

    neeseniali asupra variabilei y).Ca orice ipotez teoretic de lucru, ipoteza c x este factor principal n modificarea valorilor lui y urmeaz a fi validat sau invalidat.

    Identificarea modelului const n alegerea unei funcii matematice f(x), cu ajutorul creia seaproximeaz valorile variabilei endogene y numai n funcie de variaia variabilei exogene x.

    Forma funciei f(x) poate fi:a) funcia liniar bxa y +=

    b) funcia putere, bax y =

    c) funcia exponenial, bxae y += d) funcia de gradul doi, 2cxbxa y ++=

    e)funcia logistic, bxaec y ++

    =1

    Alegerea funciei f(x) se face pe baza valorilor reale, observate, numite i empirice, ale celor doufenomene economice sistematizate astfel:

    - n serii spaiale

    ( ) ni x y ii ,1,, = unde n este numrul unitilor statistice omogene la care s-au nregistrat ntr-o singur perioad de timpvalorile fenomenelor y, respectiv x,

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    3/48

    Modelul liniar unifactorial 3

    sau - n serii de timp

    ( ) nt x y t t ,1,, = unde n este numrul perioadelor de timp n care s-au nregistrat valorile celor dou fenomene economice y,respectiv x, dar la aceeai unitate statistic.

    Dispunnd de o astfel de serie statistic de date observaie asupra celor dou fenomene economicecauz efect, problema identificrii funciei se realizeaz utiliznd diferite procedee: grafic corelograma, conservarea ariilor, calcule algebrice.

    Indiferent de procedeul folosit, pe baza valorilor observate ale fenomenului economic xi, funcia deregresie identificat trebuie s aproximeze (estimeze) ct mai bine (cu erori ct mai mici) valorile empiricale fenomenului observat yi, prin valorile teoretice obinute ca imagini ale funciei alese.

    Dac datele statistice conduc la concluzia c anumite corelaii nu pot fi descrise de o singur funcimatematic, atunci pentru acest model econometric se identific mai multe funcii de regresie, urmnd ca

    etapa de verificare a modelului s se decid asupra uneia din ele.Pentru a gsi cea mai potrivit form a funciei f(x), o metod de identificare este reprezentareagrafic a perechilor de puncte( ) ni y x ii ,1,, = din eantionul de date observate, numit corelogram.

    Evoluia descris de o variabil n coresponden cu frecvena de apariie sau cu evoluia unei altevariabile, presupune utilizarea unui sistem de axe rectangulare:

    - pe axa verticalOy se reprezint variabila dependent y, sau frecvena n cazul histogramei;- pe axa orizontalOx se reprezint variabila independent x, variabila factorial, variabila timp;

    n cazul dependenei descrise de o funcie f(x), pe grafic se reprezint punctele de coordonate( )ii y x ,care arat ca un nor de puncte i se traseaz curba/dreapta care trece prin mijlocul norului de puncte. Sspune c am acceptat drept model (reprezentare) a relaiei de dependen, funcia( ) x f y = .

    Reprezentarea grafic prin norul de puncte, numit Scatter diagram sugereaz cea mai probabilform a graficului funciei f(x),ca mai jos:

    ( ) bxa x f += pentru 0>b

    ( ) bxa x f += pentru 0

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    4/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    ( ) 2cxbxa x f ++= pentru 0>a

    Pentru cazurile neliniare, anterior estimrii parametrilor se procedeaz la liniarizarea modelului prinlogaritmare, schimbare de variabil, fixarea arbitrar a valorii unui parametru, etc.

    Dac pe baza corelogramei este rezonabil s presupunem c media variabilei Y depinde de X printr-relaie liniar [ ] xba x y M i +=/ , atunci rezult modelul liniar unifactorial:

    iii u xba y ++=

    Acest tip de model se numete liniar, deoarece este liniar n raport cu parametriia i b . Din punct de vedere econometric ne intereseaz liniaritatea n raport cu parametrii, nu cu variabilele, deoarecemodelele neliniare necesit metode de estimare diferite.

    Relaiile dintre variabile n cadrul modelului presupun folosirea unor relaii bijective. Pentru valordate ale lui x i corespund valori ale lui y ntr-un anumit interval i caracterizat prin anumite tipuri de probabiliti.

    Parametrii sunt considerai drept necunoscute ale modelului, iar n cazul unor eantioanenereprezentative, pentru a-i putea determina vom folosi estimaii sau abateri ale acestora (, respectiv b parametri estimai, ajustai).

    Estimarea parametrilor reprezint modalitatea de exprimare a relaiilor dintre variabile n cazumodelelor econometrice.

    Estimarea parametrilor se realizeaz cu ajutorul seriilor de date i al funciilor de regresie ce descriufenomenele economice pe care le analizm. Cea mai simpl form a funciei de regresie este cea liniar, dade relaia :

    iii u xba y ++=

    unde iindexeaz observaiile. Acestea pot fi diferite uniti statistice observate n acelai moment de timpcaz n care modelul este de tip cross section sau putem avea aceeai unitate observat la momente diferide timp, ceea ce ne d o serie de timp sau cronologic.

    Abaterea ui (perturbaia sau variabila rezidual) este o variabil aleatoare care urmeaz o lege de

    distribuie normal. Termenul de variabil aleatoare se refer la faptul c aceste elemente perturb relaiil

    deterministe dintre variabile, transformndu-le n relaii de tip stocastic.Abaterea ui sintetizeaz ansamblul informaiilor neincluse n model.

    Intercept (termenul constant)Variabila de perturbaie

    (rezidual)

    Variabila independent(explicativ, factor)

    Slope (panta dreptei de regresie )

    Variabila dependent(rspuns, efect)

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    5/48

    Modelul liniar unifactorial 5

    Totodat, ui msoar diferena dintre valorile reale (observate) ale lui yi i valorile estimate prin

    model.Termenul ui

    grupeaz treitipuri de erori , Bourbonnais [1998]:

    eroare de specificare, datorit faptului c am inclus n model doar o variabil explicativ, nu toifactorii care ar putea influena variabila endogen, exist variabile independente omise din model;

    De exemplu: cererea = a + b pre + u- dac modelul este corect specificat, modelul ar include aceste variabile;- unele relaii de dependen dintre variabile nu sunt cunoscute;- unele date nu sunt disponibile;- n evoluia variabilei dependente pot interveni evenimente ce nu au loc n mod regulat greve,

    cataclisme, etc. eroare de de observare (msurare) a variabilei dependente dac datele nu au fost exact msurate

    De exemplu: cererea = a + b pre + u- nivelul cererii nu poate fi msurat cu exactitate i de aceea se folosesc estimatori ai cererii - u

    include diferena dintre cererea real i cea estimat eroare de eantionare, datorat fluctuaiilor ce pot s apar de la un eantion la altul n privina

    observaiilor i deci i a estimaiilor; utilizarea de eantioane diferite conduce la rezultate diferite nceea ce privete valoarea calculat a parametrilor.

    4.2. Ipoteze fundamentale asupra modelului

    nainte de a estima parametrii se emit ipoteze cu privire la variabilele din model.x este o variabil economic, la fel ca i y. ncercm s modelm fenomenul descris de valorile

    observate i y i condiionat de realizrilei x , de asemenea observate n eantion.

    Pentru a putea determina parametrii, este necesar respectarea unor ipoteze de lucru, cum ar fi: formfunciei de regresie trebuie s fie corect; valorile variabilelor x, y trebuie s fie fr erori de observare;media variabilei aleatoare s fie nul, etc.

    Ipotezele asupra modelului sunt detaliate mai jos, fr a detalia ns i procedurile care permittestarea lor.

    Ipoteza de liniaritate: modelul este liniar n xModelul este liniar n raport cui x sau o transformare a lui i x (logaritm, inversiune, etc.).

    Relaia dintre i x i i y este liniar, de forma iii u xba y ++= Ipoteze asupra variabilelor X i Y:

    - i x i i y reprezint valori numerice ale variabilelor x i y rezultate prin observarea statistic,neafectate de erori sistematice;- i y , variabila endogen este aleatoare, pentru c este funcie de u ; Modelul devine decialeator prin intermediul luiiu

    - i x , variabila explicativ, este considerat ca fiind o variabil determinist n model,

    nealeatoare; Termenul i x nu este deci aleator, ci determinist. Ipoteze asupra erorilor

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    6/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    H1 : ( ) 0=iu M

    Variabila rezidual este de medie nul, ceea ce nseamn c ansamblul factorilor luii y care nu aufost reinui n model este de speran matematic nul. Astfel scris:

    iii xba x y M +=)/(

    Cum i y i i x reprezint valori numerice observate fr erori, sperana condiional considerat maisus se reduce la:

    ii xba y M +=)(

    H2 : ( ) 22 == ii u M u D

    ( ) ( )[ ] 222iuiiii u M u M u M u D === ;

    Presupunem c variana perturbaiilor este constant, indiferent det , deci procesul este staionar Estecunoscut ca ipoteza dehomoscedasticitate a perturbaiilor (variabilele prezente n model sunt egalmprtiate). Intuitiv, considerm c amploarea erorilor, deci aproximaia efectuat de model esteconstant n raport cut . n caz contrar, fenomenul se numete heteroscedasticitate.

    H3 : ( ) 0,cov ' =ii uu

    Se presupune deci independena erorilor. Covariana perturbaiilor fiind nul, nseamn c dou erorcu privire la dou observaii diferitei i i sunt independente ntre ele.

    ( ) 0, ' =ii uu M deoarece ( ) ( )'ii u M u M =

    H4 : ( ) 0,cov =ii u x

    Se presupune deci c perturbaiile sunt independente n raport cu variabila explicativ.H5 : ( ),,0 2 ui

    Ipoteza de normalitate a erorilor permite efectuarea unor teste asupra modelului. Se datoreazteoremei limit-central1.

    Ipotezele de normalitate i homoscedasticitate asupra erorii se pot vizualiza n reprezentareatridimensional de mai jos, unde axa spaial este ( )u f z = . Valorile z sunt normal distribuite n juruldreptei de regresie. Pentru fiecare valoare x, dispersia n jurul dreptei de regresie este constant.

    Ipoteze asupra variabilei exogene x

    - Presupunem c, atunci cndT este foarte mare, primele momente empirice ale lui X sunt finite:

    1 Nu este necesar s presupunem normalitatea componentelor luiiu , ci doar un numr mare de factori independeni i identicdistribuii ntre care exist o relaie de tip aditiv.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    7/48

    Modelul liniar unifactorial 7

    - media empiric este finit:

    =

    =T

    t t T

    x xT 1

    01lim

    - variana empiric este finit:

    =

    =T t

    t T s x x

    T 122 0)(1lim

    - Presupunem c variana empiric a lui X converge spre o valoare nenul2

    x . Ipoteza poate fiverificat n cazul staionar, daci x sunt realizri ale unor variabile aleatoare independente i identic

    distribuite, de variane egale cu2

    x . Este de reinut c, n aceast ipotez,i x conserv o oarecarevarian cnd T .Dac ipotezele precedente sunt respectate, vom obine estimatoriB.L.U.E. (Best Linear Unbiased

    Estimators)

    4.3. Estimarea parametrilor modelului

    Importana obinerii valorilor parametrilor modelului studiat este dat de necesitatea interpretriecuaiei fenomenelor studiate. Astfel, cu ajutorul parametrilor estimai, se poate observa modificarevariabilei endogene atunci cnd cea exogen crete cu o unitate.

    Estimarea parametrilor unui model econometric se realizeaz cu ajutorul mai multor metode: metodcelor mai mici ptrate, metoda verosimilitii maxime, metode baysiane etc.

    Parte din aceste metode au fost descrise la unitatea de nvare precedent. Analizm cazuldependenei descrise de o funcie liniar bxa y += .

    Se reprezint grafic (scatter diagram ) punctele de coordonate( )ii y x , obinute din eantionul dedate observate asupra variabilelor modelului, care arat ca un nor de puncte i se traseaz dreapta care trec prin mijlocul norului de puncte. Spunem c am acceptat drept model de reprezentare a relaiei ddependen, funcia liniar: bxa y += .

    Dac din punctul i x de pe axaOx se ridic o perpendicular, aceasta intersecteaz dreapta ntr-un punct a crui ordonat este valoarea ajustati y , sau media condiionat ( )ii x y M / n cazul datelor provenite din mai multe sondaje.

    Dreapta are panta dat de parametrulb, iar axaOy o taie la o distan de origine egal cu valoarea parametruluia (numit deprtarea la origine).

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    8/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Distanele de la punctele norului( )ii y x , la dreapt, notate iu , reprezint abaterile generate de aceifactori considerai nesemnificativi, accidentali, cu rol perturbator.

    Deci, mrimea abaterii este dat de diferena:

    iii y yu = ntruct dispunem doar de eantioane de date, pentru a obine valori (estimri) pentru parametrii a

    b, sunt necesare condiii de felul:- gradul de determinare a efectului de ctre cauz, ct mai mare (nivelul coeficientului R 2 s fie

    maxim);- abaterile dintre valorile empirice ale variabilei efect i valorile sale obinute pe baza modelulu

    (aflate pe dreapt), i y - valori teoretice, ajustate, s fie ct mai mici :

    ( )2 ii y y minim- estimaiile parametrilor s fie ct mai precise (pentru un eantion n cretere, s se abat doar

    ntmpltor de la valorile adevrate), adic estimatorii parametrilor s fie eficieni, consisteninedeplasai;

    Metoda celor mai mici ptrate -Ordinary Least Squares (OLS) ndeplinete aceste condiii.

    Metoda celor mai mici ptrate (MCMMP)Fie modelul econometric liniar unifactorial scris pentru perechile de variabile observate ale unu

    eantion de volum n, (x1, y1), (x2, y2), , ( xn, yn):

    iii ubxa y ++= Estimarea parametrilor acestui model econometric folosind MCMMP) pornete de la urmtoarea relaie:

    ii xba y += care definete modelul teoretic, unde:

    i y - reprezintvalorile teoretice (valori ajustate) ale variabilei endogene y obinute numai nfuncie de valorile factorului esenial (variabila exogen)i x i valorile estimate ale parametrilor a i b,respectiv ia i b .

    Fie iu abaterile dintre valorile empirice i valorile rezultate din aplicarea modelului de regresie:

    ( ) iiii xbbaa y yu +==

    MCMMP const n a minimiza distana dintre valorile estimate i valorile teoretice:

    ( ) ( )2

    1

    2

    1minmin

    =

    n

    iii

    n

    ii y yu

    ceea ce revine la a minimiza funcia de dou variabile:

    ( )ba F ,min = ( ) 2min ii y y = ( )2min ii xba y Condiia de minim pentru funcia de dou variabile de mai sus conduce la sistemul de ecuaii:

    ==

    00

    b

    a

    F F

    echivalent cu:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    9/48

    Modelul liniar unifactorial 9

    =+

    =+

    iiii

    ii

    x y xb xa

    y xban2

    (sistemul ecuaiilor normale)

    Estimaiile parametrilor sunt date de soluiile acestui sistem. Pentru determinarea estimaiei luia senmulete prima ecuaie cu1/n i se obine:

    n y

    n x

    ba ii =+ ,adic:

    xb ya =

    =2

    ii

    i

    iii

    i

    x x xn

    x y x yn

    b

    relaii care reprezintestimaiile parametrilor .

    Din ecuaiile normale decurg i urmtoarele proprieti:

    - Media variabilei aleatoare u este zero[ ] 0 =iu M Avem ) 0 = ii xba y , adic 0 = iu rezult [ ] 0 =iu M

    - Suma valorilor empirice i y este egal cu suma valorilor teoretice i y (principiul conservrii informaiilor)Din aceeai relaie de mai sus ( ) 0 = ii xba y rezult c ( ) = 0ii y y , adicegalitatea afirmat.

    - Dreapta de regresie ii xba y += trece prin punctul de coordonate ( ) y x P , . Aceasta deoarececoordonatele lui P verific ecuaia dreptei de regresie xb ya = .

    Formule echivalente pentru calculul estimatorilor

    Calculnd determinanii din expresia estimatorului luib dat de ecuaiile normale,se obine:

    ( )22

    =ii

    iiii

    x xn y x x yn

    b

    ( )( )

    ( )n x

    x

    n x y

    x y

    ii

    iiii

    22

    =

    ( )( )( )2

    =

    x x

    y y x x

    i

    ii

    iar estimatorul lui a se obine din aceeai relaie: xb ya =

    Acestea nu sunt singurele formule de calcul a coeficienilor. Mai exist i alte formule, derivateunele din celelalte. Spre exemplu, o formul mai simpl a luib , bazat pe cunoaterea coeficientului decorelaie, se obine astfel:

    Dac mprim numrtorul i numitorul prin2n , se obine estimaia luib exprimat cu ajutorulcovarianei eantionului pentru variabilele x i y i a dispersiei de selecie a variabilei x:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    10/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    22

    xn x

    y xn

    x y

    bi

    ii

    =

    ( )

    2,cov

    x s y x=

    unde:( ) 2222

    xii sn

    x x x

    n x

    =

    = este dispersia de selecie a variabilei x iar

    ) ) ( ) xyiiii s x yn y y x x

    y xn

    y x==

    = ,cov este covariana dintre

    variabilele yi x

    Dac n expresia ( )2,cov

    x s x yb = se nlocuiete covariana n funcie de coeficientul de corelaie dat de

    formula:( ) ( ) ( )

    y x

    xy

    y x s s s

    s s x y y xr x yr r ==== ,cov,,

    atunci se obine o nou expresie pentru estimatorul luib n funcie de coeficientul de corelaie dintre x i y iabaterile standard de selecie ale acestora:

    x

    y

    s s

    r b =

    Estimatorul coeficientului de corelaie, r

    Coeficientul de corelaier este o estimaie a coeficientului de corelaie din colectivitateageneral2, calculat pentru eantion. Formula de calcul pentru coeficientul de corelaier este dat de relaia:

    ====

    ==

    =n

    ii

    n

    ii

    n

    iii

    y x

    xy

    y x xy

    y y x x

    y y x x

    s s s

    s s y xr r

    1

    2

    1

    2

    1

    )()(

    ))((),cov( .

    care poate fi adus, prin transformri elementare, la expresia de calcul:

    ==

    = == =

    = = =

    n

    i

    n

    iii

    n

    i

    n

    iii

    n

    i

    n

    i

    n

    i iiii xy

    y yn x xn

    y x y xnr r

    1

    2

    1

    2

    1

    2

    1

    2

    1 1 1 ,

    2

    ===

    ==

    =

    iY i

    i X i

    iY i X i

    y x

    xy

    y x y x

    y xY X COV

    1

    2

    1

    2

    1

    )()(

    ))((),(

    Se obinuiete ca pentru notaiile parametrilor i statisticilor modelului liniar corespunztor populaiei generale s se utilizezelitere greceti: ,, 2 , n timp ce pentru cele ale modelului estimat din eantioane de volum n, se folosesc litere din alfabetullatin: r s x ,, 2 .

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    11/48

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    12/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    - H0 : r = 0, cu ipoteza alternativ:- H1 : r 0 n cazul testului bilateral ir > 0 saur < 0 n cazul testului unilateral dreapta, respectiv

    testul unilateral stnga.Statistica t este:

    22 12

    r nr t n

    = .

    Pornind de la relaia )/( 2222 y x s sbr = se observ c testult pentru testarea ipotezei nule asupracoeficientului de corelaie H0 : r = 0 este identic de fapt, cu testult pentru testarea ipotezei nule H0 : b = 0.

    Ipoteza nul se respinge dac valoarea calculat 2,22, > nncalc t t pentru testul bilateral i

    2,2, > nncalc t t sau 2,2, < nncalc t t pentru testul unilateral dreapta, respectiv, stnga.

    Proprietile estimatorilor metodei celor mai mici ptrateConsidernd ipotezele asupra modelului liniar unifactorial potenial verificate, se studiaz

    proprietile estimatorilor i a metodelor de estimare.Estimaiile parametrilor rezultate pe baza ecuaiilor normale ale metodei celor mai mici ptrate

    (MCMMP) sunt estimaii punctuale.n cazul n care utilizm date obinute din diferite eantioane de volum n, putem obine valori diferit

    att pentru a ct i pentrub , dar ne ateptm ca media estimrilor obinute s se apropie de adevratelevaloria i b ale parametrilor populaiei.

    n cazul repartiiei normale a variabilei reziduale, estimatorii obinui prin MCMMP sunnedeplasai, eficieni i consisteni i deci aceti estimatori pot fi considerai cei mai buni n procesul ddecizie sau de modelare econometric (best linear unbiased estimator BLUE ):

    [ ] aa M = , bb M = - estimatorii sunt nedeplasai;

    aa p

    , bb p

    - estimatorii sunt consisteni ;Orice alt estimator pentru a, respectiv b, are dispersia mai mare dect dispersia luia i b -estimatorii sunt eficieni.

    Repartiia variabilelor aleatoare numite estimatori ai parametrilor De reinut c nu doar variabila rezidual are repartiia normal, ci i parametrii estimai urmeaz

    aceeai lege de repartiie, legea normal.Estimatoria i b sunt variabile aleatoare repartizate dup legea normal:

    ( );, a sa a ( )b sb b , unde:

    - abaterea medie ptratic a estimatorului a este:

    ( )

    +=

    i iua x x

    xn

    s s 22

    2

    1

    - - abaterea medie ptratic a estimatorului b este:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    13/48

    Modelul liniar unifactorial 13

    ( ) =

    ii

    ub x x

    s s 22

    - dispersia variabilei reziduale u este:

    ( )= i iu un s22

    21 =

    ( )

    2

    2

    n

    y yi

    ii

    Tabelarea valorilor calculate Valorile obinute prin calcule dup formulele de mai sus, se pot sintetiza ntr-un tabel. Dispunnd de

    estimaiile parametrilor se pot calcula valorile teoretice (estimate, ajustate) ale variabilei endogeneii xba y += (coloana 5 din tabelul de mai jos), valorile variabilei reziduale iii y yu = (coloana 6 din

    acelai tabel), precum i restul indicatorilor statistici: abaterea medie ptratic a variabilei rezidualeabaterea medie ptratic a estimatoruluia, abaterea medie ptratic a estimatorului b , etc.:

    i x i y 2i x ii y x ii xba y += iii y yu = 2iu x xi y yi

    (1) (2) (3) (4) (5) (6) (7) (8) (9)

    1 x 1 y 21 x 11 y x 11 xba y += 111 y yu = 2

    1u M M M M M M M n x n y 2n x nn y x nn xba y += nnn y yu =

    2nu

    i x i y 2i x ii y x i y 0 = iu 2iu n practic, nimeni nu mai calculeaz valorile coeficienilor a i b n acest fel. Apariia programelo

    statistice cum sunt SPSS, Eview, Excel cu o putere de calcul extrem de mare i rafinat, permit obinereacestor cifre prin simpla selectare a unei comenzi; dei calculele se fac automat, cunoaterea formulelor d baz este necesar pentru a nelege logica metodei i condiiile ei de aplicare.

    Interpretarea economic a parametrilor estimaiImportana obinerii valorilor estimate ale parametrilor modelului

    este dat de necesitatea

    interpretrii ecuaiei fenomenului studiat.

    Estimatorulb indic cu cte uniti naturale (n care este exprimat y) se modific n medie variabilaefect (crete pentrub >0 i scade pentrub

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    14/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Intervale de ncredere pentru estimatorii obinui prin MCMMP

    Pentru a realiza inferena asupra parametrilor estimai, anume raportarea rezultatelor obinute dindatele empirice ale seleciei la ntreaga colectivitate, parametrii nu se pot estima doar punctual, ca paragraful precedent, ci i sub form de intervale de ncredere.

    Am vzut c estimarea sub form de interval de ncredere este bazat pe calculul erorii standard(E.S.), la un anumit nivel de ncredere. La un nivel de ncredere de 95%, parametrul din populaie se aflntre 1,96 E.S. n jurul statisticii din eantion.

    Utiliznd noiunile de statistic matematic referitoare la intervale de ncredere pentru estimatori putem stabili:

    a) intervalul de ncredere pentru estimaia b Ne propunem stabilirea unui interval n cadrul cruia s se situeze de exemplu 95% dintre valorile lu

    b (spunem c nivelul de ncredere dorit este de 95%).

    Pentru pragul de semnificaie 05,0= ( 95,01= ) folosim variabila standardizat (redus),normal distribuit:

    b

    bb

    )1,0(

    iar limitele intervalului rezult din egalitatea:

    95,0

    205,0

    205,0 =

    z bb z P

    b

    bb z bb z b 205,0205,0 +

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    15/48

    Modelul liniar unifactorial 15

    =

    +

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    16/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    ( ) ( ) ( )( ) y P b P b y P I yb P = /,/ 0

    Analiza bayesian se refer att la datele eantionului( )ii x y , , ct i la informaii apriori despre parametrii, la care se adaug i o funcie a pierderii (cost, risc), datorat abaterilor valorilor estimate de

    cele adevrate.Metoda utilizeaz instrumentele matematice din teoria probabilitilor, operaii cu probabiliti. Dac

    metoda celor mai mici ptrate presupune c parametrii sunt necunoscui, metoda bayesian consider

    cunoscut legea de distribuie ce influeneaz parametrii ce vor fi estimai.Metoda folosete postulatele:

    - parametrii necunoscui aparin unor clase de distribuie cunoscute aprioric;- metoda bayesian de estimare definete un procedeu de selectare a celei mai bune metodedefinind clase alternative de estimri i evalundu-le n termenii valorilor ateptate alefunciilor.

    Valorile obinute cu metodele bayesiene sunt mai corecte i foarte apropiate de cele reale. Esenateoriei const n faptul c explic cum se schimb ideile existente n condiiile unor noi probe. Metoda saplic unor situaii concrete pentru care se prezint evenimente sub forma funciilor de tip cauz efect (cuar fi fumatul i efectul su negativ).

    Toate metodele enunate sunt folosite pentru obinerea de valori numerice.

    Rezumat n concluzie, etapa de estimare a parametrilor unui model econometric are loc dup definirea

    modelului i parcurgerea etapelor de specificare i identificare.Estimarea punctual a parametrilor unui model liniar unifactorial cu MCMMP presupune

    parcurgerea urmtorilor pai:

    - se raporteaz seria statistic a datelor empirice( ) ni y x ii ,1;, = pentru cele dou fenomene economice y, respectiv x i se completeaz un tabel ca cel de mai jos. Tabelul poate fi util dac nu se apeleaz lautilizarea unui instrument informatic pentru generarea valorilor numerice rezultate din aplicareadiferitelor formule de estimare:

    i x i y 2i x ii y x ii xba y += iii y yu = 2iu

    1 x 1 y 21 x 11 y x 11 xba y += 111 y yu = 21u M M M M M M M n x n y 2n x nn y x nn xba y += nnn y yu =

    2nu

    i x i y 2i x ii y x i y 0 = iu 2iu - modelul econometric liniar identificat:

    iii ubxa y ++= , undea, b sunt parametrii modelului iiu variabila eroare (rezidual)

    ii xba y += , i y valorile teoretice (estimate) ale variabilei efect

    iii y yu = - estimaia erorii iu

    - utilizarea unei metode de estimare punctual a parametrilor modelului:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    17/48

    Modelul liniar unifactorial 17

    a , b estimaiile parametrilor date de formulele

    xb ya = i

    =2

    iii

    iii

    i

    x x xn x y x

    yn

    b =2

    2

    xn x

    y xn

    x y

    i

    ii

    (obinute prin MCMMP)- determinarea intervalelor de ncredere ale estimaiilor obinute pentru parametrii i respectiv pentr

    valorile ateptate ale variabilei efect.- Reamintim c eroarea standard (E.S.) este abaterea standard a distribuiei de eantionare a

    estimatorului, care ne ofer un interval n care estimm c se afl parametrul din populaie, la unanumit nivel de ncredere.

    Spre exemplu, eroarea standard a coeficientuluib ne va da o estimare de tip interval asupra parametruluib al populaiei.

    *Temele urmtoare descriu parcurgerea etapelor prin care se urmrete verificarea modelului teoretic

    construit i validarea acestuia:- verificarea ipotezelor de fundamentare a metodei celor mai mici ptrate,- testarea pentru a afla dac estimatorii obinui sunt semnificativi precum i- testarea similitudinii modelului.Odat validat modelul, se poate trece i la alte considerente legate de predicie.

    4.4. Verificarea modelului econometric

    Etapele anterioare se bazeaz pe acceptarea unor ipoteze de lucru, dar i pe date experimentale desondaj. De aceea, modelul econometric care pn acum este doar specificat, identificat i estimat, trebuiverificat (testat).

    Verificarea valideaz sau invalideaz similitudinea statistic dintre modelul economic real descride seriile statistice ale fenomenului analizat i modelul teoretic construit i rezolvat pn la aceast etap.

    Verificarea modelului econometric presupune:

    a. Verificarea ipotezelor pe care s-a bazat estimarea anterioar a parametrilor (inclusivtestul d Durbin Watson );

    b. Verificarea semnificativitii estimatorilor parametrilor ( testul t );

    c. Verificarea similitudinii modelului econometric ( testul F ).

    a. Verificarea ipotezelor pe care se fundamenteaz estimarea parametrilorAceste ipoteze sunt:

    i) Variabilele de observaie( ) ni x y ii ,1,, = sunt fr erori de msur; variabilaiu este o variabilaleatoare, deci i variabila efect este tot aleatoare.

    ii) Erorile iu sunt homoscedastice: variabila aleatoareiu estede medie nul

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    18/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    ( ) 0 =iu M i de dispersie constant:

    ( ) ( ) ( ) 222212 unu Du Du D ==== K

    iii) Valorile variabilei aleatoareiu sunt independente (necorelate):

    ( ) ==

    teautocorelaerori,0teindependenerori ,0

    ,cov ji

    jiuu ji

    iv) Variabila aleatoare iu este repartizat dup legea normal, de medie zero i abatere medie

    ptratic constant egal cu ct uu == 2 , adic:

    ( )ui u ,0 Teoria demonstreaz c, n ipoteza iv), metoda verosimilitii maxime este echivalent cu MCMMP.

    i) Pentru verificarea ipotezei c variabilele de observaie( ) ni x y ii ,1,, = sunt fr erori de msur sefoloseteregula celor trei sigma :

    ( ) xi x x 3 xi x x x x 33 +

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    19/48

    Modelul liniar unifactorial 19

    Regula de decizie este:

    10 d d

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    20/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    - Se testeaz dac termenul libera i respectiv coeficientulb al variabilei explicative x, coeficieni ai populaiei din care provine eantionul nostru, sunt semnificativ diferii de zero.

    Astfel, se accept sau respinge una din cele dou ipoteze:

    ==

    00

    :0 ba

    H sau

    00

    :1 ba

    H

    Pentru aceasta, se compar valorile calculate ale estimaiilor reduse:

    acal s

    at

    1 0 = ib

    cal sbt

    2 0=

    cu valoarea teoretic notat t sau z din tabelul distribuiei normale (pentru n>30), sau cu ( )1, + k nt dintabelul distribuiei Student (pentru n=

    1 i t sbt b

    cal >=

    2

    , atunci se accept ipoteza H 1,

    ceea ce nseamn c parametrii estimai ai modelului corespunztor populaiei din care s-a extraseantionul sunt semnificativ diferii de zero, pentru un prag de semnificaie ales i egal cu .

    Se spune c modelul a fost corect specificat, identificat i estimat i se continu analiza econometric.n caz contrar, se accept ipoteza de nulitate H 0, ceea ce conduce la concluzia c parametrii estimainu sunt semnificativ diferii de zero i se renun la model, revenindu-se la prima etap de analiz pentru propune o nou specificare.

    Inferena statistic pe baza coeficienilor de regresie; eroarea standard (E.S.)Exist o singur dreapt de regresie adevrat pentru ntreaga populaie din care sunt extrase

    seleciile aleatoare de volum n i exist cte o dreapt de regresie pentru fiecare eantion aleator posibiDeoarece exist o infinitate de eantioane posibile, exist deci i o infinitate de drepte de regresie posibile eantion. Prin urmare, coeficieniia i b (folosii pentru predicia pe baza datelor din eantion) fac oinferen asupra coeficienilora i b din populaie, dup cum fiecare dreapt de regresie n eantion face oinferen asupra dreptei de regresie din populaie.

    Eroarea standard este abaterea standard a distribuiei de eantionare a estimatorului, care ofer uninterval n care estimm c se afl parametrul din populaie, la un anumit nivel de ncredere. Rezultatu

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    21/48

    Modelul liniar unifactorial 21

    prezentat de calculator va cuprinde obligatoriu valoarea coeficienilor estimaia i b , dar i eroareastandard a acestora a s , respectiv b s .

    Eroarea Standard a acestor coeficieni este necesar n dou direcii:1. Pentru a testa pe loc dac aceti coeficieni pot sau nu s fie considerai utili. Este vorba de un tes

    t prin care se testeaz dac sunt sau nu diferii de zero; n funcie de mrimea valorii p calculat, vomrespinge sau nu ipoteza de nulitate. Aceast probabilitate este bine s fie foarte mic, mult sub orice prag dsemnificaie rezonabil, cu att mai mult sub clasicul prag de 5%.

    2. Pentru a face o inferen asupra parametrilor din populaie. Valorile luia i b sunt estimri punctuale ale parametrilor i din colectivitatea general. Dup cum s-a vzut, exist i o estimare subform de interval de ncredere bazat pe calculul erorii standard, la un anumit nivel de ncredere. Sprexemplu, eroarea standard a coeficientuluib ne va da o estimare de tip interval de ncredere asupra parametrului , astfel:

    =

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    22/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    SSE (Error Sum of Squares) - msoar variaia neexplicat ce poate fi atribuit altor factori, diferiide variabila explicativ x.

    Corespunztor descompunerii luiSST avem i o partiionare a gradelor de libertate, astfel:SST are n 1 grade de libertate deoarece din celen puncte de observare ale seleciei s-a pierdut un

    grad de libertate prin estimarea mediei .

    SSE are asociaten (k +1) grade de libertate dac modelul este multifactorial, unde prin estimareacelork parametrii ai variabilelor regresori i a termenului liber s-au pierdutk +1 grade de libertate din celen.

    n consecin, din gradele de libertate asociate cu descompunerea variaiei totale se deducecorespunztor cSSR va aveak grade de libertate:

    ( 1) ( ( 1))SST SSR SSE n k n k = + + ,

    Sumelor ,SSR SSE li se asociaz mediile n raport cu gradele de libertate, adic suma ptratelor

    mediate: SSR MSRk

    = i( 1)

    SSE MSE n k

    = +

    .

    Raportul SRSE

    este utilizat ca estimator. El urmeaz o distribuie F cu k i respectivn (k +1) grade

    de libertate: ( )1; + k nk F MSE MSR

    Se obine statistica testului F , Fisher-Snedecor, care se folosete pentru verificarea existenei uneidependene liniare ntre variabila dependent i celek variabile independente, ntr-un model liniark factorial, sau altfel spus similitudinea modelului econometric.

    Cum distribuia F are doar valori pozitive i nu este simetric, ipoteza nul este respins doar dacvaloarea calculat *calc F depete valoarea critic crt F . Pentru o eroare fixat prin nivelul de semnificaie ,regula de decizie este urmtoarea:

    - dac crt calc F F * , atunci respingem ipoteza 0 H (decizia dorit pentru a menine modelul)- dac crt calc F F

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    23/48

    Modelul liniar unifactorial 23

    n concluzie, pentru verificarea printestul F se parcurg urmtorii pai:1. Se calculeaz:

    - variaia total a variabilei y datorat tuturor factorilor de influen:

    SST: ( )2

    1

    20

    ==

    n

    ii y yV

    - variaia explicat a variabilei y datorat numai factorului principal de influen x :

    SSR: ( )2

    1

    2 =

    =n

    ii x y yV

    - variaia neexplicat a variabilei y, rezidual, datorat factorilor nespecificai n model:

    SSE: ( )2

    1

    2

    ==

    n

    it iu y yV

    - dispersiile corectate:

    k SSR MSR = sau

    k V s x x y

    22 = i

    1=

    k nSSE MSE

    1

    22

    =k n

    V s uu

    2. Se formuleaz ipotezele de testat:

    Dac H0:

    MSR=MSEatunci influena factorilor x nu difer de cea a factorilorntmpltori i se renun la modelul specificat, cutndu-se alifactori explicativi pentru variaia variabilei y; se reia analizancepnd cu specificarea, identificarea i definirea modelului.(

    22u x y s s = )

    Dac H1: MSR MSE tunci influena factorilor x difer semnificativ de cea aactorilor ntmpltori, ceea ce permite s se continue discuiaimilitudinii modelului teoretic n raport cu cel real.(

    22u x y s s )

    3. Se calculeaz:- coeficientul de determinaie notat mai simplu cu R2 care este definit de relaia:

    SST SSR R =2 2

    0

    22

    V V R x x y =

    Coeficientul de determinaie este o msur a proporiei varianei explicate prin regresori din variantotal a modelului de regresie.

    Evident c 10 2 R . Egalitatea cu 1 are loc atunci cnd variaia explicat este egal cu variaiatotal, ceea ce nseamn c modelul explic perfect, n proporie de 100%, variaia dependenei.

    Spre exemplu, o valoare a lui 19,02 = R nseamn c variabila independent explic 19% dinvariaia dependenei. Cu alte cuvinte, cu ct valoarea lui2 R este mai aproape de 1, cu att modelul teoretic

    va fi mai bun i cu ct este mai aproape de zero, nseamn c modelul nu reuete s surprind ceea ce sntmpl n realitate.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    24/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    - raportul de corelaie care este definit de relaia:

    2 R R = sau 20

    22

    V V R R x x y x y ==

    Raportul de corelaie are aceeai semnificaie ca i coeficientul de corelaier , adic:Dac: 0= x y R , atunci x i y sunt independente;

    Dac: ( )5,0;0 x y R

    ( )1;5,0 x y R

    atunci exist o corelaie slab ntre variabile;

    atunci exist o corelaie puternic;

    Dac: 1= x y R atunci ye corelat strict cu x.

    Raportul de corelaie are semnul coeficientului de regresieb, ca i coeficientul de corelaie r , dup cum

    arat expresia y

    x

    s sbr = .

    Observaie:Dei se calculeaz unul pe baza celuilalt, un coeficient de corelaie mare nu nseamn iun coeficient de determinaie suficient de mare. Spre exemplu, atunci cnd 68,0= R (o valoare destul demare), 46,02 = R . Se poate observa c atunci cnd dou variabile coreleaz mpreun cu o valoare de 0,68,fiecare ar putea explica doar 46% din variaia celeilalte.

    ntr-o ecuaie de regresie simpl, coeficientul se numete de determinaie simpl, iar n ecuaia deregresie multipl el se numete coeficient de determinaie multipl.

    n baza descompunerii varianei totale: 2220 u x V V V += , raportul de corelaie se mai poate

    scrie: 20

    2

    1V V R R u x y == , de unde 2

    20

    211

    uV V

    R =

    sau 2

    2

    2 111

    u

    x

    V V

    R +=

    , ceea ce conduce la raportul

    2

    2

    2

    2

    1 R R

    V V

    u

    x

    = utilizat n calculul statisticii F.

    4. Se calculeaz variabila:

    1:

    22

    2

    2*

    ===

    k n

    V

    k

    V

    s

    s

    MSE

    MSR F u x

    u

    x ycalc

    k k n

    R R F calc

    11 2

    2*

    =

    i se compar cu valorile din tabelele de distribuie ale variabilei Fisher-Snedecor.Ipotezele de testat devin:

    Dac H0: 1,,22 1

    1

    = k nk cal F k

    k n R

    R F atunci 0= x y R i se renun la modelul econometric;

    Dac H1: 1,,22 1

    1 >

    = k nk cal F k

    k n R

    R F atunci 0 x y R i se trece mai departe la discuia ecuaiei

    analizei variaiei.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    25/48

    Modelul liniar unifactorial 25

    5. Se completeaztabelul A OVA , care grupeaz valorile varianelor din descompunerea222

    0 u x V V V += , utilizate n calculul statisticii F utilizate detestul Fisher .

    n tabelul ANOVA,k reprezint numrul de variabile independente luate n considerare. n analizaregresiei liniare simple asociat modelului liniar unifactorial,k =1.

    Tabelul A OVA pentru regresia multipl

    SURSA DEVARIAIE

    MSURA VARIAIEI(SUM OF SQUARES) G

    R A D E

    L I B E R T A T E

    DISPERSII

    CORECTATE(MEA SQUARE)

    *calc F

    VARIANAEXPLICAT DE

    MODEL,DATORAT

    FACTORULUI X (REGRESSIO )

    SSR:

    ( )2

    1

    2 =

    =n

    ii x y yV

    k MSR:

    k SSR

    k V s x x y ==

    22

    === 22

    *

    u

    x ycalc s

    s MSE MSR F

    k k n

    R R 1

    1 2

    2 =

    VARIANAREZIDUAL,DATORAT

    FACTORILOR NEESENIALI

    (ERROR)

    SSE:

    ( )

    =

    =

    =

    ==

    n

    ii

    n

    iiiu

    u

    y yV

    1

    2

    1

    22

    n - (

    k + 1 ) MSE:

    11

    22

    =

    =k n

    SSE k n

    V s uu

    VARIANATOTAL (TOTAL)

    SST:

    ( )2

    120 = =

    n

    ii y yV

    n-1

    Testul Fisher reprezentat prin calculele din tabelul ANOVA de mai sus este un test pentru cazulregresiei multiple, de verificare a semnificaiei globale a regresiei, sau a similitudinii modelului teoretraportat la cel real.

    n cazul regresiei simple, unde numrul de regresori (factori) estek =1, similitudinea verificat printestul Fisher se reduce la semnificaia influenei variabilei x asupra variaiei variabilei y. n consecin, pentru modelul liniar unifactorial, statistica testului devine:

    )2()1(

    2

    2*

    = n

    R

    R F calc

    iar regula de decizie este:

    dac 2,1;05,0* > ncalc F F , atunci se respinge ipoteza de egalitate a varianelor (H0 ipoteza nul), variabila x fiind semnificativ pentru variaia variabilei y.

    dac 2,1;05,0* ncalc F F , atunci se accept aceast ipotez de egalitate a varianelor i modelul se declarnevalid.

    n tabelul ANOVA obinut cu un soft, de exemplu Excel ca n aplicaiile urmtoare, exist i coloanSignificance F care dvaloarea p a erorii pe care o facem prin respingerea ipotezei nule cnd ea este de faptadevrat. Valori mici pentruvaloarea p ne conduc la concluzia c se poate respinge ipoteza nul i acceptaca adevrat ipoteza alternativ, aceea care conduce la validarea modelului ca model de regresie adecvadatelor de observare.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    26/48

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    27/48

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    28/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Probleme Rezolvate

    1. Dac admitem c numrul populaiei x determin vnzrile unui produs de uz curent y, urmrim s verificm realismul prezumiei, dar i s determinm n ce msur modificarea numrului populaiei cu 10.000 de locuitori produce modificri n ce privete volumul vnzrilor .Prezentm datele din tabelul de mai jos, date care se refer la 16 localiti:

    Y vnzri (mii kg.) 10 12 14 28 30 32 28 35 40 45 45 52 55 54 58 60X populaia (zeci

    de mii locuitori) 2 3 3 5 6 6 6 7 8 8 9 10 10 11 12 13

    Soluie:Reprezentnd ntr-un sistem de axe punctele de coordonatei x , i y , ele descriu un nor de puncte a

    crui form urmeaz mai curnd o dreapt dect o linie curb (parabol, hiperbol, exponenial, etc).

    Urmnd modalitatea de estimare a parametrilor modelului liniar ii xba y += , se obin:

    - valorile medii x=7,43 i y=37,37;- i estimaiile parametrilor:

    ( )2,cov

    x

    x yb

    = ( )( )( )

    = 2

    x x

    y y x x

    i

    ii =4,94

    61,043,794,437,37 === xb ya Interpretarea economic a rezultatului obinut se poate formula astfel: la o cretere a numrului d

    locuitori cu 1, (adic cu 10.000), vnzrile cresc (b>0) n medie, cu 4,94 mii de kg. Intervalul de ncredere n care se situeaz parametrulb (valoarea adevrat) dac 05,0= , 16-2

    grade de libertate (corespunztor, 145,22/ = t ), 22,0= , este:

    22,0145,29425,422,0145,29425,4 + b . Nivelul parametrului b se situeaz ntre 4,4706 i 5,4144, cu o probabilitate de 0,95.

    2. S presupunem c o unitate de prestri servicii a msurat statistic legtura dintre numrul clienilor servii i costul total (mii lei): ii x y 66,512272 +=

    (costul total=costul fix+costul variabilnumr clieni servii)

    Graficul "nor de puncte" (Scatter Diagram)

    0

    10

    20

    30

    40

    50

    60

    70

    0 5 10 15

    X populaia (zeci de mii locuitori)

    Y v

    n z

    r i

    ( m i i k g

    . )

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    29/48

    Modelul liniar unifactorial 29

    De asemenea, ;06,3951;5552,6;5,32;18 leimii y s xn x ==== leimii s y 6131,389= .58,198 leimii se = S se determine intervalele de ncredere pentru estimatorii parametrilor

    Soluie:

    14,781,2758,198

    185552,658,198

    2 ===b s mii lei; 73,236185552,65,32

    181

    58,198 22

    =+=a s

    Intervalele de ncredere pentru parametrii i vor fi, t0,005;16 = 2,921

    bb st b st b + 16;005.016;005.0

    14,7921,266,5114,7921,266,51 +

    52,7280,30 mii lei;

    aa st a st a + 16;005.016;005.0

    73,236921,2227273,236921,22272 + 49,296351,1580 mii lei

    3. Proprietarul unui minihotel dezvolt o analiz statistic pentru determinarea cheltuielilor cumaterialele de curenie (y) n funcie de numrul camerelor ocupate (x). El determin ecuaia deregresie pentru cheltuielile zilnice (pentru detergent, clor etc.) (zeci mii lei), pe baza datelornregistrate pentru n=14 zile: ii x y 7,38,10 += , 86,26)(

    2 = x xi , 3,2= x , = 39,163)( 2 y yi a) Proprietarul dorete s estimeze cheltuielile pentru o zi n care are 6 camere ocupate; b) Proprietarul dorete s estimeze cheltuielile medii pentru zilele n care are 6 camere ocupate.

    Soluie:Dac numrul camerelor ocupate este 61 =+n x , atunci: t0,025;12 = 2,179

    ;3367,38,10 1 =+=+n y ;179,212,025.02,2/ == t t n .69,31239,163 ==e s

    a) Intervalul de ncredere pentru cheltuielile unei zile n care sunt 6 camere ocupate este:

    86.26)3,26(

    141169,3179,233

    2++ , adic (22,89;43,11) garantat cu o probabilitate de 95%;

    b) Intervalul de ncredere pentru media cheltuielilor zilnice n cazul n care au 6 camere ocupate este:

    86.26)3,26(

    14169,3179,233

    2+ , adic (30,19;35,82), garantat cu o probabilitate de 95%.

    4. S presupunem c pe baza analizei statistice a n=20 de cazuri individuale s-a stabilit c exist o legturliniar direct ntre numrul turitilor cazai ntr-un hotel i ncasrile realizate de un Internet Caf situatn apropiere, legtur a crei intensitate s-a msurat prin coeficientul de corelaie r=0,52. S se testeze semnificaia coeficientului de corelaie astfel.Soluie:Vom testa semnificaia coeficientului de corelaie astfel:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    30/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    .583,252,01

    1852,01

    2,0:,0:

    22

    1

    0

    =

    ==

    =

    r nr t

    H H

    Pentru o probabilitate de %95)%1(100 = , 101,218,025.02,2/ == t t n Putem concluziona, cum 2,2/ > nt t , c avem suficiente dovezi pentru a respinge ipoteza nul i a

    accepta ipoteza alternativ, aceea c este semnificativ diferit de zero.

    5. Un produs a fost propus spre vnzare pe 20 de piee (zone geografice) la preuri diferite, cu venituri(medii) ale consumatorilor diferite, nregistrndu-se valori diferite ale cererii pentru fiecare pia,conform datelor din tabel:

    Nr. crt. Cerere Venit Pre Nr. crt. Cerere Venit Pre1 11,7 777 5,4 11 11,0 814 9,02 9,3 802 5,9 12 7,6 801 8,43 13,4 635 8,0 13 12,6 768 5,64 16,1 952 5,9 14 16,4 965 5,75 14,5 998 8,8 15 9,4 990 8,96 11,9 988 8,7 16 17,6 806 6,27 9,0 586 7,1 17 12,9 820 7,58 16,1 658 6,4 18 5,3 553 8,59 11,0 520 6,5 19 14,6 684 7,410 15,8 960 5,0 20 14,5 756 5,6

    Dac se noteaz cu t y = cererea (variabila endogen), t x1 = venitul; t x2 = preul (variabile exogene)

    Se cere:

    a) n ipoteza unei legturi liniare ntre cerere i venit, s se calculeze estimatorii parametrilor a i

    b .

    b) Parametrii a i b sunt semnificativ diferii de 0 ?c) S se stabileasc intervale de ncredere la un prag de 95% pentru cei doi parametri.

    d) S se arate c testarea ipotezei 0:0 =b H este echivalent cu testarea ipotezei 0=r , unde r

    este coeficientul de corelaie liniar simpl ntre cerere i venit.e) S se construiasc tabloul de analiz a varianei i testul Fisher adecvat. f) S se fac o previziune a cererii pentru dou valori ale venitului de 600 i respectiv 800. g) S se parcurg aceleai etape pentru regresia liniar simpl dintre cerere i pre.

    Soluie:a) Un grafic adecvat, de exemplu norul de puncte permite evidenierea legturii dintre cele dou variabile:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    31/48

    Modelul liniar unifactorial 31

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    400 500 600 700 800 900 1000 1100

    venit (X1)

    c e r e r e

    ( Y )

    Legtura liniar dintre cerere i venit

    12,535201 20

    1==

    =t t y y ; 791,6520

    1 20

    1==

    =t t x x

    435358,6)(20

    1

    2 ==t

    t x x ; 3396,345))((20

    1=

    =t t t y y x x

    007801,0)(

    ))((

    20

    1

    2

    20

    1 =

    =

    =

    =

    t t

    t t t

    x x

    y y x xb , 3591,665,791007801,0535,12 === xb ya

    b) Este foarte important s testm ndeosebi nulitatea parametruluib , deoarece dac el nu este semnificativdiferit de 0, variabilavenit nu poate fi considerat explicativ pentru variabila endogencerere. Seformuleaz ipoteza nul, cu alternativa ei:

    0:0:

    1

    0

    =

    b H b H

    Dac se va respinge ipoteza 0 H la un prag de semnificaie fixat, atunci parametrulb se poate considera

    semnificativ diferit de 0. Fie 05,0= adic un risc de eroare de 5%.Se cunoate c

    b sbb

    urmeaz o distribuie Student cun-2 grade de libertate. Sub ipoteza0 H , relaia devine

    bbb

    t sb

    sb

    0 == care urmeaz o distribuie Student cu 20-2=18 grade de libertate.

    0078,0 =b a fost calculat la punctul precedent, iar expresiile urmtoare se pot calcula din tabelul de mai jos

    ( )= i iu un s22 21 =

    ( )9,9082220178,3482

    2

    ==

    n

    y yi

    ii

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    32/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    ( )227590000,0

    435358,69082,9

    2

    22 ==

    = i

    i

    ub x x

    s s , de unde 0,0047706 =b s

    Calculul erorilor estimate: Nr. crt.

    i y ii x y += 0078,0359,6 iu 2

    iu 1 11,7 12,42 -0,72 0,5182 9,3 12,615 -3,315 10,9893 13,4 11,312 2,088 4,364 16,1 13,785 2,315 5,3595 14,5 14,143 0,357 0,1276 11,9 14,065 -2,165 4,6877 9,0 10,93 -1,93 3,7258 16,1 11,491 4,609 21,2439 11,0 10,415 0,585 0,342

    10 15,8 13,847 1,953 3,81411 11,0 12,708 -1,708 2,91712 7,6 12,607 -5,007 25,0713 12,6 12,349 0,251 0,06314 16,4 13,886 2,514 6,3215 9,4 14,081 -4,681 21,91216 17,6 12,646 4,954 24,54217 12,9 12,755 0,145 0,02118 5,3 10,672 -5,372 28,85819 14,6 11,694 2,906 8,445

    20 14,5 12,256 2,244 5,036

    Distribuia de eantionare sub ipoteza0 H :

    - 0. 05

    0. 45

    0. 95

    1. 45

    1. 95

    - 0. 05 0. 15 0. 35 0. 55 0. 75 0. 95

    Regula de decizie pentru un prag 05,0= devine:

    dac 025,0 2 >= nbb

    t t sb se respinge ipoteza 0 H , adic coeficientulb este semnificativ diferit de 0 (se

    accept 0b ); venitul este deci o variabil explicativ pentru cerere.

    b

    %2 %

    2

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    33/48

    Modelul liniar unifactorial 33

    dac 025,0 2

    = nb

    b

    t t sb se accept ipoteza 0 H , adic coeficientulb nu este semnificativ diferit de 0 (se

    accept 0=b ); venitul nu este deci o variabil explicativ pentru cerere.Se calculeaz:

    64,10,0047706

    007801,0

    ===

    bb s

    bt ; 101,2025,018 =t

    Se observ c 025,018 t t b ceea ce nseamn c din punct de vedere statistic, 0=b .

    c) Pentru construirea intervalului de ncredere pentru 0=b , se cunoate c:

    ) =+ 1Prob bb st bb st b Aplicnd pentru o probabilitate de 95%:

    ( ) %9500477,0101,20078,000477,0101,20078,0Prob =+ b

    ( ) %95,0178200,00222-Prob = b

    Exist deci un risc de 5% ca adevratul coeficientb s se afle n afara intervalului[ ],017820;0,00222- .Valoarea 0 se afl n interval, ceea ce ne duce la aceeai concluzie ca mai nainte, respectiv 0=b .Acelai demers se poate urma i pentru coeficientula .

    d) Coeficientul de corelaie liniar simpl este egal cu:

    = =

    =

    =

    T

    t

    T

    t t t

    T

    t t t

    y y x x

    y y x xr

    1 1

    22

    1

    )()(

    ))((, de unde

    = =

    =

    = T

    t

    T

    t t t

    T

    t t t

    y y x x

    y y x xr

    1 1

    22

    2

    12

    )()(

    ))((

    Dar:

    =

    =

    =

    T

    t t

    T

    t t t

    x x

    y y x xb

    1

    2

    1

    )(

    ))(( , de unde: 2

    1

    2

    12

    )(

    ))(( R

    y y

    y y x xbr

    T

    t t

    T

    t t t

    =

    =

    =

    =

    deci pentru regresia liniar simpl, coeficientul de determinaie este ptratul coeficientului de corelailiniar simpl.

    22

    2

    2

    2

    *)()2()1(

    )2()1(

    t nr

    r n R

    R F =

    =

    =

    de unde2

    1

    2*r

    nr t

    = care urmeaz o distribuie Student cu 2n grade de libertate.

    Aceasta permite s testm dac relaia dintreY i X este semnificativ, sau n mod echivalent dacr estesemnificativ diferit de 0.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    34/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    211864,1*r

    r t

    == 1293,02 =r 3596,0=r

    e) Pentru tabloul de analiz a varianei, calculm:

    26,4957)

    (

    20

    1

    2

    ===t i y ySSE ; 178,34920

    1

    2

    ===t t uSSR ; 204,845)(20

    1

    2

    ===t i y ySST Putem observa c se obine aceeai valoare a coeficientului de corelaie i pe baza componentelor varianei:

    1293,0845,204

    4957,26122 =====SST SSR

    SST SSE Rr

    Fie tabelul de analiz a varianei:Sursa variaiei Suma ptratelor Numrul gradelor

    de libertateVariabila explicativ (X) 26,4957=SSE 1 Variabila rezidual ( u ) 349,178=SSR 20-2

    Total 845,204=SST 20-1

    67,2)220/(

    1/* =

    =SSR

    SSE F

    Din tabelele cu distribuia Fisher - Snedecor se obine: 41,405,0 )18;1( = F 05,0

    )18;1(* F F < deci variabila venit nu poate fi considerat ca fiind explicativ pentru variabila

    endogen, cerere.

    Se poate constata deci c cele trei teste sunt echivalente:

    0:0:

    1

    0

    =

    b H b H

    0:0:

    ,1

    ,0

    =

    y x

    y x

    r H r H

    0:0:

    1

    0

    =

    SSE H SSE H

    Problema a fost rezolvat pn aici ntr-o manier didactic, cu calcule fcute fr a utiliza programeinformatice de specialitate.

    f) Pentru observaia de rangult +1 avem 6001 =+t x .

    0396,11600007801,0359,6 1101 =+=+= ++ t t xaa y

    Eroarea de estimare este:

    ++

    =

    ++=

    =

    +

    =

    =

    ++ T

    t t

    t

    t t T

    t t

    t u y

    x x

    x xn

    un x x

    x xn

    s st

    1

    2

    21

    20

    1

    2

    1

    2

    212

    2

    )(

    )(112

    1

    )(

    )(111

    11,2396435358,6

    )65,791600(2011349,178

    2201 22

    1 = ++

    =

    +t y s ; 3,35251 =+t y s

    Intervalul de ncredere pentru 1+t y se scrie:

    ( ) =+ ++ +++ 1Prob 11 2/2112/21 t t unt t unt st y y st y

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    35/48

    Modelul liniar unifactorial 35

    ceea ce pentru o probabilitate de 95% devine:

    ( ) %953525,309,20396,113525,309,20396,11Prob 1 =+ +t y

    ( ) %9505,1903,4Prob 1 = +t y

    Intervalul de ncredere este foarte larg, nesatisfctor, datorit varianei reziduale mari.

    Pentru observaia de rangult +2 avem 8002 =+t x .

    12,5998800007801,0359,6 2102 =+=+= ++ t t xaa y

    Eroarea de estimare este:

    10,4053435358,6

    )65,791800(2011349,178

    2201 22

    2 = ++

    =

    +t y s

    3,22572 =+t y s

    ( ) %952257,309,212,59982257,309,212,5998Prob 2 =+ +t y

    ( ) %9534,1986,5Prob 2 = +t y

    Intervalul de ncredere este mai ngust dect cel obinut anterior, deoarece 8002 =+t x se apropie mai mult de

    65,791= x , dar este tot nesatisfctor, datorit varianei reziduale mari.

    4.6. Utilizarea Excel pentru calculele de regresie

    Apelnd la meniulTOOLS>DATA A ALYSIS >REGRESSIO din aplicaia Excel, tabela deregresie simpl care se obine cuprinde n sumarul su (SUMMARY OUTPUT) , trei pri:

    A. Regression Statistics,B. Informaii despre estimatorii coeficienilor modeluluiC. Tabelul A OVA

    Interpretarea economic a rezultatelor numerice tabelateA. Regression Statistics

    Aceast zon din tabelele Excel conine informaii cu caracter general despre variabilele implicate n analizde regresie:

    coeficientul de corelaie multipl (Multiple R) , care la regresia simpl estecoeficientul decorelaie liniar simpl, r:

    ( ) y x s s y xr ,cov= ; -1

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    36/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    ( )( )2

    ))((,cov 1

    ==

    =

    n s s

    y y x x

    s s y xr

    y x

    n

    iii

    y x ( )

    ( )1

    2

    = n

    x x s i x ;

    ( )( )1

    2

    = n

    y y s i y

    - semnul lui r arat direcia relaiei dintre dou variabile, iar valoarea lui arat intensitatea asocieriacestora;- o valoare aproape de zero a lui r nu nseamn neaprat c ntre dou variabile nu exist nici un fel dcorelaie. Este posibil ca ntre cele dou s existe o corelaie puternic, dar ne-liniar; n acest cazdac ntre dou variabile nu exist nici un fel de corelaie, nu putem prezice absolut nimic desprvaloarea uneia folosind o valoare a celeilalte. Dac dimpotriv , ntre cele dou variabile exist ocorelaie, putem prezice cu o precizie mai mic sau mai mare valoarea uneia folosind-o pe cealaltn cazul unei corelaii aproape de maxim (+1 sau 1) atunci putem face o predicie cu un grad nalde precizie;

    - este o msur simetric a intensitii relaiei liniare dintre dou variabile, n sensul c oricare dintrvariabile poate fi cea dependent; mrimea coeficientului de corelaie nu arat care variabil estecauz i care este efect, n cazul n care exist o relaie de cauzalitate ntre cele dou;

    - atunci cnd modelul teoretic arat care variabil este cauz i care este efect, predicia trece la unnou nivel, de la corelaie la regresie.

    coeficientul de determinaie R 2, numitR Square arat validitatea modelului.

    20

    22

    V V R x x y =

    =

    =

    =

    =

    =

    = n

    ii

    n

    iii

    n

    ii

    n

    ii

    y y

    y y

    y y

    y y

    1

    2

    1

    2

    1

    2

    1

    2

    )(

    )(1

    )(

    )(

    - R2 este o msur care arat proporia din variaia variabilei dependente y care este explicat demodelul de regresie;

    - arat n ce msur modelul ales explic variaia lui y, altfel spus, este o msur a validitiimodelului;

    - 0 < R2 < 1 i cu ct este mai apropiat de 1 cu att modelul este mai bun.

    Adjusted R Square care este R2 ajustat cu un anumit numr de grade de libertate.

    Standard Error sau eroarea standard a estimrii este abaterea standard a erorilor valorilorobservate ale lui y n jurul dreptei de regresie i se calculeaz ca o abatere medie ptratic a valorilorempirice fa de cele teoretice:

    ( )

    1

    1

    1

    2

    1

    2

    2

    =

    == == k n

    u

    k n

    y y s s

    n

    ii

    n

    iii

    uu

    Pentru modelul unifactorial (k=1), eroarea standard devine:( )

    2

    2

    1

    2

    1

    2

    =

    =

    ==

    n

    u

    n

    y y s

    n

    ii

    n

    iii

    u

    Este o msur a variaiei neexplicate; cu ct aceast msur are o valoare mai mic, cu att proporiade variaie neexplicat este mai mic i evident, proporia de variaie explicat este mai mare. Se mparte lan-2 deoarece se pierd dou grade de libertate prin calcularea coeficienilor de regresie din valoarea estimata lui y: ii xba y += .

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    37/48

    Modelul liniar unifactorial 37

    Eroarea standard nu trebuie confundat cuabaterea standard a lui y de la valorile medii , care se

    refer i ea la variaia neexplicat a lui y:( )

    11

    2

    =

    =

    n

    y y s

    n

    ii

    x y

    n acest caz mprirea se face la n-1, deoarece se pierde un singur grad de libertate prin calcululmediei.

    Observations reprezint numruln de observri ale variabilei dependentei y , care este egal cunumrul de valori ale variabilei independentei x .

    B. Informaiile despre estimatorii coeficienilor modelului n coloanaCoefficients sunt trecute valorile estimate ale coeficienilor modelului liniar, pentru i=1,k:

    Intercept este estimatorul termenului libera , care poate fi zero dac s-a optat pentruConstant is Zero . Pentru un model unifactorial ii xba y += , k=1, iar formula care estimeaz este

    xb ya = . X Variable 1, X Variable 2 , ... n ordinea declarrii variabilelor explicative sunt estimatorii

    coeficienilor variabilelor explicative: naaa ,,, 21 K ;Pentru un model unifactorial k=1, iar formula dup care se estimeaz coeficientul de regresie este:

    =2

    ii

    i

    iii

    i

    x x xn x y x

    yn

    b ,sau formulele derivate:( )22

    =

    ii

    iiii

    x xn y x x yn

    b ; ( )2,cov

    x s y xb = ; ( )

    x

    y

    s s

    x yr b = ,

    Standard Error sunt abaterile standard ale estimatorilor; ele arat cu ct variaz n medie, n plus

    sau n minus valorile estimate ale coeficienilor fa de parametrii pe care i estimeaz:

    ( )

    +=

    ii

    ua x x x

    n s s 2

    22

    1 este abaterea medie ptratic a estimatoruluia

    ( ) =i

    i

    ub x x

    s s 22

    este abaterea medie ptratic a estimatoruluib

    unde: ( )= i iu un s22

    21 = ( )

    2

    2

    n y y

    i ii este dispersia de selecie a variabilei rezidualeu

    valorile Student, t* , pentru fiecare estimator, pentru verificarea semnificaiei acestuia fa de 0;dac:

    t sat a

    cal >=

    1 i t sbt b

    cal >=

    2

    atunci se accept c modelul a fost corect specificat, identificat i estimat i se continu analizaeconometric; n caz contrar, estimatorii nu sunt semnificativ diferii de zero i se renun la modelrevenindu-se la prima etap cu o nou specificare.

    naintea nceperii unui test statistic se pune problema alegerii unui nivel de semnificaie. Acestaexprim riscul maximal de a grei (de regul 5%, 1% sau chiar mai mic) atunci cnd lum decizia dorit, drespingere a ipotezei nule.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    38/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Softul modern ofer posibilitatea invers i anume: mai nti este evaluat riscul de a lua deciziagreit pe baza datelor de care se dispune. Acest risc evaluat pe baza datelor apare n tabele, la fiecare test dsemnificaie, i se numetevaloarea p ( p-value). n funcie de mrimea valorii P calculat, se va respinge saunu ipoteza de nulitate a parametrilor modelului.

    P-value , corespunztoare pragului de semnificaie , ncepnd de la care valoarea estimatorului estesemnificativ diferit de zero. Important nu este valoarea luit , ci probabilitatea p asociat, care este probabilitatea de a grei respingnd ipoteza de nulitate (eroarea de genul I).

    limitele intervalului de ncredere ale estimatorilor : inferioarLower 95% i superioarUpper95%, cu o probabilitate de 95% implicit, iar la cerere se pot solicita i alte valori ale probabilitii: 99%90%, etc.

    C. Tabelul A OVARezultatele din tabelulA OVA al ecua iei de regresie sunt echivalente cu cele din testult .Valoarea lui F este raportul dintre variana explicat de modelul de regresie (Regression Mean Squares)

    i variana neexplicat de model (Residual Mean Squares sau Error Mean Squares) i se calculeaz dup

    formula: )2()1( 22

    *

    = n R R

    F calc . Dac 2,1;05,0*

    > ncalc F F atunci se respinge ipoteza de egalitate a varianelor,variabila x fiind semnificativ pentru variaia variabilei y i modelul se declar valid.

    Exemplu:

    1. Se formuleaz ntrebarea dac exist o legtur ntre suprafaa unor apartamente din zona central i preul de nchiriere a acestora?. Presupunnd c se selecteaz aleator 25 de astfel de apartamente,valorile celor dou variabile X suprafaa (m2 ) i Y chiria lunar (RO ) formeaz seria de date dintabelul alturat.

    Se dorete exprimarea printr-un model econometric, folosind dateledin tabel, legtura dintre suprafa i pre, pentru ca apoi, odatmodelul validat, s se poat folosi pentru a face predicii la nivelmacroeconomic.Este util nti de toate reprezentarea grafic de tip XY . Rezultatulobinut cu aplicaia Excel, din meniulinsert diagram este prezentat nfigura de mai jos:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    39/48

    Modelul liniar unifactorial 39

    Toate indiciile sunt n direcia folosirii unui model clasic de regresie (dependena pare liniar, eroril par a avea dispersia constant, termenul liber pare a fi diferit de zero).

    Accesm meniul TOOLS>DATA ANALYSIS>REGRESSION din aplicaia Excel i obinemurmtoarele rezultate

    n foaia Excel SUMMARY OUTPUT se disting trei zone:A. Regression statistics pentru bonitatea modeluluiB. ANOVA pentru descompunerea varianei totale i testul F de testarea semnificaiei modeluluiC. Pentru estimaii pentru coeficieni, erorile lor standard, testult, intervale de ncredere

    Zona A ofer informaii despre:- coeficientul de determinaie multipl2 R (Multiple R) ,- coeficientul de corelaie dintre valorilei observate i valorile i ajustate prin ecuaia de regresie

    (R Square) i- despre coeficientul de determinaie ajustat2 R (Adjusted R Square) .Cu ct 2 R i 2 R au valori mai apropiate de 1 cu att regresia este mai bun.R Square este

    0,709862, deci modelul explic 70.09% din variaia chiriei pentru apartamentele din zona central

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    40/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    Tot n zona A avem informaii despre eroarea standard estimat a modelului s (Standard Error) ceestimeaz eroarea standard i numrul de observaii din eantion.

    Pentru aplicaia noastr, cum toi indicatorii de bonitate enumerai sunt apropiai de 1, putemconcluziona c modelul de regresie liniar simpl este bun. Eroarea standard estimat prin eantion est196,9 iar numrul de observaii este 24.

    Zona B , se refer la descompunerea varianei totale(SST) a variabilei dependente n doucomponente:variana explicat prin regresie (SSR) i variana neexplicat (SSE) . Aici identificm igradele de libertate asociate descompunerii, mai precis, dac avemk regresori n model in observaii, avemegalitatea 1 = + ( ( 1))n k n k + .

    n aceast zon exist dou celule importante la care trebuie s fim ateni, i anume:F iSignificance F . Valorile din aceste celule ne dau elemente importante ce stau la baza validrii modelului deregresie (n totalitatea sa). Ele ne furnizeaz informaii privind valoarea calculat a statisticii test F i erorii pe care putem s-o facem cnd respingem modelul de regresie ca fiind neadecvat.

    Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test F i valori mici pentru Significance F.

    Pe datele noastre, cum F = 53, 82607 este o valoare foarte mare i Significance F = 2,41E-07, deci ovaloare foarte mic, acceptm c modelul ales ajusteaz bine datele din eantion.

    Zona C ne ofer informaii despre:- valorile estimate ale coeficienilor modelului de regresie n coloanaCoefficients ,- erorile standard ale coeficienilor n coloanaStandard Error ,- elemente pentru aplicarea testului de semnificaie t-Student pentru fiecare coeficient (coloanelet

    Stat i P-value .). Tot aici avem informaii despre intervalele de ncredere calculate pentru fiecare coeficientdin modelul de regresie. S analizm informaiile din aceast caset:

    1) Pentru ca un coeficient s fie semnificativ diferit de zero, deci variabila regresor asociat lui sinflueneze variabila dependent, trebuie ca n coloanaP-value s avem valori mici, de exemplu 5% sau sub5% (evident n coloanat Stat avem atunci valori mari, n modul).

    Concret, pentru termenul liber al modelului (Intercept) avemP-value = 0.2368, adic putem afirmac dac respingem ipoteza c interceptul este egal cu zero, facem o eroare de 23%. Acceptm deci cadevrat ipoteza c interceptul este zero. (Analog, ajungem la concluzia c panta dreptei de regresie estdiferit statistic de zero:P-value = 2,41E-07).

    2) Ultimele dou coloane ne dau informaii privind intervalele de ncredere 95% pentru fiecarecoeficient al modelului. Astfel, pentru termenul liber (teoretic) al modelului obinem intervalul (-144,44554,0488). Analog, pentru panta ecuaiei de regresie avem intervalul de ncredere (7,486476, 13,38681). Aldoilea interval de ncredere pentru pant nu conine pe 0, ceea ce nsemn c modelul este bun.

    Panta dreptei de regresie este pozitiv i semnificativ diferit de zero, deci exist o legtur directntre chirie i suprafaa apartamentelor.

    n plus, dac suprafaa crete cu o unitate(1 m2) ,chiria va crete cu 10.436 lei. P-value probabilitatea ipotezei ca parametrul estimat s fie egal cu zero; dac P-value este mai mi

    dect pragul de semnificaie atunci respingem aceast ipotez. Avem semnificativ la pragul de 5%( = 0,05), p < 0,05)

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    41/48

    Modelul liniar unifactorial 41

    Probleme Rezolvate

    1. S se analizeze modelul sugerat de seria de date din tabelul de mai jos:

    Anul Venitul net Consumulpersonal

    1970 751,6 672,11971 779,2 696,81972 810,3 737,41973 864,7 767,91974 857,5 762,81975 874,9 779,41976 906,8 823,11977 942,9 864,31978 988,8 903,21979 1.015,7 927,6

    Urmnd indiciile din diagrama norului de puncte, acestea sugereaz folosirea unui model clasic dregresie (dependena pare liniar, erorile par a avea dispersia constant, termenul liber pare a fi diferit dzero).

    Accesm meniul TOOLS>DATA ANALYSIS>REGRESSION din aplicaia Excel

    Obinem urmtoarele rezultate n SUMMARY OUTPUT:

    Regression statistics despre bonitatea modelului:R Square este 0,991626, deci modelul explic 99% din variaia lui y datorat variaiei lui x.Cum toi indicatorii de bonitate enumerai sunt apropiai de 1, putem concluziona c modelul de

    regresie liniar simpl este bun.Eroarea standard estimat prin eantion este 8,2446 iar numrul de observaii este 10.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    42/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    A OVA despre descompunerea varianei totale i testul F de testarea semnificaiei modeluluiValorile din aceste celule ne dau elemente importante ce stau la bazavalidrii modelului de regresie

    (n totalitatea sa). - valoarea calculat a statisticii test F = 947,3477 este o valoare foarte mare i- valoarea erorii pe care putem s-o facem cnd respingem modelul de regresie ca fiind neadecvat

    este Significance F = 1,34906E-09. Rezultatele din tabelul ANOVA al ecuaiei de regresie suntechivalente cu cele din testul t:P-value = 1,35E-09.Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test F i valori mici

    pentru Significance F, deci acceptm c modelul ales ajusteaz bine datele din eantion.Estimaii pentru coeficieni, erorile lor standard, testul t, intervale de ncrederePentru termenul liber al modelului (Intercept) avem P-value = 0,043483, adic putem afirma c

    dac respingem ipoteza c interceptul este egal cu zero (ipoteza nul), facem o eroare de 4%, adic sub pragul de 5% ( = 0,05), p < 0,05. P-value este mai mic dect pragul de semnificaie atunci respingemipoteza nul i acceptm deci ca adevrat ipoteza c interceptul este diferit de zero.

    Panta dreptei de regresie este pozitiv 0,9789 i semnificativ diferit de zero

    P-value = 1,35E-09, deci exist o legtur direct ntre variabile. n plus, dac x crete cu o unitate, y vacrete cu 0,9789.Ultimele dou coloane ne dau informaii privind intervalele de ncredere 95% pentru fiecare

    coeficient al modelului. Astfel, pentru termenul liber (teoretic) al modelului obinem intervaluant a 2,2/ m =(-132,05; -2,51). Analog, pentru panta ecuaiei de regresie avem intervalul de ncredere

    bnt b 2,2/ =(0,905; 1,052). Nici unul din intervalele de ncredere pentru coeficieni nu conine pe 0,ceea ce nsemn c modelul este bun.

    a = -67,28;b =0,9789; ii xba y += devine ii x y += 9789,028,67

    =a =28,08; =b 0,03; acalca

    t 1

    = = -2,395; bcalcb

    t 2

    = = -2,395;

    2. Se reia problema 5 din unitatea de nvare U4, conform datelor din tabel: Nr. crt. Cerere Venit Pre Nr. crt. Cerere Venit Pre

    1 11,7 777 5,4 11 11,0 814 9,02 9,3 802 5,9 12 7,6 801 8,43 13,4 635 8,0 13 12,6 768 5,64 16,1 952 5,9 14 16,4 965 5,75 14,5 998 8,8 15 9,4 990 8,9

    6 11,9 988 8,7 16 17,6 806 6,27 9,0 586 7,1 17 12,9 820 7,58 16,1 658 6,4 18 5,3 553 8,59 11,0 520 6,5 19 14,6 684 7,410 15,8 960 5,0 20 14,5 756 5,6

    Problema a fost rezolvat ntr-o manier didactic, cu calcule fcute fr a utiliza programeinformatice de specialitate, ca SPSS, Stata, SAS, Eviews, Excel, etc.Utiliznd de exemplu Excel, toate aceste rezultate sunt furnizate imediat.Dac se acceseaz comanda Insert din meniul aplicaiei Excel, FUNCTION>SLOPE i respectiv

    INTERCEPT se obin aceleai rezultate ca mai sus pentru parametrii estimai.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    43/48

    Modelul liniar unifactorial 43

    Informaiile de baz pentru o regresie simpl,fr a utiliza opiuni suplimentare, se obinapelnd Regression din meniul Tools>DataAnalysis.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    44/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    F(1,18) = 2,67 este identic cu cea obinut anterior.Prob >0,1194 arat riscul cu care se poate accepta 0SSE (respectiv n mod echivalent 0 R ).

    Riscul este mai mare dect acel 5% n general acceptat, ceea ce este similar cu ce s-a concluzionat anterior.Ultimul tabel prezint estimatorii parametrilor, abaterea medie patratic a estimatorilor parametrilor

    valoarea calculat a luit , riscul de nulitate a parametrilor i intervalul de ncredere la 95%. Observm acelai prag de semnificaie 0,119 ca i la testul F pentru analiza varianei.

    Pentru regresia liniar simpl dintre cerere i pre, fr a detalia calculele, din rezultatele estimaiilo

    obinute prin utilizarea programului Excel, se observ c, de aceast dat coeficientul corespunztovariabilei explicative este semnificativ:

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    45/48

    Modelul liniar unifactorial 45

    Test de autoevaluare

    1. Vnzrile unui mic productor de echipamente industriale, n ultimele zece perioade, au evoluatastfel:Perioada 1 2 3 4 5 6 7 8 9 10Vnzri (mld. Lei) 4,0 3,5 3,8 4,2 4,6 5,2 5,0 4,8 5,3 5,6

    S se previzioneze evoluia vnzrilor ntreprinderilor n urmtoarele trei perioade folosind metodacelor mai mici ptrate pentru un model liniar.

    ii xba y += Indicaie:Se calculeaz valorile din tabelul de mai jos, valori necesare a le nlocui n relaiile care dau estimatori

    a i b , iar acetia se nlocuiesc n i y , estimnd astfel valorile vnzrilor din modelul teoretic. Pe bazamodelului teoretic se calculeaz valorile previzionate ale vnzrilor pe urmtoarele trei perioade: i=11, 1213. Modelul nu este validat, pentru aceasta fiind necesare cunotine ulterioare de verificare prin teststatistice adecvate.

    rcrt i

    x 2i x i y ii y x ii xba y += iii y yu = 2

    iu

    1 0 0 4,02 1 1 3,53 2 4 3,84 3 9 4,2

    5 4 16 4,66 5 25 5,27 6 36 5,08 7 49 4,89 8 64 5,310 9 81 5,6

    45 285 46,0 224,5

    i x 2i x i y ii y x ... 2iu 2. Vnzrile unui distribuitor de articole de uz casnic, n ultimele zece perioade, au evoluat astfel:

    Perioada 1 2 3 4 5 6 7 8 9 10Vnzri (mld. Lei) 5,0 5,4 6,2 6,0 6,6 7,1 7,3 7,8 8,5 9,0

    S se previzioneze evoluia vnzrilor ntreprinderilor n urmtoarele trei perioade folosind metodacelor mai mici ptrate pentru un model ptratic.

    2 iii xc xba y ++= Indicaie:Sistemul de ecuaii normale rezultat din aplicarea MCMMP pentru estimarea parametrilor modelulueste:

    =++=++

    =++

    y x xc xb xa

    xy xc xb xa

    y xc xbna

    2432

    32

    2

    Soluiile sistemului sunt chiar parametrii estimaia , b i c . Se calculeaz valorile din tabelul de mai jos,valori necesare a le nlocui n relaiile care dau estimatoriia , b i c , iar acetia se nlocuiesc ni y , estimnd

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    46/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    astfel valorile vnzrilor din modelul teoretic. Pe baza modelului teoretic se calculeaz valorile previzionaale vnzrilor pe urmtoarele trei perioade: i=11, 12, 13.

    rcrt i

    y i x 2i x 3

    i x 4

    i x ii y x ii y x2

    i y iii y yu = 2iu 1 5,0 0 02 5,4 1 13 6,2 2 44 6,0 3 9

    5 6,6 4 166 7,1 5 257 7,3 6 368 7,8 7 499 8,5 8 6410 9,0 9 81

    68,9 45 285

    i y i x 2i x 3i x 4i x ii y x ii y x2 ... 2iu Modelul nu este validat, pentru aceasta fiind necesare verificri prin testele statistice adecvate.

    3. Vnzrile unui productor de articole de pescuit, n ultimele zece perioade, au evoluat astfel:Perioada 1 2 3 4 5 6 7 8 9 10

    Vnzri (mld. Lei) 3,0 3,6 4,2 4,0 5,0 5,8 6,8 7,5 8,0 8,6S se previzioneze evoluia vnzrilor ntreprinderilor n urmtoarele trei perioade folosind metodacelor mai mici ptrate pentru un model exponenial.

    i X i baY =

    Indicaie:Dup liniarizarea modelului exponenial prin logaritmare i aplicnd MCMMP, se obin ecuaiilenormale ale cror soluii sunt estimatorii logaritmilor parametrilor cutai:

    =+

    =+

    iiii

    ii

    Y X X b X a

    Y X bna

    lnlnln

    lnlnln2

    Se calculeaz valorile din tabelul de mai jos, valori necesare a le nlocui n relaiile care dau estimatoriln a i ln b , iar cu acetia se caut n tabelele logaritmice valorile corespunztoare luia i b , se nlocuiescn i y , estimnd astfel valorile vnzrilor din modelul teoretic. Pe baza modelului teoretic se calculeazvalorile previzionate ale vnzrilor pe urmtoarele trei perioade: i=11, 12, 13.

    rcrt i x

    2i x i y i yln ii y x ln

    i X i baY = iii y yu =

    2iu

    1 0 0 3,02 1 1 3,63 2 4 4,24 3 9 4,0

    5 4 16 5,06 5 25 5,87 6 36 6,88 7 49 7,59 8 64 8,010 9 81 8,6

    45 285 56,4

    i x 2i x i y i yln ii y x ln ... 2iu Modelul nu este validat, pentru aceasta fiind necesare verificri prin testele statistice adecvate.

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    47/48

    Modelul liniar unifactorial 47

    4. S presupunem c dispunem de informaii privind numrul de familii (sute), suprafaacomercial (zeci m2 ) i cifra de afaceri (mil. Lei) ca n tabelul urmtor:

    r familii

    (sute)

    Suprafatacomerciala

    (zeci m2

    )

    Cifra de afaceri

    (mil. Lei)70 21 19835 26 20955 14 19725 10 15628 12 8543 20 18715 5 4333 28 21123 9 1204 6 6245 10 17620 8 11756 36 273

    Se cer:a) Pe baza datelor problemei, innd cont de semnificaia economic a fenomenelor observate, s seconstruiasc modelele econometrice unifactoriale cu ajutorul crora poate fi studiat dependenadintre fenomenele respective:

    1. Modelul unifactorial: ( ) iii u x f y 11 += explic variaia cifrei de afaceri pe seamanumrului de familii;

    2. Modelul unifactorial: ( ) iii u x f y 22 += explic variaia cifrei de afaceri pe seama suprafeei comerciale;b) S se estimeze parametrii modelelor construite la punctul a);c) Din cele dou modele utilizate pentru descrierea dependenei cifrei de afaceri de cei doi factori, s se aleag cel mai bun model;d) S se estimeze cifra de afaceri pe care o poate obine ntreprinztorul dac va cumpra magazinulrespectiv.

    5. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate inumrul vizitatorilor (mii pers.) timp de 10 zile:

    Ziua r. spoturipublicitare

    r. vizitatori(mii pers.)

    1 7 422 5 323 1 104 8 405 10 616 2 87 6 358 7 349 9 4510 3 11

    a) Sa se reprezinte grafic datele;

  • 8/12/2019 Analiza Econometrica a Unui Model Liniar_Din M. A

    48/48

    Analiza econometric a unui model liniar unifactorial _note de curs_2009_Conf. univ. dr. Din M. A.

    b) Sa se determine modelul de regresie n eantion, calculnd valorile ajustate ale numrului devizitatori n funcie de spoturile publicitare;

    c) S se verifice semnificaia modelului de regresie gsit la punctul b) folosind testul F, pentru un nivede semnificaie =0,05.

    d) S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie =0,1.e) Dac modelul s-a dovedit semnificativ, s se previzioneze numrul vizitatorilor dac s-ar fi difuza

    12 spoturi publicitare. f) S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie, testnd

    semnificaia acestuia pentru un nivel de semnificaie =0,05. g) Ce pondere din variaia total a numrului de vizitatori este explicat de influena numrului de

    spoturi publicitare?