Econometrie - Seminar 12

Post on 12-Jul-2016

60 views 5 download

description

curs econometrie

Transcript of Econometrie - Seminar 12

ECONOMETRIE - SEMINAR 12

PROBLEME RECAPITULATIVE PENTRU EXAMEN

Examenul de ECONOMETRIE 30 de grile (cu un singur răspuns corect,

adevărat/fals, grile cu răspuns deschis) Aşa cum ştiţi încă de la începutul semestrului,

nota maximă ce poate fi obţinută pentru proba scrisă este 7.

Din seminar aveţi 3 puncte: 2 puncte din lucrare 1 punct pentru activitate = 5 seminarii active

Nu aveţi voie cu formule sau alte materiale. Nu aveţi voie cu telefonul mobil, laptop, ...

Problema I Se analizează valorile privind Produsul

Naţional Brut (PNB), numărul şomerilor, numărul personalului angajat în armată, anul şi numărul persoanelor angajate (datele analizate: longley din R).

A. Se consideră următorul output privind descrierea datelor folosite în model: > str(longley) 'data.frame': 16 obs. of 5 variables: $ PNB : num 234 259 258 285 329 ... $ Şomeri : num 236 232 368 335 210 ... $ Militari : num 159 146 162 165 310 ... $ Anul : int 1947 1948 1949 1950 1951

1952 1953 1954 1955 1956 ... $ Angajaţi : num 60.3 61.1 60.2 61.2 63.2 ...

1. Spuneţi pe spaţiile punctate următoare denumirea variabilelor din model: Variabila 1: PNB Variabila 2: Şomeri Variabila 3: Militari Variabila 4: Anul Variabila 5: Angajaţi

2. Scrieţi tipul fiecărei variabile în parte:

Variabila 1: numerică Variabila 2: numerică Variabila 3: numerică Variabila 4: întreagă Variabila 5: numerică

3. Câte observaţii au fost incluse în setul de date:

16

B. Se consideră următorul output în R:

4. Modelul precedent este:a) Model de regresie liniară univariată

(simplă)b) Model de regresie multiplăc) Model de regresie logisticăd) Model de regresie neliniarăe) Model de regresie logaritmică

5. Variabila dependentă este:

a) PNBb) Şomeric) Angajaţid) Militarie) Anul

6. Variabilele independente sunt:

a) Şomeri, Angajaţi, Militarib) Anul, Şomeri, Militaric) Angajaţi, Anul, PNBd) PNB, Angajaţi, Anule) Şomeri, Militari, PNB

7. Consideraţi că modelul din output-ul precedent este statistic semnificativ? Justificaţi! Da deoarece valoarea pval = 3,189e-11

este mai mică şi decât cel mai mic prag de semnificaţie 0,001. Avem deci încredere de 99,9% că modelul este unul semnificativ.

8. Considerați că între variabila „Şomeri” și variabila „Angajaţi” există o relație statistic semnificativă? Da o Nu o

9. Justificaţi alegerea din grila precedentă:

Variabila „Şomeri” are 2 steluţe (valoarea lui pval = 0,00285 este mai mică decât 0,01).

10. Interpretaţi rezultatul precedent:

Avem 99% încredere că numărul şomerilor influenţează semnificativ numărul angajaţilor.

11. Considerați că între variabila „Militari” și variabila „Angajaţi” există o relație statistic semnificativă? Da o Nu o

12. Justificaţi alegerea din grila precedentă:

Are punct (valoarea lui pval = 0,08286 este mai mică numai decât 0,1).

Observaţie: 0,1 este echivalentul unei încrederi de 90%. În

studiile econometrice acest parg de semnificaţie nu este unul “acceptat”. Aşadar, toate variabilele care au p_val mai mic numai decât acest prag NU sunt semnificative.

Sunt semnificative NUMAI variabilele care au steluţe în cazul unui output în R.

13. Interpretaţi rezultatul precedent:

Numărul militarilor NU influenţează semnificativ numărul angajaţilor.

14. Considerați că între variabila „PNB” și variabila „Angajaţi” există o relație statistic semnificativă? Da o Nu o

15. Justificaţi alegerea din grila precedentă:

Variabila „PNB” are 3 steluţe (valoarea lui pval = 3,49e-10 este mai mică decât 0,001).

16. Interpretaţi rezultatul precedent:

Avem 99,9% încredere că PNB influenţează semnificativ numărul angajaţilor.

17. Puterea explicativă a modelului, exprimată în procente, este:

a) 47,93%b) 8,28%c) 0,28%d) 98,51%e) 1,73%

18. Interpretaţi puterea explicativă a modelului:

98,51% din variaţia numărului angajaţilor se datorează variaţiei PNB, a numărului şomerilor şi a numărului militarilor.

19. Faceţi o predicţie a numărului angajaţilor dacă valoarea PNB este 250, numărul şomerilor este 300 iar numărul militarilor este 150. Angajaţi = 53.306461 + 0.040788*250 -

0.007968*300 - 0.004828*150 Angajaţi = 60,388861

20. Interpretaţi coeficientul b_0: Atunci când variabilele PNB, Militari şi

Şomeri sunt nule, numărul angajaţilor va fi 53,30.

21. Interpretaţi coeficientul b_1: Atunci când valoarea PNB creşte cu o

unitate iar celelalte variabile nu se modifică, numărul angajaţilor creşte cu 0,04.

22. Interpretaţi coeficientul b_2: Atunci când numărul şomerilor creşte cu

o unitate iar celelalte variabile nu se modifică, numărul angajaţilor scade cu 0,008.

23. Interpretaţi coeficientul b_3: Atunci când numărul militarilor creşte cu

o unitate iar celelalte variabile nu se modifică, numărul angajaţilor scade cu 0,005.

Problema II Studiile efectuate de Asociația Americană

a Inimii a determinat modul în care vârsta, tensiunea arterială și fumatul determină riscul unui preinfarct. Presupunem că datele folosite sunt parte a studiului. Riscul este interpretat ca probabilitatea (înmulțită cu 100) că pacientul va suferi un preinfarct în următorii 10 ani în cazul în care pacienții selectați sunt fumători.

Output-ul este:

24. Consideraţi că modelul din output-ul precedent este statistic semnificativ? Justificaţi! Modelul de regresie este semnificativ

deoarece valoarea lui p_val = 4.746e-06 este mai mică decât 0,001. Putem spune cu o încredere de 99,9% că modelul este unul semnificativ.

25. Scrieţi puterea explicativă a modelului:

0,812

26. Interpretaţi puterea explicativă a modelului:

81,2% din variaţia riscului apariţiei unui preinfarct se datorează vârstei, tensiunii arteriale și fumatului.

27. Variabila “Fumător” este semnificativă?

Da o Nu o

28. Justificaţi alegerea din grila precedentă:

Nu are steluţe (valoarea p_val = 0.498698 este foarte mare).

29. Interpretaţi rezultatul precedent:

Din datele analizate rezultă că fumatul nu influenţează semnificativ riscul apariţiei unui preinfarct.

30. Interpretaţi coeficientul b_3: Din output putem observa că riscul

apariţiei unui preinfarct este mai mic cu 3.04369 în cazul unui nefumător comparativ cu un fumător. Totuşi variabila “Fumător” nu este seminificativă ceea ce ne determină să nu ne bazăm pe acest rezultat.

Problema III. Se consideră următorul output: > independent <- cbind(Book1$Varsta,

Book1$Tensiune, Book1$Fumator, Book1$Risc)> cor(independent)

[,1] [,2] [,3] [,4] [1,] 1.0000000 -0.3089517 -0.5814760 0.6502396 [2,] -0.3089517 1.0000000 -0.1918002 0.3881635 [3,] -0.5814760 -0.1918002 1.0000000 -0.6735400 [4,] 0.6502396 0.3881635 -0.6735400 1.0000000

31. Consideraţi că între variabile se manifestă fenomenul de multicoliniaritate? Justificaţi! În mod normal am spune că observă că între variabilele

“Vârstă” şi “Fumător”, respectiv între “Vârst㔺i “Risc” avem o corelaţie de 0,58, respectiv 0,65. Aceste situaţii ne pot ridica anumite semne de întrebare şi putem elimina una dintre variabilele din model. Cel mai probabil am elimina variabila “Vârstă”.

Totuşi, acest caz este unul “special” deoarece variabila “Risc” este dependentă iar variabila “Fumător” este dummy, deci nu este cazul să apară în matricea de corelaţie.

Cum între variabilele “Vârstă” şi “Tensiune” nu avem o corelaţie puternică, NU putem spune că se manifestă fenomenul de multicoliniaritate...

Problema IV A. Se analizează relaţia dintre rata

analfabetismului şi PIB pentru 214 ţări (datele sunt de pe World Bank). Pentru această mulţime de date, avem următoarea reprezentare grafică şi următorul output în R:

Diagrama Scatter

Output-ul:

32. Este semnificativ acest model?

Modelul este semnificativ deoarece valoarea p_val = 2.611e-07 este foarte mică (mai mică decât 0,001). Cu 99,9% încredere putem spune că modelul este unul semnificativ.

33. Numele variabilei independnete este:

PIB

34. Numele variabilei dependnete este:

Analfabetism

35. Variabila independentă este semnificativă?

Da. Are 3 steluţe (valoarea p_val = 2.61e-07

este mai mică decât 0,001). Cu 99,9% încredere putem spune că PIB-

ul influenţează semnificativ rata analfabetismului în ţările analizate.

36. Ce puteţi spune despre acest model? Este suficient de bun?

Este un model bun. Are însă o “mică” problemă. Graficul are forma funcţiei 1/x.

B. Vom construi un model îmbunătăţit:

Output-ul:

37. Comparativ cu modelul A, ce puteţi spune despre acest model?

Modelul este mai bun decât precedentul deoarece: Modelul este (în continuare) semnificativ. Puterea explicativă a crescut de la 16,45%

la 44,14%. Valoarea “Intercept” (Intercept-ul arată în

acest caz valori ale Analfabetismului care se datorează altor factori decât PIB) a scăzut de la 23,83 la 7,701.

38. Intepretaţi coeficientul b_1: Cu cât valoarea PIB-ului creşte, cu atât

rata analfabetismului tinde la 7,701 (valoarea lui b_0).

Observaţie: Dacă PIB-ul creşte, 1/PIB tinde la 0 ceea ce face să dispară acest termen şi Analfabetismul să fie egal cu b_0.

Spor la învăţat! Nota minimă obţinută la examenul de Econometrie să fie 10!!!

Întrebări?