Proiect Econometrie Final

download Proiect Econometrie Final

of 14

Transcript of Proiect Econometrie Final

1. Folosind tehnica verificrii ipotezelor statistice, stabilii dac exist vreo diferen semnificativ ntre preul caselor din zona Cotroceni i cel al caselor din zona Foiorul de Foc. Pentru a decide dac exista vreo diferenta semnificativa ntre preul caselor din zona Cotroceni i preul caselor din zona Foiorul de Foc, am aplicat testul privind diferena a dou medii pentru eantioane de volum mare,cu dispersii necunoscute,presupuse egale, t-Test for Two-Sample Assuming Equal Variances. Ipotezele folosite au fost :

H 0 : 1 3 = 0 H A : 1 3 03 reprezinta estimatorul diferenei dintre x1 i 3 , mediile unde 1 eantioanelor, preurile caselor din zona Cotroceni, si preurile caselor din zona Foiorul de Foc. Regula de decizie a acestui test este:

x

t < t critic = >acceptH 0 t t critic = >respingH 0 Dupa aplicarea testului t, s-a obinut variabila t stat = 5,6749. Deoarece 2, rezult :

t critic =

0 , asadar exist t stat = 5,6749> critic = 2 =>se respinge ipoteza nul diferen semnificativ ntre preul caselor din zona Cotroceni i din zona Foiorul de Foc.

t

H

t-Test: Two-Sample Assuming Equal Variances cotrocen i 389.849 3 14493.2 9 30 8758.01 8 0 58 5.67495 6 2.33E-07 1.67155 3 4.65E-07 2.00171 7 foisor de foc 252.723333 3 3022.74047 1 30

Mean Variance Observations Pooled Variance Hypothesized Mean Difference df t Stat P(T Fcrit = >respingH 0n urma aplicrii modelului ANOVA, am obinut variabila F=56. De asemenea,

Fcrit =3,101, rezult:

Fcalculat = 56 > Fcrit = 3,101 => se respinge ipoteza nul H 0 , ceea ce

inseamna ca mediile preurilor celor 3 zone prezinta diferente semnificative.Asadar zona este un factor semnificativ care influeneaza a preul vnzarii caselor. Anova: Single Factor SUMMARY Groups cotroceni p vict foisor

Count 30 30 30

Sum 11695.4 8 17806.4 7581.7

Average 389.849 3 593.546 7 252.723 3

Variance 14493.2 9 29743.1 4 3022.74

ANOVA Source of Variation Between Groups Within Groups Total

SS 176456 7 137051 6 313508 3

df 2 87 89

MS 882283. 4 15753.0 6

F 56.0071 2

P-value 2.33E16

F crit 3.10129 6

3. Alegei una dintre cele trei zone i stabilii dac suprafaa casei, suprafaa terenului, precum i numrul de camere influeneaz semnificativ preul de vnzare, construind pentru fiecare caz n parte cte un model de regresie liniar simpl. Am ales zona Piaa Victoriei pentru a putea observa dac suprafaa casei,

suprafaa terenului, precum i numrul de camere au vreo influenta semnificativa asupra preul. Forma general a unui model de regresie liniar este urmatoarea: Yi=b0 + b1*xi + i Unde: Yi, xi sunt valorile numerice ale variabilelor efect i cauz variabile nregistrate la nivelul unitii statistice i, iar b0 i b1 sunt parametrii ai ecuaiei de regresie. Pentru problema noastra, variabila efect este preul,in timpce variabilele cauzale sunt reprexentate de suprafaa casei, suprafaa terenului i numrul de camere, modelul general fiind: Pi = b0 + b1*Suprcasa + b2*Suprteren + b3*Nrcamere + i Acum vom arta ct de mult variabilele influenteaza preul caselor din Cotroceni. a) Suprafaa casei Pentru a putea gasi dependena dintre pre i suprafaa casei s-a realizat un grafic pentru determinarea tipului de legtur:pret-supr casei 1500 pretul 1000 supr casei 500 0 0 500 supr casei 1000

Aici se poate observa faptul c punctele reprezentate sunt grupate n jurul diagonalei principale, fapt care arata existena unei dependene liniare, directe ntre variabile. Deci, se poate afirma faptul c suprafaa unei casei influeneaz semnificativ i n aceeai direcie preul de vnzare al caselor din Piaa Victoriei.

SUMMARY OUTPUT Regression Statistics Multiple R 0,84029921 8 R Square 0,70610277 5 Adjusted R 0,69560644 Square 6 Standard Error 95,1505081 7 Observations 30

Interpretarea rezultatelor din tabelul SUMMARY OUTPUTIntensitatea legturii se stabilete cu ajutorul coeficientului de corelaie liniar (Multiple R). n acest caz, R=0,84, ceea ce arat c ntre pre i suprafaa casei

exist o legtur direct, puternic, suprafaa casei influennd foarte mult preul acesteia. Pentru a putea spune n ce msur modelul liniar de regresie explic dependena dintre variabile, se calculeaz coeficientul de determinaie (R-square). n cazul nostru, R2=0,70, deci 70% din variaia preului este explicat prin influena suprafeei casei asupra preului. Abaterea medie ptratic a erorilor (Standard Eror) = 95,1505 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,6956. ANOVA Regression Residual Total df 1 28 29 SS 609049,636 9 253501,337 8 862550,974 7 MS 609049, 6 9053,61 9 F 67,271 4 Significanc eF 0,00

Interpretarea rezultatelor din tabelul ANOVAValiditatea modelului de regresie se testeaz folosind testul F (Fischer). n tabelul ANOVA din Excel sunt calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz statistica F. n cazul nostru, F=67,271, iar Significance F (pragul de semnificaie) este 0,00 (valoare mai mic de 0,05) rezult c modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile. Coefficients Intercept supr casei 157,641773 0,611822103 Standard Error 55,9138779 5 0,07459503 6 t Stat 2,81936 8 8,20191 4 P-value 0,00873 7 0,00 Lower 95% 43,1073 9 0,45902 1 Upper 95% 272,176 2 0,76462 3

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT: Intercept este termenul liber, deci coeficientul b0 este 157,641773, ce reprezint punctul n care dreapta de regresie intersecteaz axa y. Limitele inferioar i superioar ale intervalului de ncredere sunt 43,10739 = 1 = 72,1762. Coeficientul b1 este 0,611822103, ceea ce nseamn c la creterea cu un metru ptrat a suprafeei casei, preul va crete cu 0,61182 mii euro. Intervalul de ncredere pentru acest parametru este 0,459021 = 1 = 0,764623. n coloana Standard Error sunt calculate erorile standard ale parametrilor estimai: 55,91387795 pentru b0 i 0,074595036 pentru b1. Aceste erori sunt folosite pentru calculul statisticii t pentru testarea semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, t0=2,819368 i t1=8,201914. Deoarece valorile p asociate (P-value) sunt foarte apropiate de 0 (i 0,05 nseamn c acest coeficient este nesemnificativ. Faptul c limita inferioar a intervalului de ncredere pentru acest parametru este negativ, iar limita superioar este pozitiv (-64,6731= 1 = 25,54323), arat c parametrul din colectivitatea general este aproximativ 0. Coeficientul b1 este 0.08619, ceea ce nseamn ca la creterea cu 1 metru ptrat al suprafeei terenului, preul va crete cu 0.08619 mii euro. Deoarece t b1= 4.6606, iar pragul de semnificaie P-value este 0.00