Probleme regresie

download Probleme regresie

of 16

description

Econometrie

Transcript of Probleme regresie

TEMA nr. 3 MODELE DE REGRESIE LINIARA

I. REGRESIA LINIARA UNIFACTORIALA (SIMPLA).

1. Pentru a analiza dac ntre valoarea vnzrilor lunare (u.m.) i vrsta agenilor de vnzri (ani), ai unei mari companii ce comercializeaz produse cosmetice, exist o legtur, un analist selecteaz aleator un esantion de 15 persoane. n urma prelucrrii n EXCEL a datelor culese pentru cele dou variabile, s-au obinut rezultatele:Regression Statistics

Multiple R.

R Square.

Adjusted R Square-0,066

Standard Error.

Observations15

ANOVA

dfSSMSF

Regression....3,712

Residual......

Total...367,6

CoefficientsStandard Errort StatLower 95%Upper 95%

Intercept11,673...-0,13123,478

Varsta0,0622.-0,3070,432

a) S se testeze validitatea modelului de regresie liniar pe baza cruia s-au obinut prelucrrile din tabelele de mai sus (F_critic = 4,67). b) S se testeze semnificatia parametrilor modelului pentru o probabilitate de 95% (tcritic= 2,624)c) Sa se masoare intensitatea legaturii folosind un indicator adecvat si sa se testeze semnificatia acestuia.d) Ce procent din variatia vanzarilor lunare este determinat de varsta agentilor?Completati tabelele Excel.

2. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul obinut pentru articolele licitate (u.m.) i numrul de persoane ce particip la licitaie (marimea audientei). n ipoteza unui model de regresie liniar, rezultatele prelucrrii n EXCEL sunt:

Regression Statistics

Multiple R0,860271

R Square..

Adjusted R Square0,707575

Standard Error..

Observations10

ANOVA

dfSSMSFSignificance F

Regression719973,5.0,001404

Residual..

Total

CoefficientsStandard Errort StatP-valueLower (95%)Upper (95%)

Intercept1086,691174,482.0,0002...........

Marimea audientei9, 2911,955..0,0014...........

a) S se testeze validitatea modelului, pentru un nivel de probabilitate de 95% (Fcritic = 5,32); Care este probabilitatea maxima cu care puteti sustine ca modelul este valid?b) Determinai i interpretai intervalele de ncredere pentru parametrii modelului (tcritic= 2,306);c) Masurati intensitatea legaturii dintre variabile; testati semnificatia statistica a indicatorului utilizat.d) Previzionati pretul mediu al unui articol vandut la licitatie, daca au participat 200 de persoane la aceasta licitatie.Completati tabelele Excel.

3. Pentru a analiza dependena dintre suprafaa cultivat (ha) (X) i producia la hectar (q/ha) (Y) s-au nregistrat date referitoare la aceste variabile pentru 10 parcele. n urma prelucrrii datelor (utiliznd EXCEL) i a specificrii ecuaiei de regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2 variabile se obine:Supr. cultivata. (ha) XProductia la hectar (q/ha) Y

Mean.....Mean24,6

Standard Deviation11,296Standard Deviation......

Sample Variance.....Sample Variance56,267

Sum824Sum.....

Count10Count10

Ecuatia de regresie este: , iar dispersia erorilor este MSE=15,656.Se cere:a) Validai modelul de regresie obinut, pentru un nivel de semnificatie de 5% (Fcritic = 5,32)b) Determinai si interpretati intervalele de ncredere pentru parametrii ecuaiei de regresie (t_critic = 2,306).c) Analizati intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator adecvat i testai semnificaia acestuia.d) Ce productie la hectar s-ar obtine de pe o suprafata cultivata de 120 de hectare?

II. REGRESIA LINIARA MULTIPLA (MULTIFACTORIALA)

Se rezolva in echipe de cate 3 persoane una din urmatoarele probleme (fiecare echipa va rezolva o alta problema. Nu vor exista 2 sau mai multe echipe pentru aceeasi problema):

ECHIPA 1.

In vederea fidelizarii clientilor sai, o banca doreste sa lanseze o noua gama de oferte pentru cardurile de credit. Pentru aceasta, o echipa de cercetatori inregistreaza pentru 30 de clienti ai bancii, selectati aleator, urmatoarele variabile statistice: vechimea la locul de munca actual (ani), venitul mediu lunar al gospodariei din care face parte clientul (lei) si datoria pe cardul de credit (lei) a clientului. Datele sunt prezentate in urmatorul tabel:

Vechime loc de munca actual (ani) X1Venit gospodarie (lei) X2Datorie pe Credit-card (lei) Y

17299201931,2

105270231,2

159350146,2

1520400452,2

24760304,3

5425066,3

2011390651,1

12646022,1

33230231,2

04250472,6

0272030,6

4391042,5

2410880668,1

64930292,4

2217000629

98330139,4

136970496,4

2312240200,6

61037095,2

0442017

228840195,5

177310100,3

3442073,1

8459068

1272040,8

05440363,8

911730120,7

2510880161,5

129860523,6

2629034

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 1%. (Fcritic=5,488).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,771).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia datoriei pe cardul de credit este explicat de modelul de regresie considerat?g. Previzionai datoria pe cardul de credit a unui client cu o vechime de 10 ani la actualul loc de munca si cu un venit mediu lunar al gospodariei de 8000 lei.

ECHIPA 2.

O echipa de analisti ai unei institutii de asigurari auto doreste sa analizeze legatura dintre: inteligenta asiguratilor (masurata prin punctajul obtinut la un test de inteligenta), varsta (ani impliniti) si numarul de accidente auto majore, in decursul ultimilor 10 ani. Pentru 50 de clienti care au incheiat contracte de asigurare auto cu institutia respectiva, selectati aleator, s-au inregistrat urmatoarele date:

Punctaj test inteligenta (puncte)Varsta (ani)Nr. accidente

77232

88351

89261

87250

66282

50311

89231

65313

55315

78271

66263

68333

69273

45305

66340

78292

56241

70262

62253

60273

80271

60224

65293

87240

82251

66333

40400

56376

78314

90323

74312

87381

68341

80310

66283

80311

89301

88341

82341

86320

70352

81321

91350

67332

68392

81341

45306

79311

66332

60283

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,195).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,012).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia numarului de accidente auto nu este explicat de modelul de regresie identificat?g. Previzionai numarul de accidente auto al unui client cu varsta de 25 de ani si cu un punctaj de 60 de puncte obtinut la testul de inteligenta.

ECHIPA 3.

Patronul unui lant de magazine alimentare doreste sa deschida un nou magazin intr-un cartier al orasului X. Pentru a modela econometric cifra de afaceri a noului magazin, el a angajat un analist care a presupus ca succesul noii afaceri depinde de suprafata comerciala a magaziului si de numarul de familii rezidente in cartier. Datele inregistrate pentru 30 de magazine similar existente, selectate aleator, sunt:

Nr. familii Supr.comerciala (ari)Cifra de afaceri (mii lei)

021198

3526209

5514197

2510156

281285

4320187

15543

3328211

239120

242662

4510176

208117

5636273

8231408

4736419

6724407

3720366

4022295

5530397

2715253

4538421

3519330

1616272

5720386

3218327

6846483

8333411

4838422

6826410

3822369

Prelucrati datele in Excel modului Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,35).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,05).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Calculati si interpretati coeficientul de nedeterminatie.g. Previzionai cifra de afaceri a unui magazin cu suprafata comerciala de 33 ari, situat intr-un cartier in care traiesc 60 de familii rezidente.

ECHIPA 4.

In vederea revizuirii politicii de fidelizare a clientilor sai, echipa de management a unei companii de telefonie mobile doreste sa studieze inclinatia abonatilor sai de a renunta la serviciile companiei. Un analist inregistreaza pentru 40 dintre clientii companiei, selectati aleator, urmatoarele informatii: valoarea medi lunara a facturii telefonice (lei), venitul mediu lunar al gospodariei clientului (sute lei), vechimea in serviciul companiei (ani) si inclinatia de a renunta la serviciile companiei (puncte ). Datele sunt redate in tabelul urmator:

Valoare factura medie lunara (lei)Venitul mediu lunar al gospodariei (sute lei)Vechime in serviciul companiei (ani)Inclinatia de a renunta la serviciile companiei (puncte)

50,8534,823,2360,77

78,8238,142,7557,48

9343,551,4471,99

46,2651,993,2556,79

62,4553,94,4953,69

49,7755,33,4555,66

60,3455,383,1354,84

47,956,892,4263,72

162,6457,071,2378,29

59,4559,082,2862,23

70,1759,42,161,65

170,8660,511,5773,47

84,5560,662,166,03

59,3360,843,3663,96

70,6862,523,256,65

58,8963,583,8760,47

72,3864,981,671,47

69,7865,933,0271,04

61,7466,432,5267,39

100,9366,531,3870,94

65,2166,832,462,74

84,4968,244,3651,09

48,4368,862,564,98

98,1269,173,0268,06

71,4269,882,6666,04

69,470,412,6761,12

56,2370,812,9666,41

55,0371,292,9659,25

65,8372,721,1870,41

184,1473,241,4677,37

3774,023,362,63

51,9575,051,9261,02

166,9275,231,3472,11

44,7275,972,5156,81

61,9377,313,4252,65

69,0677,371,2664,12

81,0978,512,264,85

82,2379,732,5868,48

85,5987,63,4558,77

172,7887,61,3883,45

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red comportamentul inclinatiei de renuntare la serviciile companiei in functie de cele trei variabile factoriale; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=2,866).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,028).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia inclinatiei de renuntare la serviciile companiei este explicat de modelul de regresie identificat?g. Previzionai inclinatia de renuntare la serviciile companiei a unui client ce plateste o factura telefonica lunara in valoare de 65 de lei, are un venit al gospodariei de 78 sute lei in medie pe luna si este abonat al companiei telefonice de 4 ani.

ECHIPA 5

Un magazin de aparate electrocasnice doreste sa-si reconfigureze oferta la gama de televizoare. Pentru aceasta, managerul magazinului comanda un studiu asupra clientilor sai, in cadrul caruia sunt inregistrate urmatoarele informatii: marimea gospodariei (persoane), venitul salarial mediu lunar (sute lei) si numarul de televizoare detinute. Pentru 25 de clienti selectati aleator datele inregistrate sunt urmatoarele:

Marimea gospodariei (persoane)Venit salarial mediu lunar (sute lei/pers)Nr. TV detinute

1191

2191

8191

2201

2221

1241

3301

2311

7371

1401

1421

2431

2461

3491

4511

6533

1571

1671

1832

3833

31073

11093

11122

11183

21373

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,44).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,07).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Calculati si interpretati coeficientul de determinatie.g. Previzionai numarul de televizoare detinut de un client al magazinului care are un venit salarial de 75 sute lei in medie pe luna si 4 persoane in gospodarie.

ECHIPA 6

Managerul unui lant de supermarketuri doreste sa analizeze valoarea vanzarilor pe anul precedent (unitati monetare). In cadrul unui studiu el inregistreaza, pentru 24 dintre supermarketurile sale, selectate aleator, urmatoarele variabile: valoarea vanzarilor pe anul precedent (unitati monetare), cheltuielile cu reclama si publicitatea realizate in cursul anului anterior (unitati monetare) si numarul de competitor din zona. Datele se prezinta astfel:

Cheltuieli cu publicitatea (u.m.)Numar competitoriVanzari (u.m.)

4,69212,23

6,41411,84

6,47112,25

3,43311,1

8,39510,97

2,1568,75

1,5467,75

2,67510,5

1,2456,71

1,7777,6

4,46312,46

1,8368,47

5,15212,27

7,25112,57

1,7268,87

3,04411,15

4,92311,86

4,85411,07

3,13510,38

2,2968,71

4,9112,07

5,75112,74

3,6159,82

4,62211,51

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru o probabilitate de 99%. (Fcritic=5,78).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,831).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Determinati influenta procentuala a cheltuielilor cu publicitatea si a numarului de competitori din zona asupra variatiei valorii vanzarilor, utilizand coeficientul de determinatie.g. Previzionai valoarea vanzarilor unui supermarket situat intr-o zona in care mai exista 5 magazine similare, daca s-au cheltuit 9,5 unitati monetare pe reclama si publicitate.

ECHIPA 7

Echipa de management a unei fabrici de confectii doreste sa analizeze valoarea vanzarilor la confectiile pentru barbati (unitati monetare) in functie de numarul cataloagelor expediate prin posta clientilor si de sumele cheltuite pentru realizarea unor spoturi publicitare la produsele fabricate (unitati monetare). Pentru 30 de magazine de desfacere a produselor, s-au inregistrat urmatoarele date:

Numar de cataloage trimise prin postaSume cheltuite pentru realizarea spoturilor publicitare (u.m.)Valoarea vanzarilor la confectii barbati (u.m.)

29782229,4511357,92

32902742,6510605,95

30292797,8716998,57

27522894,976563,75

36852264,236607,69

28472721,069839

28812663,309398,32

31213037,5010395,53

28112679,4811663,13

37063280,8112805,22

38112858,9713636,25

53093873,8722849,01

30812272,3712325,8

33782491,258273,58

35862991,7510061,19

34382091,1511497,76

35892690,2910363,16

35652607,9210194,68

35263595,738401,24

39782541,6013642,89

37612677,7612772,63

35123074,5614539,47

36972592,9814927,35

61202572,1619170,12

41152649,6411771,4

32162451,5310278,09

43582859,8311857,59

38352864,379516,91

35653439,2510074,24

45892714,5419504,5

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,35).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,05), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vanzarilor nu este explicata de modelul de regresie gasit?g. Previzionai valoarea vanzarilor unui magazin daca au fost expediate prin posta 5000 de cataloage si s-au cheltuit 4000 de unitati monetare pentru realizarea unor spoturi publicitare la produsele magazinului.

ECHIPA 8

Managerul unui lant de magazine de produse electronice doreste sa analizeze valoarea vanzarilor realizate de Black Friday la telefoanele mobile, in functie de numarul liniilor telefonice deschise in perioada respectiva pentru efectuarea comenzilor si de numarul unitatilor de service pentru clienti. Pentru 30 de magazine selectate aleator, s-au inregistrat datele:

Valoarea vanzarilor de telefoane mobile (unitati monetare)Numarul de linii telefonice deschise pentru efectuarea comenzilorNumarul unitatilor de service pentru clienti

16578,933420

18236,132920

43393,552426

30908,492022

28701,581721

29647,573023

31141,512822

31177,312720

30672,373515

37633,382520

33890,923016

513784529

18103,063522

20979,52028

34503,122528

26783,963522

31790,152824

32432,742525

37180,052428

29658,853219

33238,462818

35679,333320

37238,873426

46766,942930

21752,783027

20789,672627

37427,022831

37578,382133

34424,092423

47208,792428

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 10%. (Fcritic=2,51).c. Testai semnificaia statistic a parametrilor modelului (tcritic=1,703), pentru o probabilitate de 90%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vanzarilor nu este explicata de modelul de regresie gasit?g. Previzionai valoarea vanzarilor de telefoane mobile daca au fost deschise 40 de linii telefonice pentru efectuarea comenzilor si exista 30 de unitati de service.

ECHIPA 9

O echipa de analisti din cadrul Ministerului Sanatatii studiaza accesibilitatea la sistemul de ingrijire a sanatatii (exprimat prin rata vizitelor la medic la 10.000 persoane) in functie de investitiile in sistemul de sanatate (unitati monetare) si de rata cazurilor de imbolnavire raportate (la 10.000 persoane). Pentru 20 de localitati, datele inregistrate pentru anul precedent sunt:

Investitii in sistemul de sanatate (unitati monetare)Cazuri de imbolnavire raportate (rata la 10.000 persoane)Vizite la medic (rata la 10.000 de persoane)

155,33158,34152,13

177,34157,23167,84

165,09162,92162,21

154,28130,59146,69

185,56202,81186,93

186,96221,43188,16

198,63189,22195,39

172,14166,42175,5

198,25203,07197,04

193,9198,57190,16

157,03161,79156,47

158,07168,82159,21

182,09180,41185,65

173,2178,52176,5

151,84157,77156,97

182,9212,44181,62

197,09198,9205,51

163,86174,25167,09

192,3212,07192,71

172,03149,45165,02

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,59).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,11), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vizitelor la medic este explicata de modelul de regresie gasit?g. Previzionai rata vizitelor la medic intr-un oras in care s-au investit 200 unitati monetare in sistemul de sanatate si s-au raportat 210 cazuri de imbolnavire la 10.000 locuitori.

ECHIPA 10

Managerul unei mari agentii imobiliare analizeaza pretul de vanzare al caselor in functie de numarul de zile de la scoaterea casei la vanzare pana la incheierea tranzactiei, pe de o parte, si de suprafata locuibila a casei, pe de alta parte. Pentru 25 de case ale caror tranzactii au fost intermediate de agentia imobiliara respectiva, s-au inregistrat urmatoarele date:

Pretul de vanzare al casei (mii dolari)Perioada de la scoaterea casei la vanzare pana la incheierea vanzarii (zile)Suprafata locuibila a casei (metri patrati)

33591298

32154261

30013306

32596282

21018210

41662411

34218394

347133365

284103250

290104259

29446366

23574233

25010185

29013269

24734289

23215290

27866240

22273162

26555218

30085273

27485244

26561151

2541247

22913158

25016209

Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,44).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,074), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia pretului de vanzare al caselor este determinata de influenta factorilor aleatori?g. Previzionai pretul de vanzare al unei case cu suprafata locuibila de 300 de metri patrati, si care s-a vandut dupa 50 de zile de la scoaterea ei la vanzare?