Post on 06-Oct-2015
description
TEMA nr. 3 MODELE DE REGRESIE LINIARA
I. REGRESIA LINIARA UNIFACTORIALA (SIMPLA).
1. Pentru a analiza dac ntre valoarea vnzrilor lunare (u.m.) i vrsta agenilor de vnzri (ani), ai unei mari companii ce comercializeaz produse cosmetice, exist o legtur, un analist selecteaz aleator un esantion de 15 persoane. n urma prelucrrii n EXCEL a datelor culese pentru cele dou variabile, s-au obinut rezultatele:Regression Statistics
Multiple R.
R Square.
Adjusted R Square-0,066
Standard Error.
Observations15
ANOVA
dfSSMSF
Regression....3,712
Residual......
Total...367,6
CoefficientsStandard Errort StatLower 95%Upper 95%
Intercept11,673...-0,13123,478
Varsta0,0622.-0,3070,432
a) S se testeze validitatea modelului de regresie liniar pe baza cruia s-au obinut prelucrrile din tabelele de mai sus (F_critic = 4,67). b) S se testeze semnificatia parametrilor modelului pentru o probabilitate de 95% (tcritic= 2,624)c) Sa se masoare intensitatea legaturii folosind un indicator adecvat si sa se testeze semnificatia acestuia.d) Ce procent din variatia vanzarilor lunare este determinat de varsta agentilor?Completati tabelele Excel.
2. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul obinut pentru articolele licitate (u.m.) i numrul de persoane ce particip la licitaie (marimea audientei). n ipoteza unui model de regresie liniar, rezultatele prelucrrii n EXCEL sunt:
Regression Statistics
Multiple R0,860271
R Square..
Adjusted R Square0,707575
Standard Error..
Observations10
ANOVA
dfSSMSFSignificance F
Regression719973,5.0,001404
Residual..
Total
CoefficientsStandard Errort StatP-valueLower (95%)Upper (95%)
Intercept1086,691174,482.0,0002...........
Marimea audientei9, 2911,955..0,0014...........
a) S se testeze validitatea modelului, pentru un nivel de probabilitate de 95% (Fcritic = 5,32); Care este probabilitatea maxima cu care puteti sustine ca modelul este valid?b) Determinai i interpretai intervalele de ncredere pentru parametrii modelului (tcritic= 2,306);c) Masurati intensitatea legaturii dintre variabile; testati semnificatia statistica a indicatorului utilizat.d) Previzionati pretul mediu al unui articol vandut la licitatie, daca au participat 200 de persoane la aceasta licitatie.Completati tabelele Excel.
3. Pentru a analiza dependena dintre suprafaa cultivat (ha) (X) i producia la hectar (q/ha) (Y) s-au nregistrat date referitoare la aceste variabile pentru 10 parcele. n urma prelucrrii datelor (utiliznd EXCEL) i a specificrii ecuaiei de regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2 variabile se obine:Supr. cultivata. (ha) XProductia la hectar (q/ha) Y
Mean.....Mean24,6
Standard Deviation11,296Standard Deviation......
Sample Variance.....Sample Variance56,267
Sum824Sum.....
Count10Count10
Ecuatia de regresie este: , iar dispersia erorilor este MSE=15,656.Se cere:a) Validai modelul de regresie obinut, pentru un nivel de semnificatie de 5% (Fcritic = 5,32)b) Determinai si interpretati intervalele de ncredere pentru parametrii ecuaiei de regresie (t_critic = 2,306).c) Analizati intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator adecvat i testai semnificaia acestuia.d) Ce productie la hectar s-ar obtine de pe o suprafata cultivata de 120 de hectare?
II. REGRESIA LINIARA MULTIPLA (MULTIFACTORIALA)
Se rezolva in echipe de cate 3 persoane una din urmatoarele probleme (fiecare echipa va rezolva o alta problema. Nu vor exista 2 sau mai multe echipe pentru aceeasi problema):
ECHIPA 1.
In vederea fidelizarii clientilor sai, o banca doreste sa lanseze o noua gama de oferte pentru cardurile de credit. Pentru aceasta, o echipa de cercetatori inregistreaza pentru 30 de clienti ai bancii, selectati aleator, urmatoarele variabile statistice: vechimea la locul de munca actual (ani), venitul mediu lunar al gospodariei din care face parte clientul (lei) si datoria pe cardul de credit (lei) a clientului. Datele sunt prezentate in urmatorul tabel:
Vechime loc de munca actual (ani) X1Venit gospodarie (lei) X2Datorie pe Credit-card (lei) Y
17299201931,2
105270231,2
159350146,2
1520400452,2
24760304,3
5425066,3
2011390651,1
12646022,1
33230231,2
04250472,6
0272030,6
4391042,5
2410880668,1
64930292,4
2217000629
98330139,4
136970496,4
2312240200,6
61037095,2
0442017
228840195,5
177310100,3
3442073,1
8459068
1272040,8
05440363,8
911730120,7
2510880161,5
129860523,6
2629034
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 1%. (Fcritic=5,488).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,771).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia datoriei pe cardul de credit este explicat de modelul de regresie considerat?g. Previzionai datoria pe cardul de credit a unui client cu o vechime de 10 ani la actualul loc de munca si cu un venit mediu lunar al gospodariei de 8000 lei.
ECHIPA 2.
O echipa de analisti ai unei institutii de asigurari auto doreste sa analizeze legatura dintre: inteligenta asiguratilor (masurata prin punctajul obtinut la un test de inteligenta), varsta (ani impliniti) si numarul de accidente auto majore, in decursul ultimilor 10 ani. Pentru 50 de clienti care au incheiat contracte de asigurare auto cu institutia respectiva, selectati aleator, s-au inregistrat urmatoarele date:
Punctaj test inteligenta (puncte)Varsta (ani)Nr. accidente
77232
88351
89261
87250
66282
50311
89231
65313
55315
78271
66263
68333
69273
45305
66340
78292
56241
70262
62253
60273
80271
60224
65293
87240
82251
66333
40400
56376
78314
90323
74312
87381
68341
80310
66283
80311
89301
88341
82341
86320
70352
81321
91350
67332
68392
81341
45306
79311
66332
60283
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,195).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,012).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia numarului de accidente auto nu este explicat de modelul de regresie identificat?g. Previzionai numarul de accidente auto al unui client cu varsta de 25 de ani si cu un punctaj de 60 de puncte obtinut la testul de inteligenta.
ECHIPA 3.
Patronul unui lant de magazine alimentare doreste sa deschida un nou magazin intr-un cartier al orasului X. Pentru a modela econometric cifra de afaceri a noului magazin, el a angajat un analist care a presupus ca succesul noii afaceri depinde de suprafata comerciala a magaziului si de numarul de familii rezidente in cartier. Datele inregistrate pentru 30 de magazine similar existente, selectate aleator, sunt:
Nr. familii Supr.comerciala (ari)Cifra de afaceri (mii lei)
021198
3526209
5514197
2510156
281285
4320187
15543
3328211
239120
242662
4510176
208117
5636273
8231408
4736419
6724407
3720366
4022295
5530397
2715253
4538421
3519330
1616272
5720386
3218327
6846483
8333411
4838422
6826410
3822369
Prelucrati datele in Excel modului Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,35).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,05).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Calculati si interpretati coeficientul de nedeterminatie.g. Previzionai cifra de afaceri a unui magazin cu suprafata comerciala de 33 ari, situat intr-un cartier in care traiesc 60 de familii rezidente.
ECHIPA 4.
In vederea revizuirii politicii de fidelizare a clientilor sai, echipa de management a unei companii de telefonie mobile doreste sa studieze inclinatia abonatilor sai de a renunta la serviciile companiei. Un analist inregistreaza pentru 40 dintre clientii companiei, selectati aleator, urmatoarele informatii: valoarea medi lunara a facturii telefonice (lei), venitul mediu lunar al gospodariei clientului (sute lei), vechimea in serviciul companiei (ani) si inclinatia de a renunta la serviciile companiei (puncte ). Datele sunt redate in tabelul urmator:
Valoare factura medie lunara (lei)Venitul mediu lunar al gospodariei (sute lei)Vechime in serviciul companiei (ani)Inclinatia de a renunta la serviciile companiei (puncte)
50,8534,823,2360,77
78,8238,142,7557,48
9343,551,4471,99
46,2651,993,2556,79
62,4553,94,4953,69
49,7755,33,4555,66
60,3455,383,1354,84
47,956,892,4263,72
162,6457,071,2378,29
59,4559,082,2862,23
70,1759,42,161,65
170,8660,511,5773,47
84,5560,662,166,03
59,3360,843,3663,96
70,6862,523,256,65
58,8963,583,8760,47
72,3864,981,671,47
69,7865,933,0271,04
61,7466,432,5267,39
100,9366,531,3870,94
65,2166,832,462,74
84,4968,244,3651,09
48,4368,862,564,98
98,1269,173,0268,06
71,4269,882,6666,04
69,470,412,6761,12
56,2370,812,9666,41
55,0371,292,9659,25
65,8372,721,1870,41
184,1473,241,4677,37
3774,023,362,63
51,9575,051,9261,02
166,9275,231,3472,11
44,7275,972,5156,81
61,9377,313,4252,65
69,0677,371,2664,12
81,0978,512,264,85
82,2379,732,5868,48
85,5987,63,4558,77
172,7887,61,3883,45
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red comportamentul inclinatiei de renuntare la serviciile companiei in functie de cele trei variabile factoriale; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=2,866).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,028).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Ce procent din variatia inclinatiei de renuntare la serviciile companiei este explicat de modelul de regresie identificat?g. Previzionai inclinatia de renuntare la serviciile companiei a unui client ce plateste o factura telefonica lunara in valoare de 65 de lei, are un venit al gospodariei de 78 sute lei in medie pe luna si este abonat al companiei telefonice de 4 ani.
ECHIPA 5
Un magazin de aparate electrocasnice doreste sa-si reconfigureze oferta la gama de televizoare. Pentru aceasta, managerul magazinului comanda un studiu asupra clientilor sai, in cadrul caruia sunt inregistrate urmatoarele informatii: marimea gospodariei (persoane), venitul salarial mediu lunar (sute lei) si numarul de televizoare detinute. Pentru 25 de clienti selectati aleator datele inregistrate sunt urmatoarele:
Marimea gospodariei (persoane)Venit salarial mediu lunar (sute lei/pers)Nr. TV detinute
1191
2191
8191
2201
2221
1241
3301
2311
7371
1401
1421
2431
2461
3491
4511
6533
1571
1671
1832
3833
31073
11093
11122
11183
21373
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,44).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,07).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Calculati si interpretati coeficientul de determinatie.g. Previzionai numarul de televizoare detinut de un client al magazinului care are un venit salarial de 75 sute lei in medie pe luna si 4 persoane in gospodarie.
ECHIPA 6
Managerul unui lant de supermarketuri doreste sa analizeze valoarea vanzarilor pe anul precedent (unitati monetare). In cadrul unui studiu el inregistreaza, pentru 24 dintre supermarketurile sale, selectate aleator, urmatoarele variabile: valoarea vanzarilor pe anul precedent (unitati monetare), cheltuielile cu reclama si publicitatea realizate in cursul anului anterior (unitati monetare) si numarul de competitor din zona. Datele se prezinta astfel:
Cheltuieli cu publicitatea (u.m.)Numar competitoriVanzari (u.m.)
4,69212,23
6,41411,84
6,47112,25
3,43311,1
8,39510,97
2,1568,75
1,5467,75
2,67510,5
1,2456,71
1,7777,6
4,46312,46
1,8368,47
5,15212,27
7,25112,57
1,7268,87
3,04411,15
4,92311,86
4,85411,07
3,13510,38
2,2968,71
4,9112,07
5,75112,74
3,6159,82
4,62211,51
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru o probabilitate de 99%. (Fcritic=5,78).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,831).d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. Determinati influenta procentuala a cheltuielilor cu publicitatea si a numarului de competitori din zona asupra variatiei valorii vanzarilor, utilizand coeficientul de determinatie.g. Previzionai valoarea vanzarilor unui supermarket situat intr-o zona in care mai exista 5 magazine similare, daca s-au cheltuit 9,5 unitati monetare pe reclama si publicitate.
ECHIPA 7
Echipa de management a unei fabrici de confectii doreste sa analizeze valoarea vanzarilor la confectiile pentru barbati (unitati monetare) in functie de numarul cataloagelor expediate prin posta clientilor si de sumele cheltuite pentru realizarea unor spoturi publicitare la produsele fabricate (unitati monetare). Pentru 30 de magazine de desfacere a produselor, s-au inregistrat urmatoarele date:
Numar de cataloage trimise prin postaSume cheltuite pentru realizarea spoturilor publicitare (u.m.)Valoarea vanzarilor la confectii barbati (u.m.)
29782229,4511357,92
32902742,6510605,95
30292797,8716998,57
27522894,976563,75
36852264,236607,69
28472721,069839
28812663,309398,32
31213037,5010395,53
28112679,4811663,13
37063280,8112805,22
38112858,9713636,25
53093873,8722849,01
30812272,3712325,8
33782491,258273,58
35862991,7510061,19
34382091,1511497,76
35892690,2910363,16
35652607,9210194,68
35263595,738401,24
39782541,6013642,89
37612677,7612772,63
35123074,5614539,47
36972592,9814927,35
61202572,1619170,12
41152649,6411771,4
32162451,5310278,09
43582859,8311857,59
38352864,379516,91
35653439,2510074,24
45892714,5419504,5
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,35).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,05), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vanzarilor nu este explicata de modelul de regresie gasit?g. Previzionai valoarea vanzarilor unui magazin daca au fost expediate prin posta 5000 de cataloage si s-au cheltuit 4000 de unitati monetare pentru realizarea unor spoturi publicitare la produsele magazinului.
ECHIPA 8
Managerul unui lant de magazine de produse electronice doreste sa analizeze valoarea vanzarilor realizate de Black Friday la telefoanele mobile, in functie de numarul liniilor telefonice deschise in perioada respectiva pentru efectuarea comenzilor si de numarul unitatilor de service pentru clienti. Pentru 30 de magazine selectate aleator, s-au inregistrat datele:
Valoarea vanzarilor de telefoane mobile (unitati monetare)Numarul de linii telefonice deschise pentru efectuarea comenzilorNumarul unitatilor de service pentru clienti
16578,933420
18236,132920
43393,552426
30908,492022
28701,581721
29647,573023
31141,512822
31177,312720
30672,373515
37633,382520
33890,923016
513784529
18103,063522
20979,52028
34503,122528
26783,963522
31790,152824
32432,742525
37180,052428
29658,853219
33238,462818
35679,333320
37238,873426
46766,942930
21752,783027
20789,672627
37427,022831
37578,382133
34424,092423
47208,792428
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 10%. (Fcritic=2,51).c. Testai semnificaia statistic a parametrilor modelului (tcritic=1,703), pentru o probabilitate de 90%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vanzarilor nu este explicata de modelul de regresie gasit?g. Previzionai valoarea vanzarilor de telefoane mobile daca au fost deschise 40 de linii telefonice pentru efectuarea comenzilor si exista 30 de unitati de service.
ECHIPA 9
O echipa de analisti din cadrul Ministerului Sanatatii studiaza accesibilitatea la sistemul de ingrijire a sanatatii (exprimat prin rata vizitelor la medic la 10.000 persoane) in functie de investitiile in sistemul de sanatate (unitati monetare) si de rata cazurilor de imbolnavire raportate (la 10.000 persoane). Pentru 20 de localitati, datele inregistrate pentru anul precedent sunt:
Investitii in sistemul de sanatate (unitati monetare)Cazuri de imbolnavire raportate (rata la 10.000 persoane)Vizite la medic (rata la 10.000 de persoane)
155,33158,34152,13
177,34157,23167,84
165,09162,92162,21
154,28130,59146,69
185,56202,81186,93
186,96221,43188,16
198,63189,22195,39
172,14166,42175,5
198,25203,07197,04
193,9198,57190,16
157,03161,79156,47
158,07168,82159,21
182,09180,41185,65
173,2178,52176,5
151,84157,77156,97
182,9212,44181,62
197,09198,9205,51
163,86174,25167,09
192,3212,07192,71
172,03149,45165,02
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,59).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,11), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia vizitelor la medic este explicata de modelul de regresie gasit?g. Previzionai rata vizitelor la medic intr-un oras in care s-au investit 200 unitati monetare in sistemul de sanatate si s-au raportat 210 cazuri de imbolnavire la 10.000 locuitori.
ECHIPA 10
Managerul unei mari agentii imobiliare analizeaza pretul de vanzare al caselor in functie de numarul de zile de la scoaterea casei la vanzare pana la incheierea tranzactiei, pe de o parte, si de suprafata locuibila a casei, pe de alta parte. Pentru 25 de case ale caror tranzactii au fost intermediate de agentia imobiliara respectiva, s-au inregistrat urmatoarele date:
Pretul de vanzare al casei (mii dolari)Perioada de la scoaterea casei la vanzare pana la incheierea vanzarii (zile)Suprafata locuibila a casei (metri patrati)
33591298
32154261
30013306
32596282
21018210
41662411
34218394
347133365
284103250
290104259
29446366
23574233
25010185
29013269
24734289
23215290
27866240
22273162
26555218
30085273
27485244
26561151
2541247
22913158
25016209
Prelucrati datele in Excel modulul Data Analysis Regression si raspundeti la urmatoarele intrebari:a. Identificai modelul de regresie liniar n eantion, ce red legtura dintre cele trei variabile; interpretai valorile coeficienilor.b. Testai validitatea modelului gsit i completai tabelul ANOVA, pentru un nivel de semnificaie de 5%. (Fcritic=3,44).c. Testai semnificaia statistic a parametrilor modelului (tcritic=2,074), pentru o probabilitate de 95%.d. Determinai i interpretai intervalele de ncredere ale parametrilor modelului.e. Analizai sensul i intensitatea legturii dintre variabile folosind un indicator adecvat; testai semnificaia acestuia.f. In ce masura variatia pretului de vanzare al caselor este determinata de influenta factorilor aleatori?g. Previzionai pretul de vanzare al unei case cu suprafata locuibila de 300 de metri patrati, si care s-a vandut dupa 50 de zile de la scoaterea ei la vanzare?