Aplicatii statistica

7
APLICATII SEMINAR 3 + SEMINAR 4 Un analist doreste sa elaboreze un studiu asupra activitatii magazinelor online. Pentru aceasta, el selecteaza aleator 100 de astfel de magazine si inregistreaza valoarea vanzarilor online realizate de acestea in luna precedenta (zeci mii lei), prin intermediul site-urilor de profil. Datele se prezinta astfel: Magazin Valoarea vanzarilor online (zeci mii lei) Magazin Valoarea vanzarilor online (zeci mii lei) Se cere: a. Sa se sistematizeze datele disponibile si sa se reprezinte grafic. b. Sa se calculeze frecventele relative si sa se reprezinte grafic. c. Sa se analizeze seria de date individuale cu ajutorul indicatorilor descriptivi, sub urmatoarele aspecte: i. Tendinta centrala ii. Variabilitatea iii. Forma distributiei d. Sa se estimeze valoarea medie a vanzarilor online a unui magazin din populatia generala, pe interval de incredere garantat cu o probabilitate de 95% (z=1,9842). e. Cate magazine online ar trebui incluse in esantion, daca dorim sa obtinem o eroare limita mai mica de 1,5 ori decat cea de la punctul anterior? f. Analistul emite ipoteza ca valoarea medie a vanzarilor online a unui magazin, obtinuta anul trecut este mai mica decat cea de acum 2 ani (in valoare de 10 zeci mii lei), datorita manifestarii crizei 2. 10,1 51. 11,2 3. 11,4 52. 11,3 4. 11,5 53. 9 5. 10,4 54. 6,8 6. 7,3 55. 8,9 7. 9,2 56. 10,3 8. 11 57. 8,9 9. 10,6 58. 7,7 10. 9,5 59. 10,2 11. 11,1 60. 11,6 12. 10 61. 7,5 13. 11,4 62. 11 14. 11,6 63. 5,9 15. 11,8 64. 11,3 16. 10,3 65. 8,5 17. 10,3 66. 6,1 18. 10,4 67. 8,6 19. 10,4 68. 11,5 20. 11,4 69. 10,8 21. 10,3 70. 11,9 22. 5,4 71. 10,9 23. 12 72. 4,5

description

statistica

Transcript of Aplicatii statistica

APLICATII SEMINAR 3 + SEMINAR 4

APLICATII SEMINAR 3 + SEMINAR 4

Un analist doreste sa elaboreze un studiu asupra activitatii magazinelor online. Pentru aceasta, el selecteaza aleator 100 de astfel de magazine si inregistreaza valoarea vanzarilor online realizate de acestea in luna precedenta (zeci mii lei), prin intermediul site-urilor de profil. Datele se prezinta astfel:

MagazinValoarea vanzarilor online (zeci mii lei)MagazinValoarea vanzarilor online (zeci mii lei)Se cere:

a. Sa se sistematizeze datele disponibile si sa se reprezinte grafic.

b. Sa se calculeze frecventele relative si sa se reprezinte grafic.

c. Sa se analizeze seria de date individuale cu ajutorul indicatorilor descriptivi, sub urmatoarele aspecte:

i. Tendinta centrala

ii. Variabilitatea

iii. Forma distributiei

d. Sa se estimeze valoarea medie a vanzarilor online a unui magazin din populatia generala, pe interval de incredere garantat cu o probabilitate de 95% (z=1,9842).

e. Cate magazine online ar trebui incluse in esantion, daca dorim sa obtinem o eroare limita mai mica de 1,5 ori decat cea de la punctul anterior?

f. Analistul emite ipoteza ca valoarea medie a vanzarilor online a unui magazin, obtinuta anul trecut este mai mica decat cea de acum 2 ani (in valoare de 10 zeci mii lei), datorita manifestarii crizei economico-financiare globale. Se poate spune ca analistul are dreptate, cu un nivel de incredere de 95%? (valoare critica:1,645).

g. Estimati ponderea magazinelor online din populatia totala care au obtinut o valoarea a vanzarilor online de peste 11 zeci mii lei, pe interval de incredere (z=1,9842).

h. Se poate afirma cu o probabilitate de 95% ca ponderea magazinelor online din populatia totala care au obtinut vanzari de peste 11 zeci mii lei este de 25%?

2. 10,151. 11,2

3. 11,452. 11,3

4. 11,553. 9

5. 10,454. 6,8

6. 7,355. 8,9

7. 9,256. 10,3

8. 1157. 8,9

9. 10,658. 7,7

10. 9,559. 10,2

11. 11,160. 11,6

12. 1061. 7,5

13. 11,462. 11

14. 11,663. 5,9

15. 11,864. 11,3

16. 10,365. 8,5

17. 10,366. 6,1

18. 10,467. 8,6

19. 10,468. 11,5

20. 11,469. 10,8

21. 10,370. 11,9

22. 5,471. 10,9

23. 1272. 4,5

24. 5,473. 11,8

25. 1174. 9,3

26. 8,575. 9,3

27. 6,276. 11,9

28. 6,377. 10,5

29. 6,878. 9,1

30. 9,279. 3,1

31. 11,980. 10,5

32. 10,481. 10,3

33. 7,182. 10,4

34. 9,583. 8,4

35. 10,984. 8,1

36. 5,885. 10,5

37. 9,186. 5,7

38. 11,587. 5,8

39. 1188. 10,8

40. 8,489. 11,3

41. 9,790. 9,6

42. 9,791. 11,6

43. 11,792. 3,8

44. 7,993. 7

45. 10,694. 3,6

46. 595. 9,9

47. 9,396. 9,8

48. 10,197. 11,1

49. 10,198. 11,6

50. 8,699. 11,4

51. 10,7100. 9,4

a). Pentru gruparea datelor pe intervale egale de variatie, se parcurg urmatorii pasi:

- se determina amplitudinea: A=x_max-x_min=12-3,1=8,9 zeci mii lei.

- se calculeaza nr. de grupe: r = 1 + 3,322 * log(100)=7,64 8 grupe

- se determina marimea intervalelor: k = A / r = 8,9 / 8 = 1,11 1,2 zeci mii lei.

- se alcatuiesc intervalele, plecand de la valoarea 3,0:

Intervale de variatie a valorii vanzarilor online (zeci mii lei)Nr. magazine (frecvente absolute ni)

3,0 4,23

4,2 5,44

5,4 6,67

6,6 7,87

7,8 9,011

9,0 10,220

10,2 11,434

11,4 12,614

Total100

Pentru efectuare gruparii si determinarea frecventelor grupelor se utilizeaza Excel, astfel:

Data Data Analysis Histogram.

Se apasa pe OK si se obtine rezultatul din tabelul urmator:Bin (limite superioare)Frequency

4,23

5,44

6,67

7,87

911

10,220

11,434

12,614

More0

Din histograma se observa ca distributia este puternic asimetrica spre dreapta (prezinta asimetrie negativa si ca in serie predomina valorile mari).b). Frecventele relative se determina dupa relatia: . Ele coincid ca valori cu frecventele absolute, deoarece volumul esantionului este n = 100.

c) Rezolvare folosind EXCEL:

1. Apsai Data/Data Analysis i Descriptive Statistics.2. Introducei Input Range (A1:A101) coninnd i numele variabilei. Selectai Labels in First Row.3. Bifai Summary Statistics i Confidence Level for mean i apoi OK.

Se obin rezultatele:Val.vanz.online (zeci mii lei)

Mean9,398= (media aritmetica)

Standard Error0,215022 = (eroarea medie de reprezentativitate)

Median10,1 = Me (Mediana)

Mode10,4 = Mo (Modul)

Standard Deviation2,150216 = sx (Abaterea standard)

Sample Variance4,62343 = s2 (Dispersia)

Kurtosis0,393661 = KURT (coefficient de boltire sau aplatizare)

Skewness-1,0731 = SKEW (coefficient de asimetrie)

Range8,9 = A (amplitudinea)

Minimum3,1 = x_minim

Maximum12 = x_maxim

Sum939,8 (suma termenilor)

Count100 = n (volumul esantionului)

Largest(3)11,9 (cea mai mare a treia valoare)

Smallest(3)3,8 (cea mai mica a treia valoare)

Confidence Level(95,0%)0,42665 = (eroarea limita)

Tendinta centrala:Media (Mean): Un magazn din esantion a realizat vanzari in valoare medie de 9,398 zeci mii lei. Mediana (Median): 50% din magazine au avut vanzari mai mari de 10,1 zeci mii lei, si 50% - mai mici.

Modul (Mode): Cele mai multe magazine au avut vanzari in valoare de 10,4 zeci mii lei. Acesta este posibil s nu fie singurul, deoarece EXCEL nu afieaz dect o singur valoare.Variabilitatea:

Dispersia (Variance): >0, deci seria prezinta un grad de variatie.

Abaterea standard (Standard Deviation): vanzarile unui magazin se abat, in medie, de la media seriei cu 2,15 zeci mii lei.

Coeficientul de variatie: 30, avem esantion de volum mare, se aplica testul z:

Valoarea se poate obtine cu functia in Excel: standardize(9,398;10;0,215) ce returneaza scorul z.

.

Cum zcalc30, avem esantion de volum mare, se aplica testul z:

Valoarea se poate obtine cu functia in Excel: standardize(0,24;0,25;0,0427) ce returneaza scorul z.

.

Cum -z/2 < zcalc < z/2, zcalc se afla in Regiunea de acceptare, deci se accepta H0 si deci ponderea magazinelor din populatia totala care au avut vanzari de peste 11 zeci mii lei este de 25%.EMBED Equation.3

_1448140752.unknown

_1448141613.unknown

_1448141892.unknown

_1448142085.unknown

_1448142149.unknown

_1448142198.unknown

_1448142108.unknown

_1448141967.unknown

_1448141776.unknown

_1448141801.unknown

_1448141775.unknown

_1448141146.unknown

_1448141242.unknown

_1448141410.unknown

_1448141215.unknown

_1448141023.unknown

_1448141124.unknown

_1448140961.unknown

_1448139800.unknown

_1448140415.unknown

_1448140672.unknown

_1448140258.unknown

_1448139484.unknown

_1448139767.unknown

_1448139172.unknown

_1448136652.unknown