Aplicatii Rezolvate Statistica

download Aplicatii Rezolvate Statistica

of 13

Transcript of Aplicatii Rezolvate Statistica

Aplicatii Rezolvate Statistica

1. Pentru 30 de convorbiri telefonice de lung-distan s-au nregistrat duratele (n minute):

11,8;3,6;16,6;13,5;4,8;8,3;8,9;9,1;7,7;2,3;12,1;6,1;

10,2;8,0;11,4;6,8;9,6;19,5;15,3;12,3;8,5;15,9;18,7;11,7;

6,2;11,2;10,4;7,2;5,5;14,5.

Se cere:

a) S se determine durata medie a unei convorbiri telefonice i s se studieze dac valoarea obinut este reprezentativ;

b) S se analizeze asimetria distribuiei;

c) S se grupeze datele pe 6 intervale de mrime egal i s se reprezinte grafic rezultatul gruprii;

Rezolvare:

a) Notm cu X variabila durata unei convorbiri telefonice, iar xi reprezint valorile variabilei X pentru cele n=30 observaii.

Pentru calculul mediei se va utiliza formula mediei aritmetice simple:

minute.

Verificarea reprezentativitii mediei se face cu ajutorul coeficientului de variaie:

Calculm abaterea medie ptratic:

minute.

Coeficientul de variaie este:

>35%, ceea ce nseamn c seria de date are un grad redus de omogenitate i deci media are o reprezentativitate sczut.

b) Analizm asimetria seriei cu ajutorul coeficientului de asimetrie Pearson:

, unde Mo este valoarea modal i reprezint valoarea cel mai des ntlnit ntr-o serie statistic.

Dac analizm seria de date observm c fiecare valoare apare o singur dat i deci putem afirma nu exist mod. n acest caz vom analiza asimetria seriei folosind o formul alternativ a coeficientului de asimetrie, formul bazat pe ipoteza c ntr-o repartiie moderat asimetric ntre indicatorii tendinei centrale exist relaia .

, unde Me reprezint mediana seriei.

Pentru determinarea valorii medianei procedm astfel:

Ordonm cresctor seria de date:

2,33,64,85,56,16,26,87,27,788,38,5

8,99,19,610,210,411,211,411,711,812,112,313,5

14,515,315,916,618,719,5

Determinm locul medianei n serie:

. Aceast valoare arat c mediana se gsete ntre termenul al 15-lea, respective al 16-lea ai seriei ordodate cresctor/descresctor, adic mediana este o valoare cuprins ntre 9,6 i 10,2.

Determinm mediana ca fiind media aritmetic simpl a celor dou valori:

minute.

Aceasta nseamn c 50% dintre convorbirile telefonice au o durat mai mic de 9,9 minute, respective 50% au o durat mai mare.

Observaie: .

Valoarea coeficientului arat o uoar asimetrie pozitiv, n serie predominnd valorile mici.

c) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute

r = 6

minute

Rezultatele gruprii sunt prezentate n tabelul:Intervale de variaie a duratei convorbirilor telefonice (minute)Numr de convorbiri telefonice

2-53

5-86

8-118

11-147

14-174

17-202

Total30

Not: limita inferioar inclus n interval.

Reprezentarea grafic:

Distribuia convorbirilor telefonice dup durat

Se observ c distribuia este normal, uor asimetric la dreapta (vezi coeficientul de asimetrie-punctul b).

2. Distribuia celor 54 de ageni comerciali ai unei firme ce comercializeaz produse cosmetice de dup numrul de zile lucrate n luna iulie este urmtoarea:

Zile lucrateNumr vnztori

216

227

2314

2411

259

264

273

Total54

Se cere:

a) S se reprezinte grafic distribuia vnztorilor dup numrul de zile lucrate;

b) S se determine numrul mediu de zile lucrate i s se studieze dac valoarea obinut este reprezentativ;c) Care este numrul de zile lucrate peste care se situeaz 50% din vnztori?

d) S se analizeze asimetria distribuiei.

e) Daca cei 54 de vanzatori reprezinta un esantion reprezentativ, selectat aleator repetat, determinati intervalul de incredere pentru nr. mediu de zile lucrate de un vanzator din colectivitatea generala (probabilitate de garantare a rezultatelor este de 95% (z0,025=1.96)). Rezolvare:

a) n tabel avem o serie de distribuie de frecvene pe variante, variabila analizat X fiind numr zile lucrate. Pentru reprezentarea grafic se folosete diagrama cu coloane nelipite centrate pe variant.

Distribuia vnztorilor dup numrul de zile lucrate

b) Se calculeaz numrul mediu de zile lucrate cu ajutorul mediei aritmetice ponderate:

zile.

Tabelul 3.4

Zile lucrate

(xi)Numr vnztori

(ni)

Fci

01234

21612640,566

22715417,9213

23143225,0427

24112641,7638

25922517,6447

26410423,0451

2738134,6854

Total541276140,64-

Aadar, un vnztor din cei 54 luai n studiu a lucrat, n medie, aproximativ 23 de zile i jumtate.

Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza abaterii medii ptratice:

Dispersia variabilei este:

.

Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloana 3 a tabelului 3.4.

Abaterea medie ptratic va fi:

zile.

iar coeficientul de variaie:

< 35%, ceea ce nseamn c media calculat este reprezentativ, colectivitatea fiind omogen.

c) Se cere determinarea medianei

Mediana (Me)

Me = 24 zile.

Deci, 50% din vnztori au lucrat mai mult de 24 de zile, iar 50% mai puin.

d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.

Mo = 23 zile (nivelul variabilei cu frecvena cea mai mare).

Valoarea coeficientului de asimetrie indic fapul c seria este moderat asimetric la dreapta (predomin valorile mici ale variabilei).

e) Intervalul de incredere pentru media din colectivitatea generala este:

Eroarea limita este:

3. Procentul din profit cheltuit de 70 de firme pentru reclam i publicitate n anul 2005 a avut urmtoarea distribuie:

Tabelul 3.5

% pentru reclam i publicitateNr. firme cu % pentru reclama mai mic dect limita superioar a intervalului

0,6-1,014

1,0-1,432

1,4-1,856

1,8-2,264

2,2-2,668

2,6-3,070

Total-

Not: limita inferioar inclus n interval.

Se cere:

a) S se reprezinte grafic distribuia de frecvene absolute;

b) S se determine procentul mediu cheltuit pentru reclam i publicitate i s se studieze dac valoarea obinut este reprezentativ;c) Care este procentul din profit cheltuit pentru reclam i publicitate peste care se situeaz:c1) trei sferturi dintre firme?

c2) 50% din firme?

c3) o ptrime din firme?

d) S se analizeze asimetria i excesul distribuiei.

e) S se calculeze media i dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclam i publicitate.

Rezolvare:

a) Se observ c n tabelul 3.5 sunt date frecvenele absolute cumulate cresctor. Pentru a determina frecvenele absolute, trebuie s decumulm frecvenele date n tabelul iniial (coloana 2). Rezultatele prelucrrilor intermediare necesare pentru calcularea indicatorilor solicitai vor fi redate n tabelul 3.6.

Tabelul 3.6

% cheltuit pentru reclam i publicitateFrecvenele absolute cumulate cresctorFrecvene absolute

(nr. firme)

(ni)Centre de interval (xi)

01234567

0,6-1,014140,811,2-0,666,0982,656

1,0-1,432181,221,6-0,261,2170,082

1,4-1,856241,638,40,140,4700,009

1,8-2,26482,0160,542,3330,680

2,2-2,66842,49,60,943,5343,123

2,6-3,07022,85,61,343,5916,448

Total-70-102,417,24413,000

Distribuia de frecvene absolute este reprezentat grafic n figura 3.3, prin histogram.

Figura 3.3 Distribuia firmelor dup procentul cheltuit pentru reclam i publicitate

b) Se calculeaz media aritmetic ponderat a procentului cheltuit pentru reclam i publicitate, pe baza frecvenelor absolute (coloana 4):

%

Aadar, o firm din cele 70 luate n studiu a cheltuit, n medie, 1,46% din profit pentru reclam i publicitate.

Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza abaterii medii ptratice:

Dispersia variabilei n eantion este:

Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloanele 5 i 6.

Abaterea medie ptratic va fi:

%.

iar coeficientul de variaie:

< 35%, ceea ce nseamn c media calculat este reprezentativ, colectivitatea fiind omogen.

c) Se cer calculai urmtorii indicatori medii de poziie:

c1) prima cuartil (Q1):

Pentru calculul ei se procedeaz astfel:

se determin locul primei cuartile:

se gsete intervalul n care se afl prima cuartil (primul interval a crui frecven cumulat cresctor depete locul primei cuartile), acesta este 1,0-1,4;

se calculeaz prima cuartil, cu formula:

%.

unde:

x0 = limita inferioar a intervalului primei cuartile;

k = mrimea intervalului cuartilic;

FcQ1-1 = frecvena cumulat a intervalului anterior celui cuartilic;

nQ1 = frecvena absolut a intervalului primei cuartile.

Aadar, 75% dintre firme au cheltuit pentru reclam i publicitate mai mult de 1,08 % din profit.

c2) Mediana (Me)

Mediana se gsete n intervalul 1,4-1,8.

%.

Deci, 50% din firme au cheltuit pentru reclam i publicitate mai mult de 1,458 % din profit, iar 50% mai puin.

c3) Cuartila a treia (Q3)

A treia cuartil se gsete tot n intervalul 1,4-1,8.

%.

Aadar, 25% din firme au cheltuit pentru reclam i publicitate mai mult de 1,754 % din profit, iar 75% mai puin.

d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.

unde:

x0 = limita inferioar a intervalului modal;

k = mrimea intervalului modal;

Intervalul modal este intervalul cu frecvena maxim: [1,4-1,8)(1 = nMo nMo-1 = frecvena intervalului modal minus frecvena intervalului anterior celui modal;

(2 = nMo - nMo+1 = frecvena intervalului modal minus frecvena intervalului urmtor celui modal;

Se obine

Cele mai multe firme au cheltuit pentru reclam i publicitate 1,52% din profit.

3, iar (2 > 0.

d) Se creeaz o caracteristic alternativ cu o stare favorabil (firmele care au cheltuit peste 2,2%) i o stare nefavorabil (firmele care au cheltuit mai puin de 2,2%).

Media caracteristicii alternative este:

(n medie, 9% din firme au cheltuit peste 2,2%)

iar dispersia:

.

4. Se cunosc urmtoarele date referitoare la distribuia celor 3569 structuri de primire turistic cu funciuni de cazare turistic, pe categorii de confort n anul 2003:

Tabelul 3.7

Categorii de confort Numr de uniti (ni)

01

Neclasificate448

1 stea1080

2 stele1479

3 stele427

4 stele125

5 stele10

TOTAL3569

Sursa: www.insse.roS se determine indicatorii tendinei centrale pentru aceast serie.

Rezolvare:

Datele prezentate n tabelul 3.7 reprezint o serie de distribuie de frecvene pe variante, iar variabila analizat (categoria de confort) este calitativ, msurat pe o scal ordinal. Din categoria indicatorilor ce caracterizeaz tendina central, pentru aceast serie pot fi determinate valoarea modal (modul) i mediana.

Modul (Mo) este valoarea variabilei cu frecvena cea mai mare, deci nivelul Mo este 2 stele (nimax =1467).

Pentru determinarea medianei (Me) procedm astfel:

Calculm frecvenele absolute cumulate cresctor (Fci)- coloana 2, tabelul 3.8.

Tabelul 3.8

Categorii de confort Numr de uniti (ni)Frecvene absolute cumulate cresctor (Fci)

012

Neclasificate448448

1 stea10801528

2 stele14793007

3 stele4273434

4 stele1253559

5 stele103569

TOTAL3569-

Determinm locul medianei:

Determinm mediana:

Mediana reprezint acel nivel al variabilei analizate corespunztor primei frecvene cumulate cresctor mai mare dect locMe. Deci i nivelul Me este 2 stele (Fc3=3007>locMe=1785).

5. Dou grupe de studeni, cu efective de 25 i, respectiv, 32 de persoane, au susinut un test de cultur general. Prima grup a obinut media 7,8, iar a doua 8,4. Cercettorul este interesat n a determina nota medie pe ansamblul celor dou grupe.

Rspuns:Nota medie pe ansamblul celor dou grupe se poate determina ca o medie de medii pariale. S notm:

n1 = 25

i

n2 = 32

i

Atunci: , puncte.

6. Considerai urmtoarele valori: 5, 7, 4, 5, 20, 6, 4.

a) Calculai media aritmetic i mediana acestui set de date; ce valoare vi se pare mai potrivit pentru a caracteriza tendina central: media sau mediana?

b) nlocuii valoarea 20 cu valoarea 8 i recalculai cei doi indicatori ai tendinei centrale. Explicai modificrile survenite.

c) Adugai 50 fiecrei valori iniiale. Cum se va modifica media?

Rspuns:

Pentru determinarea medianei, datele se ordoneaz: 4, 4, 5, 5, 6, 7, 20. Se determin locul medianei n serie:

Seria avnd un numr impar de termeni, mediana este egal cu valoarea termenului central (al patrulea), deci Me = 5.

Mediana este un indicator potrivit pentru a studia tendina central n acest set de date, deoarece valoarea 20 este o valoare extrem, ce afecteaz, prin magnitudine, nivelul total al variabilei i deci valoarea mediei. ase dintre cele apte valori se situeaz sub valoarea mediei aritmetice, ceea ce face ca indicatorul median s exprime mai corect tendina central.

b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.

, Me = 5.

Valoarea medianei rmne neschimbat, ea innd cont numai de numrul valorilor mari, nu i de valoarea lor efectiv.

c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.

.

Se verific proprietatea mediei aritmetice de a se modifica (() cu a uniti, dac fiecare valoare se modific (() cu cte a uniti.

9. Directorul unei bnci dorete s cunoasc situaia numrul de zile de ntrziere a rambursrii creditelor. Analiznd distribuia debitorilor dup numrul zilelor de ntrziere, constat urmtoarele: 30% din debitori ntrzie ntre 10 i 20 de zile, 40% ntre 20 i 30 de zile, 18% ntre 30 i 40 de zile, iar restul mai mult de 40 de zile. Care este numrul mediu de zile de ntrziere a plii pe un debitor?Rspuns:

Datele pot fi sistematizate ca n tabelul 3.11:

Tabelul 3.11

Intervale de variaie a numrului de zile de ntrziere a pliiNumr de debitori (%)xi

10-204015600

20-303025750

30-401835630

40 i peste1245540

Total100-2520

Se va utiliza media aritmetic ponderat, calculat pe baza frecvenelor relative:

Aadar, n medie, un debitor al bncii ntrzie 25 zile la rambursarea unui credit.

15. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele nregistrate sunt:

Tabelul 3.20

Mrimea firmelorNumr de sptmni de la angajare pn la prima promovare

Mici30; 26; 30; 38; 32; 24; 32; 30;

Medii30; 34; 32; 25; 36;

Mari49; 42; 43; 48; 40; 49; 40.

Se cere:

a) s se determine numrul mediu de sptmni pn la prima promovare, pe fiecare grup de firme, precum i pe total;

b) s se arate dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul anterior, este o valoare reprezentativ;

c) n ce msur variaia timpului scurs pn la prima promovare este influenat de mrimea firmei?

Rezolvare

a) Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de sptmni de la angajare pn la prima promovare.

Tabelul 3.21

Mrimea firmelorni

Mici830,2515,44

Medii531,414,24

Mari744,4314,53

Total20--

, i reprezint grupa (mrimea firmei)

Calculm mediile pentru fiecare grup i ():

sptmni;

sptmni;

sptmni.

Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a mediilor pariale:

sptmni.

b) Pentru a verifica dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul anterior, este o valoare reprezentativ trebuie s calculm, mai nti, dispersia pe total cu ajutorul regulii de adunare a dispersiilor. Determinm, mai nti, dispersia fiecrei grupe i ():

Media dispersiilor grupelor va fi:

Dispersia dintre grupe care sintetizeaz influena factorului de grupare X asupra variaiei variabilei Y este:

Din regula de adunare a dispersiilor rezult:

Reprezentativitatea mediei este influenat de omogenitatea seriei de date i se msoar cu ajutorul coeficientului de variaie:

Cum v < 35%, rezult c numrul mediu de sptmni pn la prima promovare este o valoare reprezentativ pentru colectivitate.

c) Pentru a calcula n ce msur variaia timpului scurs pn la prima promovare este influenat de mrimea firmei utilizm coeficientul de determinaie:

Aadar, 74% din variaia caracteristicii Y este influenat de mrimea firmei, iar influena altor factori (considerai aleatori) este:

_1218638438.unknown

_1219320772.unknown

_1219326145.unknown

_1219339498.xlsChart1

6

7

14

11

9

4

3

zile lucrate

nr.lucratori

Sheet1

0,6-1,014140.811.2-0.666.0982.656

1,0-1,432181.221.6-0.261.2170.082

1,4-1,856241.638.40.140.4700.009

1,8-2,26482160.542.3330.680

2,2-2,66842.49.60.943.5343.123

2,6-3,07022.85.61.343.5916.448

70102.417.24413.000

1.46

0.2463428571

0.4963293837

0.3424657534

ianuarie101.31.0131.05835049351998192.11.92110.7216990726

februarie100.81.0081.00949673681999184.01.841.4849457998

martie101.11.011100.94967368392000153.91.539

aprilie101.11.0112001135.41.354

mai100.51.0052002126.81.268

iunie100.91.0092003114.81.148

Oct-2020-3030-4040-5050-6060-70

Numr de debitori354821952

3529

484029

211840

97184015600

5473025750

2241835630

12099.521245540

1002520

Sheet2

niyimediuvisyi

1009206.52603,598359,80892,0003,787,962

120104010.5811012,1071,452,845124,800668,300

180116012.0714019,6033,528,605208,800370,570

140118010.1712014,4012,016,202165,200598,3113030490.06251.9620.8849

13012007.5908,1001,053,000156,000947,51426344218.06256.765.9049

670--8,410,459746,8006,372,6573032430.06250.362.0449

3025480.062540.9612.7449

3236403.062521.1619.6249

1255332157493.062571.220.8849

11152431.44039.062514.2419.6249

95113831160.0625101.7

24244.43123.514.5285714286

30.2515.4375

22064

43.1076687425296

14.80

nyj

10660-1.5624.336-6

88640.441.549158120-1.6239.366

510502.4429.76820102000.382.888

120712842.3839.6508

231741.3255.653423040481.9048

30.2515.44577.2146.882

7.56521739139.61904761931.414.248113.92145.8632

7.569.6244.4314.537101.71537.1632

292.83829.9084

2.419686956514.6441.49542

710

35.5

44844835706

1080152817857

1479300714

427343411

12535599

1035694

3

54

Sheet3

216

227

2314

2411

259

264

273

Total54

Sheet3

0

0

0

0

0

0

0

zile lucrate

nr.lucratori

MBD00087A90.xls

Chart2

14

18

24

8

4

2

procentul pt. reclama si publicitate

Numr de firme

Sheet1

10-140.1

14-180.25

18-220.5

22-260.1

26-300.05

0-414

4-840

8-1264

12-1652

16-2020

20-2410

Sheet1

0

0

0

0

0

0

Minute

Frecvente relative

Sheet2

Vanzari (buc.)

Numar de magazine

Distributia magazinelor dupa vanzarile de combine frigorifice

Sheet3

_1219340118.unknown

_1219340346.unknown

_1219341239.unknown

_1266598497.unknown

_1266664522.unknown

_1219404934.unknown

_1219340780.unknown

_1219340221.unknown

_1219339628.unknown

_1219339970.unknown

_1219339574.unknown

_1219326754.unknown

_1219327299.unknown

_1219336486.unknown

_1219326576.unknown

_1219323948.unknown

_1219325152.unknown

_1219325229.unknown

_1219323995.unknown

_1219321880.unknown

_1219322068.unknown

_1218640963.unknown

_1218721642.unknown

_1218810552.unknown

_1218813219.unknown

_1218813961.unknown

_1218814083.unknown

_1218814128.unknown

_1218813917.unknown

_1218812970.unknown

_1218812981.unknown

_1218811225.unknown

_1218811379.unknown

_1218810738.unknown

_1218808945.unknown

_1218809872.unknown

_1218810188.unknown

_1218809096.unknown

_1218808867.unknown

_1218647661.unknown

_1218647811.unknown

_1218641223.unknown

_1218647574.unknown

_1218639895.unknown

_1218640433.unknown

_1218640572.unknown

_1218639980.unknown

_1218639174.unknown

_1218639472.unknown

_1218638643.unknown

_1218635753.xlsChart2

14

18

24

8

4

2

procentul pt. reclama si publicitate

Numr de firme

Sheet1

10-140.1

14-180.25

18-220.5

22-260.1

26-300.05

0-414

4-840

8-1264

12-1652

16-2020

20-2410

Sheet1

0

0

0

0

0

0

Minute

Frecvente relative

Sheet2

Vanzari (buc.)

Numar de magazine

Distributia magazinelor dupa vanzarile de combine frigorifice

Sheet3

_1218637594.unknown

_1218638055.unknown

_1218638151.unknown

_1218637787.unknown

_1218636729.unknown

_1218637280.unknown

_1218636169.unknown

_1108745356.unknown

_1218632271.xlsChart3

0-2

3

6

8

7

4

2

Durata

Convorbiri

Sheet1

10-140.1

14-180.25

18-220.5

22-260.1

26-300.05

0-414

4-840

8-1264

12-1652

16-2020

20-2410

0-2

2-53

5-86

8-118

11-147

14-174

17-202

Sheet1

0

0

0

0

0

0

Minute

Frecvente relative

Sheet2

0

0

0

0

0

0

Vanzari (buc.)

Numar de magazine

Distributia magazinelor dupa vanzarile de combine frigorifice

Sheet3

0

0

0

0

0

0

0

Durata

Convorbiri

Distributia convorbirilor telefonice dupa durata

_1218635044.unknown

_1218635057.unknown

_1218634916.unknown

_1201252509.unknown

_1201252517.unknown

_1201252588.unknown

_1201252513.unknown

_1201252505.unknown

_1108743167.unknown

_1108743275.unknown

_1108743244.unknown

_1091855422.unknown

_1108743061.unknown

_1108743159.unknown

_973623932.unknown

_1077981081.unknown

_973259709.unknown