Statistica Aplicatii Rezolvate

18
APLICAŢII REZOLVATE 1. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre aceste conturi. Sumele sunt date în Euro: 150 175 195 200 235 240 250 256 275 294 Se cere: a) să se calculeze suma medie de bani existentă într-un cont şi să se testeze proprietăţile mediei; b) să se calculeze indicatorii medii de poziţie; c) să se caracterizeze gradul de omogenitate al seriei. Rezolvare : Notăm cu x i = suma existentă în contul i a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate: Proprietăţile mediei aritmetice: 1) (A) 2) (150 - 227) + (175 - 227) + … + (294 - 227) = 0 (A) 3) (A) 4) Analiza statistică a seriilor de distribuţie

description

statistica

Transcript of Statistica Aplicatii Rezolvate

Page 1: Statistica Aplicatii Rezolvate

APLICAŢII REZOLVATE

1. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre aceste conturi. Sumele sunt date în Euro:

150 175 195 200 235 240 250 256 275 294Se cere:a) să se calculeze suma medie de bani existentă într-un cont şi să se testeze proprietăţile

mediei;b) să se calculeze indicatorii medii de poziţie;c) să se caracterizeze gradul de omogenitate al seriei.

Rezolvare:Notăm cu xi = suma existentă în contul i

a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:

Proprietăţile mediei aritmetice:1)

(A)

2)

(150 - 227) + (175 - 227) + … + (294 - 227) = 0 (A)

3)

(A)

4)

Fie a = 5 (ales arbitrar)

(A)

Analiza statistică a seriilor de distribuţie

Page 2: Statistica Aplicatii Rezolvate

5)

Pentru h = 2 (ales arbitrar) avem:

(A)

b) Indicatorii medii de poziţie sunt: mediana, decile, quartile, centile şi modul.MedianaPentru calculul medianei valorile xi trebuie ordonate crescător. (sunt, din ipoteză)Seria are număr par de termeni (10 termeni), deci mediana este media aritmetică a celor doi

termeni centrali:

Deci, în 50% din conturi sunt mai puţin de 237,5 Euro, iar în 50% din conturi sunt peste 237,5 Euro.

Quartila 1:- se determină locul quartilei 1:

deci Q1 va fi media aritmetică simplă a termenilor 2 şi 3

În 25% din conturi sunt sub 185 Euro, iar în 75% din conturi sunt peste 185 Euro.Quartila 2 = MeQuartila 3:- se determină locul quartilei 3:

deci Q3 se găseşte între termenii 8 şi 9.

În 75% din conturi sunt sub 265,5 Euro, iar în 25% din conturi sunt peste 265,5 Euro.Decila 1:- se determină locul decilei 1:

deci D1 se află între primul şi al doilea termen

În 10% din conturi sunt sub 162,5 Euro, iar în 90% din conturi sunt peste 162,5 Euro.Celelalte decile se calculează în mod analog.Modul este valoarea cea mai des întâlnită. Fiind serie simplă şi neavând date care să se

repete, seria nu are mod.c) Gradul de omogenitate al seriei se apreciază ci coeficienţii de variaţie (v, v’).

Analiza statistică a seriilor de distribuţie

Page 3: Statistica Aplicatii Rezolvate

Deoarece v, v’ 35%, apreciem că seria este omogenă, variaţia este mică, media este reprezentativă.

d) În acest caz, variaţia nefiind continuă se poate utiliza un grafic prin coloane:

Scara de reprezentare:1 cm OY = 20 Euro

Rezultatele obţinute cu ajutorul programului EXCEL sunt:

Număr operaţiuniMEANSTANDARD ERRORMEDIANMODE STANDARD DEVIATIONSAMPLE VARIANCEKURTOSISSKEWNESSRANGEMINIMUMMAXIMUMSUMCOUNT

227 14,446 237,5

45,682482086,889 -0,80501 -0,28987 144 150 2942270 10

Page 4: Statistica Aplicatii Rezolvate

2. Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă dintr-un an se prezintă astfel:

Zile concediu 14 15 16 17 18 19 20Nr. salariaţi 2 6 10 15 8 5 4

Se cere:a) să se reprezinte grafic seria;b) să se calculeze indicatorii tendinţei centrale;c) să se calculeze indicatorii sintetici ai variaţiei;d) să se caracterizeze gradul de asimetrie;e) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile

de concediu mai mare sau egal cu 17”.

Rezolvare:Notăm cu: xi = numărul zilelor de concediu

ni = numărul de salariaţi (frecvenţele absolute)a) Seria se reprezintă grafic prin diagrama prin bastoane sau diagrama prin coloane nelipite

centrate pe variante:

Scara de reprezentare: 1 cm OX = 1 zi; 1 cm OY = 2 salariaţi

b) Indicatorii tendinţei centrale sunt:b1) Media – se calculează ca o medie aritmetică ponderată:

b2) Mediana (valoarea centrală a seriei)

Analiza statistică a seriilor de distribuţie

Page 5: Statistica Aplicatii Rezolvate

Se cumulează crescător frecvenţele absolute (ni):

xi nini cumulate crescător

14151617181920

261015854

281833414650

Deci 50% dintre salariaţi au avut sub 17 zile concediu, iar 50%, peste 17 zile.b3) Qurtilele:

Deci 25% dintre salariaţi au avut sub 16 zile concediu, iar 75% peste 16 zile.Q2 = Me

Deci, 75% dintre salariaţi au avut sub 18 zile concediu, iar 25% peste 18 zile.b4) Decilele:

Deci, 10% dintre salariaţi au avut sub 15 zile concediu, iar 90% peste 15 zile.Restul decilelor, D2, …, D9 se calculează în mod similar.b5) Modul (dominanta unei serii) Modul este, în cazul grupării pe variante, acea valoare a caracteristicii căreia îi corespunde

frecvenţa absolută maximă. Frecvenţa absolută (ni) maximă este 15 Mo = 17 zile. Cei mai mulţi salariaţi au avut 17 zile de concediu.

c) Indicatorii sintetici ai variaţiei sunt:- abaterea medie liniară:

Numărul de zile de concediu a unui salariat se abate în medie de la numărul mediu de zile de concediu cu 1,1728 zile.

- dispersia:

Page 6: Statistica Aplicatii Rezolvate

- abaterea medie pătratică:

Numărul de zile de concediu a unui salariat se abate în medie de la numărul mediu de zile de concediu cu 1,5226 zile.

- coeficientul de variaţie:

Deoarece v, v’ 35% seria este omogenă, variaţia este mică, media este reprezentativă.

d) Aprecierea asimetriei:

Deoarece Cas 0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale caracteristicii.

Cas [-0,3; 0,3] seria este uşor asimetrică (Cas este foarte apropiat de zero).e) Avem o caracteristică alternativă:

- salariaţi care au avut un concediu 17 zile;- salariaţi care au avut un concediu 17 zile.

Varianta xiFrecvenţele absolute

ni

DA (peste 17 zile)NU (sub 17 zile)

10

m = 32n – m = 18

Total - n = 50

Media caracteristicii alternative:

64% dintre salariaţi au avut un concediu 17 zileDispersia caracteristicii alternative:

3. Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un

Analiza statistică a seriilor de distribuţie

Page 7: Statistica Aplicatii Rezolvate

magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:Calorii 75-85 85-95 95-105 105-115 115-125Nr. cutii cu brânză topită

5 10 15 14 6

Se cere:a) să se reprezinte grafic seria;b) să se calculeze indicatorii tendinţei centrale;c) să se aprecieze omogenitatea seriei;d) să se caracterizeze gradul de asimetrie;e) să se calculeze media şi dispersia caracteristicii “cutii de brânză care au sub 95 de

calorii”.

Rezolvare:Se observă că avem o serie de repartiţie de frecvenţă pe intervale egale.Notăm cu: xi = numărul de calorii

ni = numărul de cutii de brânză topităa) Seria se reprezintă grafic prin:

- histogramă;- poligonul frecvenţelor;- ogivă.

Histograma:Poligonul frecvenţelor:

- pe axa OX se reprezintă caloriile- pe axa OY se reprezintă numărul de cutii

Scara de reprezentare: 1 cm OX = 10 calorii1 cm OY = 5 cutii

Ogiva (diagrama frecvenţelor cumulate):Pentru a construi ogiva trebuie să calculăm frecvenţele cumulate crescător şi descrescător:

Caloriixi

Nr. cutiini

Număr cutii cumulatecrescător descrescător

75-85 5 5 50

Page 8: Statistica Aplicatii Rezolvate

85-9595-105105-115115-125

1015146

15304450

4535206

Total 50 - -

- pe axa OX se reprezintă caloriile (xi)- pe axa OY se reprezintă frecvenţele absolute cumulate

Scara de reprezentare: 1 cm pe OX = 10 calorii1 cm pe OY = 10 cutii

b) Indicatorii tendinţei centrale sunt:b1) Media – se calculează ca o medie aritmetică ponderatăxi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita inferioară şi

limita superioară a fiecărui interval:

b2) Mediana (valoarea centrală a seriei):

Se cumulează frecvenţele absolute şi se determină care frecvenţă absolută este imediat mai mare sau egală cu LMe. Intervalul care corespunde frecvenţei absolute cumulate ce îndeplineşte condiţia de mai sus este intervalul median.

Me se calculează cu relaţia:

x0 = limita inferioară a intervalului median;h = mărimea intervalului;

ogiva descrescătoare

ogiva crescătoare

Analiza statistică a seriilor de distribuţie

Page 9: Statistica Aplicatii Rezolvate

npMe = suma frecvenţelor absolute până la intervalul median;nMe = frecvenţa absolută a intervalului median.

Deoarece Me = 102 calorii 50% din cutii au sub 102 calorii, iar 50% au peste 102 calorii.

b3) Quartilele:

= suma frecvenţelor absolute până la intervalul lui Q1;

= frecvenţa absolută a intervalului în care se găseşte Q1.Deoarece Q1 = 92,75 calorii 25% dintre cutii au sub 92,75 calorii, iar 75% dintre cutii au

peste 92,75 calorii.

Deci 75% dintre cutii au sub 110,89 calorii, iar 25% au peste 110,89 calorii.b4) Decilele:

Deci 10% dintre cutii au sub 85,1 calorii, iar 90% peste 85,1 calorii.Celelalte decile: D2, …, D9 se calculează pe baza aceluiaşi procedeu.b5) Modul (dominanta seriei):

x0 = limita inferioară a intervalului modal;h = mărimea intervalului modal;1 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a

intervalului anterior celui modal;2 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a

intervalului următor celui modal.Intervalul modal este intervalul căruia îi corespunde frecvenţa absolută maximă. Deci Mo

[95, 105].Deoarece Mo = 103,33 calorii, rezultă că cele mai multe dintre cutii au 103,33 calorii.c) Omogenitatea seriei se apreciază cu ajutorul coeficientului de variaţie:

Analiza statistică a seriilor de distribuţie

Page 10: Statistica Aplicatii Rezolvate

Deoarece v 35% seria este omogenă, variaţia este mică, media este reprezentativă.d) Gradul de asimetrie:

Deoarece Cas 0 seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de brânză cu multe calorii.

Cas [-0,3; 0,3] seria este uşor asimetrică.e) Avem o caracteristică alternativă:

- cutii care au sub 95 calorii;- cutii care au peste 95 calorii.

Varianta xiFrecvenţele absolute

ni

DA (sub 95 calorii)NU (peste 95 calorii)

10

m = 15n – m = 35

Total - n = 50

Media caracteristicii alternative:

30% dintre cutii au sub 95 calorii.Dispersia caracteristicii alternative:

4. Despre 100 de salariaţi ai unui hipermarket se cunosc următoarele date:

Grupe de salariaţi după vechime

(ani)

Grupe de salariaţi după salariul obţinut în luna august 2007 (RON) Total

400-600 600-800 800-1000 1000-1200 1200-1400sub 10

peste 1010-

255

2020

-15

-5

5545

Total 10 30 40 15 5 100

Se cere:a) să se calculeze mediile pe fiecare grupă de vechime şi pe total;b) să se verifice regula de adunare a dispersiilor;c) să se verifice dacă factorul de grupare “vechimea în muncă” este semnificativ;d) să se caracterizeze gradul de omogenitate pe fiecare grupă de vechime şi pe total;e) să se verifice regula de adunare a dispersiilor pentru caracteristica “salariaţi cu salariul

Page 11: Statistica Aplicatii Rezolvate

peste 800 RON”.

Rezolvare:Notăm cu:

xi = vechimea ;yj = salariul ;ni = numărul de salariaţi din grupa de vechime i;nj = număr de salariaţi din grupa de salarii j;nij = număr de salariaţi din grupa de vechime i şi având salariul în grupa j.

a) Calculul mediilor pe fiecare grupă de vechime:

Pentru prima grupă de vechime: i = 1:

Pentru a doua grupă de vechime: i = 2:

Calculul mediei (salariului mediu) pe total:

b) Calculul dispersiilor pe fiecare grupă de vechime:

Analiza statistică a seriilor de distribuţie

Page 12: Statistica Aplicatii Rezolvate

Pentru prima grupă de vechime: i = 1:

Pentru a doua grupă de vechime: i = 2:

Media dispersiilor de grupă:

Dispersia dintre grupe:

Dispersia totală:

Regula de adunare a dispersiilor:

Page 13: Statistica Aplicatii Rezolvate

c) Aprecierea dacă factorul de grupare este semnificativ se face cu ajutorul gradului de determinaţie:

Deoarece putem aprecia că factorul de grupare “vechimea în muncă” nu este semnificativ, el influenţând doar în proporţie de 39,95% variaţia salariului, restul de 60,05% reprezentând influenţa altor factori asupra variaţiei salariului.

d) Aprecierea gradului de omogenitate se face cu ajutorul coeficientului de variaţie:- coeficientul de variaţie pe fiecare grupă de vechime:

- coeficientul de variaţie pe total:

Deoarece atât coeficienţii de variaţie pe grupe de vechime (v1, v2) cât şi coeficientul de variaţie pe total, v, sunt mai mici decât 35%, apreciem că atât fiecare grupă de vechime, cât şi colectivitatea în ansamblul său sunt omogene.

Deoarece v1, v2 v fiecare grupă de vechime este mai omogenă decât colectivitatea în ansamblu.

Grupa a doua de vechime este mai omogenă deoarece are coeficientul de variaţie mai mic.e) Avem o caracteristică alternativă:

- salariaţi cu salariul peste 800 RON;- salariaţi cu salariul sub 800 RON.

Media caracteristicii alternative:- pe fiecare grupă de vechime:

i = 1 : 36,36% dintre salariaţii din prima grupă de vechime

au salariul peste 800 RON

i = 2 : 88,88% dintre salariaţii din a doua grupă de

vechime au salariul peste 800 RON- pe total:

60% dintre salariaţi au salariul peste 800 RON

Dispersiile:- pe fiecare grupă de vechime:

Analiza statistică a seriilor de distribuţie

Page 14: Statistica Aplicatii Rezolvate

i = 1 :

i = 2 :

- media dispersiilor de grupă:

- dispersia dintre grupe:

- dispersia totală:

Regula de adunare a dispersiilor:

0,24 = 0,1716 + 0,0684