Aplicatii Statistica

12

Click here to load reader

Transcript of Aplicatii Statistica

Page 1: Aplicatii Statistica

Aplicatii Statistica Sociala

I. In cadrul unei gospodarii formata din 7 membri se inregistreaza urmatoarele venituri nete, exprimate in lei: 250, 200, 750, 1004, 1520, 1800, 2300.

Sa se calculeze:1) Venitul mediu net pe membru de familie;2) Mediana.

1) X= (250, 200, 750, 1004, 1520, 1800, 2300)

Observam ca avem distributii simple: f1=f2=f3=….fi=7, deci formula de calcul pentru medie (M sau X barat) este:

M (X barat)= ∑xi /fi

Unde: M (X barat) = media∑= sumaxi= caracteristica, variabilafi= frecventa relativa, nr. observatiilor

X barat = (250+200+750+1004+1520+1800+2300) / 7= 1117, 71 lei

Interpretare: Venitul mediu net pe membru de familie este de 1117,71 lei.

2) Pentru calcularea medianei (Me), in cazul distributiilor simple:

mai intai ordonam termenii in sens crescator sau descrescator:

200,250,750,1004,1520,1800,2300

apoi, suntem atenti sa vedem daca avem nr. par sau impar de termeni:

La noi este numar impar de termeni (7). In acest caz, Me este valoarea termenului din mijlocul seriei: 1004.

Interpretare: Jumatate dintre membrii familiei au un venit mai mare de 1004 lei, iar jumatate dintre ei au mai putin de 1004 lei.

II. In urma unui sondaj de opinie desfasurat intr-o localitate rurala, satenii chestionati au acordat urmatoarele

punctaje pentru implicarea comunitatii in ecologizarea spatiilor publice: 7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8,

7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7.

Care este punctajul mediu obtinut in urma acestui sondaj?

Rezolvare:

Observam ca in total sunt 35 de date strânse, de la cele 35 de persoane chestionate, deci N= 35.

Pentru a organiza datele, utilizând o distributie simpla a frecventei, sunt necesari urmatorii pasi:

1. Transcriem seria:

X = (7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8, 7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7)

2. Se cauta valorile extreme din sirul de date (valoarea cea mai mare: 10; si cea mai mica: 1);

3. Se scriu toate valorile cuprinse între cele doua extreme într-o ordine descendenta pe o coloana;

4. Se numara de câte ori apare fiecare valoare în sirul de date;

5. Se trece apoi în tabel, frecventa de aparitie a fiecarui numar.

În cazul de fata vom avea:

Page 2: Aplicatii Statistica

Caracteristica Xi

frecventa fi

f*x

1 2 2

2 0 0

3 1 3

4 3 12

5 4 20

6 4 24

7 9 63

8 7 56

9 3 27

10 2 20

∑f=35 ∑f*x=227 Observam ca f1#f2#f3#......#fi, deci formula de calcul pentru medie va fi:

In tabel mai adaugam o rubrica si calculam produsul f*x, pentru a obtine ∑f*x Atunci, media:

M (X barat) = 227 / 35 = 6,48 pct.

Interpretare: Punctajul mediu acordat gradului de implicare a comunitatii in ecologizarea spatiului public de catre satenii chestionati din localiatea rurala “…” este de 6,48 puncte.

III. Intr-un bloc se inregistreaza urmatoarea distributie a familiilor dupa numarul de copii pe care ii are fiecare familie: 6 familii nu au copii; 18 familii au un singur copil; 23 familii au 2 copii; 20 familii au 3 copii; 14 familii au 4 copii; 6 familii au 5 copii; 2 familii au 6 copii si o familie are 7 copii.

1) Sa se determine nr. mediu de copii pe familie, pentru blocul respectiv. 2) Sa se calculeze dominanta (Do) si mediana (Me).

Rezolvare:

1) Observam ca avem o distributie ponderata (cu frecvente), pe variante, unde variabila (X) este reprezentata de

numarul de copii;

Construim tabelul si se scriu toate valorile lui X, de la valoarea cea mai mica aparuta in enuntul problemei

(0 copii), pana la valoarea cea mai mare (7 copii), dupa care se trec si frecventele aparitiei fiecarei valori

in parte;

În cazul de fata vom avea:

Page 3: Aplicatii Statistica

Caracteristica

Xi

frecventa

fi

f*x Fi

0 6 0 6

1 18 18 24

2 23 46 47

3 20 60 67

4 14 56 81

5 6 30 87

6 2 12 89

7 1 7 90

∑f=90 ∑f*x=229

In acest caz, vom calcula media (X barat) utilizand formula:

= 229 / 50 = 2,54

Interpretare: Nr. mediu de copii pe familie in acel bloc este de 2,54.

2) Pentru a afla valoarea dominantei (Do) sau modului (Mo): Fiindca avem distributie ponderata (cu frecvente), pe variante, identificam in tabel frecventa maxima a

caracteristicii (f max=23) Apoi, pe aceeasi linie cu ea, vom gasi in coloana din stanga valoarea dominantei - Do (acea valoare a

caracteristicii corespunzatoare frecventei maxime): Do=2.Interpretare: Cele mai multe familii (majoritatea familiilor) din acel bloc au cate 2 copii.

3) Pentru a afla valoarea medianei (Me):

Fiindca avem distributie ponderata (cu frecvente), mai intai trebuie sa calculam Unitatea mediana (U Me):

U Me= ∑fi / 2 = 90 / 2 = 45 Stiind ca Me este acea valoare a caracteristicii (X) pentru care este indeplinita conditia:

Fi≥UMe, avem nevoie sa calculam frecventa relativa cumulata (Fi)

Fi=Fi-1+fiUnde:Fi-1=frecventa relativa cumulata inferioara

Conform conditiei de mai sus (Fi≥UMe) si stiind ca la noi UMe=45, ne ducem in tabel si din coloana lui Fi alegem valoarea mai mare sau egala cu 45, aceasta fiind 47.

Apoi, mergand pe aceeasi linie cu aceasta valoare a lui Fi, vom gasi in coloana caracteristicii (X) valoarea medianei (Me), in cazul nostru Me=2.

Interpretare: Jumatate dintre familiile care locuiesc in blocul respectiv au mai mult de 2 copii, iar jumatate dintre ele au mai putin de 2 copii.

Page 4: Aplicatii Statistica

IV. Distributia, dupa timpul de deplasare spre o anumita locatie a unui esantion de 200 de persoane, este urmatoarea: 25 pers. ajung in maxim 30 minute; 50 pers. intre 30 minute si o ora; 60 pers. intre o ora si o ora jumatate, 45 persoane intre o ora jumatate si 2 ore; 15 persoane intre 2 ore si 2 ore jumatate si 5 pers. intre 2,5 ore si 3 ore.

Sa se calculeze: a) Mediab) Dominanta c) Mediana d) Sa

Rezolvare:

a) Observam ca avem o distributie ponderata (cu frecvente), pe intervale, unde caracteristica/variabila (X) este

reprezentata de intervalul de timp, iar noi alegem ca unitate de masura minutele, deci vom transforma orele in

minute, pentru a transcribe intervalele;

Construim tabelul si se scriu toate valorile lui X, pe intervalele de timp corespunzatoare datelor din

problema, dupa care se trec si frecventele (fi) aparitiei fiecarui interval in parte;

În cazul de fata vom avea:

Caracteristica

xi-1, xi

frecventa

fi

x’i x’i*fi

0-30 25 15 375

30-60 50 45 225

60-90 60 75 450

90-120 45 105 4725

120-150 15 135 2025

150-180 5 165 825

∑fi=200 ∑x’i*fi=8625

Deoarece avem o distributie cu frecvente, pe intervale, pentru a calcula media (X barat) vom folosi formula:

X barat= ∑x’i*fi / ∑fi

Observam ca avem nevoie sa calculam mijlocul intervalului (x’i):

x’i= xi-1+xi / 2

Unde: Xi-1= limita inferioara a intervalului

Xi= limita superioara a intervalului

La noi: x’1=0+30/2=15

x’2=30+60/2=45 s.a.m.d.

Pentru a ne usura munca, trecem in tabel X’i, apoi produsul dintre frecventele relative si mijloacele intervalelor, pentru a putea calcula suma lor (∑x’i*fi).

Acum avem toate datele necesare calcularii mediei:

X barat= ∑x’i*fi / ∑fi

Page 5: Aplicatii Statistica

=8625/200=43,12 minute

Interpretare: Timpul mediu de deplasare a persoanelor respective spre locatie este de 43,12 minute.

b) Pentru calcularea dominantei (Do) sau modului (Mo), in cazul distributiilor cu frecvente, pe intervale, mai intai identificam intervalul modal, care corespunde frecventei maxime (fi):

Caracteristica

xi-1, xi

frecventa

fi

Frecv.cumulata Fi

0-30 25 25

30-60 50 (fi-1) 75 (Fi-1)

60-90 60(fimax) 135

90-120 45 (fi+1) 180

120-150 15 195

150-180 5 200

La noi, f max=60, deci intervalul modal este 60-90. Formula de calcul pt. Do va fi:

Do= xi-1+d(Δ1/ Δ1+ Δ2)

Unde:

xi-1= limita inferioara a intervalului modal (la noi: xi-1= 60)

d=marimea intervalului modal si

d= xi-xi-1

= 90-60=30

Δ1= fi max-fi-1

=60-50=10

Δ2= fi max-fi+1

=60-45=15

Do= xi-1+[d(Δ1/ Δ1+ Δ2)]

=60+[30(10/(10+15)]=60+(30*0,4)=60+12=72 minute

Conditie: valoarea lui Do trebuie sa fie cuprinsa intre limitele intervalului modal.

La noi: 72∈[60,90]

Interpretare: Majoritatea persoanelor (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in 72 minute ( 1h si 12 minute).

c) Pentru calcularea medianei (Me) (a se vedea tabelul de la punctul b)

Fiindca avem distributii cu frecvente, pe intervale, formula de calcul a medianei este:

Me= xi-1+d[(UMe-Fi-1)/fi]

Identificam intervalul median, corespunzator frecventei relative maxime (fi max) La noi, f max=60, deci intervalul median este 60-90 (din tabelul de la punctul b)

Page 6: Aplicatii Statistica

iar UMe=∑fi/2; unde Fi≥UMe, deci avem nevoie sa calculam frecventa relativa cumulata (Fi) in tabel (a se vedea tabelul de la punctul b):

Fi=Fi-1+fiUnde:Fi-1=frecventa relativa cumulata inferioara

Cum la noi UMe=200/2=100, din coloana frecventelor relative cumulate, pentru Fi≥UMe identificam valoarea Fi=135

Acum, putem calcula mediana

Me= xi-1+d[(UMe-Fi-1)/fi]

xi-1=limita inferioara a intervalului median, la noi: xi-1=60

d=marimea intervalului median; la noi: d=x-xi-1=90-60=30

Fi-1= frecventa relativa cumulata inferioara; la noi: Fi-1=75

fi=60

Me=60+30[(100-75)/60]=60+(30*0,41)=60+12,3=72,3 ≈72 minute (1h si 12 minute)Conditie: valoarea Me trebuie sa fie cuprinsa intre limitele intervalului median.

La noi: 72∈[60,90]

Interpretare: Jumatate dintre persoane (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in mai mult de 72 minute, iar jumatate dintre ele in mai putin de 72 minute.

V. Calculati cate zile au absentat in medie studentii unui an de studii:

Caracteristica

xi-1, xi

frecventa

fi

x’i x’i*fi

1-5 25 3 75

6-10 30 8 240

11-15 30 13 390

16-20 20 18 260

21-25 10 23 230

26-30 5 28 140

31- 35 4 33 132

∑fi=124 ∑x’i*fi=1467

Observam ca avem distributii cu frecvente, pe intervale, in acest caz formula de calculare a mediei M(X barat) fiind:

M (X barat)= ∑x’i*fi / ∑fi

Calculam mijloacele intervalelor (x’i): x’i= xi-1+xi / 2 si trecem rezultatele direct in rubrica din tabel, pentru a putea calcula suma mijloacelor intervalelor (∑x’i*fi)

La noi: M (X barat)= 1467/124=11,83≈12 zileInterpretare: Studentii respectivi au absentat in medie 12 zile.

Page 7: Aplicatii Statistica

VI. Calculati dispersia unei populatii pornind de la un sir de date provenite de la un esantion si coeficientul de variatie (v).

X= (13,11,15,12,11)

Caracteristica

Xi

x patrat

13 169

11 121

15 225

12 144

11 121

∑xi=62 ∑x patrat = 780

1) Calculam si media, deoarece stim ca Dispersia reprezinta gradul de imprastiere, de variatie, a elementelor individuale in jurul valorii medii M:

M (X barat)= ∑xi / n= 62/5=12,4

Stiind ca Dispersia, e notata cu:

patrat (sigma) – pentru dispersia populatiei;

s patrat – pentru dispersia esantionului

Pentru a calcula dispersia unei populatii pornind de la un sir de date provenite de la un esantion folosim formula comuna:

patrat = s patrat =[∑x patrat – (∑x) patrat /n] / n-1

n= volumul esantionului (cand esantionul n<30, folosim n-1; cand n≥30, folosim n)

/ = semnul impartirii

In cazul nostru, n= 5, deci:

patrat = (780 – 3844 /5) / 4= [ (3900-3844)/5 ] / 4= (56/5) / 4= 11,2 / 4= 2,8

Interpretare: Populatia noastra prezinta o abatere de variatie (grad de imprastiere) de 2,8 in jurul valorii medii de 12,4.

2) Calculam coeficientul de variatie (v), stiind ca el este un test al reprezentativitatii mediei, utilizand formula:

v = (x barat)* 100

In conditiile in care:

Cand v<17% : colectivitatea este omogena si media aritmetica M (x barat) este strict reprezentativa;

Cand 17 < v <35-40%: media aritmetica M (x barat) este moderat reprezentativa;

Cand v >40%: colectivitatea este eterogena si media aritmetica M (x barat) nu mai este reprezentativa.

La noi: v = (x barat)* 100 = (1,67 / 12,4)*100 =0,13*100 = 13,46

Page 8: Aplicatii Statistica

Observam ca v =13,46; v<17%, deci: colectivitatea este omogena si media aritmetica M (x barat) este strict reprezentativa;

VII. Estimati abaterea standard () a unei populatii pornind de la un sir de date provenite de la un esantion.

X= (13,11,15,12,11,12)

Abaterea standard se noteaza cu: abaterea standard a unei populatii;

s – abaterea standard a unui esantion

Fiindca noi trebuie sa calculam abaterea standard pornind de la un sir de date provenite de la un esantion, vom folosi formula:

= s = radical din [∑x patrat – (∑x) patrat /n] / n-1

Deci, daca stiu valoarea dispersiei, voi extrage radicalul din acea valoare pentru a afla valoarea abaterii standard: radical din 2,8 = 1,67

VIII. Plecand de la datele din tabel, sa se calculeze:1) abaterea medie liniara2) abaterea standard3) dispersia4) coeficientul de variatie

Caracteristica

xi-1, xi

frecventa

fi

x’i x’i*fi xi-M |xi-M | |xi-M |*fi (xi-M) patrat (xi-M) patrat * fi

1-5 25 3 75 -6,83 6,83 170,75 46,64 1166,22

6-10 30 8 240 -1,83 1,83 54,9 3,34 100,46

11-15 30 13 390 3,17 3,17 95,1 10,04 301,46

16-20 20 18 260 8,17 8,17 163,4 66,74 1334,97

21-25 10 23 230 13,17 13,17 131,7 173,44 1734,48

26-30 5 28 140 18,17 18,17 90,85 330,14 1650,74

31- 35 4 33 132 23,17 23,17 92,68 536,84 2147,39

∑fi=124 799,38 8435,72

1) Abaterea medie liniara (d barat), pt. distributiile cu frecvente pe interval, se calculeaza cu formula:

d barat = [∑|xi – x barat|*fi ] / ∑ fi

| |= modul din …

Page 9: Aplicatii Statistica

Trebuie sa calculam media M ( x barat):

M (X barat)= ∑x’i*fi / ∑fi = 1467/124 = 11,83 zile

Apoi, calculam pe rand toti termenii din formula de calcul pt. d barat x1-M= 5-11,83= - 6,83; deci |x1 – x barat|= |-6,83|= 6,83 x2-M=……s.a.m.d.

Apoi: d barat = [∑|xi – x barat|*fi ] / ∑ fi = 799,38/124=6,44

2) Pentru a calcula abaterea standard avem formula:

radical din [∑(xi – x barat) la patrat * fi ] / ∑ fi

= radical din 8435,72/ 124 = radical din 68,03 = 8,24

3) Pentru calcularea gradului de dispersie (variatie) folosim formula:

patrat [∑(xi – x barat) la patrat * fi ] / ∑ fi

La noi: patrat = 8435,72/ 124 = 68,03

4) Pentru calcularea coeficientului de variatie (v):

v = (x barat)* 100

La noi v = (8,24/ 11,83)*100 = 0,69*100= 69,65

Observam ca v > 40%, deci: colectivitatea este eterogena si media aritmetica M (x barat) nu mai este reprezentativa.