Cap4

6
   Notaţii utilizate: R = numărul de unităţi primare din populaţie; r = numărul de unităţi primare selectate în primul stadiu;  N i  = numărul total de unităţi simple (indivizi) din UP i ; n i  = numărul de unităţi simple (indivizi) extrase din UP ; = = R 1 i i  N  N numărul total de indivizi; = = i  N 1  j ij i y T totalul variabilei pentru unitatea primar  ă UP i ; = = i n 1  j ij i y T ˆ  estimatorul totalului variabilei pentru unitatea primar ă UP i; = = i  N 1  j ij y R T totalul variabilei pentru toate u nităţile primare;  ⎠  ⎞ ⎝ ⎛ = = = i n 1  j ij i i r 1 i y n  N r R T ˆ  estimatorul totalului v ariabilei s tudiate. i Y ˆ  estimatorul mediei caracteristicii calculat pentru unitatea primar ă UP i ; Y ˆ  estimatorul mediei caracteristicii la nivelul populaţiei studiate; ) T ˆ ( V  reprezintă variaţia estimatorului totalului variabilei şi stă la baza calcul ării erorii de reprezentativitate. Este definită de următoarea relaţie: = = σ R 1 i 2 i 2 1 ) T T ( R 1  variaţia în populaţie a totalurilor unităţilor primare. Deoarece aceasta nu se cunoa şte se va utiliza estimatorul acesteia: = = σ r 1 i 2 i 2 1 ) T ˆ T ( 1 r 1 ˆ  Sondajul bistadial i 2 ,i 2 r 1 i i i 2 i 2 1 2 n σ  N n 1  N r R  r σ R r 1  R ) T ˆ V( =  ⎠  ⎞ ⎝ ⎛ +  ⎠  ⎞ ⎝ ⎛ =  unde: variaţia dintre UP variaţia din interiorul UP

description

Cap4

Transcript of Cap4

  • Notaii utilizate: R = numrul de uniti primare din populaie; r = numrul de uniti primare selectate n primul stadiu; Ni = numrul total de uniti simple (indivizi) din UPi; ni = numrul de uniti simple (indivizi) extrase din UP ;

    =

    =R

    1iiNN numrul total de indivizi;

    =

    =iN

    1jiji yT totalul variabilei pentru unitatea primar UPi;

    =

    =in

    1jiji yT estimatorul totalului variabilei pentru unitatea primar UPi;

    =

    =iN

    1jijyRT totalul variabilei pentru toate unitile primare;

    =

    ==

    in

    1jij

    i

    ir

    1i

    ynN

    rRT estimatorul totalului variabilei studiate.

    iY estimatorul mediei caracteristicii calculat pentru unitatea primar UPi;

    Y estimatorul mediei caracteristicii la nivelul populaiei studiate; )T(V reprezint variaia estimatorului totalului variabilei i st la baza calculrii

    erorii de reprezentativitate. Este definit de urmtoarea relaie:

    =

    =R

    1i

    2i

    21 )TT(R

    1 variaia n populaie a totalurilor unitilor primare.

    Deoarece aceasta nu se cunoate se va utiliza estimatorul acesteia:

    =

    =r

    1i

    2i

    21 )TT(1r

    1

    Sondajul bistadial

    i

    2,i2

    r

    1i i

    i2i

    212

    n

    Nn

    1NrR

    r

    Rr1 R)TV(

    =

    +

    = unde:

    variaia dintre UP variaia din interiorul UP

  • =

    =iN

    1j

    2iij

    i

    2i,2 )yy(N

    1 variaia din interiorul unitii primare UPi

    =

    =in

    1j

    2iij

    i

    2i,2 )yy(1n

    1 estimatorul variaiei din interiorul unitii primare

    UPi. Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei

    estimatorului valorii totale dup relaia:

    i

    2,i2

    r

    1i i

    i2i

    212

    T n

    Nn1N

    rR

    r

    Rr1 R )T(V

    =

    +

    ==

    Probleme rezolvate

    Problema 1 Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia

    de 18 ani peste de 48000 . Unitile primare sunt reprezentate de seciile de votare (27) i au fost selectate dup un procedeu aleator cu probabiliti egale fr revenire. n tabelul 4.1. sunt prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor din fiecare unitate primar ce a fost selectat n eantion.

    Tabelul 4.1

    Secia nr. pers. din secia i nr. pers.

    selectate din secia i

    venitul mediu (mil lei)

    dispersia dup variabila venit

    nr. pers. care petrec la televizor mai mult de 3 h/zi

    1 2116 43 2.8 0.04 20 2 2430 43 2.5 0.0576 25 3 2268 43 2.6 0.16 24 4 2346 52 3.8 0.09 28 5 1750 42 4.2 0.25 31 6 2386 52 4.1 0.16 36 7 2180 46 3.7 0.1089 28 8 1534 45 3.5 0.01 29 9 1598 42 3.4 0.09 33

    10 2391 52 2.7 0.04 36 11 1295 52 2.9 0.0484 30

    Se cere: 1. S se estimeze venitul mediu din localitate pentru o probabilitate de 0,95. 2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru

    aceeai probabilitate.

    Rezolvare 1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza

    calculelor sistematizate n tabelul 4.2.

    ====

    ==

    =

    r

    1ii

    r

    1iii

    n

    1jij

    i

    ir

    1i

    TrRYN

    rRy

    nN

    rRT

    i

    = 4,730231127 =179239,25 mil lei

  • Tabel 4.2

    Secia Ni ni iY 22 ,i iT 2)( TTi

    i

    i

    Nn

    1 i

    ,i

    i

    ii n

    Nn

    N222 1

    1 2116 43 2.8 0.04 5924.8 509354.714 0.98 4080.44 2 2430 43 2.5 0.0576 6075 317522.005 0.98 7769.85 3 2268 43 2.6 0.16 5896.8 550105.405 0.98 18776.93 4 2346 52 3.8 0.09 8914.8 5181583.08 0.98 9314.52 5 1750 42 4.2 0.25 7350 506245.186 0.98 17791.67 6 2386 52 4.1 0.16 9782.6 9885421.98 0.98 17135.15 7 2180 46 3.7 0.1089 8066 2037782.2 0.98 11013.39 8 1534 45 3.5 0.01 5369 1611607.17 0.97 507.58 9 1598 42 3.4 0.09 5433.2 1452726.18 0.97 5328.19

    10 2391 52 2.7 0.04 6455.7 33412.5164 0.98 4301.96 11 1295 52 2.9 0.0484 3755.5 8311636.58 0.96 1498.25

    Total 22294 512 73023.4 30397397 97517.92

    Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei estimatorului valorii totale dup relaia:

    i

    2,i2

    r

    1i i

    i2i

    212

    T n

    Nn1N

    rR

    r

    Rr1 R

    =

    +

    =

    unde =

    =r

    1i

    2i

    21 )TT(1r

    1 = =10

    30397397 3039739,7

    =

    =r

    1iiTr

    1T = =11

    4,73023 6638,5 mil. lei

    Calculm primul termen al erorii de reprezentativitate indus de selecia din primul stadiu al planului de sondaj.

    Termen1=272

    27111

    117,3039739 =119378868,2

    Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a avut loc n al doilea stadiu, n interiorul unitilor primare ce au format eantionul.

    Termen2= 92,975171127 =239362,8

    Observm c primul termen al variaiei estimatorului are o contribuie substanial n determinarea mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de sondaj trebuie s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se recomand stratificarea unitilor primare.

    012,109378,239362119378868T =+= Intervalul de ncredere al totalului este:

    TT 96,1TT96,1T + 8,200675T7,157802 mil. Lei

    Venitul mediu estimat este:

    734,3NTY == mil. Lei

  • Intervalul de ncredere al venitului mediu este :

    )*96,1T(N1

    NT)*96,1T(

    N1

    TT + 18,4Y287,3

    Garantm cu o probabilitate de 95% c venitul mediu pe o persoan este de cel puin 3,287 mil. lei i cel mult 4,18 mil. lei.

    2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate n tabelul 4.3.

    Tabelul 4.3

    Secia Ni ni mi iw 22 ,i iT 2)( TTi

    i

    i

    Nn

    1 i

    ,i

    i

    ii n

    Nn

    N222 1

    1 2116 43 20 0.4651 0.2488 984.2 75228.67524 0.98 25378.59 2 2430 43 25 0.5814 0.2434 1412.8 23816.57237 0.98 32829.62 3 2268 43 24 0.5581 0.2466 1265.9 54.70016007 0.98 28942.27 4 2346 52 28 0.5385 0.2485 1263.2 22.7172322 0.98 25720.57 5 1750 42 31 0.7381 0.1933 1291.7 1102.383243 0.98 13757.28 6 2386 52 36 0.6923 0.2130 1651.8 154749.1181 0.98 22813.07 7 2180 46 28 0.6087 0.2382 1327.0 4691.155746 0.98 24088.40 8 1534 45 29 0.6444 0.2291 988.6 72838.84794 0.97 11630.56 9 1598 42 33 0.7857 0.1684 1255.6 8.369917026 0.97 9967.70 10 2391 52 36 0.6923 0.2130 1655.3 157484.5118 0.98 22909.85 11 1295 52 30 0.5769 0.2441 747.1 261477.9275 0.96 7555.70

    Total 22294 512 13843.11 751474.9792 225593.60

    Calculm estimatorul totalului variabilei studiate (numrul persoanelor care petrec la televizor mai mult de 3 h/zi

    ==

    ==r

    1ii

    r

    1iii Tr

    RwNrRT = 11,13843

    1127 = 33978,54 pers.

    Eroarea medie de reprezentativitate se va calcula pe baza relaiei:

    i

    2,i2

    r

    1i i

    i2i

    212

    T n

    Nn1N

    rR

    r

    Rr1 R

    =

    +

    =

    unde =

    =r

    1i

    2i

    21 )TT(1r

    1 = =10

    9792,751474 75147,49792

    =

    =r

    1iiTr

    1T = =11

    11,13843 1258,465 pers.

    Termen 1=272

    27111

    11275147,4979 =2951247,191

    Termen 2= 225593,601127 =553729,7456

    Observm c i n acest caz primul termen al variaiei estimatorului are o contribuie substanial n determinarea mrimii erorii de reprezentativitate. stadiu.

    31872,158366553729,74512951247,19T =+=

  • Intervalul de ncredere al totalului este:

    TT 96,1TT96,1T + 37648T30309 persoane

    Cel puin 30309 persoane i cel mult 37648 persoane petrec cel puin 3 ore pe zi la televizor.

    Procentul mediu estimat este:

    0,70789NTw ==

    Intervalul de ncredere al procentului mediu este :

    )*96,1T(N1

    NT)*96,1T(

    N1

    TT + 7843,0p6315,0

    Se garanteaz cu o probabilitate de 95% c cel puin 63,15% i cel mult 78,43% din populaia ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.

    Probleme propuse

    Problema 1 S-a organizat o cercetare n rndul unitilor sanitare(spitale) cu privire la

    atitudinea personaluluimedical fa de reforma sistemului sanitar. Studiul s-a desfurat dup un plant de sondaj bistadial. n primul stadiu din 132 de spitale s-au selectat 12. Numrul de persoane intervievate din fiecare unitate primar ce a format eantionul, precum i informaiile obinute n urma prelucrrii datelor sunt prezentate n tabelul nr. 4.4.

    Tabel 4.4

    Pers. ce consider satisfctoare Unitatea primar

    Personal medical

    Personal medical selectat dotarea cu aparatur

    medical asigurarea cu materiale

    consumabile 1 102 42 38 32 2 245 58 55 50 3 56 30 45 47 4 67 32 27 25 5 98 35 30 28 6 76 33 30 29 7 112 44 40 37 8 145 47 40 38 9 160 50 42 38 10 189 53 48 45 11 79 33 27 25 12 87 34 26 28

    Se cere: 1. S se estimeze cu o probabilitate de 95% procentul personalului medical ce

    consider satisfctoare dotarea cu aparatur medical. 2. S se estimeze cu o probabilitate de 95% procentul personalului medical ce

    consider satisfctoare asigurarea cu materiale consumabile.

  • Problema 2 n rndul studenilor studenilor Academiei de Studii Economice s-a realizat o

    cercetare ce a avut ca obiectiv caracterizarea modului de petrecere a timpului liber. Studiul realizat a avut la baza un sondaj bistadial unitile primare fiind considerate seriile iar unitile secundare studenii. n toate facultile ASE sunt 125 de serii din care au fost selectate 12. n urma prelucrrii datelor s-au obinut inforiile din tabelul 4.5.

    Tabel 4.5

    Seria studeni n serie studeni n eantion

    venit mediu pe lun (mil. Lei)

    studeni care practic sport

    studeni care merg frecvent n

    excursii/drumeii

    1 87 32 2.6 6 12 2 93 34 2.3 9 15 3 78 30 2.5 10 17 4 77 30 2.4 7 18 5 85 32 2.9 8 19 6 88 32 3 9 16 7 94 34 2.7 13 17 8 87 32 2.4 15 15 9 83 32 2.9 9 14

    10 72 30 3 8 17 11 70 30 2.6 7 16 12 75 30 2.7 9 17

    Se cere: 1. S se estimeze venitul mediu/student pentru o probabilitate de 95,45%. 2. S se estimeze procentul studenilor care practic sport si cel al studenilor

    care merg frecvent n excursii pentru o probabilitate de 95%.

    Capitolul 4 Sondajul bistadial