Statistica II_seminar03_esantionarea Si Chi2

download Statistica II_seminar03_esantionarea Si Chi2

of 4

description

Statistica II_seminar03

Transcript of Statistica II_seminar03_esantionarea Si Chi2

PAGE 2Statistic II Seminarul 3

EANTIONAREA1. Eantionri aleatorii / probabiliste principiul alegerii aleatorii

a. Eantionare probabilistic tragere la sori;

b. Eantionare prin tragere la sori secvenial tragere la sori dup criterii succesive;

c. Eantionare grupat tragere la sori a unor grupuri dup criterii succesive;

d. Eantionare stratificat populaia este divizat n subpopulaii numite straturi, fiecare cu anumite caracteristici; apoi se extrage cte un eantion din fiecare strat.2. Eantionri nealeatorii / empirice principiul construirii unui eantion cu aproximativ aceeai structur ca a populaieia. Eantionaj prin cote caracteristicile eseniale ale populaiei se gsesc n aceleai proporii i n eantion.Exemplu: Trebuie s constituim un eantion de 1000 de subieci pentru o testare psihologic. Variabilele luate n calcul sunt:

Sex 2 modaliti: S1 = masculin; S2 = feminin;

Vrst 4 modaliti: V1= 18 25 de ani; V2 = 26 40 ani; V3 = 41 55 ani; V4 = peste 55 de ani;

Nivel de studii 3 modaliti: G1 = studii generale; G2 = studii medii; G3 = studii superioare;

Nivel de salarizare 2 modaliti: N1 = salarii mici i medii; N2 = salarii mari.Alctuim un tabel cu un numr de csue care se obine prin nmulirea numrului modalitilor tuturor variabilelor: 2x4x3x2=48. n csue completm cu procentele existente. Mai alctuim un tabel n care completm numrul de persoane n funcie de procentaj i numrul total de subieci (volumul eantionului):N1

N2

V1

V2

V3

V4

V1

V2

V3

V4

G1

S1

3,2

4,6

1,3

2,1

1,1

2,4

3,2

1,6

S2

2,3

2,9

1,9

2,4

0,9

1,2

1

1,2

G2

S1

2,9

2,7

3,5

1,4

2,2

2,7

3,2

2,3

S2

2

2,6

2,7

1,1

2,1

1,7

1,9

1,3

G3

S1

0,9

0,4

0,5

0,2

3,1

4

3,6

2,9

S2

1,2

1,3

0,7

0,5

2,8

3

3,1

2,2

N1

N2

V1

V2

V3

V4

V1

V2

V3

V4

G1

S1

32

46

13

21

11

24

32

16

S2

23

29

19

24

9

12

10

12

G2

S1

29

27

35

14

22

27

32

23

S2

20

26

27

11

21

17

19

13

G3

S1

9

4

5

2

31

40

36

29

S2

12

13

7

5

28

30

31

22

32 = 3,2% * 1000; 46=4,6% * 1000 etc.

Situaia fictiv de cote procentuale n populaie

Efectivele teoretice corespunztoare Vom selecta indivizi pn la atingerea efectivelor stabilite sau valori ct mai apropiate de acestea.

ntruct de obicei cifrele aflate teoretic nu se suprapun pe cele practice, trebuie s vedem dac modelul teoretic difer semnificativ de cel practic. Verificarea se face prin testul de semnificaie a frecvenelor 2 (chi ptrat); facem verificarea numai pentru studii generale G1. foftfo - ft(fo - ft)2(fo - ft)2

ftG1S1N1V130

32

-2

4

0,13

G1S1N1V242

46

-4

16

0,35

G1S1N1V314

13

1

1

0,08

G1S1N1V422

21

1

1

0,05

G1S1N2V113

11

2

4

0,36

G1S1N2V221

24

-3

9

0,38

G1S1N2V331

32

-1

1

0,03

G1S1N2V417

16

1

1

0,06

G1S2N1V122

23

-1

1

0,04

G1S2N1V230

29

1

1

0,03

G1S2N1V315

19

-4

16

0,84

G1S2N1V420

24

-4

16

0,67

G1S2N2V112

9

3

9

1,00

G1S2N2V210

12

-2

4

0,33

G1S2N2V311

10

1

1

0,10

G1S2N2V414

12

2

4

0,33

Total

4,78

Coloana fo reprezint efectivele observate, iar coloana ft reprezint efectivele teoretice. Celelalte coloane reprezint etape de calcul.Totalul reprezint valoarea lui 2 , care are formula:

;

Ipoteza nul H0: distribuia populaiei (observat) coincide cu distribuia ateptat (teoretic);

Ipoteza alternativ H1: distribuia populaiei (observat) nu coincide cu distribuia ateptat (teoretic) sau difer semnificativ de aceasta.

este pragul de semnificaie (n general n statistic se lucreaz cu =0,05 sau 5% i =0,01 sau 1%), care se traduce prin:

pentru 0,05 95% din cazuri;

pentru 0,01 99% din cazuri.

Dac n reprezint numrul de categorii, = n1 poart denumirea de grad de libertate. n exemplul nostru n=16, iar n1=15 indic 15 grade de libertate.

H0 se accept dac valoarea obinut a lui este < dect valoarea lui din tabel corespunztoare lui v i .

H0 se respinge dac valoarea obinut a lui este dect valoarea lui din tabel corespunztoare lui v i .

(Cu alte cuvinte, respingem H0dac corespunztor lui obinut este mai mare dect fixat 0,05 sau 0,01).

Pentru a afla pragul de semnificaie trebuie s ne uitm n tabelul repartiiei 2:

Cutm pe coloan (unde sunt trecute gradele de libertate) valoarea 15.

Acum cutm pe linia lui 15 valoarea cea mai apropiat de 4,78. Aceast valoare este 4,601.

Ne uitm pe coloana acesteia la valoarea din capul de tabel i vedem c este 0,995. Aceasta este mai mare dect oricare din cele 2 valori ale lui , deci acceptm H0. Deci distribuia practic nu difer semnificativ de distribuia teoretic.

b. Eantionare prin uniti tip mprirea populaiei se face dup principalele variabile luate n calcul. Exemplu: se dorete studierea efectul nvrii neajutorate asupra unor subieci cu stim de sine sczut i ridicat, precum i n funcie de vrst. Pentru aceasta este nevoie ca eantionul s cuprind subieci difereniai:

dup categoriile de vrst;

dup nivelul stimei de sine.

Exemplu practic: Metod de eantionare utilizat ntr-o anchet psihopedagogic anchet psihosocial asupra orientrii dup primul ciclu secundar (dup M. Reuchelin Prcis de statistique);1. Definirea populaiei

n aceast anchet populaia de studiat este compus din elevi care frecventau n 1963-64, n Frana, a 3-a clas din ciclul secundar, excluznd elevii care studiaz la coli private sau de specialitate (coli de meserii, licee agricole etc.). Mijloacele disponibile permiteau examinarea a aproximativ 10 000 de elevi.

2. Alegerea modalitii de tragere la sori

a) Stratificarea un factor prea a priori ca fiind legat n mod deosebit de orientarea la sfritului primului ciclu din: tipul de instituie de nvmnt frecventat.

Elevii asupra crora se efectua ancheta erau repartizai n 3 mari tipuri de instituii: licee clasice i moderne (LCM), licee tehnice (LT) i colegii de nvmnt general (CIG).

S-a decis alegerea tipului de instituie ca factor de stratificare a eantionului: LCM i CIG trebuiau s fie reprezentate proporional cu importana lor n populaie; LT, mai puin numeroase, trebuiau reprezentate cu o pondere de 1,5 astfel nct estimrile asupra elevilor acestor instituii s poat fi stabilite ntr-o manier mai sigur. Pentru mprirea global, o pondere invers (2/3) pentru LT trebuia s restabileasc ponderile relative ale celor 3 tipuri de instituii n eantionul total.

Statisticile anului precedent anchetei indicau, pentru populaie, efectivele urmtoare: 123 756 elevi n LCM, 100 263 n CIG i 36.211 n LT. Prin urmare, eantionul trebuia s cuprind o proporie de elevi din LCM egal cu aproximativ 1,25 din proporia elevilor din CIG i, innd cont de ce s-a spus cu privire la LT, un procentaj de elevi din aceste instituii egal cu aproximativ 44% din populaia elevilor din LCM i un pic mai mult dect jumtate din elevii din CIG (54%).

b) Alegerea unitii de eantionaj n interiorul fiecrui strat, 3 uniti de eantionaj puteau fi utilizate: instituia, clasa sau elevul.

Alegerea elevului ca unitate de eantionaj ar fi adus multe dificulti: nu exist o list nominativ a elevilor n clasa a 3-a la nivel naional; tragerea la sori a elevilor ar fi implicat, pentru realizarea anchetei, deplasarea pentru examinarea unuia sau a ctorva elevi ai unei clase.

Alegerea instituiei ca unitate prea, de asemenea, nesatisfctoare mai ales din cauza variabilitii foarte mari a efectivelor instituiilor, mergnd de la 4000 de elevi la mai puin de vreo sut: tragerea la sori a unei instituii mari, ar fi dat o pondere prea mare caracteristicilor elevilor din instituia respectiv.

Prin urmare, s-a reinut clasa ca unitate de eantionare (eantionare grupat), clasele avnd efective cuprinse ntre 15 i 50 de elevi. Dar nu era posibil extragerea direct a claselor deoarece nu exista o list naional care s precizeze pentru fiecare instituie numrul de clase a 3-a pe care le aveau. n final, pentru a evita interogarea directorilor instituiilor de nvmnt cu privire la acest aspect, s-a decis eantionarea pe 2 nivele: instituie i clas.

c) Extragerea instituiilor (primul nivel) pentru extragerea instituiilor din fiecare strat (tip de instituie), s-a plecat de la o list furnizat de Serviciul central de Statistici al Ministerului Educaiei Naionale, indicnd efectivele fiecrei uniti. Instituiile au fost clasate n 5 categorii cu efective n ordine cresctoare: prima categorie cuprindea micile instituii care aveau doar o clas a 3-a, a doua categorie cuprindea instituiile cu 2 pn la 4 clase a 3-a (3 n medie), a treia categorie instituiile cu 6 clase n medie, a patra categorie 9 clase n medie, a cincea categorie n medie 12 clase.

Pentru a evita ca extragerea unor instituii mari n care toate clasele s fie examinate s contribuie cu o parte prea important la eantion, s-a decis extragerea, din fiecare categorie de instituie, un numr de uniti proporionale cu numrul mediu de clase din categorie. Astfel, trebuiau extrase de 12 ori mai multe instituii din a cincea categorie dect din prima, de 3 ori mai multe instituii din categoria a doua dect din prima, etc. Instituiile numerotate prin categorie au fost extrase dup numerele extrase dintr-un tabel de numere aleatorii.

d) Extragerea claselor la al doilea nivel al extragerii nu s-a reinut dect o clas din fiecare instituie, fapt care restabilete proporia elevilor din fiecare tip de instituie, din moment ce n prima categorie toi elevii din clasa a 3-a din instituiile extrase au fost examinai i doar 1/12 din elevii din a 5-a categorie. Pentru instituiile cu mai multe clase a 3-a, clasa a fost aleas prin tragere la sori.

n sfrit, ansamblul procedurii a permis construirea unui eantion de 11 026 de elevi repartizai n 409 clase (4 981 elevi la LCM, 4.099 din CIG, 1 946 din LT). Dup ponderarea efectivului de elevi din LT (2/3) eantionul global reprezentativ cuprindea 10 384 de elevi.

3. Compararea eantionului i populaiei

Pentru a verifica dac eantionul era reprezentativ pentru populaie, s-au realizat comparaii ale procentajelor pentru un anumit numr de caracteristici. Mai jos se afl dou tabele cu repartiiile n procente dup sex i dup categoria socio-profesional a tatlui (factori necontrolai).Sex

E(fo)

Pop (ft)

fo - ft(fo - ft)2(fo - ft)2

ftBiei

51,2

48,4

2,8

7,84

0,16

Fete

48,8

51,6

-2,8

7,84

0,15

0,31

1= 2 1 = 1

2 = 0,31 : Proporia bieilor n eantion este mai mare dect n populaie, totui diferena nu este semnificativ.

2= 9 1 = 8

2 = 11,25 : pentru categoriile socioprofesionale diferena nu este semnificativ, dei se observ c n eantion sunt mai puin patroni, mai multe cadre superioare etc.

Categ. soc-prof.E(fo)Pop (ft)fo - ft(fo - ft)2(fo - ft)2

ft

Agricultor8,78,7000,00

Salariat agricol1,72,0-0,30,090,05

Patron12,014,6-2,66,760,46

Profesii liberale, cadre superioare11,69,91,72,890,29

Cadre mijlocii19,913,46,542,253,15

Angajat6,517,0-10,5110,256,49

Muncitor29,125,33,814,440,57

Personal de serviciu1,91,40,50,250,18

Diverse8,57,80,70,490,06

11,25

PAGE

_1108454026.unknown

_1108475660.unknown

_1108453836.unknown

_1108453953.unknown