Cercetarea prin Sondaj

46
 Capitolul 5 CERCETAREA PRIN SONDAJ 5.1 NECESITATEA FOLOSIRII SONDAJULUI STATISTIC Pentru caracterizarea statistic ă a fenomenelor şi proceselor social- economice de masă în scopul evidenţierii legităţilor specifice acestora, se folosesc date individuale obţinute prin metode de înregistrare totală sau  par ţială. În practică, din diferite motive, pentru anumite colectivit ăţi nu se  poate face înregistrarea total ă a unităţilor ce le compun, fie că ar fi necesitat cheltuieli foarte mari, fie c ă operativitatea obţinerii rezultatelor cercet ării nu este asigurată. Toate aceste considerente şi altele nespecificate, necesit ă tot mai frecvent organizarea unor înregistr ări  par ţiale de tipul sondajelor statistice. În etapa actuală de trecere la economia de piaţă, cercetarea prin sondaj îşi extinde continuu aria de investigare, datorită multiplelor avantaje pe care le prezint ă. Dintre avantajele pe care le prezintă cercetarea prin sondaj, enunţăm pe cele mai semnificative:  în cele mai multe cazuri, când colectivitatea total ă este foarte mare iar cercetarea ei exhaustiv ă ar necesita un volum mare de cheltuieli materiale şi de muncă este avantajos să se recurgă la sondaj, care este mai operativ şi mai ieftin;   partea supusă înregistr ării fiind cu mult mai mică decât cea totală, iar personalul care face înregistrarea unit ăţilor fiind de specialitate, de regul ă, erorile de înregistrare sunt în acest caz mai puţin numeroase şi mai uşor de înl ăturat în faza de verificare a datelor;   programul observărilor prin sondaj cuprinde, de regulă, un număr mai mare de caracteristici decât programul observ ării totale, ceea ce permite caracterizarea mai aprofundat ă a fenomenelor studiate prin metode statistice;  cercetarea prin sondaj este singura posibil ă atunci când prin cercetarea exhaustiv ă a unităţilor s-ar ajunge la distrugerea

Transcript of Cercetarea prin Sondaj

Capitolul 5

CERCETAREA PRIN SONDAJ5.1 NECESITATEA FOLOSIRII SONDAJULUI STATISTIC Pentru caracterizarea statistic a fenomenelor i proceselor socialeconomice de mas n scopul evidenierii legitilor specifice acestora, se folosesc date individuale obinute prin metode de nregistrare total sau parial. n practic, din diferite motive, pentru anumite colectiviti nu se poate face nregistrarea total a unitilor ce le compun, fie c ar fi necesitat cheltuieli foarte mari, fie c operativitatea obinerii rezultatelor cercetrii nu este asigurat. Toate aceste considerente i altele nespecificate, necesit tot mai frecvent organizarea unor nregistrri pariale de tipul sondajelor statistice. n etapa actual de trecere la economia de pia, cercetarea prin sondaj i extinde continuu aria de investigare, datorit multiplelor avantaje pe care le prezint. Dintre avantajele pe care le prezint cercetarea prin sondaj, enunm pe cele mai semnificative: n cele mai multe cazuri, cnd colectivitatea total este foarte mare iar cercetarea ei exhaustiv ar necesita un volum mare de cheltuieli materiale i de munc este avantajos s se recurg la sondaj, care este mai operativ i mai ieftin; partea supus nregistrrii fiind cu mult mai mic dect cea total, iar personalul care face nregistrarea unitilor fiind de specialitate, de regul, erorile de nregistrare sunt n acest caz mai puin numeroase i mai uor de nlturat n faza de verificare a datelor; programul observrilor prin sondaj cuprinde, de regul, un numr mai mare de caracteristici dect programul observrii totale, ceea ce permite caracterizarea mai aprofundat a fenomenelor studiate prin metode statistice; cercetarea prin sondaj este singura posibil atunci cnd prin cercetarea exhaustiv a unitilor s-ar ajunge la distrugerea

STATISTICA

produsului respectiv (de pild, controlul distructiv al calitii unui produs); evaluarea rezervelor subterane de crbune, petrol, gaze naturale etc. nu este posibil dect pe baza unui sondaj statistic; sondajul statistic poate fi folosit la verificarea datelor culese printr-o observare total de mare amploare n care s-au folosit i nespecialiti precum i la prelucrarea selectiv a unor date. De exemplu, datele culese prin recensminte pot fi prelucrate ntr-o prim faz selectiv i mai trziu total; sondajul poate fi utilizat cu bune rezultate n verificarea programului unei observri totale ct i la verificarea unor ipoteze statistice. Avantajele amintite au permis ca metoda selectiv s capete un cmp larg de aplicare n cele mai diferite domenii ale vieii socialeconomice i culturale. Metoda sondajului este folosit cu succes n industrie pentru determinarea productivitii muncii n uniti naturale, n cercetarea calitii produselor se folosete pe scar larg n timpul desfurrii proceselor tehnologice pentru prevenirea rebuturilor, n depistarea cauzelor care provoac fluctuaia forei de munc, n studierea capacitilor de producie, a suprafeelor de producie etc. n comer, sondajul este utilizat pentru testarea acceptrii noilor produse, la studierea aspectelor complexe ale cererii de mrfuri n funcie de variaia factorilor care o influeneaz, precum i la estimarea tendinelor specifice ale activitilor de desfacere a mrfurilor i a prestrilor de servicii ctre populaie. Sondajul statistic se aplic cu rezultate bune i n celelalte ramuri ale economiei naionale, nct se poate spune pe drept cuvnt c aproape nu exist domeniu unde sondajul statistic, datorit avantajelor pe care le prezint, ct i a exactitii rezultatelor s nu fie folosit. Acesta este de fapt i principalul motiv pentru care n ultimii ani n toate rile, cercetrilor prin sondaj li se acord o atenie din ce n ce mai mare att sub raport teoretic ct i din punct de vedere practic.

Cercetarea prin sondaj

5. 2 NOTIUNI SPECIFICE SONDAJULUI STATISTIC Cercetarea parial al crei scop este ca, pe baza rezultatelor prelucrrii datelor obinute, s se estimeze, folosind principiile teoriei probabilitilor, parametrii corespunztori ai colectivitii totale, poart denumirea de sondaj statistic. Cu alte cuvinte, cercetare prin sondaj realizat cu un efort material i uman mai redus are drept rezultat obinerea unor indicatori derivai care permit caracterizarea complet i real a ntregii colectiviti. n vederea atingerii acestui deziderat cercetarea prin sondaj se desfoar n dou etape: prima etap, n care se culeg i se prelucreaz date statistice de la unitile colectivitii generale care au fost incluse n eantion din care rezult indicatori derivai: mrimi relative, mrimi medii, indici etc. care descriu statistic eantionul folosit; a doua etap, n care indicatorii obinui prin prelucrarea datelor din eantion se extind, cu o anumit probabilitate, asupra ntregii colectiviti n scopul caracterizrii acesteia din punct de vedere statistic. Din cele relatate mai sus rezult c noiunea de "cercetare statistic prin sondaj" nu trebuie confundat nici cu noiunea de cercetare statistic total care comport cele trei faze ale cercetrii statistice: culegere, prelucrare, analiz i interpretarea datelor i nici cu noiunea de "observare selectiv" care se rezum doar la culegerea informaiilor de la unitile care alctuiesc eantionul. Cercetarea prin sondaj implic folosirea unor noiuni pereche ca de pild: colectivitate general - colectivitate de selecie; media colectivitii generale - media colectivitii de selecie; dispersia colectivitii generale - dispersia colectivitii de selecie; valoarea statistic calculat - valoarea estimat .a. Colectivitatea general denumit i populaie, este alctuit din totalitatea unitilor simple sau complexe care formeaz fenomenul supus cercetrii. Pentru ca cercetarea statistic s-i ating scopul propus este necesar delimitarea n timp, spaiu i dup volum a acestei colectiviti. Volumul colectivitii generale, din care urmeaz s se extrag unitile n scopul formrii eantionului se noteaz de obicei cu N n cazul unitilor simple i cu R n cazul celor complexe. Dac s-au

STATISTICA

nregistrat i variabile alternative, atunci unitile care posed caracteristica se noteaz cu M. Colectivitatea de selecie (eantion , prob, mostr) reprezint acea parte a colectivitii generale de la care urmeaz s se culeag datele n scopul extinderii rezultatelor obinute din prelucrarea acestora asupra ntregului ansamblu. Volumul colectivitii de selecie se noteaz cu n cnd este format din uniti simple i cu r cnd se refer la uniti complexe. Pentru variabile alternative numrul unitilor care posed caracteristica se noteaz cu m. De remarcat este faptul c dintr-o anumit populaie (colectivitate general) pot fi extrase mai multe eantioane, care s difere ntre ele att ca volum ct i ca structur. Din aceast cauz indicatorii statistici cu care caracterizm colectivitatea de sondaj pot fi considerai de forma unor variabile aleatoare pentru care se pot stabili distribuii de frecvene corespunztoare, spre deosebire de media i dispersia din colectivitatea general studiat, care nu pot lua dect cte o singur valoare pentru condiii date de timp i spaiu. Formulele de calcul ale mediei i dispersiei sunt trecute n tabelul 5.1.Tabelul 5.1Denumirea indicatoruluiA

Caracteristica nealternativ Colectivitatea Colectivitate general de selecie1 2

Caracteristica alternativ Colectivitatea Colectivitate general de selecie3 4

Media

x0 =DispersiaN

xi =1

N

i

Ni

x=2

xi =1

n

i

P=

ni

M N

w=

m n

0 =2

(xi =1

x0)

N

2 =

(x x) 2i =1

n

2 2 = p(1 p) w = w(1 w) p

n

n studiul statistic al fenomenelor se folosete foarte frecvent perechea de noiuni valoare statistic calculat i valoarea estimat. Se consider c valoarea statistic calculat este rezultatul obinut dintr-o cercetare empiric. Aceste valori statistice sunt folosite pentru a

Cercetarea prin sondaj

estima un indicator corespunztor, dar pentru care nu avem date suficiente. Cel mai frecvent aceste noiuni se folosesc n teoria sondajului cnd indicatorii din eantion devin estimatori ai parametrilor corespunztori din colectivitatea general. Pentru ca cercetare selectiv s-i ating scopul propus este necesar o pregtire minuioas a acesteia, pe baza unui plan care s permit obinerea unor informaii ct mai veridice. Un astfel de plan al cercetrii prin sondaj trebuie s cuprind: delimitarea n timp i spaiu a colectivitii generale prin identificarea tuturor cazurilor individuale sub care se manifest fenomenele respective; verificarea gradului de omogenitate al colectivitii generale. Dac exist o observare total anterioar aceasta se poate realiza prin analiza indicatorilor variaiei caracteristicilor eseniale pentru care este necesar s se organizeze mai multe sondaje succesive pentru verificarea gradului de stabilitate a mediei i dispersiei caracteristicilor dup care se va face eantionarea; alegerea sau stabilirea bazei de sondaj. Prin baz de sondaj se nelege orice sistematizare a unitilor colectivitii generale (liste, hri) astfel nct s permit alegerea aleatoare a unitilor ce vor intra n eantion; determinarea mrimii eantionului; alegerea tipului i procedeului de selecie; stabilirea periodicitii efecturii sondajului; stabilirea planului observrii care de regul, este mai bogat dect al unei observri totale similare; stabilirea planului de prelucrare a datelor de selecie din punct de vedere metodologic i organizatoric; analiza, interpretarea, extinderea i prezentarea datelor; trebuie alese procedeele de verificare a semnificaiei indicatorilor de selecie i de extindere a rezultatelor seleciei asupra ntregului ansamblu. Rezolvarea cu competen a problemelor cuprinse n planul de sondaj are drept scop asigurarea reprezentativitii eantionului, de aceasta depinznd n totalitate valoarea rezultatelor obinute n urma cercetrii prin sondaj.

STATISTICA

Un eantion este considerat reprezentativ atunci cnd reproduce n structura sa aceeai structur pe care o prezint i colectivitatea general. Teoria i practica statistic demonstreaz c asigurarea reprezentativitii eantionului presupune respectarea cu strictee a urmtoarelor condiii: includerea n eantion a unitilor n mod obiectiv fr a acorda preferin uneia dintre ele, fiecare unitate fiind extras dup principiul hazardului cu o probabilitate calculabil i diferit de zero; eantionul stabilit s fie suficient de mare ca s permit redarea trsturilor eseniale ale populaiei totale, ceea ce va permite obinerea, pe baza datelor de sondaj, a unor indicatori cu un grad mare de stabilitate; includerea fiecrei uniti n eantion trebuie s se fac independent de alte uniti. De remarcat faptul c, n cazul n care populaia total (colectivitatea general) este mprit n grupe, eantionul trebuie s reproduc o structur corespunztoare acestor componente. Practica sondajului demonstreaz c reprezentativitatea unui eantion depinde n primul rnd, de alegerea corect a procedeelor i tipurilor de selecie. 5.3 PROCEDEE DE SELECTIE FOLOSITE PENTRU CONSTITUIREA ESANTIONULUI

n teoria i practica statistic, la formarea eantionului se folosesc mai multe procedee cunoscute sub denumirea de selecii aleatoare, selecii subiectiv organizate sau selecii dirijate i selecii mixte. Folosirea seleciei aleatoare exclude orice intervenie subiectiv n alegerea eantionului. Acest obiectiv se poate realiza numai dac selectarea unui element dintr-o populaie este aleatoare (ntmpltoare), dac toate elementele populaiei au aceeai ans de a fi alese. n mod analog, eantioanele formate din n elemente sunt aleatoare, atunci cnd selecia a fost fcut la toate eantioanele posibile cu respectarea riguroas a principiilor probabiliste. Selecia aleatoare i

Cercetarea prin sondaj

demonstreaz utilitatea prin faptul c rezultatele obinute pe baza ei pot fi apreciate n termeni probabilistici. Spre deosebire de seleciile probabiliste, n seleciile dirijate alegerea unitilor se face de ctre persoanele care culeg datele. Prezena unui element oarecare care sa favorizeze alegerea subiectiv din partea celui care face observarea, implic riscul producerii unei distorsiuni. Acest lucru trebuie evitat n msura posibilului. Din aceast cauz, acest tip de selecie se folosete mai rar n practic mai ales n situaiile n care se cer rezultate garantate cu o mare rigoare tiinific. Cnd folosirea acestui tip de selecie nu poate fi evitat, este necesar ca iniial s se cunoasc i s se fac o analiz amnunit din punct de vedere calitativ a colectivitii generale, formarea eantionului depinznd de modul n care sunt valorificate corect aceste informaii. Selecia mixt combin principiile sondajului aleator cu ale celui dirijat. n acest caz este necesar ca mai nti s se mpart colectivitatea n grupe tipice dup o anumit caracteristic (de exemplu, personalul dup categoria de ncadrare sau dup calificare etc.) i apoi s se extrag aleator cte un eantion din fiecare grup. Tehnica de selecie n fiecare caz n parte depinde ntr-o mare msur de circumstanele cazului i de resursele observatorului. n practic, seleciile aleatoare (probabilistice) se realizeaz prin mai multe procedee, care deriv dintr-o schem probabilistic corespunztoare rezultatelor obinute prin tragere la sori a unitilor pentru a forma eantionul.5.3.1 Procedeul tragerii la sori

Acest procedeu const n extragerea dintr-o urn a unor bile sau alte obiecte identice reprezentnd fiecare o unitate a colectivitii. Extragerea bilelor din urn se face n dou variante: procedeul seleciei repetate (al bilei revenite); procedeul seleciei nerepetate (al bilei nerevenite). n cazul folosirii procedeului bilei revenite, probabilitatea de includere n eantion a fiecrei uniti este constant (p=1/N) tot timpul ct dureaz operaia de construire a eantionului, iar la sfrit n urn rmn (N-1) uniti.

STATISTICA

n cel de-al doilea caz, procedeul bilei nerevenite, bila odat extras nu se mai introduce n urn, mrind astfel ansa fiecrei uniti rmas de a intra n eantion (p1=1/N ; p2=1/(N-1);... pn= 1/(N-(n-1))). Rezult n acest caz c n urn rmn la sfrit N-n uniti. Datorit faptului c n cazul seleciei nerepetate este exclus posibilitatea extragerii de mai multe ori a aceleiai uniti, erorile sunt mai mici, deci rezultatele obinute au un grad de precizie mai ridicat. Procedeul tragerii la sori se folosete n cazurile n care colectivitatea general cuprinde un numr mai mic de uniti pentru care se pot asigura bile sau alte obiecte identice care s poat fi incluse ntr-o urn.5.3.2 Procedeul tabelului cu numere aleatoare

Tabelele cu numere aleatoare elaborate de Kendall, Smith, Yates etc. au fost ntocmite cu ajutorul unui dispozitiv de amestecat numere. Aceste numere se nscriu n continuare n mod aleator. Tot aleator se stabilete coloana i rndul de unde ncepe citirea lor, n vederea formrii eantionului. Pentru folosirea tabelului cu numere aleatoare este necesar numerotarea unitilor colectivitii generale de la 1 la N i apoi extragerea celor n uniti care formeaz eantionul. De exemplu, considernd c n colectivitatea general sunt 900 uniti i se intenioneaz constituirea unui eantion format din 10% (n=90) se va proceda n felul urmtor: se va alege la ntmplare coloana i rndul din coloana respectiv cu care se va ncepe selecia. Numrul respectiv i numerele aleatoare formate din trei cifre care se vor citi pe coloana respectiv vor fi notate dac sunt cuprinse ntre 1 i 900 i difer de cele reinute anterior i se va renuna la ele dac sunt peste 900. Se continu n felul acesta pn la formarea complet a eantionului (90 uniti).5.3.3 Selecia mecanic

Procedeul seleciei mecanice presupune ordonarea unitilor dup o caracteristic oarecare (ordine alfabetic, numrul de la locuin etc.) prin care s se asigure includerea pe ct posibil intmpltoare a unitilor n baza de sondaj. Operaia de alctuire a eantionului n acest caz este

Cercetarea prin sondaj

precedat de stabilirea pasului de numrare - care trebuie s fie un numr ntreg - calculat ca raport ntre volumul colectivitii generale i volumul colectivitii de selecie (N/n). Prin calculul pasului de numrare se obine mprirea colectivitii generale n grupe de volum egal. Pentru constituirea eantionului se procedeaz n felul urmtor: se selecteaz la ntmplare (prin tragere la sori) o unitate din prima grup la care se adaug succesiv pasul de numrare pn la obinerea celor n uniti ale eantionului. Folosind exemplul precedent, pasul de numrare este egal cu 10 i se procedeaz astfel: din primele 10 uniti, extragem una la ntmplare (prin tragere la sori); presupunnd c am extras unitatea cu numrul trei, adugm succesiv 10 i obinem eantionul format din unitile cu numerele de ordine: 3, 13, 23, 33, ... . Se observ c, n cazul seleciei mecanice, constituirea eantionului nu este pe deplin aleatoare, deoarece fiecare unitate selectat depinde de numrul de ordine al celei precedente. De aceea, selecia mecanic este considerat n literatura de specialitate o selecie cvasialeatoare, caracterul aleator fiind asigurat doar de alctuirea ntmpltoare a bazei de sondaj. Datorit existenei unor baze de sondaj adecvate, selecia mecanic este folosit cu succes n statistica agricol i statistica nivelului de trai. Seleciile dirijate i cele mixte se folosesc n special n sondajele de opinie, n cercetrile sociologice i uneori n studiul cererii de consum a populaiei. n sondajele aplicate la studiul fenomenelor economice unde, de regul, se lucreaz cu un numr mare de uniti este necesar s se elaboreze baze de sondaj, fie cu caracter permanent, fie pentru o singur dat. Baza de sondaj pentru o colectivitate general din care va lua natere eantionul, va trebui, din punct de vedere al organizrii, s aib unitile sale simple sau complexe nscrise ntr-o ordine aleatoare dup un anumit criteriu - alfabetic, teritorial, de timp, etc. - care nu are nici o legtur cu rangul de mrime al valorilor variabilelor luate n studiu. Bazele de sondaj pot fi elaborate de ctre cel ce organizeaz selecia sau pot fi preluate din diferite situaii ntocmite n alt scop. Exemplele cele mai concludente pot fi datele din listele electorale, lista abonailor posturilor telefonice etc.

STATISTICA

O baz de sondaj trebuie s ndeplineasc o serie de condiii, i anume: s fie adecvat scopului urmrit (s cuprind ntreaga populaie); s fie ferit de orice repetiie (fiecare unitate s fie cuprins n baza de sondaj o singur dat); s fie exact; s fie ct mai actual posibil; este convenabil s fie disponibil ntr-un singur centru. n concluzie, o baz de sondaj trebuie s fie complet, constituit pe principiul hazardului i corespunztor scopului propus. 5.4 ERORILE CERCETARII PRIN SONDAJ

n accepiunea cea mai larg, se consider eroare de selecie abaterea care exist ntre valoarea unui parametru (de exemplu, media) calculat prin prelucrarea datelor din eantion i valoarea aceluiai parametru care s-ar fi obinut dac s-ar fi organizat o observare total i ar fi fost prelucrate datele de la toate unitile colectivitii. Erorile ntlnite n cadrul sondajului sunt de dou feluri: erori comune tuturor tipurilor de observri - erori de nregistrare; erori specifice cercetrii prin sondaj - erori de reprezentativitate. Deoarece nregistrarea datelor se face de un personal specializat i pentru un numr restrns de uniti, de regul, n sondaje, erorile de nregistrare apar ntr-un numr mic de cazuri i pot fi nlturate cu uurin printr-un eventual control riguros. Erorile de reprezentativitate specifice sondajului pot fi de dou feluri: erori sistematice i erori ntmpltoare. Erorile de reprezentativitate sistematice pot fi evitate dac se respect ntocmai principiile teoriei seleciei, prin nlturarea cauzelor ce duc la producerea lor. Principalele cauze care pot duce la apariia erorilor sistematice sunt: alegerea deliberat a aa-ziselor uniti "reprezentative"; alegerea la "nimereal" (nu la ntmplare) a unitilor de eantion;

Cercetarea prin sondaj selectarea preferenial a acelor uniti care s duc la

rezultatul dorit de cercettor; substituirea din comoditate a unei uniti de cercetare prin alta

asemntoare; cuprinderea incomplet n sondaj a unitilor, din motive de comoditate. Erorile ntmpltoare de reprezentativitate pot apare chiar dac se respect cu strictee aceste reguli. Ele deriv din nsi esena metodei de cercetare prin sondaj. Prin numrul mic de uniti care alctuiesc eantionul nu se poate reproduce dect ntmpltor identic seria de distribuie a variabilei din colectivitatea general sau parametrii acesteia. Dei nu pot fi evitate, erorile de reprezentativitate, pot fi calculate cu anticipaie dac selecia este probabilistic. Estimarea parametrilor din colectivitatea general se va putea face deci pe baza indicatorilor obinui din prelucrarea datelor de sondaj cu o eroare ntmpltoare de reprezentativitate care se gsete ntr-un anumit interval probabilistic. Rezult deci c fiecrui indicator derivat sau sintetic trebuie s i se ataeze i eroarea sa de reprezentativitate, pentru a putea fi generalizat pentru ntregul ansamblu. n practica sondajului erorile de reprezentativitate se pot calcula ca erori efective i ca erori probabile.

5.4.1 Erori efective. Verificarea reprezentativitii eantionului Erorile efective de reprezentativitate se pot calcula numai pentru caracteristicile la care s-au obinut date i dintr-o observare total. Considernd c i n acest caz media este indicatorul sintetic cel mai reprezentativ, eroarea efectiv de sondaj se calculeaz ca diferen ntre media eantionului i media colectivitii totale. Calculul erorii efective de sondaj nu este altceva dect verificarea gradului de reprezentativitate a unui eantion n raport cu structura colectivitii totale. Practica demonsteaz c numai ntmpltor este posibil reproducerea unei structuri identice cu aceea a colectivitii generale, ceea ce nseamn c eantioanele extrase pot avea grade diferite de

STATISTICA

reprezentativitate. Ca atare, nainte de a se trece la prelucrarea datelor culese se va face verificarea reprezentativitii eantionului. Caracteristicile utilizate la alegerea eantionului prezint, de regul, forme variate de manifestare i de aceea verificarea reprezentativitii eantionului nu este ntotdeauna o operaie uoar. La verificarea reprezentativitii eantionului se pornete de la compararea structurii pe grupe a colectivitii de selecie cu cea a colectivitii generale, denumit i structur programat. n cazul n care aceast structur nu difer cu mai mult de +/- 5% se accept eantionul constituit ca fiind reprezentativ. De exemplu, pentru a verifica gradul de reprezentativitate a unei observri selective privind cererea de consum a unei grupe de populaie se efectueaz dou selecii succesive ce vor fi analizate n continuare. Este tiut c cererea de consum depinde n primul rnd de mrimea veniturilor obinute de grupa respectiv de populaie. Deci, n acest caz, se va folosi drept caracteristic de eantionare, dup care se va alctui colectivitatea de selecie, mrimea veniturilor, n raport cu variaia creia se verific gradul de reprezentativitate a seleciei. Considerm c volumul total al unitilor din grupa respectiv de populaie este de 20.000, c volumul celor dou selecii succesive este de 10% i pe baza centralizrii datelor pe grupe de venituri s-au obinut seriile empirice de distribuie de frecvene, prezentate n tabelul 5.2.

Cercetarea prin sondaj

Distribuia vnzrilor dup marimea veniturilor sptmnale n dou eantioane succesive Tabelul 5.2Grupe de Distribuia numrului de vnztori vnztori colectivitatea n prima selecie n a doua selecie dup marimea general veniturilor frecvene frecvene frecvene frecvene frecvene frecvene sptmnale absolute relative absolute relative absolute relative (mii lei)0 1 2 3 4 5 6

sub 200 200 - 220 220 - 240 240 - 260 260 - 280 280 i peste TOTAL

1000 2400 5600 7400 2200 1400 20000

5,0 12,0 28,0 37,0 11,0 7,0 100,0

60 164 440 840 280 216 2000

3,0 8,2 22,0 42,0 14,0 10,8 100,0

124 260 500 760 240 116 2000

6,2 13,0 25,0 38,0 12,0 5,8 100,0

Comparnd cele dou distribuii de selecie cu distribuia de frecvene a colectivitii generale se pot constata unele abateri care le imprim acestora tendine diferite. n prima selecie, valorile mai mari sunt mai bine reprezentate, pe cnd n cea de-a doua selecie ponderile mai mari sunt ataate valorilor mai mici. Pentru a putea face o apreciere asupra modului n care colectivitatea de selecie reprezint sau nu colectivitatea general, se vor calcula abaterile de structur ale celor dou colectiviti de selecie de la structura teoretic a colectivitii de selecie. Aceste abateri se vor nota cu df i sunt nscrise n tabelul 5.3. n literatura de specialitate, structurii colectivitii de selecie i se mai spune i structura programat, deoarece structura ei este identic cu cea a colectivitii generale, ceea ce face ca eroarea ei de selecie s fie egal cu zero. Selecia teoretic (programat) se obine prin aplicarea frecvenelor relative ale colectivitii generale, la volumul colectivitii de selecie (vezi tabelul 5.2 coloana 1).

STATISTICA

Rezult deci c pe ansamblu abaterile de structur, la acelai volum de selecie, se compenseaz reciproc, deoarece :

df

= 0.

Pentru a putea msura gradul de abatere a structurii seleciei de la structura programat, se va face raportul dintre suma abaterilor de structur pozitive i negative luate n valoare absolut i volumul seleciei (n), adic: df 100 Kf = n unde: K f = coeficientul de realizare a structurii programate a colectivitii de selecie.Verificarea reprezentativitii eantionului Tabelul 5.3

Grupe de vnztori Distribuia numrului de vnztori dup Selecie teoretic n prima selecie n a doua selecie marimea veniturilor Abateri fa Abateri fa de sptmnal frecvene frecvene frecvene de cele frecvene cele teoretice absolute absolute relative absolute teoretice df df e (mii lei)0 1 2 3 4 5 6

sub 200 200 220 220 240 240 260 260 280 280 i peste TOTAL

100 240 560 740 220 140 2000

5,0 12,0 28,0 37,0 11,0 7,0 100,0

60 164 440 840 280 216 2000

d = 0 d = 472f

- 40 - 76 - 120 + 100 + 60 + 76

124 260 500 760 240 116 2000

f

d

d = 0ff

+ 24 + 20 - 60 + 20 + 20 - 24

= 168

Cercetarea prin sondaj

n urma efecturii calculelor se constat c, la prima selecie aproape 1/4 din unitile selectate prezint abateri de la structura programat i n cazul n care nu se vor compensa reciproc vor provoca erori mai mari sau mai mici ntr-un sens sau altul, n timp ce la cea de-a doua selecie, coeficientul de abatere este sub 10%. Este de ateptat ca indicatorii obinui din prelucrarea datelor de selecie de la cea de-a doua colectivitate s estimeze mai bine parametrii respectivi din colectivitatea general. Este suficient s se verifice acest lucru prin calcularea mediilor de selecie i a mediei colectivitii generale: x0 = 241,6 mii leiSelecia Media de selecie (mii lei) Eroarea efectiv de reprezentativitate (d x) dx = xs x0

selecia I

xI = 247,6

d x = 247,6 - 241,6 = 6 mii lei d x = 240,8 - 241,6 = - 0,8 mii lei

selecia II xII =240,8

Pentru a stabili gradul de reprezentativitate a eantionului pe baza erorii medii de selecie se raporteaz aceast eroare la valoarea mediei colectivitii totale:

Selecia

Gradul de reprezentativitatedx % = xs x 0 100 x0

Selecia Idx % =

6 0.100 = +2,5% 241,6 0,8 0.100 = 0,33% 241,6

Selecia IIdx % =

STATISTICA

Deci eantionul al doilea este mult mai reprezentativ dect primul, dei amndou se ncadreaz n intervalul admis (+/- 5%). De cele mai multe ori n cercetarea concret nu se dispune de date cu privire la ntreaga colectivitate, pentru a putea verifica astfel n ce msur media de selecie este sau nu reprezentativ. n cazurile n care media pe ntreaga colectivitate nu este anterior cunoscut este necesar s se efectueze mai multe selecii succesive pentru a verifica gradul de stabilitate a mediei i dispersiei pentru variabila dup care se face eantionarea. n acest caz, eroarea de reprezentativitate se va calcula: dx = x x n care: x - media mediilor seleciilor efectuate pentru verificarea stabilitii ei.

5.4.2 Eroarea medie probabil i eroarea limitDup cum s-a artat, n practic, erorile efective de reprezentativitate nu se pot calcula dect pentru caracteristicile la care se cunosc, pe lng datele din eantion i datele pentru ntreaga colectivitate. Cum de regul, programul observrii este mai amplu ntr-o cercetare selectiv n comparaie cu o observare total similar, nseamn c pentru unele caracterstici nu exist deci posibilitatea de a estima printr-un calcul statistic mrimea erorii de selecie. Cu att mai mult, aceast problem trebuie rezolvat pentru cazul n care metoda selectiv este singura cale de caracterizare statistic a ntregului ansamblu de fenomene de acelai tip. De aceea, concluziile formulate pe baza prelucrrii datelor obinute prin sondaj trebuie s fie considerate ca enunuri probabile obinute ca urmare a aplicrii metodei de selecie aleatoare care permite interpretarea mediei de sondaj ca o variabil aleatoare ce urmeaz la limit o funcie de probabilitate cunoscut, elaborat de statistica matematic. Pornind de la aceste considerente, rezult c ntreaga teorie a sondajului statistic se bazeaz pe principiile teoriei probabilitilor i ale statisticii matematice, de la formarea eantionului i pn la estimarea parametrilor colectivitii totale pe baza datelor din eantion. n teoria seleciei se demonstreaz c dac volumul colectivitii de selecie este suficient de mare, mediile de sondaj urmeaz la limit legea distribuiei din colectivitatea general, iar media de selecie ca

Cercetarea prin sondaj

expresie sintetic a nivelurilor individuale ale tuturor unitilor cercetate, va fi ct mai aproape de media colectivitii generale. n practic ns pentru acelai volum de selecie se pot obine mai multe eantioane extrase succesiv din aceai colectivitate total, obinnd astfel valori diferite ale mediei de selecie. n acest proces de formare a mediilor de selecie fiecare medie poate s apar o singur dat sau de mai multe ori. Se confirm astfel c i media de selecie este tot o variabil aleatoare creia i se poate stabili legea de distribuie. Pentru a putea urmri modul de formare a distribuiei de eantionare a mediei se va lua un exemplu, n care volumul colectivitii generale este de patru uniti (A; B; C; D) din care se vor forma toate eantioanele posibile din cte dou uniti, deci N=4, iar n=2. Dac se efectueaz toate seleciile posibile, folosind procedeul bilei revenite (selecie repetat) se vor obine urmtoarele eantioane, de cte dou uniti: (A+A); (A+B); (A+C); (A+D); (B+A); (B+B); (B+C); (B+D); (C+A); (C+B); (C+C); (C+D); (D+A); (D+B); (D+C); (D+D);. Generaliznd, nseamn c n cazul seleciei repetate se poate efectua un numr de eantioane egal cu Nn, respectiv n exemplul luat 42=16. n cazul seleciei nerepetate (procedeul bilei nerevenite) combinaiile sunt mai puine datorit faptului c aceeai unitate nu poate participa dect ntr-un singur eantion. n exemplul prezentat vor apare urmtoarele combinaii posibile: (A+B); (A+C); (A+D); (B+A); (B+C); (B+D); (C+D). Formula de calcul a numrului de eantioane posibile pentru selecia nerepetat este dat de formula de calcul a combinrilor, aplicat la selecie:n CN =

N! n! ( N n )!

Fiecare eantion va fi definit de o medie i o dispersie calculabil pentru fiecare caracteristic nregistrat, care vor prezenta abateri fa de media i dispersia colectivitii totale. Erorile de selecie obinute ca diferene ntre media de selecie i media general iau valori diferite de la un eantion la altul, ceea ce face necesar calcularea unui indicator sintetic numit eroarea medie de reprezentativitate.

STATISTICA

Pentru a evita compensarea unor erori de sensuri diferite la calculul erorii medii de reprezentativitate se folosete media ptratic a abaterilor, notat cu x

x = x =

s =1

( x s x0 ) 2 n ss =1

k

ns

k

(5.1)

n care : k - reprezint numrul eantioanelor posibile; ns - frecvena mediilor de selecie posibile. Dac se consider media de selecie n sens probabilistic, adic fiecare valoare a sa ca eveniment favorabil fa de toate celelalte evenimente egal posibile, orict am repeta selecia, frecvena de apariie a fiecrei valori a mediei, luat ca frecven relativ, are tendina de a coincide cu probabilitatea de producere a erorii sale fa de valoarea mediei colectivitii generale. n cazul seleciei aleatoare se poate demonstra c pentru o anumit fracie de selecie (n/N), fiecrei valori a mediei de selecie i corespunde o probabilitate de apariie bine determinat, n funcie de mrimea absolut a abaterii sale fa de media colectivitii generale. De aici rezult c mrimea i probabilitile de apariie a diferitelor medii de selecie sunt determinate i de volumul eantionului. Potrivit legii numerelor mari, cu ct eantionul cuprinde un numr mai mare de uniti n raport cu cel al colectivitii generale cu att media de selecie va estima mai bine media pe total. Aceasta corespunde legii numerelor mari, formulat de J.Bernoulli, potrivit creia probabilitatea ca diferena n valoare absolut dintre frecvena relativ f* i probabilitatea p de producere a unui eveniment s fie mai mic dect un numr pozitiv i arbitrar , tinde ctre unu cnd volumul eantionului tinde ctre infinit, adic:n

lim P(17 * p / < ) 1 oricare ar fi > 0

Respectnd cerinele legii numerelor mari, n teoria seleciei se demonstreaz c dac volumul eantionului este suficient de mare (pentru fenomenele monotipice peste 40 de uniti), media de selecie se distribuie potrivit funciei Gauss - Laplace cunoscut n statistic sub denumirea de distribuie normal.

Cercetarea prin sondaj

Distribuia normal este de forma unei distribuii simetrice n care cea mai mare probabilitate de apariie n cazul sondajului o are acea medie de selecie care coincide n valoare cu media colectivitii generale i pentru care eroarea de reprezentativitate este egal cu zero. Fa de aceast valoare central, celelalte valori ale mediei de selecie se distribuie simetric de ambele pri cu probabiliti bine determinate, egale pentru aceeai abatere absolut ntr-un sens sau altul. Fa de probabilitatea maxim, probabilitile de apariie a mediilor de selecie descresc proporional i simetric, ctre capetele distribuiei. Deci se poate spune c probabilitile descresc pe msur ce cresc erorile de reprezentativitate care sunt exprimate n aceleai uniti de msur ca i variabila studiat. Pentru a le elibera de aceast form concret i a le face comparabile pentru orice variabil numeric, abaterile absolute se transform n abateri normale normate: xs x0 = zi x Dac mediile de selecie se distribuie dup legea normal nseamn c i erorile ntmpltoare de reprezentativitate urmeaz aceeai form de repartiie i interpretarea lor se face pe baza proprietilor distribuiei normale (vezi tabelul 5.4), potrivit creia trebuie stabilit intervalul de ncredere, nivelul de siguran i pragul de semnificaie.

STATISTICA

Intervalele de ncredere, nivelurile de siguran i pragurile de semnificaie Tabelul 5.4 Intervalul de ncredere Nivelul de siguran Pragul de semnificaie (%) (%) ( x s z x )0 1 2

( xs x ) ( xs 1,96 x ) ( xs 2 x ) ( xs 2,58 x ) ( xs 3 x ) ( xs 4 x )

68,26 % 95,00 % 95,44 % 99,00 % 99,73 % 99,99 %

31,74 % 5,00 % 4,56 % 1,00 % 0,27 % 0,00 %

Pentru interpretarea modului de formare a erorii de reprezentativitate, pentru o selecie probabilist de n uniti extrase dintro colectivitate general N, a crui volum este suficient de mare i pentru care se poate formula ipoteza c media de selecie se distribuie normal se folosete i reprezentarea grafic (vezi fig. 5.1).

x 3

x 2

x

x

x +

x + 2

x + 3

+

Figura 5.1

Interpretnd graficul se constat c pe diferite intervale de variaie a mediei de selecie, considerate ca intervale de ncredere, se opereaz cu dou noiuni complementare: nivelul de siguran i pragul de semnificaie.

Cercetarea prin sondaj

Dac se efectueaz toate seleciile posibile, intervalul de variaie al tuturor mediilor obinute este acoperit cu suma probabilitilor lor de apariies =1

p s = 1,0; unde k = numrul tuturor mediilor de selecie. Dac

k

se restrnge intervalul de variaie a mediei de selecie, atunci eroarea de reprezentativitate se poate calcula n abateri normale normate ale mediei de selecie de la media colectivitii totale. Aceste intervale de variaie ( x 0 x ; x 0 2 x ; x 0 3 x ;...) sunt garantate ca nivel de siguran cu probabilitile corespunztoare funciei de repartiie normale. Potrivit teoremei formulat de Leapunov probabilitatea ca variabila aleatoare (media de eantionare) s fie cuprins ntre dou limite fixate anticipat, adic: P = ( x s z x ) < x0 < ( x s + z x ) poate fi aproximat cu relaia:

1 2( x ) .

z

Produsul z x este cunoscut sub denumirea de eroare limit

z

e

z2 2

dz = ( z )

x = z x

Coeficientul z reprezint argumentul funciei Laplace i se gsete tabelat. Urmrind valorile probabilitii ( z) , se constat c z crete corespunztor (vezi anexa 2), ceea ce nseamn c, cu ct scade probabilitatea cu att crete intervalul de ncredere al mediei i scade exactitatea cu care se estimeaz media general pe baza mediei de selecie. Calculul erorii medii de reprezentativitate, necesit cunoaterea tuturor mediilor de selecie posibile, frecvenelor corespunztoare lor i a mediei colectivitii generale. n practic ns cercetarea prin sondaj se folosete fie pentru a completa o observare total de mare amploare, fie ca singura posibilitate de caracterizare statistic a fenomenelor respective. n aceste condiii, cunoscnd, de regul, numai media calculat pe baza datelor rezultate de la un singur eantion, pentru determinarea erorii medii de

STATISTICA

reprezentativitate trebuie s se recurg la relaia care exist ntre abaterea medie ptratic ( 0 ) , eroarea medie ptratic de reprezentativitate ( x ) i volumul eantionului. n teoria seleciei se demonstreaz c n cazul seleciei aleatoare repetate ntre cei doi indicatori amintii exist relaia: 2 2 0 = x n de unde: 0 0 x = = n n Se desprinde concluzia c eroarea medie de reprezentativitate este direct proporional cu abaterea medie ptratic a colectivitii generale i invers proporional cu radical din volumul eantionului. Cum abaterea medie ptratic, n anumite condiii de timp i spaiu este un indicator stabil, rezult c marimea erorii medii de selecie poate fi influenat n plus sau n minus prin modificarea volumului eantionului. De regul, urmrindu-se reducerea erorii de reprezentativitate se folosete relaia:

x

k k2 n n cazul seleciei nerepetate numrul de eantioane fiind mai mic datorit faptului c fiecare unitate nu particip dect o singur dat la 2 selecie, relaia 0 = 2 n se transform ntr-o inegalitate deoarece x cmpul de variaie al erorilor de reprezentativitate se micoreaz. n relaiile existente ntre indicatorii variaiei din colectivitatea N n . Cu general i cei de selecie, n acest caz va interveni raportul N 1 acest raport se corecteaz eroarea medie pentru sondajul repetat i se obine formula de calcul a erorii medii pentru sondajul nerepetat:

=

2 0

) ( n N 1 n practic, dac volumul colectivitii generale este foarte mare se renun la (-1) din numitorul formulei i formula de calcul a erorii medii de reprezentativitate devine:

x =

2 0 N n

Cercetarea prin sondaj

n ) (5.4.) N n Pentru caracteristica alternativ, eroarea medie de reprezentativitate se va nota cu w , deci:

x =

2 0

(1

pentru selecia repetat: w =

p(1 p ) np(1 p ) n (1 ) N n

(5.5)

pentru selecia nerepetat w =

Dac nu se dispune de dipersia din colectivitatea general, atunci se poate nlocui cu un estimator al acesteia, adic dispersia de eantion. n acest caz se corecteaz volumul eantionului din formula erorii medii cu un grad de libertate. Calculul erorii medii de reprezentativitate presupune efectuarea unor calcule necesare determinrii erorii limit, ce se poate accepta n cercetarea prin sondaj. Deoarece media sondajului folosit pentru estimarea parametrilor din colectivitatea general poate lua valori mai apropiate sau mai ndeprate de media general, este necesar s se stabileasc mrimea erorii limit. Eroarea limit de reprezentativitate se determin ca o abatere ntre media de selecie i media colectivitii generale, garantat cu probabilitatea corespunztoare limitelor intervalului de variaie. Din formulele prezentate se observ c eroarea limit este o mrime variabil, direct proporional cu probabilitatea cu care se garanteaz rezultatele i invers proporional cu precizia rezultatelor. Eroarea limit se poate mri fie prin modificarea volumului eantionului (n), fie prin modificarea probabilitii cu care se garanteaz rezultatele, deoarece pentru condiii date de timp i spaiu dispersia colectivitii totale este o valoare constant. n concluzie, se poate afirma c eroarea medie i eroarea limit pot fi calculate anticipat dac despre o variabil statistic se cunosc media i dispersia general sau un estimator al acestora i s-a stabilit cu ce volum al eantionului se va lucra i cu ce probabiliti se vor garanta rezultatele. Pentru acelai volum al eantionului se obine o singur eroare medie i

STATISTICA

mai multe erori limit schimbnd coeficientul de probabilitate i pentru acelai coeficient de probabilitate se pot obine mai multe erori limit dac se modific volumul eantionului. Deci, valoarea erorii limit depinde de volumul de selecie i de sigurana cu care se estimeaz abaterea dintre media eantionului i media colectivitii generale. Indicatorii de selecie calculai media, eroarea medie de reprezentativitate i eroarea limit pot servi la estimarea parametrilor din colectivitatea general. n acest scop se folosesc urmtoarele procedee: procedeul coeficientului de corectare a erorilor de nregistrare; procedeul extinderii directe a rezultatelor sondajului la estimarea colectivitii totale. Procedeul coeficientului de corectare a erorilor de nregistrare se bazeaz pe probabilitatea ca erorile depistate n sondajul efectuat s coincid cu aceeai probabilitate ca i pe total. Deci, refcnd nregistrarea la o parte a unitilor selectate aleator se face raportul dintre datele observrii totale i cele de sondaj i coeficientul respectiv se aplic datelor din observarea total. Procedeul extinderii directe este cel mai frecvent utilizat n aplicarea cercetrii prin sondaj ca mijloc de caracterizare a ntregii colectiviti. Aplicarea acestui procedeu permite estimarea intervalului de ncredere pentru nivelul mediu al caracteristicii ct i determinarea limitelor ntre care variaz nivelul totalizat al caracteristicii pe ntrega colectivitate, acest lucru fiind posibil numai n cazul n care se cunoate volumul colectivitii totale (N). De asemenea, pornind de la relaia de calcul a erorii limit se poate determina volumul eantionului. Formulele de calcul difer n funcie de tipul seleciei i de procedeul de selecie folosit i ca urmare formulele de calcul vor fi prezentate n subcapitolul care urmeaz.5.5 TIPURI DE SONDAJ

Tipul de sondaj folosit n studiul fenomenelor social-economice este n funcie de gradul de omogenitate al colectivitatii studiate selectiv precum i de forma de organizare a colectivitii ce formeaz obiectul cercetrii.

Cercetarea prin sondaj

Frecvent n practica statistic se folosesc urmtoarele tipuri de selecii: selecia aleatoare simpl; selecia tipic; selecia de serii etc. n fiecare dintre seleciile prezentate se calculeaz trei indicatori de baz i anume: eroarea medie de reprezentativitate, eroarea limit i volumul eantionului. Pe baza rezultatelor folosite se realizeaz estimarea parametrilor din colectivitatea general. Prezentm n continuare modul de calcul al indicatorilor de selecie pentru principalele tipuri de sondaj ntlnite n statistica socialeconomic.5.5.1 Selecia aleatoare simpl

Practica sondajului demonstreaz c selecia aleatoare simpl poate fi folosit cu succes numai n studierea unor colectiviti monotipice care prezint un grad ridicat de omogenitate. n acest caz, eantionul se formeaz din uniti simple care se extrag din colectivitatea general prin procedeul repetat sau nerepetat pe baza unei scheme probabiliste. Acest tip de selecie dispune de cele mai simple formule de calcul a indicatorilor de selecie care cu unele modificri se folosesc ca baz de calcul i n celelalte tipuri de selecie. Se poate spune pe drept cuvnt c dei acest tip de selecie nu d rezultate bune n cazul colectivitilor neomogene, prezint avantajul c multe din principiile fundamentale ale seleciei pot fi explicate pe baza seleciei aleatoare simple. n aceast situaie sondajul simplu apare ca o variant a procedeului bilei revenite sau nerevenite.

STATISTICA

Intervalul de ncredere al mediei colectivitii generale este determinat de mrimea medie a eantionului i de eroarea limit respectiv, astfel: pentru caracteristica nealternativ: x s x < x0 < x s + x

pentru caracteristica alternativ:

w w < p < w + w n mod asemntor se poate calcula intervalul de ncredere al oricrui alt parametru. Determinarea intervalului de variaie al mediei estimate pe baza datelor de selecie permite i stabilirea intervalului de variaie al nivelului totalizat al caracteristicii care se poate determina dup relaia: pentru caracteristica nealternativ: N( x s x ) < x i < N( x s + x )i =1 N

pentru caracteristica alternativ: N ( w w ) < M < N ( w + w ) Dup cum s-a artat precizia rezultatelor seleciei, posibilitatea extinderii lor asupra ntregii colectiviti depinde i de numrul de uniti la care se face culegerea datelor. Dac se consider, drept criteriu de eficien a sondajului mrimea erorii de estimare a mediei generale, atunci trebuie ca volumul eantionului s corespund relaiei: zx x Pentru determinarea limitei minime a volumului eantionului se ine seama de procedeul de selecie aplicat. Pentru sondajul simplu repetat va fi:

x = z de unde: z 2 2 n = 2 0 x

2 0 n

(5.11)

Cercetarea prin sondaj

Aceast mrime este minim pentru asigurarea gradului de reprezentativitate dorit. Pentru sondajul simplu nerepetat:x = z2 0 n (1 ) n N

de unde: 2 2 z0 (5.12) n= 2 2 z0 2 x + N Comparnd cele dou relaii rezult c pentru acelai grad de reprezentativitate volumul eantionului este cel mai mic dac se folosete procedeul bilei nerevenite. Pentru a urmri tehnica de calcul a indicatorilor de selecie amintii, prezentm datele convenionale din tabelul 5.5 obinute n urma nregistrrii i prelucrrii datelor referitoare la volumul desfacerilor trimestriale la 120 societi comerciale (10% din populaia total). Tabelul 5.5Grupe de societi dup volumul desfacerilor trimestriale (mil lei)A

Numrul societilor1

400 - 410 410 - 420 420 - 430 430 - 440 440 - 450 450 - 460 TOTAL

8 16 22 30 26 18 120

Not: Limita inferioar inclus n intervalDeoarece nu cunoatem dispersia dintr-o cercetare total anterioar, vom folosi dispersia de selecie pentru calculul erorii medii i erorii limit. Efectund calculele am obinut: x s = 433,67 mil lei i2 s = 211,56

STATISTICA

44 = 0,37 120 2 w = w( 1 w ) = 0,37( 1 0,37 ) = 0,2331 Ne propunem s calculm indicatorii de selecie ( x i x , w i w ), n condiiile n care rezultatele vor fi garantate cu o probabilitate p = (z)=0,95 la care corespunde z = 1,96. w=

selecia repetat:2 s

x =

211,56 = 1,33 mil lei n 120 x = z x = 1,96 1,33 = 2,60 mil lei = selecia nerepetat:2 s N n

211,56 1200 120 = = 1,33 mil lei n N 1 120 1199 x = z x = 1,96 1,26) = 2,47 mil lei Se poate aprecia, pe baza probabilitii cu care se garanteaz rezultatele, c n 9500 de cazuri din 10000 posibile, media de selecie se va abate de la volumul vnzrilor din colectivitatea general cu cel mult +2,60 milioane lei n cazul n care eantionul s-a construit dup procedeul bilei revenite i +2,47 milioane de lei cnd eantionul s-a format dup procedeul bilei nerevenite. Eroarea medie i eroarea limit a greutii specifice a societilor comerciale cu un volum al desfacerilor mai mare dect media (n cazul caracteristicii alternative) vor fi:

x =

selecia repetat

w( 1 w ) 0,2331 = = 0,044 n 120 w = z w = 1,96 0,044) = 0,0862 sau 8,6%

w = w =

Cercetarea prin sondaj selecia nerepetat

w = w =

w( 1 w ) N n 0,2331 120 = 1 = 0,042 n 120 1200 N 1

w = z w = 1,96 0,042) = 0,082 sau 8,2%Deci, greutatea specific a societilor comerciale care obin un volum al desfacerilor mai mare dect media, se va abate ntr-un sens sau altul cu + 8,6% n cazul seleciei repetate i cu + 8,2% n cazul seleciei nerepetate, rezultatele fiind garantate cu aceeai probabilitate de 0,95. Rezultatele obinute confirm concluzia formulat teoretic potrivit crei n selecia nerepetat erorile sunt mai mici. Ca urmare a acestui fapt intervalul de ncredere pentru estimarea parametrilor colectivitii generale va fi mai mic, deci rezultatele vor avea un grad de precizie mai ridicat att pentru caracteristica nealternativ ct i pentru cea alternativ. ntr-adevr, folosind procedeul extinderii directe vom obine urmtoarele intervale de ncredere pentru x 0 : selecia repetat x s x < x0 < x s + x 433,67 2,60 < x0 < 433,67 + 2,60 431,07 < x0 < 436,27 mil. lei/s.c. selecia nerepetat xs x < x0 < xs + x 433,67 2,47 < x0 < 433,67+ 2,47 431,20< x0 < 436,14 mil. lei/s.c. Rezult c volumul desfacerilor realizate, n medie, de o societate comercial este cuprins ntre 431,07 milioane de lei i 436,27 milioane de lei n cazul seleciei repetate i ntre 431,20 i 436,14 milioane de lei n cazul seleciei nerepetate. Volumul total al desfacerilor realizate de cele 1200 societi va fi pentru: selecia repetat N ( x s x ) = 1200(433,6 7 2,60)

STATISTICA1200 i =1

517284