redresarea esantioanelor

14
Capitolul 6 Ameliorarea eşantioanelor, o necesitate în sondajele asupra forţei de muncă C A P I T O L U L 6 AMELIORAREA EŞANTIOANELOR, O NECESITATE ÎN SONDAJELE ASUPRA FORŢEI DE MUNCĂ 6.1. UTILITATEA REDRESĂRII EŞANTIOANELOR PROVENITE DIN SONDAJELE ASUPRA FORŢEI DE MUNCĂ Problema asigurării reprezentativităţii eşantionului este o preocupare permanentă a celui care organizează un sondaj. Stabilirea planului de sondaj şi a procedeelor de selecţie a unităţilor în eşantion sunt foarte importante şi se realizează cu multă rigurozitate. Întocmirea chestionarului pe baza obiectivelor stabilite la începutul studiului presupune şi definirea clară a variabilelor. În studiile realizate pe baza sondajelor statistice distingem următoarele tipuri de variabile: variabile de interes. Sunt cele care trebuie estimate şi ţin de obiectivele sondajului. În cazul anchetelor asupra forţei de muncă variabile de interes pot fi de exemplu statutul după participarea la activitatea economică (ocupat, şomer, inactiv) sau durata efectivă a săptămânii de lucru. variabile auxiliare sau de identificare. Sunt cele pe care le cunoaştem din alte surse şi nu formează obiectul studiului prezent dar sunt utilizate în stabilirea planului de sondaj şi ulterior în ameliorarea extrapolării. În cazul anchetelor asupra forţei de muncă informaţiile necesare pentru definirea variabilelor auxiliare se preiau din rezultatele ultimului recensământ sau din surse administrative. Aceste informaţii privesc domiciliul, mărimea gospodăriilor, distribuţia după grupe de vârstă, sex etc. Există două tipuri de 198

description

redresare esantioanelor

Transcript of redresarea esantioanelor

C A P I T O L U L VII

Capitolul 6

Ameliorarea eantioanelor, o necesitate n sondajele asupra forei de munc

C A P I T O L U L 6

AMELIORAREA EANTIOANELOR, O NECESITATE N SONDAJELE ASUPRA FOREI DE MUNC

6.1. Utilitatea redresrii eantioanelor provenite din sondajele asupra forei de munc

Problema asigurrii reprezentativitii eantionului este o preocupare permanent a celui care organizeaz un sondaj. Stabilirea planului de sondaj i a procedeelor de selecie a unitilor n eantion sunt foarte importante i se realizeaz cu mult rigurozitate.

ntocmirea chestionarului pe baza obiectivelor stabilite la nceputul studiului presupune i definirea clar a variabilelor. n studiile realizate pe baza sondajelor statistice distingem urmtoarele tipuri de variabile:

variabile de interes. Sunt cele care trebuie estimate i in de obiectivele sondajului. n cazul anchetelor asupra forei de munc variabile de interes pot fi de exemplu statutul dup participarea la activitatea economic (ocupat, omer, inactiv) sau durata efectiv a sptmnii de lucru.

variabile auxiliare sau de identificare. Sunt cele pe care le cunoatem din alte surse i nu formeaz obiectul studiului prezent dar sunt utilizate n stabilirea planului de sondaj i ulterior n ameliorarea extrapolrii.n cazul anchetelor asupra forei de munc informaiile necesare pentru definirea variabilelor auxiliare se preiau din rezultatele ultimului recensmnt sau din surse administrative. Aceste informaii privesc domiciliul, mrimea gospodriilor, distribuia dup grupe de vrst, sex etc. Exist dou tipuri de variabile auxiliare: demografice i socioprofesionale. Aceste informaii au o dubl utilitate:

Ca date individuale n momentul eantionrii. Pe baza acestor informaii se construiesc bazele de sondaj (lista gospodriilor sau a indivizilor din rndul crora se va selecta eantionul). Ulterior pot avea un rol n verificarea reprezentativitii eantionului sau n extrapolare.

Ca informaii globale, n vederea furnizrii totalurilor populaiei pe grupe de vrst, sex, mediu de reziden. Acestea vor constitui baza extrapolrii. Structura populaiei dup aceste caracteristici ar trebui s se regseasc i n structura eantionului.

n ciuda eforturilor de a asigura reprezentativitatea eantionului, n anchetele de mare amploare, realizate la nivel naional, de cele mai multe ori estimatorii variabilelor auxiliare sunt deplasai fa de parametrii populaiei. Datorit existenei corelaiei dintre aceste variabile i variabilele de interes putem presupune c i estimatorii acestora din urm vor avea aceeai problem.

Principala cauz ce determin acest lucru este faptul c unitatea selectat este gospodria i nu persoana. n aceste condiii este dificil s obinem structura ateptat. Pe de alt parte, EUROSTAT cere ca rezultatele s fie fiabile pentru fiecare regiune (i n viitor pentru fiecare jude). Acest lucru determin o ntrire a subeantioanelor corespunztoare subpopulaiilor de dimensiuni mai mici fapt ce va determina o modificare a structurilor la nivel naional.

n anchetele asupra forei de munc, n momentul selectrii gospodriilor din fiecare centru de cercetare selectate n prima treapt, fiecreia i se acord aceeai probabilitate de a intra n eantion. Conform legii numerelor mari, pentru un eantion de volum mare structura eantionului dup diverse caracteristici va reproduce relativ fidel structura teoretic a populaiei. Cu toate acestea, chiar dac eantionul selectat este echilibrat nu nseamn c aceast proporionalitate se vor respecta i n rndul respondenilor.

Plecnd de la rezultatele brute furnizate de respondeni se estimeaz ct mai bine posibil, prin extrapolare, situaia populaiei. Aceast metod const n atribuirea unei anumite ponderi sau coeficient de extrapolare fiecrui respondent dup cum el reprezint o fraciune din populaie. Pentru a extrapola trebuie s dm fiecrui respondent ponderea sa iniial reprezentat de inversul probabilitii cu care a fost selecionat ( k=1,nr, nr fiind numrul de respondeni) Astfel, dac ntr-un centru de cercetare am decis s selecionm o gospodrie din 500, fiecare individ va avea o probabilitate egal (1/500) de a intra n eantion. Dac o simpl extrapolare ar fi suficient, pentru extinderea rezultatelor n-ar trebui dect s i atribuim fiecrui respondent din centrul de cercetare respectiv un coeficient de extrapolare de 500. Acest lucru nu este posibil deoarece:

unitatea selectat este gospodria, nimic nu ne garanteaz c un individ din 500 va face parte din eantion;

structura populaiei dup variabilele auxiliare (vrst, sex medii de reziden etc) se va regsi n eantion cu o oarecare aproximaie;

mai mult ca sigur c, datorit non-rspunsurilor totale, numrul respondenilor va fi inferior efectivului eantionului selectat iniial.

Datorit acestor cauze este necesar modificarea coeficienilor de extrapolare iniiali avnd drept scop asigurarea preciziei i coerenei valorilor extrapolate.

Mrimea estimatorilor rezultai nu trebuie s fie afectat de bias prin subestimarea sau supraestimarea sistematic. De exemplu lucrtorii pe cont propriu sunt n general mai greu de intervievat fiind subreprezentai printre respondeni i deci i n extrapolarea realizat asupra populaiei totale, atta vreme ct probabilitatea de selecie nu este dependent de statutul profesional. Cu ajutorul unui coeficient de extrapolare corectat pe baza informaiilor din surse administrative se ncearc reducerea biasului.

Este posibil ca prin hazard, n eantionul anchetei din 2004 s selectm un numr mai mic sau mai mare de persoane active ocupate dect ar fi trebuit iar prin comparaie cu eantionul anchetei din 2003 s concluzionm n mod eronat creterea sau scderea ocuprii. Din acest motiv este foarte important asigurarea unui nivel ridicat al preciziei prin redresarea eantioanelor naintea extrapolrii.

Pe de alt parte, dup cum se cunoate din publicaiile rezultatelor anchetei asupra forei de munc, amploarea studiului este foarte mare fiind realizat nu numai pe totalul categoriilor de populaie ce definesc populaia activ i inactiv ci i pe grupe de vrst, sex, mediu de reziden i regiuni. Coerena datelor presupune de exemplu ca valoarea ponderii atribuite respondentelor/respondenilor s coincid cu structura furnizat de sursele administrative.

6.2. Redresarea eantioanelor prin post-stratificarePn nu demult redresarea eantioanelor n vederea extrapolrii se realiza prin post-stratificarea realizat pe baza variabilelor auxiliare.

Variabilele clasice utilizate de obicei n vederea post-stratificrii eantioanelor din sondajele realizate asupra forei de munc sunt:

REG: regiunea de dezvoltare n care locuiete respondentul. Romnia este mprit n 8 regiuni: Nord Est, Sud Est, Sud, Sud Vest, Vest, Nord Vest, Centru, Bucureti.

VRSTA: grupa de vrst creia i aparine respondentul. n ancheta asupra forei de munc se utilizeaz urmtoarele 6 grupe: 15-24 ani, 25-34 ani, 35-44 ani, 45-54 ani, 55-64 ani i peste 65 ani.

MREZ: mediul de reziden Urban sau Rural.

SEX: masculin sau feminin.

Pentru a realiza o post-stratificare dup cele patru variabile auxiliare fiecare respondent va fi clasat ntr-una din cele 8x6x2x2=192 celule numite post-straturi. n fiecare celul h (h=1,192) vom avea un numr nh de respondeni iar unde n este numrul total de respondeni. Pe baza informaiilor din alte surse putem determina distribuia pentru populaia Romniei cu vrsta 15 ani i peste (N) dup cele patru variabile: REG, VRSTA, MREZ, SEX reprezentat de frecvenele Nh unde:. Frecvenele relative ale eantionului sunt date de raportul iar ale populaiei de . Din diferite motive vor exista celule pentru care eantionul respondenilor nereprezentnd fidel populaia Romniei cu vrsta de 15 ani i peste, anumite celule (post-straturi) fiind sub sau supraestimate. n sens strict matematic am putea spune c eantionul nu este reprezentativ pentru populaia din care a fost extras. Totui noiunea (ne)reprezentativ este n general utilizat ntr-un sens mai puin strict. n acest caz se poate pretinde c eantionul este reprezentativ pentru populaie dac toate frecvenele nh sunt nenule i suficient de mari. n felul acesta fiecare combinaie dintre regiune, vrst, mediu de reziden i sex este suficient reprezentat.

Existena unor diferene semnificative statistic ntre frecvenele relative ale eantionului de respondeni i populaie poate avea consecine grave asupra calitii estimatorilor.

Am considerat y o variabil de interes (de exemplu durata sptmnii de lucru). Pe baza anchetei asupra forei de munc urmeaz s se estimeze durata medie efectiv a sptmnii de lucru. Aceast variabil nu este auxiliar i nu dispunem de informaii n ceea ce o privete din alte surse. Calculnd durata medie efectiv a sptmnii de lucru () ca o medie neponderat pe baza datelor din eantion vom obine un estimator deplasat pentru media populaiei din motivele de sub sau supra reprezentare prezentate anterior.

Estimatorul timpului total de munc (N) care va prezenta aceleai neajunsuri se poate scrie sub forma: unde yT reprezint timpul total de munc din eantion.

Din aceast relaie se deduce c pentru a trece de la totalul eantionului la totalul populaiei trebuie s atribuim fiecrui respondent acelai coeficient de ponderare . Se poate spune c n medie fiecare respondent al anchetei reprezint din populaia Romniei cu vrste de 15 ani i peste.

Utiliznd post-stratificarea aceast ponderare nu se va efectua uniform. Fiecare respondent din post-stratul h va primi un coeficient de ponderare de forma cu h=1,..192. n aceste condiii timpul total de munc din populaie YT va fi estimat pe baza relaiei:, iar durata medie efectiv a sptmnii de lucru se va estima pe baza relaiei:

. Practic, fiecare respondent din stratul h reprezint indivizi ce ndeplinesc aceleai caracteristici.

Calitatea estimatorilor obinui prin post-stratificare depinde de msura n care variabilele auxiliare regiune, vrst, mediu de reziden i sex explic variaia variabilelor de interes. Este clar c cele patru variabile sunt explicative pentru un numr foarte mare de variabile de interes totui, n cazul n care se dorete o analiz detaliat sau estimarea unor variabile de interes specifice ele nu mai sunt suficiente. Acest fapt a determinat abandonarea tehnicii clasice de post-stratificare. Modelul de post-stratificare prezentat anterior poate fi prezentat succint sub forma: REG x VRST x MREZ x SEX.

Unul din principalele obiective ale anchetelor asupra forei de munc este acela de a furniza estimatori pentru a cuantifica populaia ocupat, omerii i populaia inactiv conform definiiilor Biroului Internaional al Muncii. Pe baza informaiilor obinute din anchet se poate determina pentru fiecare respondent crei categorii din cele trei enumerate aparine. Consider cele trei variabile de interes yOc, y i yIn definite astfel:

EMBED Equation.3

Cu ajutorul post-stratificrii putem calcula estimatorii pentru populaia ocupat (POc), omeri () i populaia inactiv (PIn) astfel:

Se tie c ntre datele furnizate de sursele administrative i cele ale anchetei asupra forei de munc pot exista anumite diferene determinate de urmtorii factori: de multe ori datele nu se refer la aceeai perioad, definiiile utilizate pentru aceleai noiuni sunt diferite, metodele de estimaie aplicate variaz considerabil.

Una din sarcinile analitilor este de a nelege i a explica diferenele pe de o parte, dar i de a ncerca s mbunteasc modul de colectare a datelor i metodologiile de tratare a acestora. Din acest punct de vedere, metodologiile trebuie descrise ntr-o manier clar i complet recurgndu-se la programe soft care s execute calculele necesare cu exactitate.

Practic, cu ajutorul post-stratificrii se poate realiza o metodologie prin care s se creeze o compatibilitate ntre datele provenite din ancheta asupra forei de munc i cele din surse administrative Pentru aceasta, pornind de la modelul iniial REG x VRST x MREZ x SEX putem aduga alte variabile ajungnd la un model detaliat de forma: REG x VRST x MREZ x SEX x X1 x X2 Noile variabile introduse vor permite ameliorarea estimaiilor.

De exemplu s-ar putea introduce variabila ANOFM definit astfel:

Dac am dori s aplicm modelul REG x VRST x MREZ x SEX x ANOFM am ntmpina urmtoarele dificulti:

Pentru fiecare celul h (h=1,960) trebuie determinat numrul de elemente al post-stratului h. Datorit tehnicii de calcul acest lucru poate fi realizat cu uurin dar este posibil ca anumite celule s fie nule sau s conin un numr insuficient de elemente. n aceste condiii nu vom putea calcula un coeficient de extrapolare sau calitatea estimatorului este ndoielnic.

Nu sunt cunoscute valorile Nh pentru toate celulele.

Datele de care putem dispune sunt de forma REG x ANOFM. Pe baza acestor informaii putem construi un model de forma REG x (VRST x MREZ x SEX + ANOFM). n acest model variabilele utilizate nu se vor mai numi variabile de post-stratificare ci variabile de calibrare.

n momentul n care numrul variabilelor de calibrare este foarte mare nu se vor putea calcula izolat ponderile pentru fiecare celul rezultat din ncruciarea variabilelor. Literatura de specialitate propune diferii algoritmi pentru determinarea unei soluii.

6.3. redresarea eantioanelor prin calibrare generalizatntr-un model de post-stratificare este posibil ca pentru fiecare post-strat h s se defineasc o ecuaie exprimat ca sum a greutilor (ce trebuie calculate) acordate respondenilor din post-stratul h i a cror sum trebuie s corespund cu efectivul populaiei Nh: astfel: unde wh este greutatea acordat respondentului h.

Pentru fiecare post-strat stabilim o astfel de ecuaie n final obinnd un sistem de h ecuaii liniare ce ar trebui rezolvat. Rezolvarea lui duce la mai multe soluii deoarece, pe de o parte acest sistem cuprinde mai multe necunoscute dect ecuaii iar pe de alt parte fiecare individ k nu este cuprins ntr-o singur ecuaie. O soluie particular este obinut impunnd ca toi indivizii din acelai post-strat h s aib aceeai greutate wh astfel nct fiecare va fi tratat n aceeai manier. Ecuaia post-stratului h poate fi formulat astfel:

deci

Pentru a exemplifica diferena dintre stratificare i calarea marginal am luat ca exemplu modelul MREZ x VRSTA cu 2 x 6 = 12 post-straturi..

Populaia (informaii din surse administrative)

Tab. 6.1

MREZVRSTA (ani)

15-2424-3434-4445-5455-6565 i peste 65Total

UrbanN11N12N13N14N15N16N1.

RuralN21N22N23N24N25N26N2.

TotalN.1N.2N.3N.4N.5N.6N

Respondenii anchetei asupra forei de munc

Tab. 6.2

MREZVRSTA (ani)

15-2424-3434-4445-5455-6565 i peste 65Total

Urbann11n12n13n14n15n16n2.

Ruraln21n22n23n24n25n26n1.

Totaln.1n.2n.3n.4n.5n.6n

Coeficieni de redresare (necunoscui, determinai cu ajutorul

post-stratificrii sau a calibrrii):

Tab. 6.3

MREZVRSTA (ani)

15-2424-3434-4445-5455-6565 i peste 65 Total

Urbanw11w12w13w14w15w16

Ruralw21w22w23w24w25w26

Total

Reconstituirea populaiei

Tab. 6.4

MREZVRSTA (ani)

15-2424-3434-4445-5455-65peste 65Total

Urbanw11n11w12n12w13n13w14n14w15n15w16n16N1.

Ruralw21n21w22n22w23n23w24n24w25n25w26n26N2.

TotalN.1N.2N.3N.4N.5N.6N

Compararea celor dou procedee de redresare:

Deoarece sistemul de ecuaii de calibrare are mai multe soluii putem alegea acea soluie care modific cel mai puin coeficienii de extrapolare iniiali. Practic vom cuta acei coeficieni de redresare wk care s verifice sistemul de ecuaii de calibrare i n acelai timp s fie ct mai apropiai posibil de coeficienii de extrapolare ce rezult direct din planul de eantionare ( k=1,nr). Problema general a calibrrii const n ajustarea coeficienilor de extrapolare iniiali i obinerea unor coeficieni de redresare calibrai de forma : unde gk reprezint factorul de ajustare.

Este vorba de urmtoarea problem de optimizare:

unde:

m reprezint numrul de variabile de calibrare iar xkj este valoarea variabilei de calibrare j pentru respondentul k;

Tj reprezint totalul populaiei pentru variabila de calibrare j; G este funcia distanelor definit pe vecintatea convex a lui 1 i care verific urmtoarele condiii:G 0;

G este strict convex;

G este de dou ori continuu derivabil;

G(1)= 0

G(1)= 0;

G(1)= 1.

Teorema funciilor implicite afirm c funcia reciproc F a lui G, definit i continuu derivabil n vecintatea lui 0 satisface condiiile F(0)=1 i F(0)=1. F se numete funcie de calibrare.

Pentru simplificarea explicaiei presupun c problema de optimizare are doar o soluie i o singur restricie i anume:

unde xk este variabila de calibrare iar T reprezint totalul populaiei pentru variabila de calibrare.

Pentru soluionarea problemei de minimizare innd cont de restricie (extreme cu legturi) se recurge la funcia Lagrange definit astfel:

unde ( este valoarea multiplicatorului Lagrange.

Pentru a afla valorile minime anulm derivatele pariale

i obinem urmtorul sistem:

Introducnd kw n prima relaie obinem :

Pe baza acestei relaii putem afla valoarea multiplicatorului Lagrange i ulterior valorile wk.

Exemple de funcii de calibrare

Avem posibilitatea de a alege un criteriu de apropiere ntre coeficienii de extrapolare iniiali i coeficienii de redresare calibrai, deci de a alege o form a funciei distanelor G i implicit a funciei de calibrare F.

Unul din procedeele utilizate presupune s minimizm:

funcia distanelor fiind

Aceast metod se numete liniar deoarece pentru soluionarea problemei de optimizare cu ajutorul multiplicatorilor Lagrange se apeleaz la funcii liniare. Funcia de calibrare, inversa funciei distanelor este definit astfel:

Un alt procedeu utilizeaz urmtoarea funcie de minimizat:

funcia distanelor fiind:

Aceast metod se numete exponenial i postuleaz pozitivitatea coeficienilor de redresare wk. Determinarea acestora necesit rezolvarea unui sistem de ecuaii neliniare. Funcia de calibrare este:

6.4. Programe software utilizate pentru redresarea eantioanelorCalibrarea generalizat a devenit n momentul de fa o metod cunoscut i puternic n mediile de specialitate deoarece, utiliznd informaii auxiliare din diferite surse, reuete s mbunteasc estimaiile sondajelor prin creterea preciziei estimatorilor obinui. Mai mult dect att, calibrarea este utilizat pentru corectarea deplasrii produse de non-rspunsurile totale.

Rezolvarea matematic a problemei de minimizare cu restricii prezentat n subcapitolul precedent necesit un volum mare de calcule cu un nivel ridicat de dificultate. Literatura de specialitate propune diferii algoritmi pentru determinarea soluiei.

Generalized Estimation System (GES)

GES este utilizat de Statstics Canada i este realizat sub programul SAS. Are la baz estimarea pe baza regresiei generalizate (GREG) descris de Strndal, Swensson i Wretman n Model Assisted Survey Sampling, 1992. Aceast metod acoper o clas de estimatori calibrai care cuprinde cei mai utilizai estimatori. Cu toate acestea metoda de calibrare generalizat introdus de Deville i Strndal n 1992 este mai cuprinztoare.

GES este utilizat mpreun cu un alt soft realizat sub SAS, GSAM (Generalised Sampling System). Ambele programe acoper diverse tipuri de sondaj simple sau complexe.

Avantajul GES este deci integrarea calibrrii, a estimrii pentru totaluri, medii, proporii, rapoarte i variaia estimatorilor chiar dac numai pe baza metodei GREG.

Calibrarea n BASCULA

Bascula a fost realizat n Delphi pentru Windows 95 de ctre Nieuwenbroek n 1997 i este utilizat n Olanda. Ca i GES se bazeaz pe metoda regresiei generalizate (GREG). Variaia estimatorilor se bazeaz pe tehnica reeantionrii (balanced repeated sampling BRR)

O particularitate a programului BASCULA este modul n care factorul de ajustare gk este limitat n metoda liniar. Contrar procedurii utilizate de CALMAR i g-CALIB factorii de ajustare nu sunt trunchiai ci mai degrab redimensionai printr-o procedur iterativ. Aceasta este considerat o tehnic de netezire limitat fa de tehnica trunchierii iterative.

CALMAR (Calage sur Marges)

Acest program a fost propus de membrii INSEE (Institut National de la Statistique des Etudes Economiques Frana). CALMAR este realizat sub SAS i are la baz metoda de calibrare generalizat introdus de Deville i Strndal n 1992 concentrat pe calcularea coeficienilor de calibrare wh i a factorilor de ajustare gh. Un instrument central al metodei l constituie funcia distanelor G. Din punct de vedere practic, CALMAR este considerat superior sistemelor prezentate anterior deoarece permite utilizatorilor s limiteze n mai multe moduri flexibilitatea coeficienilor de redresare wk. Din punct de vedere teoretic, deoarece se bazeaz pe metoda calibrrii generalizate, sfera estimatorilor calibrai este mult mai cuprinztoare.

i n Romnia Institutul Naional de Statistic utilizeaz acest pachet program pentru calcularea coeficienilor de ponderare n vederea creterii gradului de precizie al estimaiilor i pentru tratarea non-rspunsurilor totale att n Ancheta asupra forei de munc AMIGO ct i n celelalte anchete n care unitatea de selecie este gospodria sau ntreprinderea.

g-CALIB

A fost introdus de ctre INS (Institut National de Statistique) Belgia, avnd la baz pachetul statistic SPSS. Prima versiune a acestui program a fost realizat de Vanderhoeft i a devenit un instrument performant, aplicabil n situaii diverse i capabil s rezolve probleme complicate de redresare a eantioanelor.

Ca i CALMAR, are la baz metoda de calibrare generalizat introdus de Deville i Strndal n 1992 concentrat pe calcularea coeficienilor de calibrare wh i a factorilor de ajustare gh.

Pachetele program g-CALIB i CALMAR sunt comparabile din punct de vedere al fundamentrii teoretice i al performanelor. Cu toate acestea, din anumite puncte de vedere CALMAR este privit ca fiind n prezent cel mai bun soft n acest domeniu din urmtoarele motive:

Interfaa este foarte prietenoas nefiind necesar ca utilizatorul s fie un expert n metoda calibrrii generalizate;

CALMAR este astfel conceput ca variabilele cantitative i calitative de calibrare s fie transformate automat ntr-o matrice proiectat de program. Acest lucru reduce foarte mult munca de pregtire a fiierelor input de ctre utilizator. Totui, pentru calibrarea variabilelor cantitative utilizatorul CALMAR trebuie s realizeze o transformare a acestora astfel nct s obin un format standard pentru fiierul de intrare;

Detectarea i raportarea erorilor se realizeaz ntr-un mod mai precis i mai eficient dect celelalte pachete program similare.

Luminet D., Vanderhoeft C., Une mthode de calibrage applique aux statistiques de lemploi, Carrefour de lEconomie 2003/7-8A, Bruxelles, pg. 4

Luminet D., Vanderhoeft C., Une mthode de calibrage applique aux statistiques de lemploi, Carrefour de lEconomie 2003/7-8A, Bruxelles, pg. 13.

Luminet D., Vanderhoeft C., Une mthode de calibrage applique aux statistiques de lemploi, Carrefour de lEconomie 2003/7-8A, Bruxelles, pg. 6.

Luminet D., Lenqute sur les Forces de travail: calibrage et autres dveloppements, Statistics Belgium, Working Paper nr. 8, pg. 32

Luminet D., Lenqute op. cit. pg. 33

Luminet D., op. Cit., pg 33

Niculescu-Aron I. G, Redresarea eantioanelor prin post-stratificare i calibrare, Revista de informatic economic, nr. 1/2005, n curs de apariie

PAGE 207

_1156939451.unknown

_1157142984.unknown

_1157208295.unknown

_1164191325.unknown

_1170035062.unknown

_1170035091.unknown

_1167146643.unknown

_1167146875.xlsFoaie1

Populaia (informaii din surse administrative)

MREZVRSTA (ani)

15-2424-3434-4445-5455-65peste 65Total

UrbanN11N12N13N14N15N16N1.

RuralN21N22N23N24N25N26N2.

TotalN.1N.2N.3N.4N.5N.6N

Respondenii anchetei asupra forei de munc

MREZVRSTA (ani)

15-2424-3434-4445-5455-65peste 65Total

Urbann11n12n13n14n15n16n2.

Ruraln21n22n23n24n25n26n1.

Totaln.1n.2n.3n.4n.5n.6n

Coeficieni de redresare (necunoscui, determinai cu ajutorul post-stratificrii sau a calibrrii

MREZVRSTA (ani)

15-2424-3434-4445-5455-65peste 65Total

Urbanw11w12w13w14w15w16

Ruralw21w22w23w24w25w26

Total

Reconstituirea populaiei

MREZVRSTA (ani)

15-2424-3434-4445-5455-65peste 65Total

Urbanw11n11w12n12w13n13w14n14w15n15w16n16N1.

Ruralw21n21w22n22w23n23w24n24w25n25w26n26N2.

TotalN.1N.2N.3N.4N.5N.6N

Post-stratificareCalarea marginal

Calcularea coeficienilor de redresare se realizeaz pe baza ecuaiilor:

de post-stratificarede calibrare

w11=N11/n11w11n11+w12n12+...w16n16=N1.

w12=N12/n12w21n21+w22n22+...w26n26=N2.

..

w26=N26/n26w16n16+w26n26=N.6

12 ecuaii pentru determinarea celor 12 coeficieni de redresare necunoscui.8 ecuaii dintre care 7 independente.

Sistem determinat. Soluie unicSistem nedeterminat. Soluii multuiple.

pentru orice nij nenul.Putem considera soluia wij=Nij/nij

pentru orice nij nenul.

Sistemul poate avea soluii i dac nij=0 atta timp ct nu exist linie sau coloan cu toate valorile nij nule.

Foaie2

Foaie3

_1162727134.unknown

_1164191178.unknown

_1157209194.unknown

_1157209437.unknown

_1157208831.unknown

_1157206570.unknown

_1157206957.unknown

_1157206967.unknown

_1157206620.unknown

_1157206081.unknown

_1157206177.unknown

_1157203537.unknown

_1157149706.unknown

_1156961680.unknown

_1157125984.unknown

_1157142251.unknown

_1156967608.unknown

_1156961611.unknown

_1156961637.unknown

_1156961651.unknown

_1156940748.unknown

_1156940901.unknown

_1156940954.unknown

_1156939551.unknown

_1156706383.unknown

_1156708422.unknown

_1156939298.unknown

_1156707260.unknown

_1156702822.unknown

_1156703296.unknown

_1156702053.unknown