Răspunsuri_Statistica

download Răspunsuri_Statistica

of 71

Transcript of Răspunsuri_Statistica

1 I.Conceptul de statistic. Statistica este tiina care studiaz aspectele cantitative ale determinrilor calitative ale fenomenelor de mas, fenomene care sunt supuse legilor statistice ce se manifest n condiOii concrete, variabile n timp, spaOiu i organizare socio-economic.Apariia i evoluia statistic. Cuvntul "statistica" precum si primele conturari ale conceptului de statistica au patruns n literatura de specialitate abia n secolul XVIII. Elementele concrete de evidenta statistica si au nsa originea n cele mai vechi timpuri. Ca domeniu de activitate, ca metod sau ca tiin statistica a ajuns la stadiul actual de dezvoltare, parcurgnd diverse etape. Prima etap coincide cu apariia primelor forme de eviden. La primele formaiuni statale se consemneaz forme incipiente de eviden a terenurilor, a numruluii micrii naturale a populaiei, a averilor etc., precum i la oraele sumeriene, n China, n Egipt, n Grecia. n Imperiul roman se efectuau nregistrri periodice (census) ale populaiei, se ntocmeau registre fiscale, vamale, cadastrale etc. O alt etap n evoluia statisticii o reprezint delimitarea evidenei statistice de evidena contabil. Evidenele statistice, chiar dac se rezumau la simple consemnri de fapte, ofereau datele necesare pentru informareaorganismelor statului, referitoare la aspectele fiscale, militarei administrative. Faza descriptiv apare odat cu dezvoltarea rapid a vechilor activiti, cu apariia altora, cu extinderea relaiilor comerciale i culturale i corespunde trecerii dela "simple consemnri de fapte", la analiza comparativ a datelor, la "descrierea faptelor" n interaciune. Curentul "descrierea statului" (sec. XII-XVIII) a atins apogeul cnd n Germania s-a format o adevrat coal. Reprezentanii de seam ai acestei coli, Herman Conrig, Martin Smeitzel, Gotffried Achewald etc., au introdus pentru prima dat denumirea de statistic ("status - situaia sau starea social"), au dezvoltat att mijloacele de investigare a fenomenelor sociale i economice, ct i mijloacele de informare a organismelor statale punnd accentul pe determinrile numerice. Faza aritmeticii politice aparine perioadei cnd n Anglia apare o statistic deosebit, cunoscut sub numele de "aritmetic politic". Aceasta se ocupa cu analiza, prin procedee matematice de prelucrare a datelor culese, cu desprinderea regularitilor i chiar cu formularea previziunilor. Astfel, John Graunt pune n eviden legiti ale populaiei i fenomenelor demografice; Wiliam Petty (printele economiei politice moderne) a utilizat metode cantitative de studiere a fenomenelor economice i sociale; Edmund Halley s-a preocupat de estimarea numrului populaiei, a elaborat prima tabel de mortalitate i a introdus conceptul de durat probabil de via. Faza probabilistic apare n disputa dintre curentul descriptiv i cel al aritmeticii politicei n care a triumfat ultimul. Odat cu dezvoltarea opticii numerice, denumirea de aritmetic politic se substituie cu denumirea de statistic i capt o nou dimensiune prin introducerea calculelor probabiliste. n acest context menionm formularea legii numerelor mari, desprinderea altor regulariti i legiti statistice. Dintre reprezentanii de seam ai acestei faze amintim: J. Bernoulli, P. S. Laplace, K.F. Gauss, S.D. Poisson, A. Quetelet, A. Ciuprov, D.P. Joravski etc. Faza statisticii moderne apare ctre sfritul secolului trecut. Un rol deosebit n aceast etap l-a avut nfiinarea oficiilor naionalei internaionale de statistic, organizarea congreselor internaionale de statistic, apariia primelor reviste de specialitate, introducerea statisticii n nvmntul universitar i secundar. n aceast etap F. Galton, K. Pearson, M.G. Kendall, F.Y. Edgeworth, A.L. Bowley, G.U. Yule, C.E. Spearmen, R.A. Fisher etc., au fundamentat teoriai practica corelaiei statistice, a analizei factoriale, a experimentelor statistice. S-au abordat n mod deosebit problemele de repartiie, specificaie i estimaie. 2 Domeniile statisticii. Geografie i mediul nconjurtor Populaie Fora de munc Venituri i cheltuieli ale populaiei Preuri Locuine nvmnt i tiin Ocrotirea sntii Protecia social a populaiei Cultur i sport Turism Justiie Conturi naionale Industrie Resurse energetice i de combustibil Agricultur Investiii n capital fix i construcii Transporturi Tehnologii informaionale, pot i telecomunicaii Comer exterior Comer interior de bunuri i servicii Finane Statistica gender Statistica regional Statistica internaional Standardul Special de Diseminare a Datelor (SDDS) Legea statisticii. (*) Metodologia statistic. Obiectul de studiu al statisticii l constituie fenomenele i procesele care prezint urmtoarele particulariti:Se produc ntr-un numr mare de cazuri (sunt fenomene de mas); Variaz de la un element la altul; Sunt forme individulae de manifestare n timp i n spaiu; Urmrind etapele oricrui proces de cunoatere, pentru rezolvarea problemelor care fac obiectul su de studiu, statistica, ca orice tiin, i-a elaborat procedee i metode special de cercetare, cum sunt cele ale observrii de mas, ale centralizrii i gruprii, procedee i modele de analiz i interpretare statistic. Putem spune c metoda statisticii este constituit din ,, totalitatea operaiilor, tehnicilor, procedeelor i metodelor de investigare statistic a fenomenelor ce aparin unor procese de tip stohastic.

II.Observarea statistic Observarea statistic ( culegerea datelor statistice)contituie prima etap n demersul metodologic al statisticii, reprezint un proces complex de identificare, msurare i nregistrare a fenomenelor de mas, de tip colectiv, n forma lor individual i concret de manifestare. 3 Principii de baz ale observrii statistice. Formarea informatiei statistice are ca punct de plecare observarea statistica. realizarea unei observari statistice presupune respectarea unor principii riguros urmarite, dintre care subliniem n mod deosebit: Asigurarea autenticitatii datelor si eficienta procesului de observare. Asigurarea autenticitatii datelor reprezinta principiul de baza al observarii statistice de respectarea acestui principiu depinde autenticitatea informatiei statistice si, implicit, calitatea deciziei. respectarea acestui principiu presupune asigurarea concordantei dintre datele nregistrate si dimensiunea reala a fenomenului observat si cere ndeplinirea conditiei de volum si a conditiei de calitate pentru toate datele obtinute prin observare statistica. ndeplinirea condiiei de volum Asigur intrarea n aciune a legii numerelor mari; o informaie insuficient ca volum nu va permite manifestarea legii numerelor mari pe seama creia s aib loc compensarea influienei factorilor aleatori, iar prelucrarea datelor nu va duce la descoperirea legitilor obiective. Condiia de calitate. Condiia de calitate cere obinerea unei informaii cu un coninut real, care s reflecte realitatea aa cum este; nerespectarea acestei condiii conduce la erori de nregistrare. Obinerea informaiei n timp util. Obinerea informaiei n timp util; obinut cu ntrziere, o informaie, dei corespunztoare ca volum i calitate, nu mai poate fundamenta o decizie care s asigure conducerea i orientarea eficient a unei activiti. Eficiena procesului de observare. Eficiena procesului de observare; presupune culegerea numai acelor date care s duc la obinerea informaiei necesare asupra colectivitii observate. Datele inutile fac ineficient procesul observrii care, chiar n condiiile unei nregistrri selective a unei colectiviti, solicit fore umane mari i cheltuieli materiale i bneti apreciabile. Surse de date statistice n procesul de elaborare a statisticilor demografice sunt utilizate urmtoarele surse de date: Surse administrative: Ministerul Tehnologiilor Informaionale i Comunicaiilor (ntreprinderea de Stat Centrul Resurselor Informaionale de Stat Registru); Ministerul Afacerilor Interne (Biroul Migraie i Azil); Ministerului Justiiei (Serviciul Stare Civil); Ministerului Sntii (Centrul Naional de Management n Sntate); Sistemul Informaional Automatizat Migraie i Azil (SIAMA). Date statistice: Recensmintele populaiei; Cercetrile selective asupra gospodriilor populaiei (Ancheta Forei de Munc, Cercetarea Bugetelor Gospodriilor Casnice); Cercetrile speciale. Perfecionarea statisticii demografice n Republica Moldova nu poate fi efectuat fr utilizarea datelor Registrului de Stat al Populaiei i ale altor surse administrative. De aceea, este stringent necesar interaciunea dintre Biroului Naional de Statistic i alte autoriti publice centrale i locale, care colecteaz i administreaz date cu caracter personal. Publicaii. Rapoarte. 4 5 Tipuri de observri statistice observare direct se face prin contactul direct cu unitile de observat. observare pe baz de documente presupune prelucrarea de date din evidena tehnico-operativ,contabil, statistic Conceptul de eroare n statistic, modaliti de eliminare a erorilor. n procesul nregistrrii datelor pot aprea diferene ntre valorile reale i cele nregistrate pe formular, care poart denumirea de erori de observare. Erorile de observare pot fi: erori de nregistrare i erori de reprezentativitate. Erorile de nregistrare sunt prezente tuturor formelor de observare statistic i se ntlnesc ca erori ntmpltoare i erori sistematice. Erorile ntmpltoare de nregistrare provoac abateri , n sensul mririi sau micorrii nivelului real al fenomenului., pot surveni , de cele mai multe ori, din neatenie . Acest gen de erori efctueaz n mic msur calitatea datelor datorit faptului c se produc n mabele sensuri i pe ansamblu se compenseaz. Erorile sistematice denregistrare produc abateri semnificative, de regul ntr-un singur sens de la realitatea observat. Producerea acestor erori se datoreaz nerspectrii sau nenelegerii principiilor de culegere a datelor. Erorile sistematice se pot datora i unor greeli de metodologie, de concepere a cercetrii, de ex. Delimitarea imprecis a colectivitii i unitilor ei, etc. Pentru a evita producerea erorilor de observare se recomand: Formularea i transmiterea de instruciuni clare. Este indicat s fie menionate cazurile n care riscul apariiei erorilor este mai mare. Elaborarea de formulare complete n care s specifice cu mult claitate ce anume trebuie s se nregistreze. Stabilirea unor ,,chei de control i posibilitatea folosirii lor n cadrul formularului de nregistrare. Efectuarea unor observri de prob. III.Metode de prelucrare a datelor statistice. Programul prelucrrii datelor statisitice Prelucrarea primar cuprindeoperaii de clasificri, de grupri, de comparri, de prezentare sub form de tabele, grafice sau serii statistice. Prin efectuarea acestor operaii se realizeaz sintetizarea datelor individuale la nivelul grupelor sau claselor, se calculeaz indicatori absolui i/sau relativi, se prezint sintezele efectuate prin tabele, grafice sau serii statistice.Sintetizarea datelor individuale la nivelul grupelor sau claselor i apoi la nivelul colectivitii, este nsoit de o pierdere inevitabil de informaii, deoarece se elimin ceea ce este neesenial i ntmpltor. n acelai timp se ctig sub aspectul obinerii unei noi informaii, sintetice, care nu pot fi obinute direct din datele primare (structura colectivitii, tendina central etc.).Rezultatele operaiilor de prelucrare primar suntelementele de intrare pentru prelucrarea secundarnurmacreia se estimeaz valori tipice, omogenitateai asimetria distribuiilor, intensitatea legturilor dintrefenomenul analizat i factorii si de influen etc. n cazul n care scopul cercetrii declanate necesit un volum mare de operaii, diverse, de prelucrare este necesar s se elaboreze, de la caz la caz, planuri de prelucrare informatic a datelor. Agregarea, centralizarea simpl, centralizarea pe grupe. Gruparea/clasificarea datelorstatistice culese este nsoit sau precedat de operaii de centralizare/agregare n scopul obinerii unor indicatori sintetici absolui. Dup nivelul la care se execut operaiile de centralizare / agregare se disting:centralizarea/gruparea simpl: se efectueaz la nivelul colectivitii negrupate, nestructurate;6 centralizarea/agregarea pe grupe: se efectueaz la nivelul grupelor n care a fost structurat colectivitatea. ntr-o clasificare/agregare ierarhic agregarea datelor individuale se face succesiv n concordan cu nivele (treptele) acesteia pn se ajunge la nivelul ntregului ansamblu. 3.Alegerea i utilizarea caracteristicilor de grupare.,felurile gruprilor statistice. (*) IV.Metode de prezentare a datelor statistice Tabele statistice: tabel cronologic, tabel teritorial, tabel cu dubl intrare, tabel de asociaie. Una dintre cele mai adecvate modaliti de prezentare a datelor statistice o reprezint forma tabelar, deoarece ea permitecaracterizarea structurii colectivitii (populaiei) investigate, a legturilor dintre grupele sale tipice etc. Tabelul statistic (TS) este format dintr-o reea adecvat de linii paralele orizontale i verticale n care sunt ncadrate datele, cuprinde i una sau mai multe serii statistice. Tabelul statistic este elaborat cu dublu scop: pentru sistematizarea datelor n vederea prelucrrii i obinerii indicatorilor sintetici; pentru prezentarea rezultatelor prelucrrii primare i secundare. Regulile de construire a tabelelor, subiectul i predicatul tabelelor Oricare ar fi destinaia TS el trebuie s fie elaborat dup anumite reguli de coninut i de form, trebuie s aib anumite elemente obligatorii i anume: *subiectul TS.Acesta este reprezentat de colectivitatea sau eantionul la care se refer datele; * predicatul TS. El se refer la sistemul de caracteristici primare sau derivate ale cror valori individuale sunt sistematizate; *macheta TS. Aceasta este format din reeaua de rnduri i coloane n care se nscriu n modordonat datele, titlul general, titlurile interioare (se nscriu n capetele rubricilor), notele explicative i sursa datelor. n funcie de scopul analizei i al prelucrrii, n teoria i practica statistic, se elaboreaz i se utilizeaz o multitudine de tabele statistice.Dintre acestea evideniem urmtoarele: -*tabele simple, descriptive. Acestea sunt elaborate pentru prezentarea indicatorilor statistici ai unitilor complexe investigate, ordonai din punct de vedere cronologic, teritorial sau organizatoric; * tabele utilizate n prelucrare.Acestea sunt instrumente intermediare utilizate pentru parcurgerea unor algoritmi de calcul; *tabele de prezentare a datelor statistice structurate pe grupe/clase de variaie; * tabele de contingen. Acestea sunt tabele cu dubl intrare. O form particular a tabelului de contingen este tabelul de asociere de tip 2 x 2 Acesta prezint repartiia unitilor dupdou caracteristici alternative corelate ntre ele. Serii statistice: Serii de repartiie unidimensionale, serii de repartiie bidimensionale, serii dinamice, serii de spaiu. Seriile statistice reprezint o alt modalitate de prezentare a datelor.Seria statistic, ca rezultat al sistematizriii/sau gruprii, definete corespondena dintre dou iruri de date statisticen care primul reprezint variaia caracteristicii urmrite, iar al doileair cuprinde frecvenele de apariie a variantelor caracterisiticii. Seriile de repartiie(de distribuie) sunt elaborate atunci cnd caracteristica urmrit este numeric (cantitativ).Seriile cronologice (de timp sau dinamice) prezint evoluia n timp a unui fenomen sau descrie un anumit proces.Seriile teritoriale(sau de spaiu) prezint variaia teritorial a caracteristicii analizate. n aceste serii valorile caracteristicii se refer la unitile teritoriale din care fac parte. n mod frecvent aceste serii se 7 obin dup criterii administrativ-teritoriale, ceea ce nseamn c n cadrul acestora spaiul este variabil, iar timpul i structura organizatoric sunt considerate fixe. Seriile teritoriale sunt reprezentate grafic cu ajutorul hrilor sau sub form de cartograme sau cardiograme.Seriile descriptive sau enumerative se prezint sub form de liste a unitilor dup o anumit caracteristic. 8 Principii i reguli de reprezentare grafic. Grafica statistic se utilizeaz n scopulvizualizrii mrimiiivariaiei independentei/sau interdependente a datelor, n scopul popularizrii acestora sau pentru a facilita desfurarea unor operaii de prelucrare, previziune i planificare. Elementele de grafic statistic se aleg n funcie de specificul fenomenelor analizate, de relaiile dintre datele care pot fi vizualizate. Deci, prin grafica statistic nu se ilustreaz att datele n sine ctproporiilei rapoartele dintre date.Din aceast cauz se apeleaz la lungimi, suprafee, i volume. Trasarea corect a graficelor statistice se efectueaz pe baza unor reguli care se refer att la coninut ct i la form. O parte din regulile de elaborare a graficelor statistice sunt comune cu cele ale tabelelor, iar altele sunt specifice. Astfel, pentru interpretarea complet i corect a mesajului transmis de grafic este necesar ca acesta s aib: legend; reea i scar de reprezentare; axele de coordonate explicite. Legenda graficului explic n form sintetizat semnificaia simbolurilor utilizate. Reeaua de reprezentare (de mai multe ori nu este vizibil) este format dintr-o mulime de linii paralele orizontale i verticale sau din cercuri concentrice, dup cum graficul este trasat: n coordonate rectangulare sau n coordonate polare. n mod frecvent, n practica statisticgraficele sunt trasate n sistemul de coordonare rectangulare. Pe axaOXa acestora se vor fixa variantele sau intervalele de variaie ale caracteristicii independente, momentele sau intervalele de timp, iar pe axa OY se vor fixa frecvenele, valorile caracteristicii a crei evoluie este urmrit, valorile sau intervalele de variaie ale caracteristicii dependente. Pentru a respecta proporiile din date este necesar ca pe cele dou axe punctele s fie fixate la scar. V.Indicatori statistici rezultai din prelucrarea datelor. Funciile indicatorilor statistici. Indicatorul statistic este expresia numeric a unor fenomene, procese, activitOi sau categorii economice i sociale, delimitate n timp, spaiu i structur organizatoric. Pentru cunoaterea fenome-nelor de mas, indicatorii statistici ndeplinesc mai multe funcii: de msurare, de comparare, de analiz sau sintez, de estimare, de verifi-care a ipotezelor, de testare a semnificaiei parametrilor utilizai. Indicatorii primari i derivai. Indicatori primari, ce se obin n procesul prelucrrii primare, prin centralizarea datelor provenite din observare total sau parial.Indicatori derivai, ce se obin prin comparri, abstractizri, generalizri, prin aplicarea unor procedee specifice de prelucrare a mrimilor absolute a indicatorilor primari. Ei pun n eviden aspec-tele calitative ale fenomenelor analizate:- relaia dintre prile colectivitii, dintre caracteristici;- legturile de interdepende dintre fenomene sau valori tipice;- contribuiile diverilor factori la variaia unui fenomen etc. Mrimi relative - indicatori derivai din prelucrarea datelor. Mrimi relative de structur, intensitate i coordonare. Mrimea relativ (M.R.) este rezultatul comparrii, sub form de raport, a doi indicatori statistici, i arat printr-un singur numr cte unitOi din indicatorul raportat revin la o unitate a indicatorului baz de raportare. Se poate exprima sub form de:Coeficieni care arat cte uniti din indicatorul de raportat revin unei singure unitOi baza de raportare.Procente, care arat cte unitOi din indicatorul baz de raportare revin la 100 de unitOi din indicatorul de baz de raportare. n analiza statistic se utilizeaz n funcie de scopul analizei: Mrimirelative de structur (MRS) sunt numite ponderi sau greuti specifice, frecvene relative, exprimnd raportul dintre parte i ntreg i se calculeaz ca raport ntre fiecare element sau grup de elemente ale colectivitii, fa de volumul ntregii colectiviti.9 Mrimi relative de intensitate (MRI) evideniaz gradul, intensitatea de rspndire a fenomenului , n raport cu variabila la care se raporteaz. Sunt considerate caracteristici derivate ce se obin prin raportarea a doi indicatori absolui, de natur diferit ce se afl ntr-un raport de interdependen cu semnificaie economic concret. Mrimi relative de coordonare (MRC) caracterizeaz raportul n care se afl doi indicatori de acelai fel, aparinnd unor grupe ale aceleai colectiviti statistice, sau unor colectiviti de acelai fel, dar situate n spaii diferite. Mrimi relative ale prevederii (MRPL) fiind specifice oric-rei economii moderne n economia de pia, se calculeaz numai la nivelul fiecrei uniti sau firme, n funcie de programele elaborate privind aprovizionarea, producia, desfacerea de mrfuri. VI.Indicatorii medii i de poziie n seriile de repartiie. Clasificarea mrimilor medii. Relaiile dintre cele patru tipuri de medii. Mrimile Medii sunt instrumente statistice ce exprim, n mod sintetic i generalizat, ceea ce este normal esenial, tipic i general n evoluia fenomenelor. Pentru aplicarea corect a mediilor este necesar s se respecte urmtoarele condiii:a) calculul mediilor s se bazeze pe folosirea unui numr mare de cazuri individuale diferite, sub care s-a nregistrat caracteristica, a cror variaie este ntmpltoare n raport cu fenomenul n totalitatea lui;b) valorile din care se va calcula media s fie omogene;c) alegerea acelei forme de medie care corespunde cel mai bine formei de variaOie a caracteristicii cercetate i informaOiilor de care se dispune. n funcie de natura caracteristicii urmrite, de scopul investigaiei, nivelul mediu a acesteia se calculeaz camedie aritmetic, armonic, ptratic, geometric etc. Indiferent de tipul de medie adoptat, pentru caracterizarea tendinei centrale, media se calculeaz n funcie de natura obiectiv dintre date dar i n funcie de forma de repartizare a frecvenelor, ca medie simpl sau ponderat. Mediile simple se calculeaz atunci cnd se utilizeaz toate variantele nregistrate. n cazul n care dup sistematizarea/gruparea datelor, (valorile individuale prezint frecvene diferite de apariie) nivelul mediu se calculeaz ca medie ponderat. Media aritmetic. Tipuri de medie aritmetic. Proprietile mediei aritmetice. Calculul simplificat al mediei aritmetice. n sens statistic, media aritmetic (sau momentul iniial de ordinul unu) a valorilor individuale x1,x2,...xn ale caracteristicii numerice X reprezint acea valoare ( x ) care s-ar fi nregistrat dac toi factorii de influenarfiacionat constant (cu aceeai intensitate) la nivelul fiecrei uniti de nregistrare. Aceasta nseamnc media aritmetic( x ) dac ar substitui fiecare valoare invidualxi (cui = 1,n ) valoarea totalizatobiectiv format a caracteristicii nu s-ar modifica.Se folosete n general cnd fenomenul supus cercetrii nregistreaz modificri aproximativ constante ntr-o progresie aritmetic. Poate fi: Media aritmetic simpl:

unde:X = media aritmetic n =nr. variantelor individuale xi = suma valorilor individuale ale caracteristiciiMedia aritmetic ponderat: se folosete pentru seriile de distri-buOie, cnd variante ale caracteristicii se nregistreaz de mai multe ori. Formula: unde: x1, x2,..., xp niveluri individuale,ni frecvenOa grupelor Media armonicMedia armonic, ca msur a tendinei centrale ntr-un ansamblu de observaii cantitative, se definete ca valoare invers a mediei aritmetice a inverselor valorilor individuale nregistrate. Aplicarea mediei armonice pentru exprimarea numeric a tendinei centrale are sens numai dac este obiectiv 10 nsumarea inverselor valorilor individuale. Deci, relaia de calcul a mediei armonice simple este urmtoarea: ( Xh) Se calculeaz din valorile inverse ale ter-menilor seriei, ca medie simpl sau ponderatedia armonica.

Media geometrica. Spre deosebire de tipurile de medii prezentate anterior, care au la baz o relaie deaditivitate ntre termenii unei serii statistice, media geometric se calculeaz pe baza unei relaii obiective multiplicative ntre termenii aceleiai serii.Prin urmare, media geometric (xg ) reprezint acea valoare a caracteristicii observate care dac ar nlocui fiecare valoare individual din serie produsul acestora nu s-ar modifica. 2) Calculul nivelului mediu ca medie geometric are sens economic numai atunci cnd relaia de multiplicare a termenilor seriei este real. Calculul nivelului mediuntr-o serie de distribuie media geometric se utilizeaz mai rar, ndeosebi cnd termenii prezint o evident concentrare ctre valorile cele mai mici sau cnd se urmrete s se acorde o importandeosebit valorilor individuale reduse. 3) Dac cel puin o valoare individual este nul sau negativ, calculul mediei geometrice este lipsit de sens. 4) n mod frecvent, media geometric se utilizeaz pentru calculul indicelui mediu al dinamicii,pentru caracterizareatendinei centrale din seria indicilor de dinamic cu baz mobil. 5) Media geometric a produsului (raportului) dintre dou variabile este produsul (raportul) mediilor geometrice ale valorilor variabilelor observate. Formula:

;

Media ptratic. Media ptratic( x )exprim p tendina central a valorilor numerice nregistrate pentru variabila observat dac are sens obiectiv nsumarea ptratelor valorilor individuale. Ea reprezint acea valoare a caracteristicii care dac ar nlocui fiecare valoare individual din serie suma ptratelor termenilor seriei nu s-ar modifica. Se calculeaz prin extragerea rdcinii ptrate din media aritmetic a ptratelor termenilor seriei, ca medie simpl sau ponderat:

;

; Modul si calcularea lui. Valoarea modal. Reprezint acea valoare a caracteristicii, care are cea mai mare frecven de apariie. Se calculeaz numai n distri-buie de frecven. Pentru o repartiie de frecven pe variate M0 se identific pe calea simplei examinri a irului de frecvene. Valoarea modal a caracteristicii(numit i valoare dominant, valoarea cea mai probabil sau modul) reprezint acea valoare a caracteristicii care corespunde celui mai mare numr de uniti sau aceea care are cea mai mare frecven de apariie.De exemplu, n seria {5, 6, 7, 8, 9, 10}valoarea individual "8" apare cel mai frecvent: modulul este, deci, 8 Pentru o serie de frecven pe intervale, determinarea M0 se face pe etape:- determinarea intervalului modal, fiind intervalul de variaOie al caracteristicii cu frecvenO maxim 11 - estimarea valorii modale cu relaa: unde:X0=limita inferioar a intervalului modal1 =diferenOa dintre frecvenOa intervalului modal i frecvenOa intervalului precedent2 =diferenOa dintre frecvenOa intervalului modal i frecvenOa intervalului urmtorh = mrimea intervalului. M poate nlocui media cnd ea nu se poate calcula sau nu are sens a fi calculat: industriaconfecOiilor: nu exist mrime medie, ci talia cea mai cutat (la fel la nclOminte) M este util pentru seria de repartiOie asimetric M i M se exprim n aceleai unitate de msur ca i variabila studiat. Mediana i felul ei de detrminare. Mediana (Me): Mediana (cuantila de ordinul 2) reprezint acea valoare a caracteristicii localizat n mijlocul seriei sau repartiiei statistice cu valori individuale aranjate n ordine cresctoare sau descresctoare. Cu alte cuvinte, mediana mparte numrul unitilor investigate n doupri egale: numrul valorilor individuale superioare medianei este egal cu numrul valorilor individuale mai mici dect mediana. Din aceast cauz mediana se mai numete valoarea echiprobabil a caracteristicii: Relaia ntre medie, median i mod. Observaii: M poate nlocui media cnd ea nu se poate calcula sau nu are sens a fi calculat: industriaConfeciilor: nu exist mrime medie, ci talia cea mai cutat (la fel la nclminte) M este util pentru seria de repartiie asimetric M i M se exprim n aceleai unitate de msur ca i variabila studiat. Localizarea n cadrul seriei a valorii mediei aritmetice, a valorii modalei mediane conduce la informaii despre forma de distribuire a unitilor colectivitii dup caracteristica urmrit. Astfel: - dac exist egalitatea x = M0 = Me atunci, aa cum s-ar observa i din grafic, distribuia frecvenelor este simetric; - n cazul unei distribuii unimodale uor asimetrice, frecvenele sunt uor deplasate ntr-o parte sau alta,ntre cei trei indicatori ai tendinei centrale exist urmtoarea relaie, fr s se verifice cu regularitate:x M0 = 3(x Me) (4.46) Sunt cazuri cnd unul din cei trei indicatori ai tendinei centrale are o semnificaie mai puternic. Exemple: 1) Fie seria2 ,4 ,4 ,7 ,8 ,1 0 0 0 . n aceast serie mediana, ca valoare central, este mai semnificativ dect media aritmetic, corespunztoare care este afectat de valoarea extrem: 1000. 2) n seria studenilor din anul I ordonai dup media obinut la concursul de admitere pentru a identifica studentul care se localizeaz cel mai bine se caut n mijlocul seriei rangul studentului median; acesta mparte seria ordonat n dou pri egale. 3) Sindicatele estimeazc societatea comercial Ei remunereazmai puin angajaii. Ei calculeaz salariul cel mai frecvent obinut i declarc este mai mic dect n alte societi comerciale din acelai domeniu. Patronatul n schimb replic i calculeaz salariul mediu i gsete c acesta este superior salariilor medii din alte societi comerciale. Cele dou calcule efectuate sunt corecte, dar comparaia sufer; se comparaiciunsalariu modal cu un salariu mediu. Exemplele de mai sus pun n eviden faptul c dup calculul indicatorilor tendinei centrale o atenie deosebit trebuie acordat analizei n concordan cu natura fenomenului analizat cu gradul de mprtiere (variaie) a valorilor individuale. Aceasta este cu att mai important cu ct n elaborarea deciziilor se ine seama de valoarea tipic calculat, cea mai reprezentativ cu cea mai mare ncrctur informaional despre tendina central. 12 13 Analiza statistic a legaturilor dintre variabilele economice. Metode elementare de studiere a legturilor statistice. Metoda seriilor statistice independente const n compararea termenilor a doua serii independente, x i y. Dac comparm dou serii de timp, ordonm termenii cronologic, iar cnd comparm doua serii de spaiu sau de distribuie, termenii se ordoneaz n ordine cresctoare sau descresctoarea variabilei independente x. Prin compararea celor doua serii putem evidenia exixtena i direcia legturii. b).Metoda gruprilor statistice se foloseste cnd avem un numr mare de variante. Se face gruparea valorilor variabilei x pe intervale de variaie i se calculeaz valorile corespunztoare ale variabilei y sub forma unei marimi derivate ( de regul ca nivel mediu ). c) Metoda tabelului de corelaie presupune gruparea simultan dup ambele variabile corelate x i y. Se recomand folosirea intervalelor de grupare egale i un numr aproximativ egal de grupe pentru ambele variabile. n funcie de modul de distribuie a frecvenelor n tabel se poate aprecia existena, direcia i intensitatea legturii. d) Metoda grafic presupune reprezentarea grafic a perechilor de valori (xy). Putem stabili existena, sensul forma i intensitatea corelaiei folosind corelograma. Cu ajutorul graficului putem constata direcia spre care se indreapt mulimea (norul de puncte), ct i apropierea punctelor de o linie sau o curb ce pot fi trasate pe diagram. Metode analitice de studiere a legturilor statistice. Mai nti se costruiete corelograma i se gsete cel mai bunmodel teoretic corespunztor legturii dintre cele dou variabile.Apoi se estimeaz parametrii ecuaiei de regresie n baza metodei celor mai mici patrate i se interpreteaz regresia n funcie de semnul i valoarea lor. Tipuri de legturi simple.y= a+ bx; Legturi de tip parabolic y= a+bx+cx2; Legturi de tip hiperbolic y=a+ b/x Dup ce am gsit graficul corespunztor care coincide cel mai bine legturii dintre cele dou fenomene corelate, urmeaz estimarea parametrilor modelului, testarea semnificaiei acestora i n final msurarea intensitii corelaiei. Metoda regresiei: modele de regresie unifactonal, modele de regresie multifactorial.Modele de regresie unifuncional: a)Modelul liniar. Considernd c legtura dintre "y" i "x" este liniar, rezult c y=a+bx. Modelul prezentat este specific tipului de legtur dintre dou caracteristici care variaz n progresiearitmetic. Precizm c dependena liniar dintre "y" i "x" se consider ca o dependen stohastic n care unei valori i x i pot corespunde mai multe valori y. Parametrii a i b se estimeaz: frecvent, se folosete metoda celor mai mici ptrate, care presupune c suma ptratelorabaterilor dintre valorile empirice (reale) "y" i valorile teoretice (ajustate) "Y" s fie minim, adic:

= minim ; nlocuind n loc de y valorile lui, obinem:

= minim Derivnd n raport cu "a"i "b", anulnd derivatele pariale, se obine sistemul de ecuaii normale: {

} Unde unde "n" reprezint numrul unitilor observate, adic numrul perechilor (x,y). Rezolvnd sistemul de ecuaii normale prin metodele cunoscute, se obin parametrii "a" i "b". Coeficientul "a", care poate lua att valori pozitive ct i negative, reprezint ordonata la origine,respectiv, este valoarea lui "y" cnd "x" este egal cu zero. 14 Coeficientul "b" - denumit coeficient de regresie - arat msura n care se modific caracteristicadependent n cazul n care caracteristica independent se modific cu o unitate. n funcie de semnulcoeficientului de regresie putem aprecia tipul de legtur: n cazul corelaiei directe coeficientul are o valoare pozitiv; n cazul corelaiei inverse, valoarea lui este negativ; n cazul n care b=0, se apreciaz c cele douvariabile (x i y) sunt independente. n graficul de corelaie coeficientul "b" indic panta liniei drepte. Cu ajutorul coeficienilor "a" i "b" se calculeaz apoi valoarea ecuaiei de regresie pentru fiecaremrime a caracteristicii "x". Aceste valori ale ecuaiilor de regresie se mai numesc i valori teoretice alecaracteristicii "y" n funcie de "x", iar operaia de nlocuire a termenilor reali "y" cu valorile ecuaiei deregresie (valori teoretice) se numete ajustare. Modelul exponenial. Modelul logaritmic. Modelul teoretic al parabolei de gradul 2. Metode de regresie multifuncional. ntre fenomenele economico-sociale exist legturi complexe care se caracterizeaz prin influenaunui numr mare de factori (variabil independente) asupra caracteristicii rezultative (variabila dependent). Asemenea legturi se pot exprima cu ajutorul ecuaiei de regresie multipl dat de relaia: Y=f(X1,X2,Xn) Specific regresiei multiple liniare este faptul c variabila rezultativ y se modific uniform n cazul n care variabilele factoriale i x se modific cu o unitate. Legtura multifactorial liniar se poate reprezenta grafic sub forma unui plan. Acest tip de legtur presupune ca variabilele factoriale s fie independente, adic s nu apar fenomenul de multicolinearitate. n practica statistic pot aprea situaii n care diferitele caracteristici studiate acioneaz prin multiplicarea lor. Influenele nu mai sunt, n acest caz, uniforme, ci proporionale cu valoarea caracteristicii;ele se manifest cu un ritm de cretere, ceea ce face ca gradul de influen al caracteristicilor analizate s fie proporional cu valoarea acestora. Indicatorii sintetici ai corelaiei: covariana, coeficientul de corelaie liniar simpl, raportul de corelaie, raportul de corelaie parial i multipl.M etoda corelaiei vine s completze metoda regresiei , stabilind ct de strns etse legtura dintre variabilele incluse n modelul de regresie. Intensitatea legturii se poate msura cu ajutorul raportului de corelaie (R)sau a coeficientului de corelaie (r) . Intensitatea legturilor de tip statistic ntre dou sau mai multe variabile care urmeaz o lege de repartiie de tip normal sau asimptotic normal, se studiaz cu ajutorul metodelor parametrice. Dintreacestea, cea mai utilizat n practic este metoda corelaiei. Covariana: Formula: Coeficientul de corelaie liniar simplu: Acest indicator msoar numai intensitatea legturii de tip liniar dintre dou variabile x i y. Se calculeaz ca o medie aritmetic a produsului abaterilor normale normate ale celor dou variabile. Formula :

[

][

] Coeficientul de corelaie este o mrime fr dimensiuni, ceea ce face ca valorile variabilelor X i Y s se exprime n orice unitate de msur. Aceste uniti se aleg astfel nct, utiliznd noile valori exprimate n funcie de unitile alese, s se realizeze o simplificare a calculelor. Se va proceda ca la calculul simplificat al mediei aritmetice. n acest caz vom obine valorile x' i y', iar coeficientul de corelaie se calculeaz pe baza acestor valori micorate. Coeficientul de corelaie poate lua valori cuprinse ntre -1 i +l. Semnul su, ca i cel al coeficientului de regresie, semnific tipul de legtur: semnul minus indic legtura invers, semnul plus indic legtura direct. Cu ct coeficientul de corelaie are valori mai apropiate de 1 sau -l, cu att corelaia rectilinie dintre variabilele x i y este mai puternic. Pe msur ce coeficientul de corelaie se apropie de zero, scade i 15 intensitatea legturii dintre cele dou variabile. n cazul n care r = 0, variabilele sunt independente ori necorelate liniar, iar pentru xy r egal cu unitatea, rezult dependena funcional ntre cele dou variabile. Raportul de corelaieDenumit i coeficientul de corelaie Pearson, acest indicator msoar att intensitatea legturilor liniare ct i curbilinii.Formula:

; Calculul raportului de corelaie se bazeaz pe descompunerea dispersiei totale a variabilei dependente n dispersia valorilor empirice fa de valorile teoretice. Raportul de corelaie poate lua valori ntre 0 i l. Cu ct valoare raportului este mai apropiat de l, cu att legtura de corelaie este mai puternic i invers. Indicatori i metode de analiz a dinamicii fenomenelor Conceptul de serie cronologic. O serie cronologic este format din dou iruri paralele de date, din care primul ir reprezint valorile variabilei de timp (t) iar cel de-al doilea valorile variabilei nregistrate pentru o anumit perioad de timp (y). Reprezentri grafice ale seriei cronologice. Seriile cronologice de perioade se reprezinta grafic prin cronograma, iar seriile cronologice de momente se vizualizeaz prin diagrama cu coloane. Sistemul de indicatori statistici ai seriei cronologice: indicatori exprimai n mrimi absolute, indicatori exprimai n mrimi relative, indicatori medii ai seriilor cronologice.n funcie de modul de exprimare si de calcul, indicatorii sunt structurai n: indicatori absolui, indicatori relativi,indicatori medii. Analiza statistic a termenilor unei SCR impune alegerea unei baze de comparare (y0) sau nivel de referin, care s fie tipic procesului analizat. n cazul variabilelor economice se impune folosirea: unei baze fixe un nivel de referin neschimbat pentru ntreaga perioad analizat; unei baze n lan un nivel de referin mobil, ce gliseaz n timp simultan cu perioada la care se refer indicatorul.De regul, se foloseste perioada imediat anterioar (yt se compar cu yt-1). Sistem de indicatori: a)Indicatori abslouti -Indicatorii de nivel reprezinta valoarea variabilei la momentul sau in perioada de referinta. Daca se insumeaza toti termenii seriei, rezulta nivelul totalizat - =ntty1. -Modificarea absoluta exprima cu cit a crescut sau scazut in marime absoluta un termen comparativ cu un alt termen, considerat baza de comparatie. -Cu baza fixa : 1 1 /y yt t = A-Cu baza in lant: 1 1 / = At t t ty yb)Indicatori relativiarata de cite ori s-a modificat unei ponderi fata de baza de comparatie. -Indicele de crestere/descrestere -Cu baza fixa:100 *11 /yyItt=-Cu baza in lant :100 *11 / =ttt tyyI-Ritmul de crestere/descrestere arata cu cite procente s-a modificat nivelul in perioada curenta fata de perioada considerata baza de comparatie. 16 -Cu baza fixa :100 *11 /1 /yRttA=-Cu baza in lant:100 *11 /1 /A=tt tt tyR-Valoarea absoluta a unui procent din ritmul de crestere/descrestere exprima care este echivalentul absolut al unui procent din ritmul de crestere/descrestere. -Cu baza fixa: (%)1 /1 /1 /tttRAA=-Cu baza in lant: (%)1 /1 /1 /A=t tt tt tRA c)Indicatorii medii ofera informatii sintetice care se refera la intreaga serie cronologica. -Nivelul mediu al seriei se determina ca o medie aritmetica simpla a termenilor seriei : nyyt = -Modificarea absoluta medie sintetizeaza modificarile absolute cu baza in lant li se calculeaza ca o medie aritmetica simpla a acestor modificari: 1 11 / 1 /A=A= A n nt t t -Indicele mediu de crestere/descrestere se determina ca o medie geometrica a indicilor cu baza in lant: 1yyIn=-Ritmul mediu de crestere/descrestere masoara cu cite procente s-a modificat fiecare termen fata de termenul precedent:( ) 100 * 1 A = R Modelarea statistic a seriilor cronologice: componentele seriei cronologice. Modelul aditiv si modelul multiplicativ de combinare a componenelor seriilor cronologice.n abordarea tradiional, fluctuaiile din seriile de timp sunt privite ca o rezultant a suprapunerii urmtoarelor componente: Componenta tendenial (trend) Tendina general se manifest ca o modificare uniform, consecvent cu ea nsi, fr asperiti, exprimnd ntr-o form stilizat evoluia unui fenomen n decursul unei perioade ndelungate. Trendul poate fi liniar sau neliniar, pozitiv sau negativ. Fiind de natur determinist, timpul este singura variabil care explic variaia fenomenului luat n calcul. Determinarea trendului se face printr-o funcie continu, printr-o funcie polinomial n timp,) (t f Yt = , de grad n. Estimarea trendului poate fi efectuat prin folosirea metodei celor mai mici ptrate. Componenta ciclic Componenta cilic exprim fluctuaii de tip sinusoidal, n jurul trendului ale valorilor seriei care revin la un anumit numr de perioade, dar cu amplitudini i frecvene diferite. Variaia ciclic cuprinde patru faze: 17 Expansiunea; Criza; Recesiunea; Relansarea. Aceast component este frecvent ntlnit n cazul seriilor trimestriale sau lunare dar poate fi depistat i n cazul seriilor anuale. Componenta sezonier Sezonalitatea se manifest sub forma variaiilor periodice, relativ regulate n cadrul seriilor cronologice care se repet la perioade mai scurte dect un an, de regul luni sau trimestre.Variaiile sezoniere sunt datorate unor cauze diferite care definesc ritmul activitilor sezoniere (periodicitatea concedilor, a srbtorilor). 18 Componenta aleatoare Componenta aleatoare are drept caracteristic de baz caracterul nondeterminist al variaiei i se manifest ca devieri de la linia normal de evoluie a fenomenului studiat. Este ntlnit ca variaie aleatoare sau accidental. n calitate de componente aleatoare pot fi factoriiaa ca greve, catastrofe naturale. Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu aciune continu asupra fenomenului, n timp ce componenta rezidual are caracter aleator fiind efectul aciunii unor factori imprevizibili, accidentali. Combinarea celor patru componente ale seriei de timp, se poate realiza prin: Model Aditiv n funcie de timp, fenomenul studiat se descompune n componente independente unele de altele: t t t t tC S T Y c + + + = . (2.40) unde: tT- componenta tendenial; tS- componenta sezonier; tC- componenta ciclic; te- componenta rezidual. Modelul Multiplicativ variabila studiat se descompune n componente dependente unele de altele: t t t t tC S T Y c =(2.41) Modelul Mixt combinarea legturilor aditive i multiplicative n componena modelului examinat:

) () (t t t t tt t t t tS T C YC T S Ycc + = + =(2.41) Determinarea trendului cu metode mecanice. Determinarea trendului cu metode analitice. Analiza statistic a sezonalitii seriilor cronologice. Interpolarea i extrapolarea pe baza datelor seriilor cronologice.

Metoda indicilor Probleme teoretice ale construirii indicilor. Indicii agregai Sisteme de ponderare folosite la construirea indicilor de grup.Sistemul de ponderare propus de E. Laspeyres, la care ponderile folosite sunt cele din perioada de baz: 19 pentru factorul cantitativ: pentru factorul calitativ: =0 01 0 ) (0 / 1**f xf xIf y Sistemul de ponderare propus de H. Paasche, la care ponderile utilizate sunt cele din perioada curent: pentru factorul cantitativ: pentru factorul calitativ: Sistemul de ponderare propus de I. Fisher presupune calcularea indicelui de grup al preurilor ca o medie geometric a celor doi indici agregai de tip Laspeyres i de tip Paasche. Generaliznd, pentru factorul calitativ: pentru factorul calitativ: Indicii de grup calculai ca medie a indicilor individuali. pentru fenomenul complex: =0 00 0 0 / 1 ) , (0 / 1** *f xf x iIyf x y

010 / 1yyiy= pentru factorul cantitativ:pentru factorul calitativ:

Indicii calculai ca raport a dou medii. Pentru msurarea variaiei unei caracteristici calitative, care se formeaz ca mrime medie la nivelulunei grupe de uniti, pe total colectivitate se folosesc indici calculai ca raport a dou medii. = =00 011 1010 / 1:ff xff xxxI x Msurarea influenei celor 2 factori se realizeaz cu urmtorii indici:Indicele cu structur fix arat influena factorului calitativ x asupra luixpstrnd pondereaconstant: Indicele modificrilor structurale: Exprim influena factorului cantitativ (f) asupra luix : =0 00 1 ) (0 / 1**f xf xIx y=0 11 1 ) (0 / 1**f xf xIf y=1 01 1 ) (0 / 1**f xf xIx y=0 11 10 01 0 ) (0 / 1****f xf xf xf xIf y=1 01 10 00 1 ) (0 / 1****f xf xf xf xIx y=1 1 *0 / 11 1 ) (0 / 1*1*f xif xIx y=0 00 0 0 / 1 ) (0 / 1** *f xf x iIff y= =00 011 001 ) (0 / 1:ff xff xxxIgf x= =11 011 101 ) (0 / 1:ff xff xxxIx x20 Relaia dintre indici: ) (0 / 1) (0 / 1 0 / 1*gf x x x xI I I = n statistic indicii se folosesc sub form de sisteme, n vederea caracterizrii evoluiei n timp i spaiu a fenomenelor social-economice. Descompunerea pe factori a variaiei unui fenomen complex folosind metoda indicilor. Metoda subtituirilor in lant consta in anihilarea pe rind, a cite unui factor de influena, mentinindu-se variatia factorului supus analizei. In aceasta idee se vor folosi sisteme de ponderare diferite, care fac ca produsul lor sa fie egal cu indicele general. Presupunem existenta unui fenomen complex de tipul y=x*f Analizat in timp, acesta va fi :0 01 10 / 1**f xf xY y =Unde x este factorul calitativ si f este factorul cantitativ. Corespunzator descompunerea analitica va fi: 0 0 1 1 0 / 1f x f xy = AInfluenta factorului calitativ se determina dupa una din relatiile: =1 01 1 ) (0 / 1f xf xIx y 21 Organizarea unul sondaj statistic. Sondajul statistic et eo form de cercetare statistic ce-i propune estimarea parametrilor unei populaii statistice pe baza datelor culese asupra unei pri reprezentative a acesteea. Sondajul statistic cuprinde un ansamblu de etape pentru culegerea, prelcrarea i estimarea parametrilor populaiei de referin, pentru un ansamblu de caracteristici. Principalele etape ale unui sondaj statistic sunt: *stabilirea obiectivelor cercetrii. ntr-o etap se definesc obiectivele cercetrii ce au dus la organizarea observrii populaiei prin tehnica sondajului. n cadrul acestei etape se stabilesc caracteristicile pentru care se estimeaz parametrii, se identific populaia ce urmeaz s fie studiat prin intermediul caracteristicilor incluse n planul observrii, sunt stabilite costurile cercetrii i personalul necesar pentru organizarea acesteia, sunt identificate bazele de date ce pot fi utilizate n procesul de generare a eantionului, etc. n aceast etap pot fi folosite i rezultatele ce au fost obinute n cadrul altor sondaje din domeniul studiat. *generarea eantionului. Se definete, folosind un procedeu adecvat, eantionul asupra cruia se cunosc informaii statistice. Proprietile tehnicii de eantionare sunt eseniale n estimarea aprametrilor. Pentru a obine cele mai bune rezultate prin tehnica de sondajului statistic, sunt specificate toate tehnicile de eantionare ce pot fi aplicate, lund n considerare informaiile disponibile asupra populaiei cercetate. De altfel, generarea eantionului reprezint problema esenial din planul de organizare a sondajului statistic. *elaborarea chestionarului statistic. n procesul observrii, chestionarul reprezint elementul folosit pentru colectarea informaiilor statistice. n funcie de calitatea chestionarului se poate controla calitatea datelor i se pot reduce erorile de observare. *culegerea datelor statistice. Pentru culegerea datelor statistice pot fi utilizate diferite tehnici : interviul direct, prin completarea unui chestionar, interviu prin telefon, culegerea datelor prin coresponden etc. Aceasta este o etap esenial n desfurarea cercetarii, calitatea estimrilor depinznd n mare msur de calitatea datelor culese n procesul de observare a unitilor eantionului. *codificarea i prelucrarea datelor. n cadrul acestei etape sunt identificate i eliminate eventualele date eronate. *prelucrarea seriilor de date pentru estimarea parametrilor de referin. n aceast etap sunt puse n eviden erorile care apar n procesul de realizare al sondajului. De altfel, estimarea parametrilor 22 reprezint a doua etap esenial din planul sondajului statistic. Pentru estimarea parametrilor se pot folosi datele culese asupra unitilor din cadrul eantionului, dar i o serie de informaii auxiliare penru ameliorarea estimatorilor. Bazele de sondaj.Reprezinta, uzual, o lista cu toate unitatile compun colectivitatea generala, lista alcatuita dup un criteriu care nu are nici olegatur cu ordinul de marime al valorilor variabilelor nregistrate. Exemplede baze de sondaj folosite frecvent n cazul anchetelor statistice ar putea fi: registrul auto, liste electorale, lista localitilor, lista agenilor economici. O baza de sondaj trebuie s ndeplineasc cteva cerinte fundamentale i anume: *s cuprind ntreaga populaie; *s fie actual; *s fie ferit de orice repetiie. IndicatorCaracteristic nealternativCaracteristica alternativ Colectivitatea generalEantionColectivitatea general Eantion Media =NN xxii i0 =nn xx11 1 NMp =NMW =Dispersia ( )=NN x x1120 120 o ( )=nn xx11 12o ) 1 (20p p =o) 1 (2W ww =o 23 Procedee de eantionare aleatoare n cadrul acesor metode, fiecare unitate elementarp din populaia de referin are o anumit probabilitate, nenul, de a fi inclus apriori n eantion. Utiliznd metoda probabilist n generarea unui eantion, eroarea de eantionare este n general mai mica dect ntr-o eantionare neprobbailist. Pentru eantioanele generate prin aceste metode se poate calcula mrimea erorii de eantionare pentru fiecare estimator. *Eantionarea aleatoare simpla : fiecare unitate elementar a populaiei are o anumit probabilitate nenul de a fi inclus n eantion. Vom avea: - eantionarea aleatoare simpl cu revenire- prin aceast metod, o unitate poate fi inclus de mai multe ori n eantion. - eantionarea aleatoare simpl fr revenire ofer rezultate mai precise, precum i avantaje mai mare din punct de vedere operaional. *Tabele de numere aleatoare : i gsesc o larg aplicare n costituirea unui eantion aleator i se utilizeaz dac exist o baz de sondaj, iar fiecare unitate din populaia de referin se poate identifica printr-un numr. S-au constituit diverse tabele care sunt mai puin utilizabile, dintre care menionm : -Tabelele lui Kendal i Smith, cuprinznd 100.000 de cifre; -Tabelele lui Rand Corporation cu 1.000.000 cifre. Metodele cele mai des utilizate sunt cele bazate pe definirea unei relaii de recuren.Dezavantajul major al acestor metode este c duc dup un anumit numr de pai, la generarea de iruri periodice. Putem aminti de metoda lui J.Von Neumann i de metoda lui Lehmar. *Eantionarea sistematic sau mecanic. Includerea unitilor din populaie n eantion se face pe baza unei progresii aritmetice, alegnd un numr de la care se realizeaz construirea progresiei. Raia progresiei se numete pas de numrare i se determin pe baza relaiei : ((

=nNkDeci, construirea unui eantion prin metoda sistemic se realizeaz prin intermediul a dou elemente: -Pasul de sondaj sau de numrare (k); -Punctual de plecare ales (x), unde xe{1,..,k} 24 Se poate scrie i n acest caz eantionul sub,forma: E={x,x+k,x+2k,}. *Eantionarea stratificat : se bazeaz pe descompunerea variaiei totale n variant datorat dispersiei n interiorul claselor i cea dintre straturile constituite. ntruct o o2 2> eantionarea stratificat ofer rezultate mai bune dect eantionarea simpl sau sistemic. Creterea eficienei este cu att mai mare, cu ct populaia de referin este enomogen i permite construirea de clase tipice. Procedeul eantionrii se face n urmtoarele etape: -Se definesc straturile sau clasele tipice n care se partajeaz populaia de referin. Prezint o mare importan alegerea criteriilor de stratificare a populaiei i alegerea numrului de straturi; -Se reapartizeaz volumul eantionului pe straturi, avnd n vedere criteriile dup care s-a realizat stratificarea. -Pentru fiecare strat se genereaz aleator unitile care se include n eantion. -Se realizeaz stratificarea apriori, care utilizeaz diferite informaii statistice suplimentare obinute dup stratificarea anterioar pentru optimizarea acesteea. *Eantionarea cu probabilit inegale : Asigurarea reprezentativitii unui eantion prin tehnica sodajului simplu este dificil de realizat n pracica statistic. De regul, exist populaii statistice constituite din uniti elementare ce se difereniaz net n raport cu caracteristici eseniale din planul cercetrii. De exemplu, pentru o populaie constituit din ansamblul unitilor comerciale dintr-o localitate exist diferene mari dac se tine seama de volumul desfacerilor sau suprafa. Identificarea unitilor din aceast populaie printr-un numr, fr a tine seama i de aceste informaii, ar duce la obinerea unor estimaii mai puin consistente, ce pot caracteriza ntr-o mica msur parametrii populaiei. *Esantionarea de tip cluster : cluster un ansamblu de uniti elementare ( persoanele care locuiesc n aceeai locin, imobilul, sectorul administrative, etc. ) Un avantaj major este reducerea costului de culegere a datelor, ntruct aceast metod asigur constituirea eantionului n grupe mai compacte de uniti. Forma de generare a eantionului reduce n mod 25 simitor deplasrile n teren, asigur o mai bun supervizare a culegerii datelor i urmrirea nonrspunsurilor. *Eantionarea n mai multe etape : este o metod care se desfoar n mai multe etape successive i se aplic tot pentru o populaie care este organizat ierarhic, pe mai multe niveluri. Se constituie astfel pentru fiecare nivel una sau mai multe baze de sondaj, cuprinznd unitile elementare corespunztoare de pe nivelul intermediary urmtor. -n prima etap, se aleg unitile din primul nivel sau treapt -n a doua etap, pentru unitile alese n prima etap, trebuie s se dispun de baza de sondaj. Avem astfel o dispunere n cascad a bazelor de sondaj. Pentru fiecare nivel, includerea unitilor trebuie s se fac respectnd principiul complementaritii i completitudinii. *Eantionul n mai multe faze : reprezint o generalizare a eantionrii stratificate i se utilizeaz din cel puin urmtoarele considerente : - prin modul de organizare duce la creterea operativitii i reducerea cheltuielilor cu colectarea informaiei statistice - de la o faz la alta sre loc reducerea numrului de uniti din eantion, dar cresc corespunzator obiectivele pe care le pune cercetarea - cnd nu exist date care s asigure stratificarea populaiei, prin modul de desfurare, eantionarea n mai multe faze poate fi asimilat cu o stratificare aposteriori care stratific un eantion i nu ntreaga populaie. Noiunea de sondaj simplu aleator. Poate fi aplicat n cazul n care colectivitatea general este omogen. n vederea formrii eantionului se extrag aleator uniti simple, prin procedeul repetat sau nerepetat. Sondaj aleator simplu cu probabiliti egale; cu probabiliti inegale.Este variant aleatoare elementar de sondaj, celelalte tipuri putnd fi nelese ca soluii obinute prin particularizarea unor elemente ale acestui tip de sondaj. El se poate realiza, din punct de vedere al prelevrii unitilor, n una din cele 2 variante repetat, nerepetat. Calculul erorilor de sondaj. Erorile de sondaj - de selecie se consider diferenele care exist ntre valorile oricarui indicator calculat pe baza datelor eantionului i valorile aceluiai indicator determinate pe baza datelor aferente colectivitii generale. n cadrul sondajului statistic se disting doua feluri de erori: 26 -erori de nregistrare, comune tuturor tipurilor de observri statistice; -erori de reprezentativitate, specifice cercetarii prin sondaj. Erorile de nregistrare - care intervin n cazul sondajului statistic sunt de mai mica amploare comparativ cu cele n cazul unei inregistrari totale. Aceasta, datorita faptului ca volumul datelor inregistrate este semnificativ mai mic, iar culegerea datelor se realizeaza de un personal de specialitate. Erorile de re prezentativitate sistematice se concretizeaza in abateri de la realitate intr-un singur sens. Aceasta grupa de erori se datoreaza nerespectarii principiilor pe care se fundamenteaza sondajul statistic.Printre principalele cauze care pot duce la aparitia erorilor sistematice mentionam: -alegerea deliberata a unor unitati considerate reprezentative; -selectarea preferentiala a acelor unitati care sa duca la rezultatuldorit de cercetator; -baze de sondaj incomplete; -volumul redus al esantionului. Aceste erori pot fi evitate daca se respecta intocmai principiile teoriei selectiei. Erorile de reprezentativitate intamplatoare nu pot fi evitate, chiar dacase respecta toate regulile sondajului statistic. Aceasta deoarece prinnumarul mic de unitati care compun esantionul nu se pot reproduceintocmai toate trasaturile esentiale ale colectivitatii generale. Erorile de reprezentativitate intamplatoare, desi nu pot fi evitate, ele pot fi calculate cu anticipatie, daca selectia este probabilistica. Parametriicolectivitatii generale se estimeaza pe baza indicatorilor obtinuti dinprelucrarea datelor esantionului cu o anumita eroare intamplatoare de reprezentativitate. % 5 100 *00sxxx X media esantionului X0 media colectivitatii generale 5% Se considera ca un esantion este reprezentativ daca eroarea seincadreaza in intervalul +/- 5% Sondaj aleator simplu REPEATAT Sondaj aleator simplu NEREPETAT Sondaj tipic (stratificat) 27 Eroarea medie de reprezentativitate nSx2= |.|

\| =NnnSx12 =nn SSSii ixn*222 Eroarea limit admis oxx Z D* =D x D x xx x + < < 0 D x DZ Dx xxxx x + < < =0*o oxx Z D* =Determinarea mrimii eantionului. Sondaj aleator simplu REPEATAT Sondaj aleator simplu NEREPETAT Sondaj tipic (stratificat) ni DS Znxi 22 2*=NS ZDS Znxi 2 222 2*+=Rep. proporional Rep. optim nNNnii* =SSS NS Nnii ii iin2*= = Estimarea parametrilor populaiei totale pe baza estimaiilor de eantion. *pentru estimarea mediei populaiei de referin se calculeaz media eantionului e=E ii xnx1 Dac se definete variabila boolean oiprin urmtoarea relaie : =oi{

Atunci media calculate la nivelul eantionului se exprim prin relaia : ==Nii i xNx11o Ultima relaie de calcul ets folosit pentru demonstrarea proprietilor acestui estimator *estimarea volumului total al caracteristicii X se realizeaz prin intermediul mrimii28 e= =E iNnxXX Nit Pentru variaie se folosete drept estimator variaia calculate la nivelul eantionului : 21211=|.|

\|=nixunx Si n cazul estimrii lui p se folosete mrimea: npn1 =Sondajului de volum redus.- sondajul unde este folosit eantionarea de tip cluster. Sondajul stratificat. Pentru sondajul stratificat sunt reprezenatte principalele rezultate ce sunt folosite la estimarea mediei, volumului total i a unei caracteristici calitative. Estimatorii definii pentru sondajul stratificat sunt comparai cu estimatorii similari utilizai pentru sondajul simplu. Prin rezultatele obinute se demonstreaz eficiena acestei metode de eantionare n raport cu procedeele simple de eantionare. Sondajul de serii. Sau Sondajul n mai multe faze Adesea unitile colectivitii generale alctuiesc aa-numitele uniti complexe. De pild, muncitorii lucrez n cadrul anumitor formaiuni d elucru, oamenii traiesc n familii, etc. n aceste cazuri, sondajul poate fi organizat n aa fel nct s extrag spre studio asemenea uniti complexe, urmnd ca toate unitile aferente unitilor complexe extrase s se cerceteze, fr nici o excepie. n mod current n practica metodei sondajului, unitile complexe se numesc serii ( sau uneori cuiburi). De unde rezult denumirea de sondaje de serii. Evaluarea rezultatelor sondajului de serii se face cu ajutorul metodelor descries la sondajul aleator simplu, nlocuind ns numrul unitilor simple din populaia N i din sondaj n, cu numrul seriilor (uniti complexe) R i r. n locul dispersiei dintre valorile individuale S2 se utilizeaz dispersia dintre serii, o2, determinate analog cu dispersia dintre grupe. La acest calcul se presupune c volumul seriilor este egal. n mod tacit poate fi extins aceast ipotec de calcul i pentru seriile aproximativ egale. Dac ns volumul seriilor este mult mai diferit, sunt necesare alte scheme de calcul. Atunci poate fi similar cu sondajul stratificat. n statistica economic i social unitile complexe, ce se pot asimila seriilor, se formeaz nu la ntmplare, ci n procesul dezvoltrii economice i sociale. De aceea, unitile elementare din cadrul unei uniti complexe sunt mai asemntoare ntre ele, deci i cu ct ele difer de la o unitate complex la 29 alta, cu att ele difer de ansambll populaiei. n consecin, seria asemuit cu unitatea complex nu etse reprezentativ fa de populaie. Un numr sufficient de mare de serii ns poate forma un eantion reprezentativ. Datorit avantajelor organizatorice pe care le prezint, sondajul de serii- chiar cu carenele de reprezentativitate- se justific n numeroase domenii ale statisticii economice i sociale, ca, de pild, n statistica preurilor pe piaa rneasc, statistica bugetelor de familie n cadrul anchetelor integrate n gospodrii, etc. n acest caz, formula de calcul se particularizeaz n sensul c se lucreaz cu dispersia dintre serii, iar volumul eantionului se estimeaz prin numrul seriilor. 30 Formularea i ordinea de ntrebri n timp ce are loc ntocmirea unui chestionar, forma specific pe care o iau ntrebrile variaz dup problematica cercetrii, dar exist totui anumite orientri de baz care trebuie urmrite atunci cnd se formuleaz ntrebrile: - ntrebrile trebuie s fie scurte; ntrebrile lungi tind s duc la confuzii din partea interlocutorului; - Nu ntotdeauna este cel mai bine s pui ntrebri directe. Cteodat se obin informaii mai multe i mai bune la ntrebrile indirecte; - Trebuiepusenumaintrebrila careestedeateptatca interlocutorii s rspund dup propria lor experien i cunoatere; - Fiecare ntrebare din chestionar trebuie s se refere numai la o singur problem; - ntrebrile trebuie s invite la rspunsuri care pot fi repede i uor nregistrate;- Eliminarea ntrebrilor inutile, ntruct chestionarul trebuie s fie ct mai scurt i ct mai simplu. Din experiena ntocmirii chestionarelor se tie c aceleai ntrebri, ns formulate oarecum diferit, pot determina rspunsuri diverse, de aceea este bine ca o dat de cercettorul a scris o serie de ntrebri, s repete exerciiul, reformulnd de mai multe ori fiecare ntrebare. ntrebrile incluse ntr-un chestionar trebuie s rspund i la urmtoarele cerine: a) S fie corect formulate i uor de neles; b) S nu fie contradictorii, absurde sau fanteziste; c) S fie consistente n raport cu ntreaga populaie; d) S previn reaciile ostile ale respondenilor i s reduc nonrspunsurile. ntrebrile din cadrul unui chestionar trebuie s fie aranjate ntr-o ordine logic pentrua se asigura o anumit dinamic a chestionarului. Astfel, ntrebrile se vor pune ncepnd dela general c tre particular, de la simplu c tare complicat. Primele ntrebri din chestionar vor fintrebri uoare, care s captiveze subiectul,nu s -l descurajeze printr-o solicitare prea mare nc de la nceput. De asemenea, se va evita nceperea chestionarului cu o ntrebare filtru care dirijeaz o mare parte dintre respondeni ctre sfritul chestionarului, ntruct se pierde reprezentativitatea eantionului. Selecia subiecilor care au o anumit caracteristic de baz pentru cercetare se va face nc din faza deeantionare, nu la momentul aplicrii chestionarului. Primele ntrebri vor fi bazate pe utilizarea unor scale nominale, referitoare la comportamente uzuale ale respondenilor,referitor la care rspunsurile pot fi date spontan, fr ca subiectul s se gndeasc prea mult. ntrebrile mai dificile,bazate pe scale ordinale, interval sau proporionale ce solicitprocesele mentale ale respondentului, se vor plasa ctre mijlocul chestionarului , ns vor fi intercalate cu ntrebri uoare i de complexitate medie pentru a nu obosi respondentul Chestionare prin coresponden sau telefon Ancheta indirect (prin coresponden) presupune utilizarea chestionarului potal. Acest fapt presupune o independen i autonomie a subiectului fa de operatorul de interviu. n unele cazuri aceast modalitate se desfoar ca o anchet colectiv -- cnd se lanseaz simultan chestionare unui mare numr de subieci elevi, studeni la sal, salariai aflai la locul de munc, persoane ntr-o reuniune, spectatori etc. Avantajul principal al metodei sondajului prin pot este nivelul redus al cheltuielilor pe care le implic. Cu un buget foarte mic se pot itacta un mare numr de persoane de pe o arie geografic foarte mare. Dezavantajele acestei metode sunt: - dificultatea alegerii unui eantion reprezentativ; -necesitatea de a avea un chestionar simplu i scurt, ceea ce limiteaz profunzimea analizei; - rata mic de rspunsuri, de obicei nu mai mare de lO^c: - influena pe care o poate exercita numrul mic de rspunsuri. De obicei cei care rspund, manifest un interes mai mane n subiectul respectiv dect unele persoane luate la ntmplare din cadrul eantionului. O subvariant a anchetei indirecte este ancheta prin publicaii (ziare, reviste etc.). INTERVIUL PRIN TELEFON 31 Principalulavantajal discuiilor prin telefon ca tehnic de cercetare const n costul lor mic. Este mai puin eficient dect metoda discuiilor personale, dar pe de alt parte este mai simpl i mai rapid. Interviurile prin telefon se recomand n cazul cadrelor de execuie foarte ocupate sau cnd persoanele avute n vedere nu doresc s acorde interviuri personale. Rata rspunsurilor prin telefon este mai mare dect cele prin coresponden. Interviurile prin telefon se cer, n principal, n cazurile: -pre-testarea chestionarelor pentru interviuri personale; -selectarea subiectelor pentru interviuri personale prin depistarea subiectelorceintereseaz persoanelencauzsau pentru sondarea disponibilitii persoanelor care vor acorda interviurile; - obinerea de date statistice simple; - verificarea i confirmarea unor date obinute prin interviuri personale sau sondaje prin pot; - obinerea de date imediate cu privire la dimensiunea audienei avut la public a unor reclame publicitare prin radio i televiziune; realizarea unui contact iniial cu viitoare persoane ce vor fi intervievate. Dezavantajele interviurilor prin telefon sunt n principal urmtoarele: - chestionarul trebuie s fie scurt i simplu ceea ce limiteaz profunzimea i gama informaiilor ce se vor obine; -trebuie meninut un flux continuu de conversaie ceea ce face dificile pauzele pentru gndire; - cu greu se pot aprecia atitudinea i reaciile celui care rspunde; -informaii confideniale foarte rar se dau prin telefon ceea ce influeneaz, deci, profunzimea i acurateea informaiilor; Interviul Interviul - form derivat a anchetei prin sondaj - prezint unele deosebiri comparativ cu ancheta, ndeosebi prin faptul c rareori se bazeaz pe un chestionar, ci uneori pe un ghid de interviu. Dac la anchetele prin sondaj condiia de baz o constituie reprezentativitatea eantionului cercetat, iar principiul fundamental al includerii unui subiect n eantionul cercetat este ntmplarea, la interviu, dirijismul este criteriul impus de cercettor care orienteaz selecia subiecilor n funcie de gradul de interes i competen pe care l au anumite persoane. Interviurile se grupeaz n: -interviul fa n fa" sau telefonic - dup genul desfurrii convorbirii; -dup gradul de libertate n formularea ntrebrilor se disting interviuri: structurate, semistructurate i nestructurate; - dup numrul participanilor la interviu se deosebesc: interviuri personale i de grup. Interviul structurat se apropie cel mai mult de ancheta pe baz de chestionar i desfurare oral. Interviul semistructurat presupune stabilirea doar a temei ce va forma obiectul discuiei. Rezult de aici importana pe care o au calitile operatorului de interviu pentru a obine rspunsuri relevante de la cel intervievat. Interviul nestructurat presupune o discuie liber la care nici tema nu a fost prealabil fixat. Erorile de rspuns Erori de nonrspuns. Se nelege prin nonrspuns lipsa rspunsurilor la anumte ntrebari din chestionarsau la ntregul chestionar. Motivele refuyzului la ntrebare pot si generate de cele mai diferite cause. Marjele de rspunsoscileaz ntre 85-90% n ri cu tradiie n anchete prin sondaj i 25%-45% la anchetele comerciale effectuate prin pot. Cea mai simpl soluie de contractare o reprezint majoraea volumului eantionului,iar cea mai complet i precis este metoda probabilist de corectare a prediciilor n baza ratei de nonrspuns. Erorile de chestionar Cele mai frecvente erori de chestionar provin din chestionarele autoadmisnitrative. Erorile de chestionar se mpart n: -erori generate de forumlarea ntrebrilor -erori generate de nr i oridnea ntrebrilor -erori generate de forma de rspuns a ntrebrilor -erori generate de construcia grafic a chestionarului. 32 Erorile datorate operatorilor. Operatorii prin personalitatea, propriile opinii i priceperi pot induce erori n rezultate finale. Erori datorate respondeilor. Generate de-dezirabilitatea social a temei abordate, astfel nct subiecii snt tentai s rspund n conformitate cu ceea c este de dorit din punct de vedere social, ndeosebi ca o chestiune de imagine. -Limitele memoriei umane snt evidente n cadrul ntrebrilor ce vizez memoria de lung durat. Specialitii apreciaz c la distane de 1-3 luni de interviu, % de erori de amintire a evenimentelor este de 35%, pentru 4-6 luni de 50% , la 10-12 luni de 70%. Codificarea rspunsurilor din chestionar Codificarea rspunsurilor din ntrebarile deschise. Pe baza frecvenelor rspunsurilor se elaboreaz un cod specific astfel nct toate sau aproape toate rspunsurile se se poat ncadra n categorii omogene i distincte. Posibile erori pot proven de laoperatori n nregistrarea rspunsurilor, datorate fie neateniei i divergenelor de interpretare din parte codatorilor. Prelucrarea automat a datelor din sondaje Prelucrareapresupune parcurgerea a dou mari etape: 1) cantitativ, 2) calitativ. 1. Prelucrarea cantitativ are ca subetape: - verificarea numeric a chestionarelor; - verificarea completitudinii, n sensul nregistrrii de rspunsuri la toate ntrebrile (sau la toate la care este logic, avnd n vedere c pot fi ntrebri ce vizeaz doar un segment al populaiei); -verificarea exactitii nregistrrilor prin parcurgerea chestionarului n ansamblul su, ncercnd s urmrim coerena rspunsurilor, absena contrazicerilor; - verificarea uniformitii chestionarelor presupune o comparare a modului n care au fost "administrate" chestionarele i nelese ntrebrile i instruciunile de ctre diferii operatori de interviu. 2. Prelucrarea calitativ are ca obiectiv extragerea de indicatori care s dea o msur a fenomenelor i proceselor investigate. Aceast faz presupune parcurgerea tuturor etapelor ce au fcut obiectul cursului pn la acest capitol, de la sistematizare, eliminarea valorilor aberante, alctuirea seriilor, calculul parametrilor de tendin, de mprtiere, corelarea indicatorilor etc., pn la extinderea rezultatelor la ntreaga populaie. Compararea medie de sondaj cu cu media populaiei ntr-o repartiie normal Acest procedeu statistic re o larg aplicabilitate n controlul calitii produselor, pentru verificarea parametrilor tehnici ai unui process tehnologic.Se face ipoteza c media populaiei de referin este o valoare m0 iar pe baza eantionului prelevat, de volum n, se stabileste media acestuia ca fiind . Se pune astfel problema de a testa dac media populaiei este egal sau nu cu valoare fixat anterior.Pentru cazul tetului bilateral, adic: {

a)Variana 2 este cunoscut, situaie ntlnit n controlul unui process de producie. Pentru testare se definte:

Care urmez o repartiie normal centrat redus dac volumul eantinului este mai mare dect 30 uniti sau o repartiie Student daca n 30 iar varianele populaiilor snt cunocute

La fel urmeaz o repartiie student cu grade de libertate c)daca n1>30, n2>30 iar variantelesint cunoscute. Atunci variantele vor fi inlocuite cu estimatorii acestora

34 De unde se obtine statistica:

Pentru toate cazurile regiunea de accpetare este

Luarea deciziei se realizeaz astfel: - dac diferena calculat aparine intervalului

tuncicele 2 populaii nu difer n mod semnificativ din punc e vedere al nivelului mediu al caracteristicii studiate. -n caz contrar , diferena este semnificativ Conceptul de eficien a sondajului statistic Utilizareasondajului statistic, ca alternativ a observrii statistice totale, este un avantaj major pe care l aduce aceast formde cercetare. Eficiena sondajului este demonstrat prin avantajele pe care le are: 1.Costul- costurile de obinere a datelor statistice snt cu multmai reduse dect n cazul observrii exhaustive.Aceasta ntruct se nregistreaz numai o parte a populaiei cercetate.2.Rapiditatea reprezint unul din argumentele importante ce a dus la utlizarea cu preponderen a cercetrilor selective n studiul fenomenelor socio-economice. Aa cum eantioanele snt cu mult mai mici dect populaia de referin, are loc reducerea timpului de culegere i prelucrare a datelor, n aceeai msur reducndu-se timpul alocat pregtirii observrii.3.Exactitatea. n general orice proces de observare statistic este susceptibil de a fi afectat deerori, dar sondajul permite obinerea de date mai exacte dect n cazul recensmintelor.Aceasta se datoreaz n primul rndutilizrii n procesul de culgere a datelora unor persoane competente, organirii riguroase a controlului n teren.4.Cerine speciale. Exist anumite domenii n care observprile exhaustive nu pot fi utilizare. Exemplu tipic este analiza calitii unui lot de produse, caz n care n mod frecvent, aceasta presupune distrugerea total sau parial a prduselor. Econometrie Modeluli ipotezele sale Modelul econometric prezentat fie sub forma unei scheme vizuale, fie prin ecuaii, red ce are esenial agregatul economiei limitndu-se la descrierea, deseori global, a transformrii cauzelor n efecte ce privesc principalele sectoare din economie. Modelele de regresie au ca scopreprezentarea rezumativ ntr-un plan a norului de puncte, adic reprezentarea alurii distribuiei a dou variabile corelate. Prin curbele de regresie se prezint corespondena ntre perechile de valori( )i iy x ; sau, n cazul tabelului de corelaie ntre( )i iy x ; , numindu-se curbe de regresie a variabilei y n x.Cele mai utilizate modele de regresie n studiul fenomenelor i proceselor social economice sunt: a) Liniar, b) Exponenial, c)Putere,d) Parabolic, e) Hiperbolic, f) Tornqvist, g) Gompertz, h) Logistic. Stabilirea i analiza modelului de regresie presupune efectuarea urmtorilor pai: Construirea corelogramei; Aproximarea, pe baza ajustrii corelogramei, a formei legturii printr-un model teoretic i scrierea ecuaiei corespunztoare modelului de regresie ales; 35 Estimarea parametrilor ecuaiei de regresie (pe baza metodei celor mai mici ptrate) i interpretarea regresiei n funcie de semnul i valoarea lor. Legtura statistic ntre dou variabile: Y (variabila dependent) i X (variabila independent) se poate exprima printr-o funcie de regresie: ( ) e x f yx+ =Alegerea modelului depinde de volumul datelor cunoscute.Modelul de regresie liniar simpl exprim legturadintre dou variabile i ia forma: c + + = bX a YUnde a i b sunt parametrii necunoscui ce urmeaz a fi estimai,c -variabila aleatoare (eroare perturbaie). Ipotezele I.1. Modelul este liniar n raport cutX ; I.2. Valorile tXsunt considerate fr erori de observare sau msurare. n raport cu perturbaia tc se fac urmtoarele ipoteze (Condiiile Gauss-Markov) Datele statistice sunt colectate fie pentru un eantion n cazul datelor instatntanee, fie pentru o perioad limitat de timp n cazul seriilor cronologice. I.3. Variabila rezidual ( c ) este normal distribuit de medie nul. Sperana matematic a erorii este nul ( ) ( ) n t Et, 1 , 0 = = c ( cea ce nseamn c n medie modelul este bine specificat). I.4. Perturbaia este omoscedastic. Variaia erorilor este constant i nu depinde de numrul observaiei. ,{ } ( )2 2o c c = = = const E Vt t n caz contrar avem eteroscedasticitate. I.5. Perturbaiile pentru diverse observaii nu coreleaz ntre ele{ } s t Covs t= = pentru0 ,c c . Valorile variabilei reziduale nu sunt autocorelate (sunt independente ntre ele). Valorile consecutive ale variabilei reziduale nu depind una de alta. Astfel se presupune c lipsete legtura sistemic dintre valorile termenului aleatoriu n oricare dou observaii. I.6. Valorile variabilei reziduale sunt independente de valorile variabilei explicative( ) 0 , =t tX Cov c . Variabila rezidual este independent de evoluia variabilei explicative, ceea ce presupune c dispersiile valorilor reziduale, calculate pentru diverse segmente de valori tX nu difer ntre ele. Modelul prezentat mai sus mpreun cu ipotezele 3-5 satisfac condiiile Gauss-Marcov i se numete modelul clasic de regresie. Proprietile estimatorilor Proprietatea de nedeplasare Sperana matematic a estimaiilor este egal cu valoarea adevrat a valorii parametrului ( ) a b X X b a b E X Y X b Y E a Ebxbx xxEy xxy xE b Ett ttt ttt t= + = = == = = = 2 2 2 Proprietatea de consisten La cretereanumrului de observaii despersia estimaiei parametrilor tinde spre 0. Valorile estimaiei parametrilor se concentreaz n jurul valorilor adevrate.Astfefel pentru calcularea disperiilor estimaiilor( ) ( ) sia V b V este necesar de cunoscut nc un parametru al modelului: dispersia erorilor 2oi deoarece ea este necunoscut e necesar de obinut estimaia ei pe baza rezultatelor observaiilor . Estimaia disperiei erorilor se determincu ajutorul obsevaiilor reziduale te : 36 = =2 2 221tens o , forma dat reprezint o estimaie nedeplasat a dispersiei erorilor2o . Astfel : ( )=222ttx nXs a V ;( ) =22 txsb VY Y y X X xt t t t = = , Ipoteza de normalitate a erorilor. Consecinele ipotezei de normalitate a erorilor Ipoteza de normalitate a erorilor presupune c variabilac urmeaz o lege normal de medie 0 i varian 2o .( )2, 0 o c Nt ~ . Efectele nclcrii acestei ipotezeIpoteza de normalitate a erorilor este important pentru stabilirea proprietilor estimatorilor parametrilor modelului de regresie. Dac( )2, 0 o c Nt ~ , atunci estimatorii parametrilor de regresie urmeaz de asemenea o lege normal:( )2, 0 oo o N ~ ;( )2, 0|o | N ~Dac ipoteza de normalitate este nclcat, proprietile estimatorilor construii pe baza MCMMP au doar proprieti asimptotice, adic necesit eantioane sau seturi mari de date. Verificarea acestei ipoteze implic testarea ipotezei c, n medie modelul este bine specificat( ) 0 = c MTestarea ipotezei de normalitate a erorilor se poate realiza cu ajutorul procedeelor grafice sau numerice (spre exemplu testul T student, Kolmogorov-Smirnov, Jarque-Bera). Ecuaia de analiz a varianei Ecuaia fundamental de analiz a varianei este ( ) ( )SPRSPE SPT2 2 2+ =+ = t t te y y y y. Analiza varianei presupune i efectuarea testului Fisher conform crui se depisteaz urmtoarele: exist cel puin o variabil explicativ semnificativ? Astfel: H0: a1=a2=ak=0 (toi coeficienii sunt nuli). H1: exist cel puin un coeficient diferit de zero Cazul n care ipoteza H0 este acceptat semnific c nu exist nici o relaie liniar semnificativ ntre variabilele de explicat i variabilele explicative (adic Suma Ptratelor Explicate nu este semnificativ diferit de zero). Tabelul 1 Analiza varianei pentruo regresie multipl Sursa variaieiSuma ptratelorGradul de libertatePtrate medii kx x x ,..., ,2 1 ( )2 = y y SCEt kSCE/k Reziduu =2te SCRn-k-1SCR/(n-k-1) Total ( ) =2y y SCTt n-1- ( ) ( ) ( ) 1 / 1/1 //22 = =k n Rk Rk n SPRk SCEFcalc Ipoteza de normalitate a erorilorimplic c n baza ipotezei H0, Fcalc urmeaz o lege Fisher . 37 Vom compara deci Fcalc cu F teoretic cu k i (n-k-1) grade de libertate: dac Fcalc. >Ftab., atunci vom elimina ipoteza H0, modelul este global explicativ. Pentru regresia simpl, analiza presupune: Formularea ipotezelor: 0 :0 :10==R IR I 2. Calculm valoarea calculat a testului .

( )( )2212Rn RFcalc = 3.Calculm valoarea teoretic a testului Fisher ,n dependen de nivelul de semnificaie ,cu o probabilitate de 95% ,=0,05.

k n kF ; 1 : o 4.Comparm valoarea teoretic cu cea calculat a testului: Dac: k n k calcF F , atinci neglijm ipoteza H0, iaeste semnificativ diferit de 0a . Caz particular test n raport cu o valoare particular00 = aDac dorim s tim dac o variabil explicativ care figureaz ntr-un model este ntr-adevr semnificativ diferit de 0 pentru un prag ales, n general% 5 = o , atunci relaia de mai sus a tcalc. Devine: aicalcato= - legea Student (n-k-1) grade de libertate Acest test este foarte important, dac ntr-un model estimatunul din coeficieni nu este semnificativ diferit de 0, e mai bine de eliminat aceast variabil i de estimat coeficienii modelului. Intervalul de ncredere a variaiei erorii permite determinareavariaiei amplitudinei erorii. Astfel, avem: ( ) ( )((

222212 1; 1:_o_oe ek n k nICCu21_avnd (n-k-1) grade de libertate i( ) 2 / 1 o de probabilitate de a fi depit i 22_avnd (n-k-1) grade de libertate i2 / ode probabilitate de a fi depit. ( ) ( )( ) ( ) 1 ;2121 05 , 02122 = = =k nk no_o_ o 39 Deci, intervalul de ncredere pentru variaia erorilor, dac probabilitatea cu care se garanteaz rezultateleeste de 95% va fi cuprins ntre: IC Previziunea variabilei endogene Pentru cazul regresiei simple Pentru a afla prognoza celor dou variabile pe intervalevom utiliza formula de estimare de prognoz: ( ),1) 1222 2||.|

\|+ =tpyxxns s( ) X X xpreviz p = Pentru a determina limitele intervalului de ncredere este necesar de calculat dispersia sumar: 2 22) 1 s s sYp+ =Limitele pentru intervalele de prognoz a valorilor individuale Yt se determin conform relaiei: ( ) oo = 1p ts t Y P 40 Pentru cazul regresiei multiple Previziunea pentru data (t+h) este urmtoarea: h kt k h t h t h tx a x a x a a y+ + + ++ + + + = ... 2 2 1 1 0 Eroarea de previziune este dat prin h t h t h ty y e+ + + = Variana erorilor de previziune este egal cu: ( ) | |((

= '+ ' ' =+ + + ++++h kt h t h t h th t h t ex x x X undeX X X Xh t... 11 1 11 2 2o o Intervalul de previziune pentru perioada h ( ) | | 1 *2 2 /1+ ' ' =+ + + h t h t e k n h tX X X X t Y IC oo Forma matricial a modelului multiplu Forma modelului: i i i i ix a x a x a a Y c + + + + =3 3 2 2 1 1 0 Forma matricial a modeluluidat va fi: ( ) ( ) ( ) ( ) 1 , 1 ; 1 1 ; 1 ;*n k k n na X Y c + =+ + Unde : ||||||.|

\|=|||||.|

\|=||||||.|

\|=||||||.|

\|=1432132101 13 23 132 22 121 21 11321..; ;1.. .. .. ..111;..cccccaaaaax x xx x xx x xx x xXyyyyYkn n nkkkt Se observ c prima coloan a matricei X,este compus din 1,corespunde coeficientului 0a(coeficientultermenului constant). Soluionarea modelului presupune estimarea vectorului compus din parametrii 3 2 1 0, , , a a a a,astfel vom aplica Metoda Celor Mai Mici Ptrate (MCMMP) care const na minimiza suma ptratelor erorilor, adic: ( ) ( ) ( )( ) Xa X a Y X a Y YXa X a Y X a Xa Y Y Y S Xa Y Xa Yniia' ' + ' ' '= ' ' + ' ' ' ' = = ' = ' ==2 minmin min min min min12c c c Pentru a minimiza aceast funcie n raport cu a, calculm difereniala lui S n raport cu a: 41 ( ) ( ) ( ) ( )( ) ( ) Y X X X aastf elY X X X a X X X XY X a X XXa X Y XaS' ' =' ' = ' '' = '= ' + ' =cc 11 1,0 2 2 ( )|||||||.|

\|= ' 23 2 3 1 33 222 1 23 132 12211321x x x x xx x x x xx xxx xxxxxxxnX Xt t tttt ( )|||||||.|

\|= 't tt tt tty xy xy xyY X321 Estimarea coeficienilor regresiei Estimarea parametrilor de regresie par prin metoda MCMMP. Este necesar respectarea condiiilor: ( ) ( ) = = = = =ntntt t t tb atnt b aX b a Y Y Y e1 12,21 ,*min min, iar parametrii trebuie alei astfel, nct suma ptratelor reziduurilor s fie minimal. ( )( )( )( ) xy xx x ny x y x nbx x ny x x x yay x x b x ay x b a ni ii i i ii ii i i i ii i i ii ivar, cov222222==== += + ,x b a y + =(estimaia modelului teoretic) Ipotezele i proprietile estimatorilor Pentru Modelul de regresie multiplmenionm urmtoarele ipoteze: 1. Ipoteze stocastice: H1:valorile t ix, sunt observate fr eroare. H2:( ) 0 =tE c , sperana matematic a erorii este nul. H3:( )2 2co c = t E , variana erorii este constant( ) t (omoscedasticitate) H4:( ) s, t si 0 , = =s tE c c erorile nu sunt corelate (sau independente) H5:( ) 0 , =t itx Cov c , eroarea este independent de variabilele explicative. 42 2. Ipoteze structurale H6: absena colinearitii ntre variabilele explicative, ceea ce implic ca matricea( ) X X's fie regulat i ca matricea invers( )1 'X X s existe. H7:( ) X X' /n tinde spre o matrice finit non-singular H8:1 + > k nnumrul observrilor este superior numrului de serii explicative. Proprietile estimatorilor 1.Estimatorul este nedeplasat ( ) a a E = 2.Proprietatea de consisten Conform definiiei variana erorilor se calculeaz astfel: 1 122 = '=k nek ne eieo Matriceavarianei i covarianei coeficienilor de regresie este: ( )1 2' = O X Xe ao Ecuaia analizei varianei i calitatea unei ajustrii a) y y y ytttt = = pentru un model de regresie simpl, avem b) =tte 0Din aceste dou relaii, deducem ecuaia fundamental a analizei varianei: ( ) ( )SPRSPE SPT2 2 2+ =+ = t t te y y y y Variabilitatea total (SPT) este egal cu variabilitatea explicat (SPE)+ variabilitaea rezidurilor (SPR). Totui, aceste valori depind de unitile de msur, de aceea se prefer utilizarea numrului fr dimensiune: ( )( ) ( ) ==222221y yey yy yRtttt 2Rse numete coeficient de determinare, i R coeficient de corelare multipl. 2Rmsoar proporia vareianei luiY explicat prin regresia lui Y prin X. Atunci cnd gradul de libertate este slab, trebuie de corectat 2Rpentru a ine cont de numrul relativ slab de observri comparat cu numrul de factori explicativi prin calculul unui 2Rcorectat notat 2R : ( )2 21111 Rk nnR = Construirea tabelului de analiz a varianei i testul de semnificaie global a unei regresii 43 Este folosit la verificarea validitii modelului. Un model este valid dac proporia varianei explicate prin model este semnificativ.Ipoteza nul pentru testul F in cazul acesta este cea de model nevalid FactoriiSuma ptratelor Grade de libertate Dispersiiile Test Fishercalc

Eseniali (x) ||.|

\|.2y yi k-1 ||.|

\|.2y yi / (k-1) =2xo Fcalc=22uxoo Neeseniali (u) |||.|

\| .2i iy yn-k |||.|

\| .2i iy y/(n-k)=2uo

Total ||.|

\|2i iy yn-1

Evaluarea global a modelului de regresie se realizeaz prin testarea fie a coeficientului de corelaie,fie a raportului de corelaie. Presupune testarea influenei variabilei factoriale (X ) asupra variaiei variabilei rezultative (Y ). Se verific dac variabila factorial (X ) influeneaz semnificativ variaia variabilei rezultative (Y ), adic dac estesemnificativproporia variaiei explicate pe seama variabilei factoriale.Aceast operaie se bazeaz pe ecuaia de analiz a varianei, respectiv a raportului de determinare, R, i araportului denedeterminare, (1- R2). Pentru testarea coeficientului de ocrelaie se poate folosi testul t-Student, iar pentru testarea raportului de corelaie, testul Fisher, rezultatele sunt aceleai. Fiabilitatea previziunii i intervalul de ncredere Calitatea prognozei depinde de orizontul pentru care se realizeaz aceasta, care trebuie stabilit n funcie de natura fenomenului studiat. Marea mojoritate a procedeelor de analiz a calitii ajustrii se bazeaz pe studiul abaterilor dintre termenii reali i termenii ajustai ai seriei cronologice. Unul din procedee const n compararea irului valorilor empirice(reale) cu cel al valorilor ajustate. n acest mod se observ amplasarea abaterilor valorilor ajustate de la valorile reale i se alege acea metod de ajustare care ne arat cele mai apropiate valori calculate de valorile reale. Al doilea procedeu const n compararea sumelor valorilor ajustate cu suma termenilor reali. Potrivit acestui criteriu, metoda care realizeaz cea mai bun estimare a tendinei centrale este aceea care conduce la cea mai mare apropiere a sumei valorilor ajustate de suma valorilor empirice. Argumentul n favoarea utilizrii acestui procedeu se bazeaz pe condiia ca suma abaterilor valorilor ajustate fa de termenii reali trebuie s fie nul. 44 O alt modalitate de caracterizare a calitii ajustrii are la baz funcia obiectiv a metodei celor mai mici ptrate, care este utilizat pentru estimarea modelelor de regresie, i anume ( )t ty y . A defini un interval de ncredere nseamn a cuta limitale de ncredere Li=-x i Ls= +x, n care probabil se situiaz (parametru) pentru un coeficient de ncredere: P(LiLs)=1-. Calculul limitelor de ncredere pornete de la valoarea erorii limit. Aflarea limitelor de ncredere ne ajut s stabilim intervalul de ncredere n care se gsete o valoare observat a unui parametru calculat pa baza datelor observate la nivelul unui eantion.

Teste de detectare a multicolinearitii n cazul modelului de multifactorial, ipoteza 1, presupune independena variabilelor explicative, nerespectaarea ipotezei produce fenomenul de multicoliniaritate, caz n care o variabil endogen este explicat de mai multe variabie explicative.Teste de determinare a multicoliniaritii: 1)Testul Klein, acest test presupune compararea coeficientului de determinaie 2yR , calculat pentru modelul cu k variabile exogene:u x x yx k+ + + + =. . .| | | ...1 1 0i coeficientul de corelaie simpl 2,j ix xrntre variabilele explicative pentru i = j. Dac2yR2,j ix xr , exist prezumia (presupunerea) multicoliniaritii. 2)Testul Farrar ef Glauber Etapa 1. Calculm determinantul matricei coeficienilor de corelaie ntre variabilele explicative: 1 ......... 1... 13 2 12 3 2 1 21 3 1 2 1xkx xkx xkxxk x x x x xxk x x x x xr r rr r rr r rD =dac valoarea determinatului D tinde spe 0, riscul multicoliniaritii este mare. Etapa 2. Efectum un test 2_ , verificnd ipotezele : I0. D=1(seriile sunt ortogonale); I1. D=0 (seriile sunt dependente). Dactabelar calc2 2_ _ > , atunci I0 este respins, are loc prezumia multicoliniaritii, n caz contrar se accept I1. 3)Metoda regresiei consecutive, ncepe cu estimarea dependenei ce include toate variabilele explicative identificate. La fiecare iteraie se exclude o variabil. Procesul se termin cu ecuaia final testa, adecvat dependenei analizate. Aceasta este o metod de a ajunge la acelai rezultat, dar procednd n direcie invers. Procedurile de estimare n cazul autocorelrii erorilor Pentru corectarea influenei generale de autocorelarea erorilor sunt folosite o serie de proceduri: 45 1.Metoda Cochrane-Orcutt de estimare a parametrilor, presupune parcurgerea urmtoarelor etape: a)Se estim