Note de Curs Statistica

of 183 /183
STATISTICĂ ECONOMICĂ NOTE DE CURS CAPITOLUL 1 STATISTICA - INSTRUMENT DE CUNOAŞTERE A FENOMENELOR DE MASĂ Conceptul de statistică, scurt istoric Statistica este stiinta care se ocupa cu descrierea si analiza numerica a fenomenelor de masa, dezvaluind particularitatile lor de volum, structura, dinamica, conexiune, precum si regularitatile sau legile ce le guverneaza [Trebici, V., 1985]. Exista un mare numar de definitii ale statisticii fapt care are mai multe explicatii; istorice - statistica s-a constituit la confluenta mai multor orientari si discipline, dar avand la origine un caracter social; metodologice - statistica incorporeaza o serie de metode in care predomina cele cantitative, cu fundamentarea epistemologica corespunzatoare; aplicative - prin generalitatea metodelor sale, statistica se aplica in cele mai variate domenii, de la astronomie la societate, de la microcosmos la macrocosmos in - 1 -

description

statistica

Transcript of Note de Curs Statistica

STATISTICĂ ECONOMICĂ

NOTE DE CURS

CAPITOLUL 1

STATISTICA - INSTRUMENT DE CUNOAŞTERE A

FENOMENELOR DE MASĂ

Conceptul de statistică, scurt istoric

Statistica este stiinta care se ocupa cu descrierea si analiza numerica a

fenomenelor de masa, dezvaluind particularitatile lor de volum, structura, dinamica,

conexiune, precum si regularitatile sau legile ce le guverneaza [Trebici, V., 1985].

Exista un mare numar de definitii ale statisticii fapt care are mai multe explicatii;

istorice - statistica s-a constituit la confluenta mai multor orientari si discipline, dar avand

la origine un caracter social; metodologice - statistica incorporeaza o serie de metode in

care predomina cele cantitative, cu fundamentarea epistemologica corespunzatoare;

aplicative - prin generalitatea metodelor sale, statistica se aplica in cele mai variate

domenii, de la astronomie la societate, de la microcosmos la macrocosmos in natura si

societate, de la fizica statistica pana la statistica sociala. Trebici, V., 1985\.

O definitie sau alta, staruie fie asupra unei faze din demersul metodologic, fie asupra unui

domeniu restrans, fie asupra unui grup de metode, asupra teoriei sau dimpotriva a

aplicatiilor.

In prezent statistica dispune de un corp de metode a caror putere de cunoastere

este verificata in variate domenii si de o teorie generala in continua dezvoltare. Cultura

statisticii devine tot mai mult o componenta din cultura generala a omenirii

contemporane, iar gandirea statisticii - o modalitate stiintifica indispensabila pentru

analiza si interpretarea unor clase foarte largi de fenomene.

- 1 -

Rezultat al unui indelungat proces, statistica se prezinta cu un corp comun de

notiuni organizat in jurul conceptului de probabilitate, de metode stiintifice, cu

fundamentare epistemologica explicita si cu o varietate de domenii de aplicare,

acoperind practic natura si societatea.

Astazi, statistica constituie un puternic instrument de cunoastere a lumii

inconjuratoare. Marea majoritate a disciplinelor imprumuta de la statistica modelele si

procedeele acesteia, indispensabile de altfel indeplinirii rolului acestora. Trebuie

mentionat insa marele pericol la care aceste discipline pot fi supuse in cazul folosirii

necorespunzatoare a metodelor si procedeelor statistice.

Analiza si cunoasterea fenomenelor si proceselor social economice se poate

realiza numai ca urmare a unei observari riguroase si metodice, in cursul careia ele pot fi

masurate. In cadrul operatiei de modelare a fenomenelor si proceselor are loc un proces

de simbolizare si abstractizare a lor in vederea analizarii sub aspect cantitativ. Analiza

cantitativa constitute o faza premergatoare analizei calitative. Testarea modelelor

construite se realizeaza prin intermediul operatiei de simulare. Pe parcursul tuturor

fazelor de construire si testare a modelelor, statistica este mereu prezenta in campul

cercetarii stiintifice fiind solicitata de a lua decizii pe baza metodelor si procedeelor pe

care le pune la dispozitie. Modelul construit si testat vine in ajutorul statisticii sa

aprofundeze cunoasterea fenomenelor si proceselor.

Modelarea matematica a castigat tot mai mult teren, dobandind o importanta

deosebita, odata cu intensificarea aplicarii modelelor statistice. Culegerea si organizarea

datelor rezultate din observari statistice constituie etapa premergatoare elaborarii unui

model. In acest mod, modelul realizat va reprezenta o macheta a realitatii, alcatuita pe

baza datelor din observarea statistica. Pe buna dreptate, modelarea este considerate o

modalitate de cunoastere a realitatii inconjuratoare.

Organizarea culegerii, transmiterii si receptionarii informatiilor in cadrul unui

sistem economic constituie obiectivele esentiale ale unui sistem informational. Un sistem

informational este alcatuit din mai multe circuite informationale, unde fiecare in parte

trebuie sa includa operatii de culegere, transmitere neperturbata a datelor si receptionarii

acestora in scopul folosirii lor. Trecerea de la prelucrarea manuala la cea automatizata a

tuturor fazelor din cadrul sistemului informational, adanceste procesul de cunoastere a

- 2 -

realitatii, permitand asimilarea sistemului informational unui flux tennologic

informational, prin transformarea lui intr-un sistem cibernetic. Organizarea circulatiei

informatiei intr-un sistem in conformitate cu principiile sistemelor cibernetice, constituie

un suport stiintific in abordarea gestiunii eficiente a acestuia. Avand in vedere natura

nedeterminista a majoritatii elementelor componente dintr-un sistem cibernetic, studierea

stabilitatii acestora se realizeaza apeland tot la statistica. Studii de reglare si echilibru

intr-un sistem cibernetic se pot aborda numai pe baza unor observari statistice realizate

metodic care ne permit sa construim modelul matematic in conformitate cu realitatea.

` Informatica, prin aparatul sau, se implica tot mai mult in toate fazele de

vehiculare si prelucrare a informatiilor din cadrul sistemelor informationale, conducand

in acest mod la un salt calitativ important, cu consecinte semnificative si asupra statisticii.

Calculatoarele electronice, prin puterea lor de calcul, conduc la o noua viziune cu

privire la functiile statistice, precum si la modalitatile de realizare a acestor functii.

Realizarea automata si in regim interactiv a tuturor metodelor si procedeelor

algoritmizabile din statistica, cu ajutorul calculatorului nu afecteaza cu nimic obiectul si

metoda statisticii. Calculatorul electronic nu constituie decat un instrument de calcul,

degajand statistica de volumul mare de calcule. In aplicatiile practice implementate cu

ajutorul calculatorului specialistul este absolvit in totalitate de manipularea datelor cat si

a operatiilor cu acestea, concentrandu-se in exclusivitate asupra interpretarii rezultatelor

intermediare si finale.

Statistica informationala, care a fost denumita asa de academicianul Octav

Onicescu, si-a gasit aplicatii practice in diverse domenii. Studierea sistemelor in raport cu

informatia continuta in acestea, a permis o abordare sistemica si mai bine fundamentata

matematic a realitatii. Teoria matematica a informatiei formuleaza legile cele mai

generale cu privire la comenzile, controlul si comunicatiile dintr-un sistem, stabilind in

acelasi timp principiile de codificare, prelucrare, pastrare si transmitere a informatiei de

care statistica beneficiaza din plin. Initiatorul teoriei matematice a informatiei a fost

Claude Shannon, care s-a bazat pe teoria probabilitatilor. Teoria initiata de Shannon a

permis reducerea perturbatiei care influenteaza transmiterea informatiei.

Fiind un proces complex de cunoastere, judecata si actiune, managementul se

concretizeaza prin operatii de informare, analiza si control, punctul esential constituindu-l

- 3 -

momentul luarii deciziei. Toate aceste operatii folosesc metodele si procedeele statisticii

incepand cu culegerea (observarea) datelor si incheind cu deducerea concluziilor necesare

luarii deciziilor. Aceasta a permis conturarea unei discipline denumita teoria deciziei,

avand drept scop fundamentarea stiintifica a procesului decizional. Deoarece teoria

deciziei face apel si la modele deterministe, aceasta se integreaza intr-un domeniu mai

larg privind matematica aplicata si anume in cercetarea operationala. Cercetarea

operationala este considerata un instrument de conducere nationala a proceselor si

fenomenelor cu un inalt grad de complexitate. Aceasta disciplina integreaza in cuprinsul

sau metode si procedee statistice cat si o multime de tehnici de natura stiintifica, tehnica

si de culegere si prelucrare a informatiei.

Decizii in situatii de risc constituie un alt domeniu in care statistica se aplica.

Diversele variante de dezvoltare a unui fenomen sau proces, fie social sau economic,

presupune descompunerea acestuia intr-o multime de evenimente care formeaza un camp

complet de evenimente. Anticiparea celei mai plauzibile variante de dezvoltare a

fenomenului presupune cunoasterea distributiei de probabilitate asociata acestuia. Acest

lucru nu este posibil fara o observare metodica a evolutiei fenomenului in timp si ca

urmare o determinare a legii de probabilitate pe care o urmeaza.

Aflarea distributiei de probabilitate, utilizand modele si procedee statistice,

permite a aprecia gradul de risc la care este supusa o actiune sau alta.

In marketing statistica se regaseste in S.S.D.M. (sistemul suport al deciziilor de

marketing), ca acesta fiind compus din ,,Banca statistica" si ,,Banca de modele". SSDM

este un ansamblu coordonat de date, sisteme, instrumente si tehnici, inzestrat cu

tehnologia necesara ce ajuta o organizatie sa culeaga si sa interpreteze informatiile

relevante referitoare la activitatea sa si la mediul in care opereaza facand din acesta

temelia actiunilor de marketing. [Kotler.Pk, 1997}.

Pe baza celor prezentate se poate sublinia inca o data rolul si importanta

cunoasterii metodelor si procedeelor puse la dispozitie de statistica in procesul

cunoasterii. Nu este lipsit de importanta aportul statisticii nici in domenii ca: medicina,

biologie, fizica, chimie, stiinte juridice etc. Frecvente sunt cazurile in care studii

intreprinse in aceste domenii trag concluzii care au la baza o multime de date rezultate in

urma unor observari statistice, implicand nemijlocit modele ale inferentei statistice.

- 4 -

Ronald Fisher a remarcat: ,,Catre statisticieni ne indreptam pentru a raspunde la

problemele cele mai serioase puse de marile aventuri ale epocii noastre. De fiecare data

cand se intreprinde ceva important, statisticienii sunt in culise. In toate cercetarile

stiintifice de baza, ei sunt cei care elaboreaza planurile de experiena sau observatii si tot

la ei se recurge pentru a analiza rezultatele pentru a evalua constatarile si pentru a separa

faptele clar demonstrate de cele ce mai cer confirmarea" [Trebici, V., 1985\.

Cercetarile stiintifice simt necesitatea unei ,,escorte statistice" in doua momente

fundamental ale cercetarii: momentul de inceput legat de culegerea si prelucrarea datelor

si in momentul aplicativ, de verificare a teoriilor pe calea confruntarii cu realitatea.

Multitudinea de domenii in care statistica se aplica i-a permis lui M.G. Kendall sa spuna

ca ,,Statistica, in sensul cel mai larg, este matricea oricarei stiinte experimentale".

Statistica, in contextul celorlalte stiinte, s-a confruntat ca discipline de sine

statatoare, urmand o traiectorie care leaga practica de teorie. Preocupari de natura

statistica, prin abordari variate a diverselor fenomene, se pierd in vechimea istoriei. Atat

in Grecia antica, dar mai cu seama in imperiul roman, investigatiile arheologice au scos la

iveala o serie de date care privescinventarierea bunurilor, a resurselor umane, descrierea

geografica si politica a diverselor state.

Toate aceste preocupari, indiferent de natura lor, au constituit o consecinta a

necesitatii practice, executandu-se in mod empiric si fara respectarea unor criterii

riguroase. Beneficiari ai acestor date erau organele fiscale, militare si cele administrative,

direct interesate in evaluarea potentialului uman si material a diverselor forme de

organizare teritoriala sau statala. Aceste date serveau in principal nevoilor practice de

orientare.

Interesele de ordin stiintific nu au intarziat prea mult sa apara, obligand statistica

sa paraseasca stadiul de statistica practica. Incepea sa se impuna cunoasterea unor

fenomene, referitor la care se cereau o multitudine de date. Ca urmare, apare necesitatea

cunoasterii unor tehnici care sa permita desprinderea unor concluzii fundamentale pe

baza datelor inregistrate. In faza incipienta de confruntare a statisticii, aceasta se

marginea la descrierea statului, expunerea situatiei geografice, economice si politice.

Acest mod de abordare a statisticii cunoscut sub numele de ,,descrierea statului"

a predominat pana in sec. al 17-lea si al 18-lea cand a atins punctul culminant,

- 5 -

concordand cu constituirea a in Germania a unei scoli, cunoscuta sub denumirea de

scoala descriptiva germana.

In conformitate cu normele teoretice, care erau specifice universitatilor germane,

descrierea statului s-a conturat ca o disciplina cu obiect propriu de predare. Ulterior,

aceasta disciplina nascuta din practica a primit numele de statistica, devenind un obiect

de studiu favorit in Germania. Termenul de statistica definit in spiritul scolii din

Gottingen, a fost preluat de multi statisticieni recunoscuti ai epocii respective.

Reprezentantii scolii de statistica din Germania, s-au ridicat in oarecare masura

peste orientarea pur descriptiva a inaintasilor, studiile care aveau drept obiectiv,

descrierea statului inregistrand o noua dimensiune si anume cea numerica. In acest nou

context, de imbogatire prin componenta numerica, statistica nu s-a schimbat din punct de

vedere a continutului, ea continuand sa ramana o discipline orientata cu preponderenta

spre descrierea fenomenelor si nu spre cautarea unor legi, ramanand o disciplina

caracterizata de un mod de prezentare preponderent verbal. In acest context au fost

elaborate lucrari cu privire la descrierea statelor in diferite tari europene, constituind

astazi valoroase surse de informatie.

In Moldova, cea mai de seama lucrare este ,Descrierea Moldovei" a lui Dimitrie

Cantemir. Aceasta lucrare, cu un pronuntat caracter monografic in plan geografic, politic,

social si cultural, s-a impus in mod deosebit lumii europene din acea perioada,

desemnandu-l pe autor in randul fruntasilor statisticii descriptive europene.

In perioada de avant a statisticii descriptive a statului, in Anglia si in afara universitatilor,

apare un curent statistic nou, cunoscut sub numele de aritmtlica politica. Noul curent din

statistica se caracterizeaza prin analiza datelor de observatie prin procedee matematice,

relevarea regularitatilor in fenomenele social-economice, formulari si incercari de

previzionare a unor fenomene.

Implicarea aparatului matematic in descoperirea legitatilor care caracterizau

fenomenele constituia un real progres, anticipand aparitia statisticii moderne.

Reprezentantii de seama a noului curent in statistica au insistat in mod deosebit

prin lucrari in domeniul demografiei, deoarece vedeau in studiul populatiei izvorul

bogatiei si puterii Angliei. Merita sa amintim in acest sens pe John Graunt, William Petty

si Edmund Malley.

- 6 -

J. Graunt, analizand cu atentie registrele de nasteri si decese din Londra, a

incercat sa gaseasca legitatile cresterii populatiei, a echilibrului numeric dintre sexe, a

fertilitatii, mortii etc. Studiile lui Graunt relevau, pentru prima oara, preponderanta

nasterilor masculine in raport cu nasterile feminine (107 baieti la 100 fete), calculand

primele rate de mortalitate pe grupe de varsta, alcatuind si o rudimentara tabela de

mortalitate.

W. Petty, prin lucrarile sale, foloseste estimarile cantitative in compararea

potentialului uman si economic al diferitelor state.

E. Halley a fost un reprezentant de seama a scolii statistice din acea vreme din

Anglia, abordand in lucrarile sale subiecte legate de estimarea populatiei catorva state,

bazandu-se pe criterii ceva mai rationale decat cele adoptate anterior, cat si alcatuirea

primei tabele complete de mortalitate.

La promovarea principiilor aritmeticii in investigarea fenomenelor economice s-

au evidential in mod deosebit alti doi reprezentanti ai scolii engleze: Devanant si King.

Ultimul s-a dedicat in mod special calculelor privind veniturile statului pe calea

impozitelor, de asemenea incercand sa stabileasca marimea capitalurilor de care dispunea

Anglia in sec. al 17-lea, pierderile suferite in urma razboaielor, incendiilor, epidemiilor.

Influenta aritmeticii politice engleze s-a facut simtita si in alte tari, conturandu-se

un curent al aritmeticii politice europene. Aritmetica politics s-a impus in lupta cu scoala

statisticii descriptive din Germania, prin intermediul lui J.P. Sussmlich. Lucrarile sale se

remarca in special prin: cautarea explicatiei fenomenelor vietii umane si indicarea legilor

ce le guverneaza, corelarea fenomenelor demografice si economice, examinarea

fenomenelor in dinamica, identificarea regularitatilor in volumul de date rezultate din

observatii etc.

In consecinta, se poate afirma ca la sfarsitu! sec. al 18-lea, in statistica se

prefigurau doua curente: primul curent corespunzator caruia statistica era

inteleasa ca o descriere empirica si verbala a caracteristicilor statului (statistica

descriptiva) si al doilea curent conform caruia statistica trebuie sa se dedice analizei

fenomenelor sociale, in cautarea de legitati intemeiate cu regularitate pe observatii si

calcule numerice (aritmetica politica).

- 7 -

Statistica, prin curentele sale, castiga teren tot mai mult, iar descrierile statistice

devin preocupari de baza in institutiile publice. Aritmetica politica, sub aspect

conceptual, capata o noua dimensiune odata cu inventarea calculului probabilitatilor.

Aceasta noua ramura a matematicii, avea sa indeplineasca misiunea fundamentarii

stiinfifice a preocuparilor statistice de pana atunci. Bernoulli si Laplace aveau sa fie

primii care au utilizat modelele teoriei probabilitatilor in studiul statistic al fenomenelor

economice si sociale. Bernoulli formuleaza ,,legea numerelor mari", deschizand drumul

aplicarii calculului probabilitatilor in economie. Laplace s-a preocupat de studierea

fenomenelor dependente de diversi factori complecsi de actiune, prefigurand utilitatea

acestui calcul si in abordarea de ansamblu a fenomenelor sociale.

Un alt reprezentant de seama al calculului probabilitatilor a fost Gauss, care a

definit legea de repartitie normala. In aceeasi perioada, Fourier a publicat un numar de

studii"despre aplicarea matematicii in investigatii demografice, iar Poisson descopera

legea de repartitie a evenimentelor rare.

Gandirea probabilistica avea sa se consolideze in statistica in secolul al 19-lea,

asigurandu-i progresul si renumele de care se bucura astazi in intreaga lume. Un

reprezentant de seama din aceasta perioada si care a dominat gandirea statistica a acestui

secol a fost matematicianul, astronomul si statisticianul belgian Adolphe Quatelet.

Conform teoriei acestui mare ganditor, diversele caractere fizice, intelectuale si

morale ale oamenilor, observati in masa, s-ar echilibra intr-o fiinta fictiva, ideala, dorita

de natura, dar neizbutita. Fiintele umane, conform teoriei ,,omului mediu", s-ar distribui

de-o parte si de alia a acestei fiinte ideale. Pentru a desprinde ce este general fiintei

umane, A. Quetelet presupune debarasarea omului de caracterele individuale ale sale care

nu sunt decat accidentale. Ideea de ,,om mediu" a constituit izvorul de inspiratie privind o

serie de notiuni si concepte noi din statistica, cum ar fi: repartitie, medie, dispersie,

observare de masa, regularitate etc. In conformitate cu teoria iui A. Quetelet,

regularitatile deduse ca urmare a unei observari de masa deriva din legi care sunt urmate

de om atat in ordinea fizica cat si in cea morala. Lui A. Quetelet i se atribuie, pentru

prima oara, o teorie sintetica a statisticii bazata pe principii, tehnici si procedee statistice.

Acesta imprima statisticii noi directii de cercetare: cercetarea variatiei si a

relatiilor cazuale in masa fenomenelor, sesizarea regularitatilor, abordarea cu prioritate a

- 8 -

fenomenelor vietii umane etc. Conform teoriilor lui A. Quetelet, statistica defineste

metode unice necesare studierii fenomenelor bazate pe calculul probabilitatilor, endinta

de ansamblu, dedusa pe baza unui volum mare de observatii statistice. Legea statistica se

poate pune in evidenta numai daca se considera un numar suficient de mare de unitati

statistice elementare ale populatiei de studiat supuse observarii.

Legea numerelor mari, care constituie o expresie a legaturii dintre neccsitate si

intamplare, se verifica in colectivitati relativ mari si cuprinzatoare. In conformitate cu

aceasta lege, actiunea conjugata a unui numar mare de factori aleatori, in conditii bine

determinate, conduce la rezultate aproape independent de intamplare, dand astfel

posibilitatea ca necesitatea sa se realizeze. Referindu-ne la prima lege statistica

descoperita stim ca la nastere numarul baietilor intrece pe eel al fetelor, raportul initial

admis era de baieti 107; fete 100. Particularizand aceasta lege statistica la distributia pe

sexe a nascutilor in sanul fiecarei familii in parte, ar fi imposibil sa indicam ce fel de

raport exista, date fiind variabilele sale destul de numeroase si in acelasi limp importante

pentru diferite familii. O cercetare statistica care sa prezinte rezultate semnificative in

acest sens, trebuie intreprinsa pe mase indeajuns de mari de nasteri : insusi J. Bernoulli

care a dat acestei legi o forma matematica, a tinut sa mentioneze la vremea sa, ca sporirea

numarului observatiilor in scopul maririi gradului de siguranta a deciziei nu constituie

ceva nou si neobisnuit, deoarece omul indiferent de pregatirea sa stie ca sursa de reusita

referitor la o actiune a sa este cu atat mat mare, cu cat mai multe observatii sunt luate in

considerare.

Despre un inceput de organizare statistica in tarile romanesti nu poate fi vorba

decat din secolul al. XVIII-lea incoace. Prima scriere sau recensamant al locuitorilor pare

sa fi fost facuta de Constantin Mavrocordat, cu ocazia reformelor sale in Muntenia si

Moldova. Regulamentul organic (1831) introduce catagrafia sau recensamantul sistematic

si periodic. Din 7 in 7 ani trebuia sa se faca categrafia populatiei, dupa norme bine

stabilite, pentru a servi la ,,asezarea birului si la hotararea veniturilor tarii".

La 28 aprilie 1859, domnitorul Al. I. Cuza aproba infiintarea unui birou de

statistica in Tara Romaneasca, numind sef pe Dionisie Pop Marxian, iar la I iulie 1859

aproba infiintarea Directiei de Statistica din Moldova, sub conducerea lui Ion lonescu de

la Brad.

- 9 -

La 4 august 1862 cele dou3 organe de statistica se reunesc sub denumirea

Oficiului Statistic pentru Principatele Unite sub conducerea lui Dionisie Pop Martian.

Gandirea statistica romaneasca s-a aliniat in contextul amplu al curentelor statistice

existente in Europa. Reprezentantii statisticii romainesti au pastrat un contact permanent

cu preocuparile statistice din tarile Europei, aducandu-si contributia de seama atat la

promovarea statisticii teoretice si practice, cat si al organizarii ei institutionale. Cei mai

de seama reprezentati ai statisticii romanesti din acea perioada au fost Ion lonescu de la

Brad si Dionisie Pop Martian. Primul si-a prezentat punctul de vedere despre statistica in

lucrarea intitulata ,,Povaturi pentru catagrafia Moldovei" (1859). Statistica, in viziunea

lui I. I. de la Brad trebuie sa cuprinda doua parti: o prima parte care sa presupuna

culegerea datelor de observare, iar a doua parte sa implice aparatul matematic. Se

regaseste in aceste abordari metodologice, in linii mari, insusi demersul statistic modern,

format din doua etape: una descriptiva, alta inductiva, inferentiala..

In conceptia lui D. P. Marjian statistica trebuie sa studieze fenomenele naturale si

sociale, avand drept scop descoperirea legilor care le guvemeaza. Se evidentiaza

apartenenta sa la curentul de larga circulatie conform caruia obiectul de cercetare al

statisticii trebuie sa depaseasca granitele sferei fenomenelor sociale.

In spiritul statisticii descriptive europene si la noi in tara s-au scris lucrari

statistice, statistica figurand ca obiect de studiu in invatamantul romanesc. Un curs de

statistica a fost introdus in 1856 la Facultatea Juridica de la Academia Mihaileana din lasi

de catre Al. Papiu llarian, care avea drept obiect descrierea statelor componente ale

Europei sub aspect economic si social.

In 1860 apar Analele Statistice pentru cunoasterea Romaniei, in care se publica

lunar date privind statistica agricola, statistica vamilor, a miscarii populatiei precum si

studii cu caracter economic.

In 1918 este creat Institutul Social Roman, forma institutionalizata de cercetare

sociologica. Rezultatele au fost publicate sistematic in ,,Arhivele pentru stiinta si reforma

sociala", aparand primele cercetari statistice sub forma de monografii. [Bogdan, V.,

1995].

- 10 -

Un recensamant general al populatiei, cladirilor, intreprinderilor industriale si

comerciale are loc in 1930. Debutul Anchetei Bugetelor de Familie are loc in 1950, care

va deveni cercetare permanenta intre 1950-1994.

In 1964 are loc o reuniune stiinpfica cu tema ,,Anchetele selective", cand pentru

prima data in Romania sunt formulate principle proiectarii si utilizarii unui esantion

«maitre ».

Categoriile fundamentale ale statisticii -Concepte de baza

Populatia statistica reprezinta multimea elementelor simple sau complexe, de

aceeasi natura, care au una sau mai multe insusiri esentiale comune, proprii elementelor

cat si populatiei privita ca un tot unitar. \Florea I., 1998}

O populatie este finita daca include un numar determinat de elemente, dar ea

poate fi considerate drept reprezentativa a unei populatii teoretice infinite. Ca urmare

apare necesitatea de a delimita o populate in: continut, spatiu si timp. Se mai denumeste

si populafia univers.

Exemple de populatii statistice: multimea persoanelor dintr-o anumita tara, localitate,

zona etc. in anul t, multimea gospodariilor din Romania, la momentul t, multimea

consumatorilor unui produs, multimea societatilor producatoare sau concurente ale unui

produs, mullimea societatilor distribuitoare, angajatii unei societati, etc.

Se noteaza cu majusculele de la inceputul alfabetului: A, B, etc.

Unitatea statistica constituie elementul component, al populatiei statistice,

asupra caruia se va efectua nemijlocit observarea.

Unitatea statistica este purtatorul originar de informatie sau subiectul logic al informatiei

statistice. Datorita varietatii aspectelor sub care se poate prezenta in fapt, unitatea

statistica comporta o definitie precisa, care sa excluda prin posibilitate de interpretare

diferita de catre observatori si astfel orice eroare ce poate prejudicia valoarea

investigatiei.

- 11 -

In exemplele citate mai sus, unitatile statistice sunt: persoana, gospodaria,

consumatorul, societatea producatoare sau concurenta, societatea distribuitoare, angajatul

etc.

Se noteaza cu minusculele corespunzatoare majusculei ce simbolizeaza populatia

statistica, respectiv aL, b, etc..

Volumul populatiei reprezinta numarul unitatilor statistice care alcatuiesc

populatia statistica. Acesta poate fi finit sau infinit, in functie de tipul populatiei care

poate fi la fel finita sau infinita.

Se noteaza cu N, iar pentru o populate A, avem: A : { a

Esantion reprezinta o submultime a unei populatii statistice, constituita dupa

criterii bine stabilite. In raport cu procedeul de formare a esantionului avem esantioane

aleatoare si esantioane dirijate.

Esantionul aleator este format din unitatile statistice care rezulta printr-un

procedeu aleator: procedeul tragerii la sorti, tabelul cu numere intamplatoare, procedeul

extragerilor sistematice.

Esantionul dirijat este constituit pe baza unor informatii auxiliare existente la

nivelul populatiei studiate sau lasand liber pe anchetator sa aleaga unitatile respectand

doar realizarea structurii esantionului in functie de criteriile stabilite.

Se noteaza cu n.

Majoritatea studiilor au ca suport datele provenite de la nivel de esantion, de aici

importanla constituirii acestuia si implicit, apelarea la inferenta statistica, pentru a estima

parametrii la nivelul populatiei univers.

Variabila statistica reprezinta o insusire sau o trasatura comuna tuturor unitatilor

unei populatii. Nivelul inregistrat de o variabila statistica la o unitate oarecare a

populatiei se numeste realizare sau starea variabilei. \FloreaL, 1998\.

In general se noteaza cu majusculele de la sfarsitul alfabetului, X, Y, Z etc. Daca

se noteaza cu X o variabila statistica oarecare, atunci cu x , x 2,..-, XN se vor nota starile

variabilei respective.

Variabilele statistice se clasifica in raport cu natura, modul de exprimare si modul

de variatie.

a) Dupa natura lor variabilele statistice pot fi atributive, de timp si de spatiu.

- 12 -

• Variabila atributiva exprima un atribut sau insusire esentiala (alta, decat timpul sau

spatiul) unitatilor populatiei;

• Variabila de timp ne arata timpul in care au luat fiinta unitatile populatiei sau

perioada de timp in care au existat (exista);

• Variabila de sptiu ne arata spatiul in care exista sau au luat nastere unitatile

populatiei.

b) Dupa modul de exprimare a starilor deosebim:

• Variabila cantitativa este variabila ale carei stari se exprima prin valori mimerice. Se

mai numeste si variabila metrica.

• Variabila calitativa este variabila ale carei stari se exprima prin cuvinte sau coduri. Se

mai numeste variabila nominala (starile se exprima prin cuvinte) sau variabila ordinala

(starile se exprima prin coduri).

c) dupa modul de variatie variabila cantitativa poate fi:

• Variabila discreta este acea variabila care, in intervalul sau de definite inregistreaza

eel mult valori rationale, variatia are loc in salturi.

Variabila continua este acea variabila care poate lua orice valoare reala din intervatul

sau de variatie.

Exemple de variabile statistice relativ la populatia formata din multimea consumatorilor

unui produs:

- varsta: variabila atributiva, cantitativa, continua

X={x1 = [l5-20)[20-30)... }

- frecventa de cumparare: variabila atributiva calitativa

Y = { y - foarte rar; y 2 - rar, ... }

- numar de sortimente cumparate relativ la produsul analizat: variabila atributiva,

cantitativa, discreta:

Z={z1 = l; z 2 = 2,...}

- localizarea magazinelor de unde cumpara: variabila de spatiu , calitativa

S= {s1-cartierul M sau s2-strada P,... }

- data ultimei cumparari a produsului analizat: variabila de timp,

T = {t1 = 27.01.2002; t2 = 24.02.2002,... }

Variabila aleatoare

- 13 -

Variabila aleatoare este variabila care poate lua orice valoare din valorile unei

multimi finite sau infinite, cu o anumita probabilitate, rezultata dintr-o functie asociata

variabilei, numita lege de probabilitate.Ca si variabila statistica, variabila aleatoare in

raport cu valorile sale poate fi discreta sau continua.

In timp ce o variabila aleatoare inregistreaza valori la intamplare, variabila

statistica constituie o insusire certa a unitatilor statistice din populatie. Valorile unei

variabile aleatoare sunt probabile si in stransa legatura cu un anumit experiment. Starile

unei variabile statistice nu sunt probabile, ele cuantifica o trasatura proprie fiecarei unitati

din populatie.

Observarea statistica consta in identificarea unitatilor populatiei si inregistrarea

starilor variabilelor in raport cu care este studiata. Ansamblul starilor variabilelor

rezultate prin observare se numesc statistici.

Dupa gradul de cuprindere a populatiei statistice, observarea statistica este de

doua feluri: totala si partiala.

Observarea totala este acel tip de observare statistica in care are loc inregistrarea tuturor

unitatilor care fac parte din populatie statistica supusa studiului. Recensamantul

populatiei Romaniei este un exemplu de observare totala.

Observarea partiala presupune observarea si inregistrarea unui anumit numar de unitati

din populatie, alese dupa criterii bine definite.

In cercetarea statistica a unei populatii punctul de pornire il poate constitui fie

statistici exhaustive rezultate prin observarea populatiei univers , fie statisticile rezultate

din observarea partiala a unui esantion A ≤A, in ambele cazuri scopul final fiind acelasi -

obtinerea de informatii la nivelul populatiei univers A.

In primul caz, ansamblul de tehnici folosite in prelucrarea statisticilor se bazeaza

pe matematica delerminista si au un caracter relativ simplu. Acest demers al cercetarii

statistice constituie obiectul asa numitei statistici descriptive.

In al doilea caz tehnicile cantitative utilizate se bazeaza pe teoria probabilitatilor,

permitand extinderea informatiilor de la esantion la populatia univers — inductie

statistica. Acest demers constituie obiectul asa numitei statistici inferentiale.

- 14 -

Seria statistica

Seria statistica este o constructie care reda fie distributia unei populatii in raport

cu una sau mai multe variabile, fie variatia unei marimi in timp, in spatiu sau de la o

categorie la alta.

Seriile statistice se clasifica in raport cu mai multe criterii, astfel:

1. In raport cu numarul variabilelor

• Serii statistice unidimensionale, au la baza o singura variabila;

• Serii statistice multidimensionale, care au la baza doua sau mai multe variabile.

2. Dupa natura variabilelor deosebim:

• Serii aiributive, care au la baza variabile atributive;

• Serii cronologice (de timp sau istorice), care au la baza variabile de timp;

• Serii de spatiu sau teritoriale, care au la baza o variabila de spatiu.

3. Dupa modul de exprimare a starilor variabilei deosebim:

• Serii calitative, care au la baza variabile calitative;

• Serii cantitative, care au la baza variabile cantitative si care dupa modul de variatie a

variabilei pot fi: discrete (cand variabila este discrete) si continue (cand variabila este

continua).

4. In raport cu natura indicatomlui din care este alcatuita seria, avem:

• Serii de frecventa sau serii de distributie (repartitie);

• Serii de variatie.

Seria statistica redand distributia populatiei in raport cu una sau mai multe

variabile constituie o descompunere a acesteia intr-un numar R de clase. O astfel de serie

este formata in exclusivitate din frecvente (absolute cumulate sau necumulate, relative

cumulate sau necumulate) si de aceea se numesc serie de frecventa, de distributie sau de

repartitie. Prescurtat se mai foloseste si denumirea de repartitie statistica sau distributie

statistica.

Seria statistica ce reda variaria unei marimi in timp, in spatiu sau de la o categorie

la alta se numeste serie de variatie.

Seria statistica de repartitie

- 15 -

Conform definitiei de mai sus, prin aceasta serie se distribuie unitatile

unei populatii statistice in raport cu una sau mai multe variabile.

Fie o serie statistica unidimensionala avand la baza variabila X,

respectiv:

X:

Ni este frecventa absoluta a clasei i, i= si reprezinta numarul de unitati ale

populatiei din clasa pentru care variabila X a inregistrat valoarea Xi ;

N1+N2+…+NR = N

Clasa (grupa) de unitati in raport cu o variabila reuneste acele unitati din cadrul

populatiei care inregistreaza aceeasi stare a variabilei sau starile

variabilei apartinand unui anumit interval de variatie.

Ca urmare, in raport cu o variabila statistica populatia poate fi structurata intr-un anumit

numar de clase.

Exemplu

Fie A - populatia statistica reprezentand unitatile de cazare turistica din Romania, in anul

1999 si X - categoria de confort (este o variabila statistica atributiva, cantitativa

discreta). Distributia acestor unitati in raport cu variabila X este urmatoarea (conform

A.S. al Romaniei, 2000)

X:

- 0 - neclasificate;

- 1090 - ne arata numarul unitatilor de cazare turistice avand categoria de ,,2 stele";

- 16 -

De asemenea, relativ la seria statistica unidimensionala avand la baza variabila X,

poate fi formata cu frecvente relative, frecvente cumulate absolute sau relative.

Fie seria X formata cu frecvente relative:

X:

fi – ne arata ponderea unitatilor din populatie care au inregistrat pentru variabila X starea

xi:

fi = sau

fi = *100 i = = 1 (100%)

Exemplu:

X:

Sau:

X:

33,55 % reprezinta ponderea unitatilor de cazare turistica avand categoria de ,,2 stele".

- 17 -

Pornind de la seria (1.1) se poate deduce seria formata cu frecvente absolute cumulate,

respectiv:

X : (1.3.)

unde: N(xi) reprezinta numarul de unitati din populatia studiata pentru care variabila

inregistreaza valori ce nu depasesc valoarea xi.

N(x1) = N1

N(x2) = N1+N2

…………………………

N(xi) = N1 + N2 + ... +Ni

…………………………………..

N(xR) = N1 + N2 + ... +Ni + … + NR = N

Exemplu.

X:

- 18 -

2864 - ne arata numarul unitatilor de cazare turistica avand cel mult doua stele.

Pornind de la seria (1.1) sau (1.2) se poate deduce seria formata cu frecvente relative

cumulate, respectiv:

X: (1.4.)

unde: FN(XI) - exprima ponderea unitatii populatiei studiate pentru care variabila a

inregistrat valori ce nu depasesc valoarea xi.

FN(XI) = f1 + f2 +… + fi

FN(XI) = * 100 i =

Exemplu:

X:

88,15 % - reprezinta ponderea unitatilor de cazare turistice avand cel mult ,,2 stele".

- 19 -

Asa cum se poate constata din definitia celor doua marimi de frecvente cumulate,

acestea se pot calcula si are sens elaborarea unor serii statistice doar in cazul in care la

baza seriei se gaseste o variabila cantitativa.

Relativ la aceeasi populatie statistica studiata A – multimea unitanlor de cazare turistica

din Romania in anul 1999, din A.S. al Romaniei /2000, se pot extrage alte serii statistice

de repartipe, ca de exemplu:

- distributia unitatilor de cazare in raport cu forma de proprietate (cf. A.S. al

Romaniei/2000, pg.518).

Y :

Aceasta este o serie statistica de repartitie unidimensionala avand la baza o

variabila atributiva, calitativa si formata cu frecvente absolute, in aceasta situatie se poate

elabora seria statistica formata cu frecvente relative, respectiv:

Y :

- distributia unitatilor de cazare in raport cu tipul destinatiei turistice (cf. A.S. al

Romaniei/2000, pag.519)

Z

- 20 -

Este o serie statistica de repartitie unidimensionala avand la baza o variabila

atributiva calitativa si formata cu frecvente absolute. Se poate elabora seria formata cu

frecvente relative.

De asemenea, se pot elabora serii de repartitie unidimensionale in raport cu

numarul de turisti cazati, cu gradul de utilizare a capacitatii in functiune, capacitatea

existenta etc.

Seria statistica de repartitie bidimensionala este o constructie ce reda distributia

unei populatii in raport cu doua variabile.

Astfel, fie populatia statistica A studiata in raport cu variabilele X si Y, rezultatele

observarii se pot grupa intr-un tabel de forma urmatoare:

(1.5.)

unde:

- 21 -

X

Y

x1 x2 … xj … xJ Total

y1

y2

yi

.

.

yl

N11 N12 … N1j … N1J

N21 N22 … N2j … N2J

- - - - - -

Ni1 Ni2 … Nij … NiJ

- - - - - -

N1l Nl2 … Nlj … NlJ

N1

N2

-

Ni

-

Nl

Total N1 N2 … Nj … NJ N

- Nij reprezinta numarul de unitati pentru care, variabila X inregistreaza starea Xj si

variabila Y inregistreaza starea yi, ;

- Ni numarul de unitati pentru care Y = y,, indiferent de nivelul inregistrat de variabila X;

- Nj numarul de unitati pentru care X = Xj, indiferent de nivelul inregistrat de

variabilaY;

- N - numarul total de unitati analizate.

Din seria bidimensionala se pot extrage serii unidimensionale de forma

urmatoare :

X :

X :

denumite si serii de repartitie marginale, in raport cu X si Y

X/Y = yj :

denumita seria de repartitie unidimensionala in raport cu X conditionata de Y = yi,

numarul acestora fiind egal cu numarul de stari a variabilei Y.

Y/ X = xj :

- 22 -

denumita serie de repartitie unidimensionala in raport cu Y conditionata de X = xj,

numarul acestora fiind egal cu numarul de stari a variabilei X.

De asemenea se poate elabora sau deduce seria de repartitie bidimensionala

formata cu frecvente relative, respectiv:

(1.6.)

fij = fj = fi = i =

Exemple:

Relativ la populatia statistica A studiata, din A. S. al Romaniei/2000, se poate

extrage o serie de repartitie bidimensionala, avand la baza variabilele:

- 23 -

X

Y

x1 … xj … xJ Total

Y1

-

-

f11 ...

-

-

fij … f1J

- - -

- - -

f1

Yi

-

fi1 ... fij … fiJ

… …

fi

Yl fl1 flj … flJ fl

Total f1 ... fj fJ 1

X - categoria de confort (numar de stele)

Y - tipul unitatii de cazare turistica de forma urmatoare:

X

Y

0

neclasificate

1 2 3 4 5 Total

Hoteluri 57 259 388 91 14 2 811

Moteluri 12 50 53 5 - - 120

Hanuri turistice

22 - - - - -

22

Cabane turistice

83

59 19 4 - - 165

Campinguri 56 69 15 2 - - 142

Vile turistice si bungalouri 2 57 482 212 122 69 3 1145

Tabere scolare 17 6 - - - - - 176

Pensiuni turistice 3 77 191 44 7 - 322

Sate de vacanta - - 1 - - - 1

- 24 -

Pensiuni agroturistice - 110 210 21 - - 341

Spatii de cazare pe nave - 2 1 1 1 - 5

Sursa: A.S. al Romaniei/2000, pag.515

21 - ne arata numarul de pensiuni agroturistice avand categoria de confort de 3 stele.

Tabelul de mai sus este o repartitie statistica bidimensionala avand la baza o variabila X

atributiva cantitativa discreta si o variabila Y atributiva calitativa, formata cu frecvente

absolute.

Se poate deduce seria de repartitie bidimensionala formata cu frecvente relative,

respectiv:

X

Y

0 1 2 3 4 5 Total

Hoteluri 0,018 0,08 0.119 0,028 0,004 0,0006 0,25

Moteluri 0,004 0,015 0,016 0,002 0.037

Hanuri turistice 0,007 0.007

Cabane turistice 0,026 0,018 0,006 0,001 0,051

Campinguri 0,017 0,021 0,005 0,0006 0.044

Vie turistice si

bungalouri

0,079 0,148 0,065 0,038 0,021 0,0009 0,352

- 25 -

Tabere scolare 0,054 0,054

Pensiuni

turistice

0,0009 0,024 0,059 0,014 0,002 0.099

Sate de vacanta 0,0003 0,0003

Pensiuni agroturistice 0,034 0,065 0,006 0.105

Spatii de cazare pe nave 0,000 6 0,0003 0,0003 0,0003 0,002

Total 0,205 0,341 0,335 0,089 0,028 0,0015 1

0,6 % - reprezinta ponderea pensiunilor agroturistice avand categoria de confort de ,,3

stele", din totalul unitatilor de cazare turistica.

De asemenea se pot extrage seriile unidimensionale marginale in raport cu X si Y si cele

conditionate, de exemplu:

X:

Y:

- 26 -

X/Y = pensiuni turistice :

Y/X = 3 :

Seria statistica de variatie

Conform definitiei seria de variatie reda variatia unei marimi, in timp, in spatiu

sau de la o categorie la alta. Ca urmare, in continuare vom vorbi de serii cronologice (au

la baza o variabila de timp), serii de spatiu si serii categoriale (au la baza variabile

atributive). Cele mai des intalnite sunt seriile cronologice si seriile de spatiu.

Seriile de variatie au la baza marimi absolute si relative. Dupa unii autori din

cadrul marimilor absolute fac parte indicatorii de nivel si diferenta absoluta a unei

marimi, iar din cadrul marimilor relative fac parte: indicatorul relativ de intensitate,

indicele statistic si diferenta relative a unei marimi.

Indicatorul de nivel (Y) este o marime ce reflecta nivelul unui fenomen analizat.

De exemplu: productia diferitelor produse, veniturile populatiei, suprafata cultivata cu

principalele culturi, transportul, exportul, importul etc.

Diferenta absoluta a unei marimi (Δy) exprima diferenta dintre nivelul cercetat si

nivelul baza de comparatie al marimii analizate. Se exprima in aceeasi unitate de masura

in care este cuantificat fenomenul analizat si ne arata cu cat s-a modificat acesta de la un

nivel la altul.

Indicele statistic al unei marimi (/y ) exprima raportul dintre nivelul cercetat si

nivelul baza de comparatie al marimii analizate. Ne arata de cate ori se modifica acea

marime, de la un nivel la altul.

Diferenta relativa a unei marimi (Ry) exprima raportul dintre diferenta absoluta a

marimii respective si nivelul baza de comparatie al acesteia. Ne arata cu cat la suta se

modifica marimea de la un nivel la altul.

- 27 -

Indicatorul relativ de intensitate (d) se defineste ca raport intre doi indicatori de

nivel de natura diferita si arata gradul de raspandire a fenomenului cuantificat de

indicatorul de la numarator in raport cu fenomeoul cuantificat de indicatorul de la

numitor. De exemplu: productia diferitelor culturi / ha, densitatea populatiei, productia

principalelor produse / locuitor, rata somajului etc.

Greutatea specifica (g) reflecta structura fenomenului analizat in raport cu starile

variabile X, de la baza seriei.

Seriile cronologice

Seria cronologica reflecta evolutia in timp a unei marimi.

Valorile variabilei ca functie de timp pot fi fixate la un anumit moment de timp sau sa se

refere la un interval de timp.

Seria cronologica de momente este o serie de observatii ordonate in timp,

exprimand stocuri [Trebici V.. 1985]. De exemplu, volumul populatiei, numar de

universitati, banci, institutii, fonduri fixe, numarul salariatilor, intreprinderile mici si

mijlocii din diferite domenii de activitate, unitatile de cazare turistica etc.Intr-o astfel de

serie insumarea marimii analizate nu are sens din punct de vedere al continutului, aceasta

fiind permisa din considerente de calcul, ajustat etc.

Seria cronologica de intervale este o serie de observatii ordonate in timp

exprimand fluxuri. De exemplu: nascutii vii, divorturile, decesele, productia diferitelor

culturi sau produse, venituri, cheltuieli, productia industriala, agricola, exportul, importul

etc.Intr-o astfel de serie are sens insumarea marimii analizate.

Fie o serie cronologica de momente sau de intervale ce reflecta evolutia in timp a

nivelului unei marimi Y,

Y:

- 28 -

Pornind de la aceasta serie se pot deduce seriile formate cu diferente absolute,

indici si diferente relative. In functie de modul de raportare a starilor variabilei timp t,

marimile de mai sus se pot calcula cu baza fixa (t / to) (baza de comparatie ramane

aceeasi) sau cu baza in lant(t /t-1) (baza de comparatie se schimba, fiind considerata cea

precedenta nivelului comparat).

Fie seriile cronologice formate cu: - diferente absolute cu baza fixa:

(1.8)

= y(t) – y(0)

- diferente absolute cu baza in lant

(1.9)

Intre cele doua tipuri de diferente absolute cu baza fixa si cu baza in lant, exista relatii de

legatura ce ne permit exprimarea unora in functie celelalte. In acest context, insumand

diferentele absolute cu baza in lant se obtin diferentele absolute cu baza fixa.

- 29 -

Scazand diferentele succesive cu baza fixa se obtin diferenfele cu baza in lant.

y(t) – y(0) – y(t-1) + y(0) = y(t) – y(t-1) =

Diferenta absoluta ne arata cu cat se modifica marimea analizata de la un moment

la altul. Se exprima in aceeasi unitate de masura in care este cuantificat fenomenul

studiat.

Daca fenomenul analizat se exprima valoric, atunci diferenta absoluta nu reflecta

prea bine modificarile ce intervin, impunandu-se utilizarea marimilor relative respective,

indicele statistic si diferenta relativa.

Fie seriile cronologice formate cu:

- indici statistici cu baza fixa

(1.10)

*100

- indici statistici cu baza in lant :

(1.11)

- 30 -

* 100

Indicele statistic ne arata de cate ori se modifica fenomenul analizat. Este

marimea cel mai des folosita in caracterizarea evolutiei fenomenelor din economie.

Avand ca baza de referinta o serie cronologica de forma (1.7) se pot elabora serii formate

cu:

- diferente relative cu baza fixa

(1.12)

sau

- diferente relative cu baza in lant

- 31 -

(1.13)

Diferentarelativa ne arata cu cat la suta se modified fenomenul de la un moment la altul.

Aceasta mSrime la fel ca si indicele statistice, se foloseste frecvent in caracterizarea

fenomenelor din economic.

Daca seria cronologica analizata, de forma (1.7) este de intervale, se poate deduce seria

formata cu greutatea specifica :

g y (1.14)

g(t) =

Seria statistica de spatiu (teritoriala)

Seria statistica de spatiu este o constructie statistica ce reflecta variatia in spatiu a

unei marimi.

Seria de spatiu prezinta o importanta din ce in ce mai mare, datorita dezvoltarii

sistemului informational, a necesitatii comparatiilor internationale si a comparatiilor intre

regiunile unei tari.

- 32 -

In cadrul Anuarului Statistic al Romaniei exista capitole distincte de ,,Statistica

teritoriala" si ,,Statistica internationala". In capitolul de ,,Statistica teritoriala" sunt

cuprinse informatii privind: populatia, fort a de munca, conditii de munca, veniturile

populatiei, cheltuielile si consumul populatiei, locuinte, asistenta sociala, sanatate,

invatamant, cultura, sport, conturi nationale, rezultate si performante ale intreprinderilor,

agricultura, silvicultura, industrie, transporturi, posta, telecomunicatii, turism, finante,

justitie si starea infractionala, pe cele 7 regiuni si Bucuresti.

La baza seriei de spatiu se gasesc atat marimi absolute (indicator de nivel,

diferenta absoluta), cat si marimi relative (indicator relativ de intensitate, indicele

statistic, diferenta relativa).

Fie seria statistica Z, de forma urmatoare:

Z: (1.15)

unde: __

Si - este o stare a variabilei ce exprima spatiul, i=1,R,

Z(i) - exprima o marime (indicator de nivel sau relativ de intensitate).

Plecand de la seria de forma (1.15) se pot deduce seriile formate cu:

- diferente absolute cu baza fixa:

(1.16)

= z(i) – z(0)

- indicii statistici cu baza fixa

- 33 -

(1.17)

= * 100

- diferente relative cu baza fixa

(1.17)

= * 100

Se deduc seriile formate cu marimi absolute si relative calculate doar cu baza fixa (se

poate alege orice stare a variabile ce exprima spatiu).

PROBLEME PROPUSE

- 34 -

PI. Dati 5 exemple de populatii statistice a caror cercetare ar prezenta interes si pentru

fiecare populatie selectata precizati:

1. denumirea populatiei, a unitatii statistice si volumul acesteia;

2. scopul cercetarii statistice;

3. variabilele statistice in raport cu care s-ar face observarea statistica a populatiei.

P2. Sa se extraga din Anuarul Statistic sau alte surse informationale o serie statistica

bidimensionala ce reda distributia unei populatii in raport cu doua variabile atributive,

relativ la care se cere:

1. denumirea populatiei ce a fost supusa observarii si volumul acesteia;

2. unitatea statistica;

3. caracterizarea variabilelor statistice in raport cu care a fost studiata populatia;

4. caracterizarea seriei statistice in raport cu toate criteriile cunoscute;

5. elaborarea seriei bidimensionale formata cu frecvente relative, interpretare;

6. extragerea repartitiilor unidimensionale marginale si a celor conditionate;

7. pornind de la o repartitie marginala deduceti celelalte serii statistice posibile,

interpretare.

P3. Din Anuarul Statistic sau alte surse informationale extrageti o serie statistica de

repartitie, avand la baza o variabila de spatiu, relativ la care se cere:

1. denumirea populatiei statistice si volumului ei;

2. unitatea statistica;

3. caracterizarea seriei dupa toate criteriile cunoscute;

4. deducerea seriei formata cu frecvente relative;

5. interpretare.

P4. Din Anuarul Statistic sau alte surse informationale extrageti doua serii cronologice

avand la baza indicatorul de nivel, una de momente, alta de intervale si deduceti seriile

formate cu diferente absolute, indici statistici, diferente relative, cu baza fixa si cu baza

in lant (interpretari).

P5. Dati 5 exemple de serii cronologice avand la baza indicatorul relativ de

intensitate.

- 35 -

P6. Din Anuarul Statistic sau alte surse informationale extrageti o serie de spatiu formata

cu indicatorul de nivel sau indicator relativ de intensitate si deduceti seriile formate cu

diferente absolute, indici si diferente relative, calculate cu baza fixa. Interpretare.

P7. Extrageti 5 exemple de serii de spatiu ce contin informatii importante pentru

domeniul economic.

P8.Se da urmatoarea serie de variatie, cronologica, de momente, avand la baza un

indicator de nivel :

-farmaciile din Romania la sfirsitul anului 1989

Z :

Deduceti seriile formate cu toti indicatorii derivati posibili.

P9.Se da urmatoarea serie de variatie, cronologica, de intervale, avand la baza un

indicator de nivel :

Z :

Deduceti seriile formate cu toti indicatorii derivati posibili.

P.10 Se considera o firma a carei C.A. a evoluat in ultimele 12 luni dupa cum urmeaza :

-Luna 1-220

- Luna 2-225

- Luna 3-240

-Luna 4-250

- Luna 5-240

- 36 -

- Luna 6-245

- Luna 7-260

- Luna 8-280

- Luna 9-270

- Luna 10-275

- Luna 11-290

- Luna 11-290 (mil.lei)

Se cere :

1.Alcatuiti o serie cronologica cu datele din problema si comentati tipul de

indicator folosit.

2.Analizati cu cat s-a modificat C.A. atat in raport cu prima luna cat si in raport cu

luna precedenta.

3.Aratati de cate ori se modifica C.A. in raport cu prima luna, cat si de la o luna la

alta.

4.Aratati cu cat la suta s-a modificat

C.A. in raport cu prima luna, cat si de la o luna la alta.

5.Graficul seriei.(cronograma).

CAPITOLUL II

OBSERVAREA, SISTEMATIZAREA ŞI

PREZENTAREA DATELOR STATISTICE

Observarea statistica

Observarea statistica constituie prima etapa in cadrul studierii fenomenelor

sociale, economice sau de alta natura, etapa in care se culeg datele statistice despre

fenomenul supus cercetarii. Cercetarea fenomenelor respective presupune cunoasterea

- 37 -

populatiei statistice in vederea surprinderii actiunii legilor care actioneaza la nivelul

acesteia. De calitatea acestei etape, intr-un proces de cercetare statistica, depinde si

calitatea rezultatelor obtinute in celelalte faze.

Observarea statistica presupune identificarea, urmarirea si inregistrarea, dupa

reguli unitare si precise, a nivelutui atins de variabilele statistice studiate la unitatile din

care este formata populatia luata in studiu.[Florea L, 1998},

Pentru asigurarea unor date, rezultate din observare, valide si pertinente se impun

cateva precizari. In primul rand, observarea statistica presupune urmarirea si inregistrarea

unui numar mare de unitati statistice, ceea ce implica un volum mare de munca. In al

doilea rand, pentru ca cercetarea populatiei sa-si atinga scopul, trebuie precizate care sunt

variabilele in raport cu care este studiata populatia. Variabilele statistice ce urmeaza sa fie

urmarite si inregistrate la nivelul flecarei unitati din populatie, trebuie sa fie esentiale si

sa prezinte interes din punct de vedere al studiului intreprins. In al treilea rand, trebuie

stabilite criterii exacte, daca observarea si inregistrarea datelor este facuta de mai multe

persoane este necesar ca acestea sa se alinieze unei metodologii unitare pentru a asigura

corectitudinea necesara datelor rezultate.

Observarea statistica, ca prima etapa intr-un studiu de cercetare presupune:

specificarea unitatilor statistice care trebuie sa fie urmarite si inregistrate, alegerea

variabilelor statistice care caracterizeaza cel mai bine populatia si care raspund

obiectivului urmarit, inregistrarea starilor variabilelor statistice considerate.

Atingerea scopului cercetarii statistice presupune rezolvarea urmatoarelor probleme care

sa asigure o pregatire stiintifica a observarii statistice:

- delimitarea populatiei supuse observarii;

- definirea unitatilor statistice de observat;

- timpul si locul unde va avea loc observarea;

- programul observarii;

- alegerea purtatorilor de informatie;

- pregatirea persoanelor ce urmeaza sa faca observarea.

Fiecareia din aceste probleme trebuie sa i se acorde importanta cuvenita, fiindca

fiecare dintre ele conduce la o pregatire cat mai completa a observarii, de rezultatele

careia depinde corectitudinea celorlalte etape a cercetarii statistice.

- 38 -

Delimitarea populatiei supuse observarii fata de alte populatii statistice cu care

aceasta se afla in legatura se realizeaza prin evidentierea insusirilor si trasaturilor comune

ce caracterizeaza populatia supusa studiului. In conditiile in care se impune cercetarea

doar a unei parti din populatie, atunci trebuie precizat care anume vor fi unitatile ce vor fi

supuse observarii, dupa ce criterii se selecteaza acestea din populatia initiaia, astfel incat

rezultatele cercetari sa poata fi extinse la nivelul intregii populatii.

Definirea unitatilor statistice de observat presupune claritate si precizie pentru a

nu da loc confuziilor. In momentul observarii trebuie cunoscut exact care sunt unitatile

statistice ce trebuie inregistrate in raport cu variabilele de studiat.

Stabilirea timpului si a locului unde va avea loc observarea are importanta din

punct de vedere a comparabilitalii datelor rezultate din observare. Notiunea de timp a

observarii are in statistica doua acceptiuni:

- momentui sau perioada la care se refera datele inregistrate (timpul de referinta);

- durata observarii.

Momentul sau perioada la care se refera datele inregistrate trebuie sa fie in

concordanta cu natura fenomenelor cercetate . In cazul in care presupune inregistrarea

unui fenomen in mod static trebuie precizat un moment critic. Stabilirea momentului

critic are in vedere posibilele repetari sau omisiuni in inregistrarea unitatilor datorate

evolutiei populatiei in timp. Daca fenomenul de studiat presupune o inregistrare continua,

atunci trebuie pretizata perioada de timp in care are loc observarea. De exemplu,

recensamantul populatiei Romaniei din anul 2002 a avut ca moment critic ora ,,zero"

dintre 17 si 18 aprilie, iar timpul inregistrarii a fost de 7 zile. In cazul indicatoriior care

cuantifica activitatea de productie, timpul la care se refera datele inregistrate poate fi

luna, trimestml sau anul. Observarea statistica trebuie facuta intr-un timp optim.

Recensamantul populatiei ar trebui sa se realizeze de obicei iarna cand miscarea

populatiei este redusa in comparatie cu celelalte sezoane.

Alegerea momentului critic sau a perioadei de timp la care se refera datele

obtinute prin inregistrarea unitatilor, trebuie facuta de asa maniera incat populatia sa fie

surprinsa in starea ei tipica si naturala.

- 39 -

Locul observarii reprezinta punctul din spatiu in care se deruleaza procesul supus

cercetarii (incinta unei intreprinderi, a unui magazin, o localitate in cazul in care

populatia o reprezinta familiile etc.).

In cadrul programului observarii statistice trebuie stabilite variabilele statistice

care urmeaza sa fie studiate in populatia de cercetat. Alegerea si definirea variabilelor

statistice trebuie sa fie in consens cu natura populatiei si obiectivul cercetarii statistice

intreprinse. Variabilele statistice care fac parte din programul cercetarii trebuie sa

surprinda aspectele esentiale, sa expliciteze fenomenul sau procesul studiat, sa permita

prelucrarea si generalizarea acestora la nivelul intregii populatii. Programul observarii

trebuie sa cuprinda un numar optim de variabile. Alegerea unui numar de variabile prea

mare sau prea mic poate dauna calitatii cercetarii statistice efectuate asupra populatiei in

cauza. Stabilirea programului observarii presupune o consultare reciproca a

statisticienilor, care intreprind cercetarea si a specialistilor din domeniul considerat.

Alegerea purtatorilor de informatie se face in functie de volumul datelor ce

urmeaza a fi inregistrate. Purtatorii de informatie reprezinta suportii materiali pe care se

inregistreaza datele din observarea unitatilor statistice.

Problema selectarii si pregatirii persoanelor care urmeaza sa fie angrenate in etapa

de observare, se pune mai ales in cazul in care fenomenul sau procesul de studiat este de

mare amploare. Un asemenea fenomen il constitute recensamantul, care constituie o

observare la scara nationals cu un mare consum de mijloace materiale si financiare.

Observarea statistica se poate desfasura in diverse forme in raport cu: natura

proceselor social-economice de studiat, obiectivul cercetarii, formele de organizare cat si

posibilitatile practice de urmarire si inregistrare a unitatilor statistice din populate.

Dupa cum se stie, in raport cu gradul de cuprindere a populatiei considerate avem:

observarea totala si observarea partiala. Observarea totala permite inregistrarea, in raport

cu variabilele statistice a tuturor unitatilor statistice din populatie, implicand un volum

mare de munca, antreneaza, de obicei, un numar de persoane si dureaza mult timp. Ca

urmare se creaza conditii pentru apariritia de erori de observare, ceea ce va conduce la

micsorarea eficientei observarii. Forma cea mai frecventa de observare totala o constituie

recensamantul populatiei. Avand in vedere anvergura unei asemenea observari totale,

recensamantul presupune o pregatire prealabila din punct de vedere uman, material si

- 40 -

financiar de reusita careia depinde in mare masura eficacitatea lui. Cu prilejul fiecarui

recensamant se elaboreaza o metodologie corespunzatoare cerintelor perioadei

considerate, constituind baza de referinta a tuturor celor implicati in aceasta actiune.

Observarea totala se practica si in domeniul controlului tehnic de calitate, in cazul

produselor de inalta tehnicitate , asa cum ar fi: televizoare, masini de spalat, frigidere,

automobile etc. Este necesara o observare totala in acest caz, deoarece constatarea

defectiunilor de catre cumparatori ar implica cheltuieli mult mai mari cu remedierea

acestora in comparatie cu organizarea unei observari totale a loturilor de produse ce

urmeaza a fi scoase pe piata.

In cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt

nesemnificative, este suficienta realizarea unor observari partiale prin care sa se asigure

ca rebuturile nu depasesc un anumit procent admis. O astfel de observare, care include

doar o parte din unitatile populatiei supuse studiului corespunde observarii partiale.

Observarea partiala constituie o alternativa la observarea totala in cazul

populatiitor infinite sau chiar daca sunt finite prin observare are loc distrugerea acestora.

Avand la baza procedeul observarii partiale se pot evalua rezervele de titei,

carbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a

unei zone sau la nivelul intregii tari. In general, observarea partiala se recomanda in toate

cazurile in care se considera mai avantajoasa decat observarea totala. Avantajele acestui

tip de observare se materializeaza de cele mai multe ori intr-un program de observare mai

complex si mai complet, cu cheltuieli de timp si materiale mai reduse si nu de putine ori

cu un grad de exactitate mai ridicat.

Esantionul, ca rezultat al observarii partiale, presupune respectarea cu strictete a

principiului reprezentativitatii, in conformitate cu care fiecare unitate statistica din

populatia generala sa aiba aceeasi sansa de a face parte din esantion. Asigurarea

respectarii principiului reprezentativitatii in formarea esantionului de observat permite

acestora o structura foarte apropiata cu cea a populatiilor din care sunt formate. Aceasta

ne asigura, cu o anumita probabilitate dinainte fixata, ca rezultatele obtinute la nivelul

esantionului pot fi extinse la nivelul intregii populatii. In raport cu legea de probabilitate

urmata de variabilele urmarite in populatia generala sunt doua tipuri de esantioane:

esantioane de volum mare si esantioane de volum redus.

- 41 -

O forma de observare partiala este observarea prin ancheta. In cadrul acestei

forme de observare, unitatile supuse observarii se aleg in functie de scopul cercetarii, iar

inregistrarea lor se face sub forma de raspunsuri scrise pe care persoanele desemnate in

acest sens le dau intrebarilor dintr-un chestionar. Persoanele ce urmeaza a fi chestionate

primesc chestionarul respectiv raspunzand benevol la intrebari.

Observarea statistica in raport cu procedeul folosit este de doua feluri: observarea directa

si observarea indirecta.

Observarea directa presupune o observare nemijlocita a unitatilor din populatie,

care sunt prevazute pentru cercetare. Acest mod de observare se realizeaza printr-un

contact direct cu unitatile statistice, fie prin masurare, fie prin interogare, daca unitatile

sunt persoane. Acest procedeu permite observatorului perceperea nemijlocita a

fenomenelor luate in studiu in vederea masurarii nivelelor inregistrate de variabilele

considerate.

Observarea indirecta presupune un intermediar intre unitatile care urmeaza sa fie

supuse observarii si observator. Intermediarul poate fi un document special conceput in

vederea observarii si atunci observarea este pe baza de document sau intermediarul poate

fi o alta persoana decat observatorul, caz in care avem observare prin interogare.

Observarea prin interogare presupune ca persoana intermediara sa fi participat la

desfasurarea fenomenului sau sa fie in masura sa dea informatiile despre nivelul

variabilelor care prezinta interes pentru studiul intreprins. Observarea indirecta

neimplicand in mod direct observatorul, constituie o posibila sursa de erori.

Suportul pentru culegerea datelor il reprezinta chestionarul.

Elaborarea si testarea chestionarului

Chestionarul este o lista de intrebari de diferite forme care sunt puse oral sau in

scris in vederea culegerii de informatriei relative la un subiect [Chirouze Y., 1985].

Redactarea chestionarului este o problema dificila mai ales in cazul studiilor de

piata, pentru ca nu exista o formula unica de elaborare care sa conduca la stabilirea unui

chestionar foarte bun. De fapt un chestionar este bun, atunci cand furnizeaza raspunsuri

- 42 -

precise, adevarate si utilizabile. Conceperea unui chestionar se bazeaza foarte mult pe

experienta.

Problemele care intervin in elaborarea unui chestionar sunt numeroase si

complexe. Acestea nu vor fi prezentate detaliat in acest studiu, ci vor fi abordate doar in

linii mari.

Elaborarea chestionarului depinde de ohiectivul anchetei. Intrebarile si

eventualele probleme ce intervin in elaborarea lor sunt legate de obiectivele urmarite.

Astfel daca informatiile privesc anumite fapte, evenimente petrecute, atunci

intrebarile sunt relativ usor de formulat. Ceea ce ar putea impiedica obtinerea de

informatii ar fi refuzul celor intrebati de a da un raspuns exact la unele din intrebari,

datorat unor motive personale sau imposibilitatii furnizarii unui raspuns total sau partial

aferent unor evenimente mai indepartate. Este evident ca lungimea perioadei analizate

depinde de natura faptelor. Daca evenimentele se produc curent atunci perioada este mai

scurta, iar daca evenimentele sunt rare, perioada analizata este mai lunga.

Ia schimb in cazul anchetelor asupra opiniilor, motivatiilor, intentiilor, elaborarea

chestionarului este mai dificila, intrebarile vor fi formulate si studiate cu o foarte mare

atentie. Ca de exemplu in cazul anchetelor asupra opiniilor, intrebarile privind

exprimarea acestora sunt usor de formulat, in cea mai mare parte se primesc raspunsuri

(fiecare isi exprima opinia). Ceea ce este dificil in culegerea informatiilor privind opiniile

il reprezinta masurarea intensitatii de manifestare a acestora [Fournis, 1985].

In situatii ca cele formulate mai sus trebuie sa se evite intrebarile care ar conduce

la aparitia de erori in raspunsuri. Aceste erori pot sa fie provocate voluntar, de catre

repondent, datorita mascarii unei atitudini, opinii etc., sau pot fi involuntare datorate

neintelegerii clare a problemei in cauza.

Pentru evitarea acestor inconveniente intrebarile puse trebuie sa raspunda la o

serie de caracteristici bine definite [Heifer, 1985].

Astfel ele trebuie sa fie:

• usor de inteles, adica sa nu contina cuvinte ce nu pot fi intelese de orice repondent;

• stimulatoare, adica intrebarile puse trebuie sa incite la raspuns;

• precise, sa antreneze raspunsuri usoare si sa permita o buna prelucrare a datelor culese.

- 43 -

Inainte de a vedea in ce maniera se prezinta chestionarul trebuie rezolvate problemele

legate de continutul intrebarilor, ca de exemplu: tipul si forma intrebarilor, succesiunea

lor si codificarea.

Tipuri de intrebari

Pentru redactarea chestionarului este nevoie sa se aleaga intre diferitele tipuri de

intrebari. Alegerea nu este indiferenta, ci fiecare tip corespunde nevoilor specifice

anchetei.

Mai mult autori printre care sunt si M. Lejeune, C. Javeau, clasifica intrebarile in:

• intrebari inchise;

• intrebari deschise;

• intrebari semi-deschise.

Intrebarile inchise sunt acele intrebari pentru care raspunsurile sunt fixate dinainte si

repondentii trebuie sa-si aleaga din variantele de raspunsuri propuse. Acest tip necesita o

precodificare a raspunsurilor, ceea ce va permite prelucrarea imediata a acestor intrebari.

Intrebarile inchise sunt usor de exploatat, aceasta determinand utilizarea frecventa a lor.

Acest tip de intrebare este eficienta atunci cand ancheta se desfasoara asupra faptelor,

deoarece variantele de raspuns pot fi usor delimitate. In schimb in cazul anchetelor asupra

opiniilor, motivatiilor, atitudinilor, este diflcila sa se asigure pertinenta, exclusivitatea si

exhaustivitatea prin variantele de raspuns propuse.

Desi intrebarile inchise aduc informatii ce pot fi exploatate usor si rapid, uneori

ele sunt destul de restrictive, deoarece permit alegerea uneia sau a mai multor variante de

raspuns numai dintre cele propuse, excluzandu-se variantele pe care cel ce a formulat

intrebarea nu le-a avut in vedere. Aceste intrebari sunt foarte utile atunci cand are loc o

urmarire in timp a unor evenimente, pentru ca asa se pot observa modificarile in structura

raspunsurilor.

Intrebarile inchise sunt de mai multe tipuri :

- cu raspuns unic, unde repondentul trebuie sa aleaga doar o varianta de raspuns. Acestea

sunt cel mai usor de prelucrat din punct de vedere statistic.

- 44 -

- cu raspunsuri multiple, unde repondentul poate sa aleaga mai multe variante de raspuns.

Daca acest numar nu este limitat atunci codificarea si prelucrarea datelor necesita

o perioada mai lunga, motiv pentru care se recomanda limitarea numarului de raspunsuri.

- cu clasameme, unde repondentul claseaza raspunsurile posibile intr-o anumita ordine in

functie de preferintete sale. Aceste tipuri de intrebari cer un efort mai mare din partea

repondentului, ca urmare ele devin obositoare. Astfel se impune limitarea variantelor de

raspuns. De asemenea aceste intrebari necesita o perioada mai mare de pregatire a lor

pentru prelucrare, iar exploatarea nu este imediata,

- intrebari cu scale ale atitudinilor, permit nuantarea raspunsurilor binare pe o gradate de

tip excelent - foarte rau. Aceasta se poate realiza explicitand fiecare varianta prin cuvinte

de tipul excelent, bun, mediu, rau, foarte rau, sau un sistem de note de exemplu, acordand

note de la 1 la 5, stiind ca 1 este pentru foarte rau iar 5 pentru excelent. Aceste intrebari

permit masurarea atitudinilor folosind instrumente puse la punct de psihologi, iar atasarea

de note fiecarei trepte a scalei simplifica prelucrarea si da posibilitatea efectuarii unor

calcule. In schimb daca scala are prea multe trepte alegerea unei sau alteia dintre ele

devine diflcila, de aceea utilizarea unui numar de 5 trepte este cel mai convenabil. Daca

treptele nu sunt bine diferentiate si scala nu se schimba de la o intrebare la alta atunci

repondentul poate avea tendinta de a ramane mereu in aceeasi zona a scalei.

Claude Jeveau in ,L 'enquette par questionnaire" caracterizeaza intrebarile inchise astfel:

• sunt cele care se preteaza cel mai bine la prelucrarea si analiza statistica, raspunsurile

primite pot fi prelucrate imediat fara a necesita analize intermediare complicate;

• sunt usor de inteles si se poate raspunde repede;

• garanteaza un anumit anonimat;

• ele pot fi folosite ca intrebari filtru, servind la gruparea repondentilor;

• ele prezinta pericolul de a ,,dicta" raspunsul celui anchetat in masura in care raspunsul

la care s-a gandit nu figureaza printre cele posibile, el alegand unul care se apropie cel

mai mult de ceea ce s-a gandit;

• ele nu pot fi folosite pentru obtinerea de informalii nuantate, corespunzatoare

atitudinilor, motivatiilor profunde, aplicarea lor se limiteaza doar la culegerea de

informatii obiective.

- 45 -

Intrebarile deschise

O intrebare deschisa este aceea care lasa pe cel interesat sa raspunda cum vrea el,

neexistand nici o constrangere. Intrebarile deschise pot fi prezentate astfel:

• complet nestructurate, sunt intrebarile la care repondentii pot sa raspunda cum doresc,

de tipul: ce parere aveti... ?

• asociere de cuvinte, cand se dau pe rand diferite cuvinte iar repondentilor li se cere sa

noteze primul cuvant care le vine in gand;

• completarea frazei, cand repondentilor li se prezinta o fraza incompleta, pe care trebuie

sa o completeze;

• completarea unei povestiri, cand repondentilor le este prezentata o

povestire incompleta, pe care trebuie sa o continue, etc. In chestionar trebuie rezervat

spatiu suficient pentru completarea intregului raspuns.

Intrebarile deschise pot fi caracterizate astfel:

• daca sunt bine formulate atunci se pot obtine informatii asupra oricarui subiect;

• ele sunt indispensabile in culegerea informatiilor privind problemele delicate, cum sunt

cele legate de masurarea atitudinilor, nevoilor, motivatiilor;

• utilizarea lor este impusa in cazurile in care nu pot fi prevazute toate raspunsurile

posibile;

• formularea lor este foarte delicata, de aceea ele trebuie sa fie cuprinzatoare, sa nu

comporte ambiguitati si contrasensuri;

• prelucrarea lor este foane costisitoare si anevoioasa.

Intrebirile semi-deschise (mixte) sunt intrebari in care principalele raspunsuri

posibile sunt propose ca in cazul intrebarilor inchise, dar se lasa si posibilitatea adaugarii

de raspunsuri libere in afara celor propuse, cum sunt intrebarile deschise[Javeou, 1992].

Aceasta forma mixta tinde sa rezolve problemele de exhaustivitate a fntrebarilor

inchise si sa reduca costul de codificare al intrebarilor deschise. Intrebarile mixte sunt

avantajoase atunci cand sunt precodificate raspunsurile stabilite, care acopera cea mai

mare parte din aria raspunsurilor, ramanand ca un numar destul de mic de raspunsuri,

obtinute pe parcursul anchetei, sa fie codificat ulterior.

Aceste intrebari au urmatoarele caracteristici:

- 46 -

• ele contribute la usurarea prelucrarii deoarece un numar mare de raspunsuri sunt

prevazute, acestea fiind codificate;

• ele risca sa influenteze reactia repondentilor prin sugerarea posibilelor raspunsuri;

• variantele de raspuns sugerate in prima parte a intrebarii trebuie sa fie stabilite foarte

riguros, in general acestea se bazeaza pe o cercetare prealabila, astfel incat sa fie evitata

situatia ca cele mai importante si cele mai multe raspunsuri sa fie concentrate in partea

deschisa a intrebarii. Intr-o astfel de situatie intrebarile mixte nu mai sunt avantajoase.

Redactarea chestionarului

Dupa ce a fost definit continutul chestionarului, respectiv diversele domenii ce

trebuie regasite in intrebari, este necesar sa se rezolve problemele legate de forma si de

structura chestionarului si anume acestea depind de urmatoarele aspecte [Javeau C.,

1992]:

• modul de administrate a chestionarului, care influenteaza lungimea chestionarului,

nivelul de aplicare al intrebarilor;

• tipul de intrebari ce vor fi utilizate, acesta determinand modul de prelucrare, termenul

anchetei, mijloacele financiare;

• ce limbaj va fi utilizat, acesta depinzand de specificul anchetei, de pregatirea celor

anchetati;

• modul de prelucrare ce va fi folosit, adica manual, sau pe calculator;

• cum pot fi evitate erorile involuntare realizate de repondenji prin intermediul

raspunsurilor date. Aceste erori pot fi provocate de frica de a nu fi judecat prost, de

dorinta de a se conforma normei sociale, de reactia la intrebari le prea ,,delicate" sau

personale, de sugestibilitatea continutului intrebarilor.

In redactarea unui chestionar trebuie sa se aiba in vedere si aspectele care ar putea

conduce la non-raspunsuri patiale sau totale, pentru a putea fi evitate.

C. Javeau in ,L 'enqueue par questionnaire" propune anumite principii de redactare ale

unui chestionar legate de:

a) Ordinea in care sunt puse intrebarile

- 47 -

Ordinea de succesiune a intrebarilor depinde de tipul anchetei, de modul de

administrate a chestionarului, de lungimea sa, dar este dificil de propus un model adecvat

pentru orice situatie.

b) Textele de introducere si de legatura

Oricare ar fi modul de administrate a chestionarului este necesar sa existe texte de

introducere si texte de legatura intre diferitele parti si mai ales intre diferitele teme

abordate. Atunci cand repondentul trebuie sa completeze singur chestionarul, acesta

trebuie sa contina mai multe texte, fiind sursa principala de explicatii. Textele ce contin

informatii privind obiectivul anchetei, sunt plasate la inceputul chestionarului, pe urma

exista texte care sa informeze despre caracterul de anonimat al datelor si despre faptul ca

ele nu vor fi folosite in alte scopuri. De asemenea trebuie sa existe texte care sa

informeze repondentii cu privire la modul de completare a chestionarului.

Daca chestionarul este completat in prezenta anchetatorului sau acesta scrie in

chestionar raspunsurile primite, atunci multe din textele prezentate mai sus nu trebuie sa

apara in chestionar. In acest caz anchetatorul trebuie sa fie bine pregatit si la randul sau

sa-l informeze pe repondent.

c) Prezentarea materiala si tipogrqfica, prezentarea materiala a chestionarului trebuie

realizata cu foarte mare atentie, mai ales in cazul administrarii directe.

In concluzie, redactarea unui chestionar presupune munca in echipa, necesita

multa atentie si mai ales multa experienta deoarece chestionarul este suportul de culegere

a datelor iar daca acesta este intocmit superficial, chiar daca metodologia de sondaj si

tehnicile de prelucrare a datelor sunt foarte avansate si complexe, rezultatele obtinute nu

vor fi chiar cele mai bune.

Testarea chestionarului

Oricare ar fi experienta celor care redacteaza chestionarul sunt foarte rare

situatiile cand acesta se prezinta intr-o forma perfecta, care sa nu necesite imbunatatiri.

De aceea este nevoie de testarea, chestionarului, respectiv verificarea modului de

intelegere, de interpretare si de acceptabilitate a intrebarilor.

- 48 -

Testarea chestionarului este absolut necesara in orice situate si la orice tip de

sondaj. Daca cei anchetati suni consumatorii, in general marele public, se stie ca exista

diferente intre nivelul de cultura al celor ce redacteaza chestionarul, care sunt specialisti

in domeniul respectiv, si repondenti care nu dispun de limbajul tehnic de specialitate.

Astfel in intrebari s-ar putea regasi cuvinte sau fraze strict de specialitate si care

sa nu fie infelese de majoritatea celor anchetati.

Chestionarul este testat pe un numar reduse de persoane apartinand populatiei

srudiate, respectiv in jur de 20, 30 persoane, acest esantion trebuie sa cuprinda persoane

cat mai diferite.

De asemenea anchetatorii trebuie sa fie persoane cu o anumita pregatire de

specialitate, pentru a fi in masura sa sesizeze reactiile celor anchetati, sa poata interpreta

comportamentul acestora.

In cursul acestei etape trebuie verificate urmatoarele aspecte: daca termenii

utilizati sunt usor de inteles si nu conduc la confuzii; daca ordinea intrebarilor nu conduce

la nici o reactie defavorabila; daca forma intrebarilor permite culegerea de informatii

dorite; daca intrebarile nu sunt prea lungi si nu produc dezinteres sau iritarea celor

anchetati; daca anumite intrebari nu sunt utile; daca textele de introducere si de legatura

sunt suficiente si eficiente; daca variantele de raspuns a intrebarilor inchise sunt

suficiente; daca numarul intrebarilor deschise nu este prea mare ca sa oboseasca pe cel

anchetat.

Modalitati de administrare a chestionarului

Pentru colectarea datelor exista mai multe modalitati, dar nu toate au aceleasi

avantaje si nu pot fi utilizate cu indiferenta. Alegerea uneia sau alteia depinde de o serie

de factori.

Culegerea datelor se poate realiza cu ajutorul urmatoarelor tehnici

• ancheta prin interviu direct;

• ancheta prin corespondenta;

• ancheta prin telefon.

- 49 -

1) Ancheta prin interviu direct se caracterizeaza prin aceea ca administrarea

chestionarului se face direct la domiciliu, la locul de munca, in strada, la diferite puncte

de vanzare, la expozitii, etc.

Astfel, in cazul anchetei la domiciliu sau la locul de munca se pot administra

chestionare cu multe intrebari si se pot obtine numeroase informatii. Calitatea

raspunsurilor este asigurata datorita prezentei anchetatorului al carui rol este si acela de a

crea o atmosfera favorabila, de a explica sau reformula anumite intrebari care nu sunt

foarte explicite, de a prezenta fotografii (mai ales in cazul testarii intentiilor privind

produsele noi), chiar si mostre de produse. Uneori anchetatorul poate oferi produse celor

anchetafi, el urmand sa treaca dupa un timp si sa preia chestionarul cu raspunsurile

completate privind calitatile produselor testate.

De asemenea, anchetatorul are posibilitatea sa verifice sinceritatea unor

raspunsuri prin observare sau consultarea unor documente (facturi, chitante, bonuri etc.).

Ancheta la domiciliu are si unele inconveniente. Primul inconvenient este cel

legat de prezenta anchetatorului, care poate fi o sursa de erori, provenite din transcrierea

unor raspunsuri sau din formularea unor intrebari. De asemenea de multe ori prezenta

anchetatorului il determina pe cel anchetat sa se comporte altfel decat daca ar fi singur,

aceasta conduce la deformarea raspunsurilor, ele nu mai sunt sincere, sunt date pentru a

impresiona pe anchetator.

Un alt inconvenient este acela ca reusita anchetei la domiciliu depinde de

competenta si seriozitatea anchetatorilor, deci selectia lor trebuie sa fie foarte riguroasa.

Un alt aspect ce trebuie adaugat la inconveniente este acela ca persoanele din mediul

urban permit destul de greu patrunderea persoanelor straine in casa, astfel rata non-

raspunsurilor provenite din mediul urban este mult mai mare decat din mediul rural.

Ancheta in strada sau la expozitii, targuri, magazine, are avantajul ca se poate

realiza un numar mare de interviuri, intr-un timp scurt si cu cheltuieli mici. Ancheta la

magazine, targuri permite culegerea de impresii la timp, recente, referitoare la produse,

publicitate, promovare etc.

Anchetele in strada au un camp de actiune limitat si pot fi folosite doar atunci cand se

doreste obtinerea unor informatii ieftine si rapide, calitatea si complexitatea lor

neinteresand foarte mult.

- 50 -

Ancheta prin corespondenta

Aceasta tehnica presupune trimiterea chestionarului, prin intermediul postei sau a

unor anchetatori, la destinatar. De regula destinatarul este ales folosind un procedeu

aleator. In general chestionarul se trimite intr-un plic care contine si o scrisoare

explicativa prin care repondentul sa inteleaga importanta sondajului, a raspunsurilor pe

care este rugat sa le dea. De asemenea se trimite si un plic pentru raspuns, iar uneori se

specifica ca in cazul returnarii raspunsului repondentul va primi un mic cadou.

Aceasta modalitate de administrare a chestionarului poate fi aplicata pentru orice

populate studiata. Ca o diversiflcare a acestei modalitati a aparut administrarea

chestionarului prin intermediul faxului, aceasta fiind folosita in cazul sondajelor in randul

intreprinderilor si a diferitelor institutii.

Avantajele anchetei prin corespondenta sunl legate de cheltuielile postale care

sunt cu mult mai mici decat cheituielile ocazionate de ancheta la domiciliu. De asemenea

dispersia geografica a corespondentilor poate fi mare fara a afecta costul anchetei. In plus

aceasta tehnica ofera repondentului un sentiment de libertate si de anonimat, deoarece el

nu vine in contact cu anchetatorul. Acest anonimat este asigurat atita timp cat nu trebuie

sa-si scrie adresa pe plicul ce contine raspunsul.

Ancheta prin corespondenta permite repondentului sa se gandeasca la raspunsuri,

sa-si culeaga informatiile necesare, sa consulte documente. El completeaza chestionarul

in ritmul si la momentul ales de el. Cel mai adesea raspunsurile sunt mai personale si mai

sincere. Deoarece ancheta nu se desfasoara intr-un timp foarte limitat, chestionarul poate

fi relativ lung.

Un inconvenient al acestei anchete il reprezinta rata non-raspunsurilor care este

destul de ridicata, aceasta impunand trimiterea de noi chestionare altor persoane si deci

cresterea cheltuielilor anchetei.

Ceea ce propunem este imbinarea anchetei la domiciliu cu cea prin

corespondenta, astfel s-ar imbunatati calitatea datelor culese. Respectiv anchetalorul ar

avea rolul de a duce chestionarul la repondent, de a-i da cateva explicatii si de a reveni

dupa un anumit timp bine specificat pentru a prelua raspunsurile. Repondentul va trebui

- 51 -

sa completeze singur chestionarul, asigurandu-se astfel conditiile ca raspunsurile sa nu fie

afectate de erori datorate anchetatorului. Rata raspunsurilor ar fi cu mult mai mare decat

in cazul anchetei prin corespondenta, dar in acelasi timp si cheituielile vor fi mai mari, in

special cele de deplasare.

Acest tip de administrare este eficient in cazul populatiilor statistice putin dispersate din

punct de vedere geografic.

Ancheta prin telefon

Anchetatorul pune o serie de intrebari persoanelor din esantion, prin intermediul

telefonului. Aceasta modalitate de culegere a datelor permite obtinerea de informatii

rapid, numerele de telefon fiind extrase din cartea de telefon, iar durata unei convorbiri

este de 10-15 minute. Aceasta tehnica este mai economica decat ancheta la domiciliu,

cheituielile cuprind doar tarifele telefonice. Ca o consecint a cheltuielilor reduse, este

faptul ca ancheta este eficienta atunci cand esantionul este dispersat geografic.

Printre avantajele anchetei prin telefon este si acela ca tele-anchetatorul poate

telefona la diferite ore din zi si de mai multe ori, pentru a contacta persoanele ce fac parte

din esantion. Astfel rata raspunsurilor este destul de mare.

Deoarece durata convorbirii telefonice este limitat a, chestionarul este relativ

scurt, intrebarile vor fi simple, ceea ce arata ca aceasta modalitate de culegere a datelor se

aplica in cazul temelor mai simple si care sunt supuse schimbarii intr-un timp scurt.

Principalul inconvenient este acela ca esantionul de cele mai multe ori nu este

reprezentativ. Acesta pentru ca nu toata populatia dispune de telefon, iar populatia din

mediul rural este foarte greu de contactat telefonic.

In concluzie alegerea unei tehnici sau a alteia depinde de obiectivele studiului, de

complexitatea informatiilor culese, de volumul esantionului si de dispersia geografica a

acestuia, de bugetul alocat si de timpul acordat pentru sondaj.

Ceea ce se contureaza pentru viitor este aparitia de noi modalitati de culegere a

datelor, mult mai eficiente decat cele aplicate in prezent (cum ar fi folosirea internetului).

Erori de observare

- 52 -

In cele mai multe cazuri observarea statistica presupune si manipularea unui

volum mare de date. Ca atare intervin diferite tipuri de erori:

- eroare de esantionare (de reprezentativitate);

- erori de observare;

- erori datorate non-raspunsurilor.

Eroarea de esantionare exista in toate anchetele prin sondaj, dar ea este nula in

cazul observarii totale (nu constitute obiectul acestei lucrari).

Erorile de observare tin de faptul ca valoarea inregistrata poate fi o valoare yį* diferita de

valoarea adevarata yi corespunzatoare unitatii i.

Din categoria erorilor de observare fac parte urmatoarele:

a) Erori datorate dificultatilor de vocabular, cum ar fi:

- utilizarea unui limbaj savant, prea tehnicist, cand de regula intr-un chestionar nu trebuie

sa fie folosite decat cuvinte usor de inteles;

- folosirea unor cuvinte a caror sens este variabil de la un mediu la altul, sau de la un

individ la altul;

- folosirea unor cuvinte a carui sens este vag sau sunt prea abstracte.

b) Erori datorate neintelegerii corecte a sensului intrebarilor, ca de exemplu:

- persoanele intervievate declara o aita situate decat cea normala, cum ar fi cazul

declararii venitului (cand cel in cauza declara venitul salarial si nu venitul total realizat),

declararea unei vechi profesii in loc de cea actuate etc.;

- persoanele intervievate comit erori fie datorate nedefinirii perioadei de referinta (o p

erioada pentru care se solicita informatii) sau datorate lungimii prea mari, solicitandu-se

prea mult memoria celor anchetati;

- nedefinirea exacta a unitatilor de observat, pentru ca sunt intrebari ce se refera la o

persoana, iar altele la un grup, mai ales in cazul anchetelor organizate in gospodarii;

- neintelegerea intrebarilor foane lungi, foarle complexe si care contin mai multe ideii

in acelasi timp;

- 53 -

- folosirea unor intrebari vagi, abstracte, a caror implicatii nu sunt bine intelese;

- dificultatea alegerii unuia sau a mai multor raspunsuri dintr-o lista. Este important sa

se stie daca raspunsurile se exclud sau nu, daca poti alege doar unul sau mai multe. In

general se prefera o lista cu raspunsuri cat mai completa, dar sa nu fie prea lunga.

c) Erori datorate solicitarii memoriei, si anume:

- erori cauzate de uitarea unor evenimente sau retinerea lor partiala;

- erori cauzate de lungimea perioadei de referinta, mai ales atunci cand ea este mare.

d) Erori datorate lipsei sinceritatii in furnizarea informatiilor. Astfel de erori sunt mai

frecvente in cazul tarilor unde persoanele nu sunt obisnuite cu sondajele. In cadrul acestei

categorii s-ar include:

- erori datorate fricii de a declara o situate asa cum este ea, de exempiu in cazul

venitului, persoanele declara in general salariul, pensia sau ajutorul primit, veniturile

suplimentare nu sunt declarate mai ales de frica impozitelor fiscale;

- erori cauzate de dorinta impresionarii anchetatorului, de exemptu subestimand

consumul de alcool, supraestimand activitatile culturale etc.

e) Erori cauzate de anchetatori, si anume:

- prin interpretarea unor intrebari sau ,,suflarea" unor raspunsuri, la cei intervievati;

- in cazul organizarii de sondaje probabiliste, atunci cand o uniitate este inlocuita cu

aita, care nu este trecuta pe lista esantionului, situatie intalnita mai ales atunci cand nu se

obtin informatii de la unitatile ce trebuie supuse observarii.

Pentru reducerea acestor erori este necesara o selectie riguroasa a anchetatorilor, o

buna pregatire a acestora, si o testare prealabila a chestionarelor. De asemenea se

recomanda efectuarea de controale a anchetatorilor. Depistarea erorilor se poate realiza

si in faza de prelucrare a datelor, iar in functie de natura lor se pot lua diferite masuri

pentru eliminarea efectului acestora.

In concluzie, asa cum spunea J. Desabie , atunci cand o ancheta esueaza, eel mai frecvent

se datoreaza erorilor de observare decat erorii de esantionare. De aceea este irational sa

consacri mari eforturi pentru reducerea erorii de esantionare atunci cand erorile de

observare sunt consistente. Dar in general erorile de observare sunt mult mai mici in

cazul anchetelor prin sondaje decat in cazul recensamintelor, datorate faptului ca

anchetatorii au o pregatire mult mai buna decat agentilor recenzori.

- 54 -

Erorile datorate non-raspunsurilor provin din absenta totala sau partiala a datelor

privind unitatile supuse observarii.

Sistematizarea si prezentarea datelor statistice

Sistematizarea constitute o etapa in cadrul prelucrarii datelor statistice in vederea

prezentarii acestora sub forma de serie statistica.

Datele obtinute ca urmare a procesului de observare statistica, in forma lor bruta,

permit o caracterizare amanuntita a fiecarei unitati din populatia considerata. Deoarece,

datele rezultate din observare se prezinta sub forma dezorganizata nu permit o

caracterizare a populatiei in ansamblu.

In vederea atingerii scopului cercetarii statistice intreprinse si anume acela de a da

o caracterizare de ansamblu a populatiei considerate este necesar ca datele rezultate din

observare sa fie supuse unor operatii de sistematizare si prezentare in vederea deducerii a

ceea ce este esential, tipic si general in legatura cu populatia.

Deoarece in prelucrarea statistica primul pas il constituie prezentarea datelor

observate sub forma de serie, pentru construirea seriilor statistice se aleg variabilele care

trebuie sa fie in stransa dependent cu scopul cercetarii si cu natura fenomenului cercetat.

In raport cu una sau mai multe variabile din programul observarii, se poate

construi o serie statistica, permitand astfel diverse ordonari (grupari) a datelor

inregistrate. Orice cercetare statistica se face cu un anumit scop bine precizat. In urma

efectuarii observarii statistice, indiferent de numarul variabilelor prevazut in programul

cercetarii, prelucrarea datelor rezultate se face in raport cu acelea care sunt strans legate

de scopul final.

Odata precizate variabilele de la baza seriei, se stie care va fi continutul primului

sir de date si ca urmare esle elucidat criteriul in raport cu care informatiile rezultale din

observare vor fi ordonate, necunoscandu-se insa cum se face propriu-zis ordonarea si

cum se completeaza primul sir al seriei.

Completarea primului sir de date al unei serii statistice nu presupune doar o

simpia aranjare in ordine crescatoare sau descrescatoare a variabilelor numerice sau in

- 55 -

ordine alfabetica a starilor variabilelor calitalive. Definirea unei serii, referitor la primul

sir de date se realizeaza in raport cu toate starile variabilei stabilite.

In cazul unei variabile calitative sau cantitative discrete (si care inregistreaza un numar

redus de stari) ce sta la baza construirii unei serii, procedeul cel mai simplu de completare

a primului sir il constituie ordonarea sau aranjarea starilor variabilei respective intr-o

anumita ordine. Daca variabila care sta la baza seriei este de variatie continua sau desi

discreta inregistreaza un numar prea mare de valori in cadrul populatiei de studiat,

ordonarea valorilor acestei variabile va conduce la o faramitare prea mare a populatiei,

ceea ce nu permite evidentierea principalelor aspecte ale acesteia. Pentru asemenea

cazuri, completarea primului sir presupune in primul rand reunirea in clase distincte a

acelor unitati din populate pentru care variabila nu prezinta variatii esentiale. Ca urmare,

in vederea definitivarii primului sir de date al unei serii, se grupeaza datele in mod

corespunzator, fiind necesar in primul rand stabilirea claselor.

Operatia de stabilire a claselor presupune imparprea unitatilor unei populatii in

clase distincte in raport cu una sau mai multe variabile si aranjarea claselor rezultate intr-

o anumita ordine. In urma unei asemenea operatii, fiecare unitate trebuie sa se gaseasca in

una si numai una din clasele rezultate. Aceasta operatie nu trebuie sa conduca la pierderi

de unitati, regasindu-se insa intr-o alta ordine decat cea dupa care s-a realizat observarea.

De modul cum se face operatia de grupare a unitatilor populatiei depinde in mare

masura sesizarea principalelor aspecte calitative care se pot contura in cadrul unei

populatii cat si calitatea informatiilor rezultate in urma prelucrarii datelor respective.

Omogenitatea constituie o proprietate de baza pe care trebuie sa o aiba clasele.

Se spune ca o clasa este omogena daca, pentru unitatile care fac parte din ea, variabila de

grupare inregistreaza variatii nesemnificative.

In cazul seriilor care au la baza o variabila de grupare calitativa sau cantitativa

discreta, problema omogenitatii nu se ridica deoarece, toate unitatile pentru care variabila

a inregistrat aceeasi stare constituie o clasa.

In cele ce urmeaza se va prezenta operatia de stabilire a claselor in cazul unei serii

unidimensionale.

Daca la baza seriei avem o variabila calitativa, atunci clasele se stabilesc in raport

cu starile acesteia. Pentru fiecare stare a variabilei se va construi o clasa. Ca urmare, in

- 56 -

acest caz, intr-o clasa vor intra toate unitatile care au inregistrat aceeasi stare in timpul

observarii in raport cu variabila considerate.

Pentru o variabila cantitativa, care sta la baza construirii unei serii, stabilirea

claselor se realizeaza in mod diferit pentru o variabila discreta si pentru o variabila

continua.

In cazul unei serii care are la baza o variabita cantitativa discreta (numarul

starilor nu este prea mare), clasele se stabilesc in mod asemanator ca si la variabilele

calitative, respectiv:

X:

In conditiile in care cercetarea populatiei presupune elaborarea unei serii care are la baza

o variabila cantitativa continua sau o variabila cantitativa discreta, dar care in populatia

considerate inregistreaza un numar prea mare de stari, clasele nu se mai pot stabili cu

ajutorul starilor variabilei. Pentru asemenea cazuri, gruparea unitatilor populatiei in clase

se face cu ajutorul intervalelor de grupare (variatie), fiecare interval cuprinzand un numar

oarecare de valori ale variabilei. Ca urmare, pentru o serie continua, clasele se definesc

cu ajutorul intervalelor de grupare.

Doua probleme se pun in cazul elaborarii unei serii care are la baza o variabila cantitativa

continua:

• determinarea lungimii intervalelor de variatie;

• stabilirea formei de scriere a intervalelor de variable.

Determinarea lungimii intervalelor de variatie conduce la doua situatii:

• serii construite cu intervale de lungime egala;

• serii construite cu intervale de lungime diferita. Alegerea unuia din cazurile de mai sus

(intervalele de lungime egala sau diferita) trebuie precedaia de o analiza atenta a modului

de variatie a variabilei in cadrul populatiei. Stabitirea numarului de intervale de variable

trebuie sa asigure satisfacerea umiatoarelor conditii:

- informatia care se pierde in urma operatiei de grupare sa nu fie prea mare, iar

populatia sa nu fie prea faramitata in raport cu variabilele de grupare;

- 57 -

- media aritmetica a fiecarei grupe (in raport cu valorile inregistrate) sa fie cat mai

aproape de centrul intervalului de variatie respectiv;

- sa nu existe grupe vide;

- reprezentarea grafica a seriei rezultate sa permita conturarea unei regularitati a

fenomenului de studiat din cadrul populatiei. Trebuie remarcat ca acest lucru nu este

posibil nici in cazul unui numar mic de intervale deoarece se pierd prea multe date, nici

in cazul unui numar prea mare de intervale, populatia farmitandu-se prea tare.

Statisticianul american H.A. Struges a stabilit pentru cazul in care populatia in raport cu

variabila X este normala, urmatoarea expresie:

l x =

avand semnificatia de ,,numar de intervale”, pentru celelalte cazuri rezultatul fiind

orientativ, servind la determinarea cu aproximatie a lungimii intervalelor de variatie in

cazul in care acestea vor fi de lungime egala. In expresia de calcul a lungimii intervalelor

intervine valoarea maxima si cea minima a variabilei, cat si volumul populatiei. In urma

stabilirii lungimii intervalelor, se elaboreaza seria de intervale de lungime egala dupa

cum urmeaza:

X :

__

daca se presupune ca au rezultat R intervale, unde N , k =1,R reprezinta volumele

claselor in care s-a structurat populatia.

- 58 -

Nu intotdeauna impartirea domeniului de variatie a variabilei in intervale de

lungime egala este relevanta din punct de vedere al scopului urmarit in ceea ce priveste

desprinderea tipurilor calitative din cadrul populatiei cercetate. Numeroase sunt cazurile

practice in care studiul unei populatii in raport cu o variabila sau mai multe presupune

impartirea domeniilor de variatie ale acestora in intervale de lungime neegala. In

asemenea cazuri nu exista o relatie decalcul in acest sens. Stabilirea intervalelor de

variatie se face in directa legatura cu variaria variabilelor si distribuirea unitatilor in

raport cu acestea.

Daca la baza seriei in cauza stau doua sau mai multe variabile calitative sau cantitative

atunci clasele se stabilesc in raport cu fiecare din variabilele considerate prin starile

acestora.

Nu este recomandat ca numarul variabilelor in raport cu care se studiaza populatia

sa fie prea mare, deoarece aceasta duce la o divizare exagerata a populatiei pierzandu-se

din vedere aspectele principale.

Dupa ce clasele au fost definite, are loc repartizarea unitatilor populatiei in clasele

respective, folosind in acest scop un algoritm adecvat.

Pentru elaborarea si prezentarea seriilor statistice se apeleaza la pachete de

programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences),

STATIST1CA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc.

Exemple

Elaborarea seriilor statistice unidimensionale.

De cat timp sunteti client al bancii R:

Frecventa absoluta Frecventa relativa Frecventc relativa cumulata

sub 1 an 20 22.2 22.2

1-3 ani 28 31.1 53.3

4-6 ani 11 12.2 65.6

peste 6 ani 31 34.4 100.0

- 59 -

Total 90 100.0

Ce tipuri de produse utilizati de la aceasta banca :

Frecventa

absoluta

Frecventa relativa Frecventa relativa

cumulata

non-raspuns 56 62.2 62.2

card 12 13.3 75.6

card,cont 1 1.1 76.7

cont 10 11.1 87.8

credite 3 3.3 91.1

credite in valuta 1 1.1 92.2

depozit 5 5.6 97.8

depozit,cont 1 1.1 98.9

plata

utilit.,prod.econ.

1 1.1 100.0

Total 90 100.0

- 60 -

Veniturile familiei

Frecventa

absoluta

Frecventa relativa Frecventa relativa cumulata

pana la 2,5 mil. lei 25 27.8 27.8

2,6-5 mil.lei 26 28.9 56.7

6-10 mil. lei 28 31.1 87.8

11 -25 mil. lei 8 8.9 96.7

peste 25 mil.lei 3 3.3 100.0

Total 90 100.0

Categoria socio-profesionala

Frecventa absoluta Frecvema

relativa

Frecventa relativa

cumulata

manager 7 7.8 7.8

patron 5 5.6 13.3

- 61 -

liber profesionist 9 10.0 23.3

salariat 29 32.2 55.6

profesor 3 3.3 58.9

medic 4 4.4 63.3

pensionar 10 11.1 74.4

fermier 5 5.6 80.0

elev/student 13 14.4 94.4

casnica 2 2.2 96.7

somer 3 3.3 100.0

Total 90 100.0

Calitatea si diversitatea serviciilor( note acordate)

Frecventa absoluta Frecventa relativa Frecventa relativa cumulata

2 1 1.1 1.1

3 9 10.0 11.1

- 62 -

4 55 61.1 72.2

5 25 27.8 100.0

Total 90 100.0

Promptitudinea personalului

Frecventa absoluta Frecventa relativa Frecventa relativa cumulata

3 1 1.1 1.1

4 23 25.6 26.7

5 66 73.3 100.0

Total 90 100.0

Nivelul dobanzilor

Frecventa absoluta Frecventa relativa Frecventa relativa cumulata

1 4 4.4 4.4

2 20 22.2 26.7

3 41 45.6 72.2

- 63 -

4 21 23.3 95.6

5 4 4.4 100.0

Total 90 100.0

Serii de repartitie bidimensionale

Nivelul dobanzilor * Veniturile familiei

Veniturile familiei

Nivelul Jobanzilo r pana la 2,5 mil. lei 2,6-5

mil.lei

6-

10

mil.

Lei

11-

25

mil.

lei

peste

25

mil.lei

Total

1 2 2 4

2 4 7 5 3 1 20

3 11 15 9 4 2 41

4 8 3 10 21

5 1 2 1 4

Total 25 26 28 8 3 90

- 64 -

Reprezentari grafice

Reprezentarea grafica a unei serii ne da o imagine geometrica (in plan sau spatiu)

cu privire la forma statica sau evolutia dinamica a fenomenului cuantificat de seria

respectiva.

Graficul asociat unei serii constituie o imagine spatiala a fenomenului de cercetat,

permitand evidentierea rapida a structurii, dinamicii si tendintei de dezvoltare a acestuia.

Reprezentarile grafice sunt folosite atat in scopul cunoasterii populatiei in cauza, cat si

pentru popularizarea unor rezultate din diverse domenii de activitate.

Elaborarea completa si corecta in acelasi timp a unui grafic presupune elucidarea

urmatoarelor elemente: titlul graficului, scara de reprezentare, reteaua graficului, semnele

conventional si notele.

Titlul graficului trebuie sa fie scurt, clar si semnificativ pentru continutul

fenomenului reliefat prin seria considerata.

In cele mai frecvente cazuri un grafic se traseaza intr-un sistera de axe

rectangulare xOy. Pe fiecare din cele doua axe se reprezinta valorile variabilelor X,

respectiv Y, un astfel de punct marcat se mai numeste punct cotat. Scara de reprezentare

reuneste multimea tuturor punctelor cotate. In cazul in care variabila inregistreaza valori

mici, gradarea scarii incepe in principiu de la zero, daca variabila inregistreaza valori

mari se considera o alta origine stabilita cu aproximatie. Pentru a nu incarca prea mult

desenul, se recomanda reprezentarea pe scara doar a valorilor dispuse la un anumit

interval convenabil ales. Distantele dintre doua puncte cotate consecutive se numeste

intervalul graficului. Cand intervalele sunt egale atunci avem scari uniforme, in caz

contrar avem scari neuniforme.

Scara aritmetica este o scara uniforma in timp ce scara logaritmica sau cea

binomiala constituie exemple de scari neuniforme.

Reteaua graficului permite identificarea cu usurinta in plan sau in spatiu a

punctelor corespunzatoare valorilor inregistrate de variabilele in cauza. Sistemul axelor

- 65 -

rectangulare (in plan sau spatiu) constituie cele mai uzuale repere in reprezentarea

grafica a seriilor statistice.

Semnele conventionale se pot materializa intr-o reprezentare grafica fie prin

inscriptii, fie printr-o legenda.

Inscriptia trebuie sa fie scurta si semnificativa si plasata cat mai bine in raport cu

elementul din grafic pe care il expliciteaza.

Legenda se foloseste pentru a explicita folosirea semnelor, culorilor sau

diverselor hasururi folosite in graficul in cauza. Legenda se plaseaza inafara graficului,

in coltul din stanga sau dreapta jos.

In cazul graficelor complexe, pentru o intelegere mai buna, sunt necesare unele explicatii,

care se dau sub forma de note. Notele generale privesc in ansamblu graficul si se plaseaza

chiar sub titlul graficului. Notele speciale privesc portiuni din grafic si sunt legate de

acestea prin diverse semne de trimitere. Notele se plaseaza in partea de jos a diagramei,

in coltul din stanga sub retea.

In continuare se vor prezenta principalele tehnici de construire a graficelor utilizate in

reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma

Graficul specific seriilor care au la baza o variabila continue (de intervale) este

histograma. Aceasta se construieste intr-un sistem de axe rectangulare dupa cum

urmeaza: pe abscisa se trec intervalele de variable, iar pe ordonata se traseaza scara

frecventelor. Scara frecventelor se construieste in conformitate cu respectarea principiului

proportionalitalii intre frecvente si segmentele delimitate pe scara ordonatelor. Pentru

fiecare interval de variajie a seriei (Xi-1 - Xi) se construieste un dreptunghi a carui baza

este chiar lungimea intervalului, iar cealalta latura se determina din conditia proportional

itatii ariei dreptunghiului cu marimea indicatorului in clasa respectiva.

Latura necunoscuta a dreptunghiului, notata cu L, se determina din

urmatoarea relatie:

Li*li = k * Ni (2.2)

- 66 -

1i= latura cunoscuta a dreptunghiului corespunzator intervalului (Xi-1 - Xi) ;

Li= latura necunoscuta a dreptunghiului corespunzator intervalului (Xi-1 - Xi)

Ni= frecventa absolute a clasei i;

k = un coeficient de proporponalitate care se alege in raport cu scara dereprezentare.

Din relatia (2.2) se deduce Li :

Li = k , i =

unde: li = xi– xi-1 adica diferenta dintre limita superioara si cea inferioara a intervalului de

variatie.

Multimea tuturor dreptunghiurilor astfel determinate, formeaza histograma atasata seriei.

Poligonul frecventelor

Este o reprezentare grafica a seriilor statistice avand la baza o variabila atributiva

cantitativa continua si formata cu frecvente absolute sau relative, simple sau cumulate.

Trasarea acesteia presupune realizarea in prealabil a histogramei. Poligonul frecventelor

se obtine unind prin segmente de dreapta mijloacele laturilor superioare ale

dreptunghiurilor, din care este alcatuita histograma.

Poligonul frecventelor poate fi construit si direct, fara intermediul histogramei.

Aceasta presupune ridicarea de perpendiculare din mijlocul fiecarui interval de variatie, a

caror lungimi(inaltimi) sunt proportionale cu frecventele intervalelor corespondente.

Unind prin segmente de dreapta varfurile acestor perpendiculare, se obtine graficul dorit.

Graficul produce o imagine a functiei densitate de probabilitate empirice (in cazul

utilizarii frecventelor simple), sau a functiei de repartitie empirica (in cazul utilizarii

frecventelor cumulate).

Poligonul frecventelor este un grafic important pentru aproximarea formei distributiei

populatiei studiate, cat si pentru compararea a doua distributii pe aceeasi diagrama.

- 67 -

Diagramele de structura

Punerea in evidenta sub forma grafica a structurii unei populatii statistice este

posibila apeland la diagramele de structura. In acest sens se prezinta: dreptunghiul,

patratul, cercul si semicercul de structura. Aceste tipuri de grafice permit reprezentarea

grafica a seriilor unidimensionale construite cu marimi de structura( frecvente relative,

greutate specifica).

Cel mai des folosit este cercul de structura denumit si diagrama sectoriala (piechart).

Cercul de structura

Se construieste un cerc de raza oarecare a carei suprafata se considera ca

reprezinta volumul intregii populatii in cauza (exprimat in frecvente absolute sau

relative).

Fiecare clasa in care este divizata populatia supusa studiului este reprezentata

printr-un sector de cerc de arie direct proportionala cu volumul clasei. Trasarea sectorului

de cere presupune determinarea masurii in grade a unghiurilor la centru a fiecarui sector.

Unghiul la centru de 360° corespunde volumului intregii populatii. Unghiurile sectoarelor

de cere care reprezinta clase din populatie trebuie sa fie proportionale cu volumul

acestora (exprimat in frecvente absolute sau relative). Unui procent ii corespunde 3,6° cu

procentul corespunzator clasei respective.

Exemplu

Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand

distributia voturilor electoratului pentru Senat (dupa redistributie) la alegerile din 3

noiembrie 1996:

Formaitunea Politica CDR PDSR USD UDMR PRM PUNR

Voturi obtinute (%) 37,0 28,7 16,1 7,7 5,6 4,9

Sa se realizeze cercul de structura in acest caz.

- 68 -

Semicercul de structura

Constructia acestuia este asemanatoare cu a cercului de structura, cu a cercului de

structura, cu deosebirea ca volumul populatiei cercetate este reprezentat printr-un

semicerc de 180°, cu respectarea aceluiasi principiu conform caruia unghiurile la centru

corespunzatoare sectorului prin care se reprezinta clasele trebuie sa fie proportionale cu

indicatorii care le reprezinta. In acest caz, unui procent ii corespunde 1,8°, unghiurile la

centru corespunzatoare sectoarelor se vor determina inmultind 1,8° cu procentele

corespunzatoare claselor respective.

Diagrama prin benzi (barchart)

Acest tip de grafic utilizeaza benzile (barele), pentru a reprezenta distributia unei

populatii in raport cu o variabila cantitativa discreta sau calitativa. Benzile au aceeasi

latime (baza), iar lungimea (inaltimea) lor este direct proportionala. cu frecventa clasei

reprezentate. Numarul benzilor este egal cu numarul claselor in care este impartita

populatia studiata. De asemenea se pot lua in considerare o variabila sau doua.

In reprezentari se utilizeaza benzi simple sau benzi grupate. Pozitia benzilor poate fi

orizontala sau verticala.

Exemplu

Din Anuarul Statistic al Romaniei din anul 2000 am extras seria care urmeaza, redand

nivelul PNB/loc in S calculat pe baza puterii de cumparare in Romania si alte tari est-

europene

Tara Bulgaria Cehia Polonia Romania Slovacia Ungaria

PNB/loc ($) 4683 12197 7543 6153 9624 9832

Cartograma si cartodiagrama

- 69 -

Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafica a seriilor

statistice de spatiu.

Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spatiului (sub

forma de harta) in interiorul caruia se manifesta fenomenul care este cuantificat de seria

de reprezentat. in interiorul hartii astfel realizata, prin diverse culori sau nuante ale

aceleiasi culori, prin hasururi sau prin diferite diagrame, este evidentiata intensitatea

dezvoltarii fenomenulut cercetat precum si marimea indicatorilor seriei.

Cartograma in culori sau nuante ale aceleiasi culori se utilizeaza pentru redarea

intensitatii manifestarii unui fenomen. Acest tip de grafic este recomandat in special

atunci cand intensitatea fenomenului surprins de seria de spatiu nu prezinta o variabila

prea mare pentru a nu apela la prea multe culori sau nuante ale acestora, care sa

ingreuneze citirea graficului.

Cand realizarea unei cartograme in culori este prea costisitoare sau culori le si

nuantele sunt greu de reprodus este utilizata cartograma prin hasuri. Si in acest caz

densitatea hasurilor trebuie sa redea diferente de intensitate a fenomenului in spatiu

surprins de seria de reprezentat. Dupa ce harta a fost desenata si impartita in

conformitate cu starile variabilei de spatii, ce sta la baza seriei, in interiorul fiecarei

subdiviziuni se utilizeaza hasuri a caror intensitate sa fie proportionala cu intensitatea

fenomenului cuantificat de indicatorul cu care s-a construit seria.

Cartodiagrama constitute o modalitate de reprezentare grafica a seriilor de spatiu,

realizandu-se ca o imbinare intre cartograma si diferite alte tipuri de diagrame, ca de

exemplu diagrame prin benzi, cerc , patrat, dreptunghi etc. De exemplu, pentru a

reprezenta o serie de spatiu ce exprima volumul investitiilor straine pe judete, la noi in

tara, se procedeaza astfel: in primul rand se deseneaza harta Romaniei, delimitandu-se

judetele; in cadrul fiecarui judej se deseneaza o figura geometrica oarecare convenabil

aleasa, a carei arie sau marime sa fie direct proportionala cu volumul investitiilor straine

din judetul respectiv.

Si acest tip de reprezentare grafica isi are o larga aplicabilitate in special in

urmarirea acelor fenomene de natura economica sau sociala care sunt urmarite in spatiu.

- 70 -

CAPITOLUL 3

SERII STATISTICE ATRIBUTIVE DE REPARTIŢIE

UNIDIMENSIONALE

Organizarea datelor rezultate din observarea statistica sub forma de serie de

frecvente, constituie o prima etapa a prelucrarii acestora. O serie statistica reda sub forma

rezumativa (sintetica) o prima imagine asupra populatiei de studiat in raport cu variabila

de la baza seriei.

Pornind de la repartitia statistica, ca forma sintetica de prezentare a rezultatelor

observarii, se pot deduce o serie de caracteristici specifice populatiei considerate, cum ar

fi:

- nivelul mediu al variabilei;

- structura populatiei in raport cu variabila considerata;

- variatia variabilei in raport cu nivelul mediu al acesteia;

- forma dupa care se dispun unitatile populatiei in jurul valorii medii. Caracterizarea

numerica a acestor aspecte poate fi realizata prin urmatorii parametri (caracteristici):

- parametrii tendintei centrale;

- parametrii de structura;

- parametrii variatiei;

- parametrii concentrarii;

- parametrii formei.

Se prezinta, in cele ce urmeaza, aspecte legate de definirea, semnificatia si modalitati de

calcul pentru fiecare parametru.

Parametrii tendintei centrale

Parametrii din aceasta grupa au menirea de a evidentia pozitia in jurul careia se

grupeaza ansamblul valorilor unei variabile de la baza unei serii. Aceasta pozitie

exprimata printr-un numar se numeste pozitie centrala. Ea poate fi evidentiata prin:

__

- valoarea medie (X);

- 71 -

- valoarea mediana (Me(x));

- valoarea modaia (M0(x).

1. Valoarea medie

Valoarea medie reprezinta principalul parametru care caracterizeaza tendinta

centrala a unei repartitii statistice.

In vederea definirii parametrului valoarea medie se considera o populatie

statistica studiata in raport cu variabila cantitativa X si o functie G(x1,x2,...,xR) unde xi,

i = reprezinta starile variabilei X. Functia G exprima o anumita insusire esentiala,

un atribut al populatiei in raport cu variabila X. Aceasta functie se numeste functie

determinanta.,

Prin definitie, valoarea medie a variabilei X este parametrul

care lasa invarianta functia determinanta, adica:

G(x1,x2,...,xR) = G ( , , ..., )

(3.0)

Aceasta egalitate se intalneste sub denumirea de relatia lui BOIARSKI-KISINI. In

functie de forma analitica a functiei G, din relatia (3.0) se deduce expresia analitica

(indicatorul) de calcul a valorii medii .

Determinarea, pe aceasta cale, a valorii medii , este destul de anevoioasa.

Utilizarea acesteia presupune stabilirea continutului (semnificatiei) si a formei analitice a

functiei determinante G, pentru fiecare caz in parte. Dar, valoarea medie poate fi

definita ca un raport a doua marimi din care se deduce aceeasi expresie pentru ca si din

(3.0).

Exista, asadar, doua modalitati echivalente de definire a valorii medii, criteriul

relatiei determinante a lui Boiarski-Kisini si criteriul raportului, ultima fiind mai

accesibila. Criteriul raportului presupune raportarea volumului fenomenului cercetat la

volumul populatiei. Acesta presupune cuantificarea volumului fenomenului in functie de

natura lui.

- 72 -

Pentru a exemplifica cele prezentate mai sus, se considers populatia familiilor

dintr-o localitate, cercetata in raport cu numarul de copii. Datele rezultate din observare

se prezinta ca o serie de repartitie de forma:

X:

In acest caz, functia determinanta are urmatoarea forma:

G(x1,x2,...,xR) =

semnificand numarul total de copii din localitatea respectiva. Pentru a gasi numarul

mediu de copii pe familie se particularizeaza relatia (3.0) dupa cum urmeaza:

=

De unde rezulta

La acelasi rezultat se putea ajunge pornind de la faptul ca numarul mediu de copii

pe familie se poate exprima ca un raport intre numarul total de copii si numarul de familii

din localitatea respectiva, adica:

- 73 -

In acest exemplu, fenomenul fiind de natura demografica, volumul acestuia se

cuantifica prin numarul total de copii la nivelul populatiei statistice considerate. Aceasta

este in directa concordanta cu natura si senmificatia variabileiifn raport cu care se face

cercetarea statistica.

Cunoasterea "naturii" parametrului valoare medie, conduce la o definite mai

completa si plina de semnificatie. _

Pentru a intelege semnificafia valorii medii , trebuie subliniat faptul ca, in

general, variatia unui fenomen, de orice natura, si in particular variatia unei variabile X in

raport cu care este cercetata o populate, este determinata de actiunea simultana a doua

categorii de factori: factori esentiali si factori neesentiali.

In categoria factorilor esentiali intri acei factori care actioneaza asupra tuturor

unitatilor populatiei in mod continuu si in acelasi sens, determinand, in principal, nivelul

de dezvoltare a variabilei pentru fiecare unitate componenta din populatie.

Factorii esentiaii se conjuga in actiunea lor cu factorii neesentiali, care, in general,

au un caracter aleator, sunt numerosi si neuniform raspanditi printre unitatile populatiei.

Fiecare din factorii considerati neesentiali acjioneaza numai asupra unui anumit numar de

unitati din populatie. Ca urmare, acestia pot contribui fie la cresterea nivelului variabilei

(pentru unele unitati din populatie), fie la scaderea nivelului variabilei (pentru alte unitati

din populatie).

La randul lor factorii esentiali nu actioneaza cu aceeasi intensitate asupra tuturor

unitatilor din cadml populatiei considerate, determinand, in acest fel, variatia neuniforma

a variabilei respective in cadrul populatiei.

In consens cu cele sublimate mai sus, se poate afirma ca parametrul valoarea

medie a unei serii statistice care are la baza variabila X, constituie acel nivel pe care 1-ar

putea inregistra variabila tn cadrul populatiei cercetate in conditiile in care factorii

neesentiali nu s-ar fi manifestat, iar factorii esentiali ar fi actionat asupra unitatilor din

populatie cu aceeasi intensitate.

- 74 -

Parametrul valoarea medie, calculat pentru o serie statistica, pune in evidenta ceea

ce este comun, general si esential sub aspectu! nivelului de dezvoltare al variabilei, in

raport cu care este studiata o populatie.

In raport cu natura variabilei ce sta la baza seriei, cat si a formei de prczentare a

indicatorilor cu care aceasta este construita, exista mai multe posibilitati de calcul a

valorii medii.

Pornind de la respectare conditiei (3.0) se determina expresia de calcul a valorii medii.

Pentru diverse valori ale lui k, in stricta concordanta cu continutul si semnificatia functiei

G, se intalnesc mai multe tipuri de medii:

media armonica (k = -1);

media aritmetica (k = 1);

media patratica (k = 2);

media cubica (k = 3);

media de ordinul k in general.

In caz concret, valoarea medie reala este aceea care se obtine prin indicatorul

(mediu) rezultat fie prin aplicarea criteriului relatiei determinante, fie criteriului

raportului.

Modalitati de calcul a valorii medii

Media aritmetica

Acesta este indicatorul eel mai utilizat in calculul parametrului valoarea medie a

unei serii statistice, asa cum rezulta din practica statistica.

Se considera acum doua serii statistice de repartitie, una formata din frecvente absolute,

iar cealalta din frecvente relative:

X: (3.4.)

- 75 -

X: (3.5.)

Avand in vedere respectarea relatiei (3.0) se gasesc urmatoarele expresii de calcul pentru

media aritmetica:

- in cazul seriilor de forma (3.4) se obtine:

=

De unde rezulta

(3.6)

- In cazul seriilor de forma (3.5) se obtine:

=

De unde rezulta prin definitie, media aritmetica ponderata, exprimata cu ajutorul

frecventelor relative, respectiv :

= (3.7.)

- 76 -

Expresia (3.6) reprezinta, prin definitie, expresia de calcul a mediei aritmetice

ponderate pentru o serie discreta, unde ponderile sunt insasi frecventele absolute

N1,N2,...NR.

Pentru cazul particular in care frecventele absolute sunt egale intre ele, adica:

N1 = N2 = …= Nr = C

Relatia de calcul (3.6) devine:

= = (3.8.)

reprezentand media aritmetica simpla a unei repartitii discrete.

Fie o serie de repartitie, care are la baza o variabila continua X, respectiv,

X:

Daca s-ar cunoaste densitatea f(x) a variabilei X, atunci, prin definite, media aritmetica

teoretica (speranta matematica) a acesteia, notata cu E(X), ar fi:

E(X) = (3.9)

Cum densitatea sa de probabilitate f(x) nu se cunoaste, aceasta se aproximeaza in

fiecare interval de variable (clasa), prin raportul dintre frecventa intervalului si lungimea

sa, respectiv prin:

- 77 -

Aplicand relapa de calcul (3.9') se deduce expresia de calcul a mediei aritmetice, dupa

cum urmeaza:

E(X) = M(X) = =

Folosind notatiile:

= M(X)=E(X) unde XI’, reprezinta mijlocul intervalului "i", obtinem relatia:

= (3.10)

Relatia(3.10)ne arata ca media aritmetica a unei serii de intervale se reduce la

media aritmetica a unei serii discrete in care clasele sunt reprezentate prin mijloacele

intervalelor de variatie.

Pentru cazul particular de serie care are la baza o variabila alternativa de forma:

X:

calculand media aritmetica, obtinem:

= (3.11.)

- 78 -

Ca urmare, media aritmetica a unei serii care are la baza o variabila alternativa

coincide cu frecventa relativa a starii notata cu 1.

In vederea intelegerii mai profunde a celor prezentate mai sus, se considera, in

cele ce urmeaza, doua exemple concludente in acest sens.

Exemplu

Angajatii unei societati comerciale se distribuie dupa salariul lunar cuvenit conform

urmatoarei serii de repartitie continua:

X :

unde variabila X este exprimata in milioane lei.

In vederea determinarii salariului mediu pe angajat, se recurge la transformarea seriei de

intervale intr-o serie discreta, dupa cum urmeaza:

X :

Salariul mediu se determine astfel:

- 79 -

= =

Presupunem ca este necesara determinarea ponderii agentilor economici, dintr-un

anumit judet, care au inregistrat pierderi in anal calendaristic incheiat. Datele inregistrate

de la institutiile competente se aranjeaza intr-o serie alternativa de forma:

X :

Unde starea 1 pentru variabila X corespunde acelor agenti care au inregistrat pierderi in

anul considerat. Media (ponderea) agentilor cu capital de stat care au inregistrat pierderi

se determina astfel:

= (15%)

In judetul considerat, 15% din agentii economici cu capital de stat au inregistrat

pierderi in anul calendaristic considerat.

Proprietati ale mediei aritmetice

Prezentarea celor mai reprezentative proprietati ale mediei aritmetice prezinta

importanta din punct de vedere al aplicatiilor practice, ilustrand, in acest fel si

- 80 -

posibilitatile de calcul simplificat al acestui indicator. In acest sens prezentam

urmatoarele proprietati:

I 1.Media aritmetica a unei constante este egala cu constanta respectiva, daca la

baza unei serii se afla o variabila-care a inregistrat o singura stare X = C, atunci aplicand

relatia de calcul a valorii medii se obtine:

M(X) = M(C ) = C

2. Media produsului dintre o variabila X si o constanta k este egala cu produsul dintre

media variabilei X si constanta respectiva:

M(k*X) =

unde am considerat o serie discreta forrmata cu frecvente relative; in acelasi mod se

procedeaza pentru o serie cu frecvente absolute.

3.Media aritmetica a sumei a doua sau mai multe variabile este egala cu suma mediilor

acestora:

M(X1+X2+...+XR) = M(X1)+ M(X2) +...+M(XR)

Pentru a nu ingreuna scrierea si pentru a intelege mai bine, se demonstreaza

aceasta proprietate pentru cazul a doua variabite X, Y. Se considera o populatie cercetata

in raport cu cele doua variabile X si Y pentru care se cunoaste si se intentioneaza

calcularea mediei M(X + Y).

4° Media produsului a r variabile doua cate doua independente este egala cu produsul

mediilor acestora:

M(X1*X2*...*XR) = M(X1)* M(X2) *...*M(XR) (3.16)

- 81 -

Pornind de la cele patru proprietati ale mediei aritmetice se pot deduce o serie de

consecinte ale acestora, frecvent intalnite in calcule statistice privind media. Prezentam in

acest sens urmatoarele consecinte:

a) Facand media sumei dintre o variabila X si o constanta C se obtine suma

dintre media variabilei si constanta respectiva :

M(X + C) = M(X) + C (3.19)

Aceasta proprietate se obtine ca o particularizare a proprietatii 3°, pentru r = 2 siX2 = C.

Daca constanta C are semnul negativ, atunci relatia (3.19) devine:

M(X-C) = M(X)-C

De unde rezulta:

M(X) = M(X - C) + C (3.20)

Aceasta ultima relatie, 3.20, conduce la concluzia conform careia, daca starile

unei variabile cantitative cresc sau descresc cu o constanta C, atunci si media noii

variabile obtinute creste sau descreste cu acea constanta.

b) Daca valorile unei variabile X sunt simplificate cu o constanta, atunci media

variabilei X descreste de acel numar de ori.

Daca in proprietatea 2°, constanta este de forma 1/k, atunci, relatia (3.13)devine:

M(X/k ) = 1/k * M(X) (3.21)

De unde rezulta

M(X) = k*M(X/k)

c) Primele doua consecinte conduc la relatia de calcul simplificata a indicatorului

media aritmetica. In acest sens, se face urmatoarea transformare asupra variabilei X:

Z = (3.22)

unde C si k sunt doua constante, iar Z numele variabilei rezultate.

- 82 -

Aplicand operatorul medie asupra relatiei (3.22) se obtine:

M(k* Z) = M(X)-C

M(X) = M(Z)*k + C

M(X) = M (X – C/ k) + C (3.23)

Aceasta ultima relatie (3.23), constituie formula de calcul simplificat a mediei aritmetice.

Avantajul maxim privind aplicarea acestei relatii se obtine alegand pentru constanta C

starea de mijloc a seriei care are la baza variabila X, iar pentru k valoarea care reprezinta

cel mai mare divizor comun al tuturor diferentelor X-C.

Formula (3.23) se particularizeaza dupa cum seria, care are la baza variabila X,

este o serie construila cu frecvente absolute sau cu frecvente relative:

- in cazul unei serii construita cu frecvenfe absolute, de forma:

X:

Se obtine:

*k +C (3.24)

- in cazul unei serii construite cu frecvente relative, de forma:

X:

Se obtine:

*k +C (3.25)

- 83 -

Formulele (3.24) si (3.25) se aplica in mod frecvent, sub denumirea de formula de

calcul simplificat, pentru determinarea mediei aritmetice, in cazul seriilor consruite cu

indicatorii frecventa absolute si relativa.

d) Proprietatea de aditiune a mediei aritmetice.

Se presupune o populatie care este structurata in raport cu un criteriu C cantitativ sau

calitativ, in P clase, C1, C2, ..., Cp. Atunci media aritmetica a variabilei X, in raport cu

care este studiata populatia, se poate obtine ca o medie a mediilor variabilei din cele P

clase.

5.Daca frecventele absolute cu care s-a construit o serie, se simplifica cu o constanta,

atunci media aritmetica a seriei respective nu se modifica.

Se considera o serie de forma:

Se noteaza cu Nį’= Nį/ d , unde d reprezinta o valoare cu care se divid toate

frecventele absolute.

= =

Pentru a se obtine un maxim de eficienta din punct de vedere a volumului

calculelor mediei aritmetice, este nevoie ca d sa fie ales drept cel mai mare divizor comun

a tuturor frecventelor absolute cu care a fost construita seria.

6° Media aritmetica a unei serii este cuprinsa intre valoarea minima si valoarea

maxima pe care o inregistreza variabila X, care sta la baza seriei.

Aceasta dubla inegalitate rezulta din urmatorul sir de inegalitati:

- 84 -

= Xmax

7° Suma abaterilor liniare ale valorilor unei variabile de la media aritmetica este

nula.

M(X - ) = 0

8° Proprietatea de minim a mediei aritmetice, se formuleaza astfel:

M(X - )2

unde x0 este un numar real oarecare.

Deci, valoarea medie a unei serii calculata cu media aritmetica, in sensul metricii

folosite, este cea mai apropiata de ansamblul valorilor variabilei X.

2.Media armonica

Se considera o serie de forma:

X: (3.27)

In cazul unei serii discrete de forma (3.27), media armonica notata cu X-1 se

defineste prin:

(3.28)

numita si formula mediei armonice ponderate.

- 85 -

Daca ponderile sunt egale intre ele, adica N1=N2=...=NR=N*, atunci

relatia(3.28)devine:

(3.29)

care reprezinta formula mediei armonice simple.

In cazul unei serii care are la baza o variabila continua X, respectiv,

X:

procedand ca la media aritmetica, pentru media armonica rezulta:

(3.30)

unde xi reprezinta mijlocul intervalului "i", i = l,R.

Si in acest caz, daca ponderile sunt egale, se obtine relatia de calcul a mediei

armonice simple, de forma:

(3.31)

Proprietati ale mediei armonice

- 86 -

Cateva proprietati ale acestui indicator sunt absolut necesare in vederea

simplificarii volumului de calcule necesare pentru obtinerea valorii medii.

1 ° Media armonica este cuprinsa intre cea mai mica si cea mai mare valoare a variabilei

X, inregistrata in populatia cercetata

xmin xmax

2.Daca valoarea medie a unei serii avand la baza variabila X, a fost calculata cu

indicatorul media armonica, atunci, trebuie sa fie verificata urmatoarea relatie:

respectiv, relatia determinanta Boiarski-Kisini.

3° Media armonica a unei serii nu se modifica daca ponderile ce intervin in

calculul acestui indicator se simplifica cu aceeasi constanta. Efectul maxim privind

simplificarea volumului de calcule, se obtine daca se alege cel mai mare divizor comun al

tuturor ponderilor, cu care urmeaza a se simplifica acestea.

4° Pentru doua serii, care au la baza aceeasi variabila X de forma:

X: ; X:

intre care exista urmatoarea relatie de legatura:

mi = kxiNi ; i= (3,32)

media armonica apare ca oa forma transformata a mediei aritmetice.

Urmatoarele egalitati sunt relevante in acest sens:

- 87 -

=

Ca urmare, daca intre cele doua sisteme de ponderi mi si Ni, exista o relatie de forma

(3.32), media armonica este identica cu media aritmetica.

Exemplu

Se considera o intreprindere industriala formata din 5 sectii unde se cunosc

productivitatile medii in fiecare sectie la nivel de muncitor cat si a realizarilor totale la

nivelul fiecarei sectii. Datele din tabelul de mai jos redau acest lucru:

Sectia Productivitalea medie pe muocitor TOTAL REALIZARI

1 300 300.000

2 400 450.000

3 350 400.000

4 380 420.000

- 88 -

5 420 500.000

si sunt exprimate in mii lei.

Pornind de la acest tabel, se construieste urmatoarea serie:

X :

unde se respecta relatia mi = xiNi ; Ni reprezentand numarul de muncitori din sectia i,

i = 1,5 . Ca urmare, valoarea medie a acestei serii se poate determina folosind media

armonica, dupa cum urmeaza:

Valoarea medie, astfel obtinuta, reprezinta productivitatea medie pe muncitor la

nivel de intreprindere, intr-o perioada considerata.

Media geometrica

Pentru o serie care are la baza variabila discreta X, formata cu frecvente absolute,

media geometrica notata cu este definita prin expresia:

(3.33)

- 89 -

Din (3.33), pentru media geometrica ponderata exprimata cu frecvente relative se

deduce:

= (3.34)

Daca variabila X, de la baza seriei este de variatie continua, atunci relatiile de

calcul pentru diversele variante de medie geometrica, raman variabile cu singura

modificare ca valorile xi, i = 1,R, se inlocuiesc cu mijloacele intervalelor de variatie,

calculate conform formulei:

i =

Raportul intre valorile medii calculate prin indicatori diferiti

Se considera o serie care are la baza variabila X a carei valori sunt pozitive. Daca

se calculeaza media acestei serii X, pe rand cu ajutorul indicatorilor: media armonica,

media geometrica, media aritmetica, media patratica etc., folosind acelasi sistem de

ponderi, atunci rezultatele obtinute verifica sirul de inegalitati:

, (3.40)

In relatia de mai sus, are loc egalitatea in cazul cand variabila X este constanta sau

intre ponderi exista anumite relatii.

Deoarece nu prezinta interes studiul variabilelor care inregistreaza o singura

valoare, prezinta inponanta intelegerea erorii ce poate fi comisa cand, in cazul unei serii

date cu un sistem de ponderi determinat, un indicator de calcul pentru medie se substituie

cu altul.

- 90 -

In vederea alegerii corecte a unuia dintre indicatorii de calcul a valorii medii a

unei serii, trebuie folosit in functie de semnificatia variabilei, fie criteriul raportului, fie

criteriul relatiei determinante.

Prin folosirea unuia duitre criterii, rezulta indicatorul care trebuie utilizat, precum

si a sistemul de ponderi corespunzator in calculul valorii medii.

Valoarea mediana

Valoarea mediana, notata cu Me este acea valoare a variabilei cantitative X

care imparte repartitia in doua parti egale, respectiv:

FN(Me) = ½ sau N(Me) = N/2 (3.41)

Calculul valorii mediane se face diferentiat, dupa cum seria are la baza o variabila

discreta sau continua.

Pentru o repartitie discreta, calculul medianei nu implica probleme deosebite si nici un

volum mare de calcule.

Se considera o repartitie cu frecvente absolute:

X: (3.42)

In calculul valorii mediane a unei serii discrete, pot aparea doua situatii:

a) volumul N al populatiei este un numar impar;

b) volumul N al populatiei este un numar par.

In ambele cazuri, calculul medianei presupune, in prima faza, determinarea

rangului medianei, notat cu rM , conform urmatoarei relatii:

(3.40)

- 91 -

a) Daca volumul populatiei N este un numar impar, rangul medianei este un numar

zecimal a carui parte intreaga[N/2] indica numarul de unitati din populatie pentru care

variabila X a inregistrat valori mai mici ca mediana.Ca urmare Me trebuie sa fie valoarea

imediat urmatoare celei de rang [N/2], adica :

Me = (3.44)

b) Daca volumul populatiei este un numar par, rangul medianei este un numar intreg si ca

urmare la mijlocul seriei nu se mai afla o valoare a variabilei X cu care sa coincida

mediana ci se gasesc doua valori, mediana calculandu-se in acest caz ca media aritmetica

a acestora. Relatia de calcul a medianei, in acest caz, este:

Me = (3.45)

Pentru o repartitie continua, calculul valorii mediane presupune

verificarea egalitatii (3.41) si ca urmare, trebuie cunoscuta densitatea de

repartitie f(x). Determinarea functiei implica un volum mare de calcule si

deci, din acest motiv, in activitatea practica f(x) este aproximat.

Acest lucru va conduce la o expresie aproximativa de calcul a valorii mediane,

care necesita un volum redus de calcule.

Pentru acesta se considera o repartitie continua in raport cu variabila X, si anume:

(3.46)

unde intervalele Xi-1- Xi, i = l,R pot fi de lungime egala sau neegala. Calcularea rangului

medianei va permite stabilirea intervalului in care se afla valoarea mediana, interval

- 92 -

numit si interval median. Se cumuleaza frecventele absolute din aproape in aproape pana

ce este indeplinita inegalitatea:

Ultima frecventa Ni, cumulata, ne permite sa indicam intervalul median [Xi-1 - Xi).

Ca urmare, Me , si deci se poate scrie:

Me = (3.47)

unde Δx este distanta de la limita inferioara a intervalului median (Xi-1) pana la mediana.

Pentru determinarea medianei mai trebuie cunoscuta aceasta distanta Δx.

Determinarea distantei Δx , de la limita inferioara a intervalului median pana la

mediana se poate face in ipoteza ca in intervalul median frecventa absoluta se distribute

proportional cu lungimea intervalului, de unde rezulta:

(3.48)

unde:

N(Me)- reprezinta frecventa absoluta cumulata pana la mediana (rangul medianei);

N(Xi-1) - reprezinta frecventa absoluta cumulate pana la limita inferioara a intervalului

median care se mai numeste si suma frecventelor intervalelor premergatoare intervalului

median.

Valoarea necunoscuta Δx, rezulta din egalitatea (3.48):

Δx =

care intocuita in (3.47), permite gasirea formulei aproximative de calcul a medianei:

- 93 -

Me= xi-1+ (3.49)

Introducandu-se urmatoarele notatii mai sugestive:

Xi-1=XMe- limita inferioara a intervalului median;

Ni = Nme - frecventa absoluta a intervalului median;

xi -xi-1 =1Me - lungimea intervalului median.

Aceeasi expresie de calcul a medianei este folosita si in cazul in care seria

continua este formata din frecventele relative, cu urmatoarele precizari:

FN(Me) - reprezinta suma frecventelor relative ale intervalelor

premergatoare intervaluiui median;

fMe ~ notatie sinonima pentru NM reprezentand frecventa relativa a

intervalului median.

Cu aceste notatii relatia (3.50) devine:

Pe langa procedeul expus anterior, mai exista si un procedeu grafic de calcul a

valorii medianei. Acest procedeu poate conduce la rezultate cel putin la fel de bune, mai

ales in cazul seriilor care au la baza o variabila continua, deoarece, nu mai este necesara

persupunerea repartizarii proportionale a frecventei in intervalul median, cu conditia ca

- 94 -

reprezentarea grafica a seriei sa se faca cat mai exact posibil. In acest sens, se

construieste poligonul cumulativ crescator al seriei si se duce o paralela la axa Ox prin

punctul de ordonata ½*N. Abscisa punctului de intersectie a acestei paralele cu poligonul

cumulativ crescator va fi valoarea mediana a seriei respective.

Proprietati ale valorii mediane

In cele ce urmeaza se vor prezenta cateva din cele mai reprezentative proprietati

ale valorii mediane, care sa permita o caracterizare cat mai completa a acestui parametru

sub aspectut aplicabilitatii practice.

1. Valoarea mediana a unei serii este cuprinsa intre cea mai mica si cea mai mare

valoarea a variabilei care sta la baza ei:

Aceasta proprietate este evidenta insasi din definitia data parametrului, dar ea poate

rezulta aplicand o serie de majorari si minorari in relatia de calcul (3.50).

2° Valoarea mediana a unei serii nu se modifica daca frecventele absolute se

simplifica cu aceeasi valoare (de obicei, cel mai mare divizor comun).

Demonstratia acestei proprietati rezulta din formula de calcul a valorii mediane

(3.50). Urmatorul raport:

care apare in expresia de calcul a medianei ramane invariant la simplificarea frecventelor

absolute cu aceeasi valoare si ca urmare nu afecteaza marimea medianei.

3. Proprietatea de minim. Pentru o repartitie a carei mediana este Me , se poate

arata ca dintre toti parametrii care intervin in caracterizarea seriei respective, mediana

este aceea fata de care valorile individuale ale variabilei X de la baza seriei se abat cel

mai putin, daca aceste abateri se iau in valoare absoluta.

- 95 -

Aceasta proprietate este cunoscuta si sub numele de proprietatea de minim sau de

reprezentativitate a medianei.

In vederea demonstrarii acestei proprietati se considera o valoare reala x0 oarecare si

urmatoarea functie:

φ(xo) = M\X-x0\

Demonstrarea proprietatii enuntate este echivalenta cu a arata ca valoarea minima

a acestei functii se atinge pentru xo = Me . Fara a particulariza demonstratia, se poate

presupune ca x0 se afla intre doua valori consecutive xr si xr+1 ale variabiiei X.

Aceasta proprietate, confera valorii mediane calitatea de a juca rolul de valoare

medie. Valoarea mediana poate substitui valoarea medie in conditiile in care aceasta din

urma nu poate fi calculata. De obicei, pentru serii care au la baza o variabila X continua,

iar intervalele de variatie marginale sunt deschise si nu dispunem de informatii pentru a

putea fi inchise, calculul valorii medii nu este posibil, caz in care mediana ii va lua locul.

Valoarea mediana prezinta unele avantaje in comparatie cu valoarea medie.

In acest sens, se amintesc cateva dintre acestea:

- volumul de calcule este mai redus, deoarece, in calculul acesteia nu

intervin toate valorile variabilei;

- mediana este mai putin afectata de valorile extreme ale variabilei, care uneori, pot fi

anormal de mari sau de mici, situatie in care mediana este mat reprezentativa.

Cu toate aceste avantaje, totusi mediana nu poate compensa avantajele valorii

medii. Mediana nu se bucura de anumite proprietati ale valorii medii, cum ar fi: media

unei sume de variabile, proprietatea de aditiune.

Valoarea medie continua sa ramana parametrul care scoate in evidenta esentialul

despre o populate statistica studiata in raport cu o variabila X, a carei medie se

calculeaza.

Valoarea modala

Valoarea modala M0(X) a unei repartitii reprezinta aceea valoare a variabilei X

careia in corespunde frecventa cea mai mare.

Acest parametru se mai numeste modul, valoare dominanta, sou modala se

noteaza cu M0.

- 96 -

Mod de calcul:

a) Pentru o serie de repartitie discreta, data sub forma:

X:

(3.51)

valoarea modala se citeste direct din serie, nefiind nevoie de nici o tehnica sau formula de

calcul. In cazul acestui tip de serie, valoarea modala va fi acea valoare a variabilei X

pentru care frecventa este cea mai mare.

b) Pentru serii de repartitie continue, respectiv:

(3.52)

modala nu poate fi determinate direct.

Intervalul caruia ii corespunde frecventa cea mai mare, se numeste intervalul

modal si va contine modala. Sa presupunem ca intervalul modal este Xi-1 –Xi .

Se vor prezenta doua modalitati de calcul a modalei, una care se bazeaza pe

aproximarea densitatii de probabilitate f(x) de-a lungul a trei intervale de variatie

(intervalul modal si cele doua intervale cu care se invecineaza), iar cealalta metoda

permite gasirea unei formule de calcul aproximativ, a carei deductie se bazeaza pe

principiul repartizarii uniforme a frecventei de-a lungul intervalului modal.

Prima metoda de calcul a modalei presupune estimata densitatea de probabilitate

f(x). Odata gasita f(x), valoarea modala va fi acea valoare a lui x pentru care f(x)

inregistreaza valoarea maxima.

Aceasta metoda se bazeaza pe posibilitatea aproximarii densitatii f(x) de-a lungul

celor 3 intervale precizate cu un arc de parabola de forma:

f(x) =ax2 + bx + c

unde, a, b, c sunt trei parametri ce trebuie determinati.

Estimarea celor trei parametrii a,b si c se face utilizand metoda ariilor, conform

careia suprafafa marginila de arcul de parabola, axa Ox si cele doua perpendiculare

ridicate in punctele de abscisa xi-2 si xi+1 si suprafata celor trei dreptunghiuri care

- 97 -

formeaza histograma seriei de-a lungul celor trei intervale, sa fie egale. Respectarea

acestei conditii conduce la urmatorul sistem de ecuatii:

(3.53)

daca seria este de intervale egale.

Un calcul elementar de integrate definite printr-o functie polinomiala, transforma

egalitatile (3.53) intr-un sistem liniar de ecuatii in necunoscutele a, b, c. Rezolvand acest

sistem, se afla estimatiile pentru cei trei parametrii [5].

Determinarea modalei implica gasirea punctului pentru care f(x) isi atinge maximul.

Acest punct va fi chiar modala si se calculeaza din conditia:

f’(x)=0 (3.54)

Rezolvand ecuatia (3.54), solutia acesteia x = M0 reprezinta valoarea modala daca

mai are loc si urmatoarea conditie:

f'(Mo)<0 (3.55)

A doua metoda de calcul a modalei se bazeaza pe repartizarea uniforma a

frecventei de-a lungul intervalului modal.

M0=xi-1+ Δx , (3.56)

unde s-a notat cu Δx, distanta necunoscuta de la limita inferioara a intervalului modal

pana la modala. Gasirea necunoscutei Δx, se face din urmatoarea egalitate de rapoarte:

(3.57)

- 98 -

care semnifica repartizarea uniforma a frecventelor de-a lungul intervalului modal.

Avem urmatoarea expresie de calcul pentru Δx:

Atunci, formula de calcul aproximativa a modalei va fi :

(3.58)

unde :

- M0 –reprezinta valoarea modala;

- XMo-reprezinta limita inferioara a intervalului modal

- -reprezinta diferenta dintre frecventa intervalului modal si frecventa

intervalului precedent;

- - reprezinta diferenta dintre frecventa intervalului modal si frecventa

intervalului urmator;

- lMo-reprezinta lungimea intervalului modal.

Parametrii de structura

Frecvente sunt cazurile cand este necesara studierea structurii populatiei in raport

cu o variabila sau alta.Parametrii statistici, in forma cea mai generala, folositi in

caracterizarea structurii unei populatii, poarta denumirea de valori quantile.

Valorile quantile ale unei serii de repartitie unidimensionale sunt acele marimi

inregistrate de variabila X, care impart seria in n parti egale ( mai precis imparte

populatia in n parti egale).In acest caz se vor calcula p quantile; p=n-1.

Pentru o serie continua a carei densitate de probabilitate f(x) este cunoscuta,

urmatoarea egalitate este satisfacuta de cele p quantile :

(3.2.1.)

- 99 -

unde cele n-1 quantile s-au notat cu q1, q2,..., qn-1

Pentru o serie oarecare quantila de ordinul p, este definita astfel :

FN(qp)= p sau N(qp)=

Dupa cum seria este cu frecvente relative sau absolute.

Fie o serie de repartitie care are la baza o variabila X discreta, de forma

urmatoare :

X:

Pentru calculul valorii quantile de ordinul p ( p= ), in prima etapa trebuie

determinat rangul acesteia :

Se disting doua cazuri :

a) Daca pn se divide cu n atunci quantila de ordin p se calculeaza ca o medie

aritmetica simpla a valorilor variabilei X, de ordinul rangului si al rangului

majorat cu o unitate, dupa cum urmeaza :

b) Daca pN nu se divide cu n atunci quantila de ordin p este egala cu acea valoare a

variabilei X corespunzatoare partii intregi a rangului majorat cu 1 :

In cazul seriilor care au la baza o variabila continua , cf. definitiei, cele n-1 quantile

trebuie sa satisfaca relatia 3.2.1.

- 100 -

Fie o serie de variatie continua, ale carei intervale de variatie nu trebuie sa fie neaparat de

lungime egala, cum ar fi :

In prima etapa se determina rangul quantilei de ordinul p, conform urmatoarei relatii :

Quantila de ordinul p, se calculeaza conform relatiei :

,

unde am presupus intervalul Xi-1 –Xi ca intervalul quantilei de ordinul p, iar ,

reprezinta distanta necunoscuta inca, intre limita inferioara a intervalului quantilei de

ordinul p si valoarea din acest interval cu care coincide quantila de ordin p.

Distanta necunoscuta se deduce astfel :

Introducem urmatoarele notatii :

,reprezinta limita inferioara a intervalului quantilei de ordinul p.

, reprezinta lungimea intervalului quantilei de ordinul p.

, reprezinta frecventa absoluta a intervalului quantilei qp,

care conduc la formula de calcul ;

(3.2.2.)

- 101 -

Valoarea mediana Me este si un parametru de structura, obtinindu-se ca un caz

particular de quantila , cand n=2.Daca pentru o serie se cunoaste quantila de ordinul 2,

atunci structura populatiei poate fi redata astfel :

X :

Semnificand faptul ca jumatate din populatia supusa studiului a inregistrat pentru

variabila X valori cuprinse intre valoarea minima a lui X si mediana, iar cealalta jumatate

din populatie a inregistrat pentru variabila X valori cuprinse intre mediana si valoarea

maxima a lui X.

Formula de calcul a medianei se poate gasi ca un caz particular a relatiei 3.2.2.

Valorile quartile reprezinta acel caz particular al valorilor quantile pentru care n=4.Cele 3

quartile care se obtin, notate cu Q1, Q2, Q3 sunt acei parametri de structura care impart

populatia in 4 parti egale.

In raport cu mediana quartila intai Q1 se numeste quantila mica (inferioara), quartila a

doua Q2 coincide cu mediana si se numeste quartila mijlocie , iar quartila a treia Q3, se

numeste quartila mare (superioara).

Valorile efective pentru cele 3 quartile se determina in mod diferit, dupa cum

seria este discreta sau continua.

1.In cazul seriilordiscrete, rangul pentru cele 3 quartile se calculeaza conform

formulelor :

- 102 -

Expresiile rangurilor pentru cele 3 quartile sunt diferite, dupa cum valorile rangurilor

corespunzatoare lor sunt intregi sau nu.

In cazul in care rangurile sunt valori intregi, quartilele se calculeaza ca medie

aritmetica simpla a valorilor lui X corespunzatoare rangului si rangului majorat cu o

unitate.

Daca p , se divide cu 4, atunci relatiile pentru calculul quartilelor

sunt :

iar daca p , se divide cu 4, atunci relatiile pentru calculul quartilelor sunt :

In cazul seriilor de variatie continua , etapele privind determinarea celor 3 quartile

sunt aceleasi.

Mai intai se determina rangul quartilei, conform relatiilor :

Pentru prima quartila :

- 103 -

Primul interval care satisface inegalitatea :

reprezinta intervalul quartilei mici.

Acest interval fiind gasit, quartila mica se determina conform relatiei:

Pentru quartila mijlocie, calculele se fac ca si pentru mediana.

In cazul quartilei mari, rangul se calculeaza astfel :

Primul interval care satisface inegalitatea :

reprezinta intervalul quartilei mari.

Acest interval fiind gasit, quartila mare se determina conform relatiei:

Valorile decile reprezinta acel caz particular al valorilor quantile pentru care

n=10. Valorile decile reprezinta acei parametri de structura care impart populatia in 10

parti egale.

- 104 -

Parametrii variatiei

In functie de elementul de referinta folosit in masurarea variatiei, deosebim :

-parametrii variatiei in raport cu valoarea medie

-parametrii variatiei in raport cu valoarea mediana.

1.3.1. Parametrii variatiei in raport cu valoarea medie

Din aceasta grupa fac parte:

-amplitudinea sau variatia maxima

-variatia maxima si variatia minima fata de valoarea medie

-abaterea medie liniara

- abaterea medie patratica.

Amplitudinea sau variatia maxima

Acest parametru se noteaza cu W si se defineste ca fiind diferenta intre valoarea maxima

si valoarea minima inregistrate de variabila.

Amplitudinea , sub forma absoluta, conform definitiei se exprima astfel:

Wx=xmax-xmin si caracterizeaza imprastierea maxima a variabilei X.

Amplitudinea , sub forma relativa, conform definitiei se exprima astfel:

sau

si masoara imprastierea intre valorile extreme ale variabilei X, in ipoteza ca valoarea

medie ar fi fost 1 sau 100.

- 105 -

Abaterea medie liniara

Abaterea medie liniara notata cu , reprezinta media aritmetica a abaterilor variabilei X

de la valoarea medie a acesteia, luate in valoare absoluta:

(3.3.1.)

Pentru o serie discreta formata cu frecvente absolute relatia 3.3.1. se particularizeaza in :

Pentru o serie discreta formata cu frecvente relative relatia 3.3.1. se particularizeaza in :

Acest parametru serveste caracterizarii sintetice a gradului de reprezentativitate a

valorii medii, aratind cu cat se abate in medie orice valoare a variabilei X, de la valoarea

medie, intr-un sens sau altul.

Sub forma relativa acest indicator poarta denumirea de coeficient simplu de

variatie si se calculeaza conform relatiei :

Coeficientul simplu de variatie arata cu cat se abate in medie orice valoare a variabilei X

de la valoarea medie echivalenta cu 1 sau 100%.

Abaterea medie patratica

- 106 -

Acest indicator este utilizat atat pentru caracterizarea gradului de

reprezentativitate a valorii medii cat si in scopul estimarii unor parametrii necunoscuti.

Abaterea medie patratica , notata cu , se defineste ca fiind media patratica a

abaterilor valorilor variabilei X, de la valoarea medie, adica:

Un calcul intermediar in aflarea acestui parametru, il constituie calcularea

patratului abaterii medii patratice, care se numeste dispersie sau varianta si are

urmatoarea expresie de calcul :

, aceasta fiind o alta notatie pentru varianta.

Relatia de calcul a dispersiei se particularizeaza in raport cu tipul seriei.Astfel, pentru o

serie care are la baza o variabila discreta, varianta are expresia :

pentru o serie cu frecvente absolute,

sau :

pentru o serie cu frecvente relative.

Pentru o serie data, varianta calculata nu are interpretare, dar daca se extrage

radacina patrata din aceasta se obtine un numar care se exprima in aceleasi unitati de

masura ca si variabila de la baza seriei. Acest numar reprezinta abaterea medie patratica,

simbolizind cu cat se abate in medie in plus sau minus orice valoare xi a variabilei X, de

la valoarea medie.

Parametrul abatere medie patratica se poate exprima si sub forma relativa, caz in

care se numeste coeficient de variatie a lui Pearson si se noteaza cu Vx.

Expresia de calcul este :

- 107 -

si reprezinta abaterea medie a oricarei valori a variabilei X de la valoarea medie,

considerata egala cu 1 sau 100.

Proprietati ale variantei :

1.Varianta unei constante este egala cu 0.

V(X)=V(C)=0.

2.Varianta unei variabile X este independenta de schimbarea originii.

V(X)=V(Y)

3.Daca intre doua variabile Y si X exista urmatoarea relatie liniara :

Y=aX + b, atunci are loc urmatoarea egalitate :

V(Y)= a2 * V(X)

4.Varianta unei variabile, fiind un moment centrat de ordinul doi, se poate exprima cu

ajutorul diferentei dintre momentul de ordinul doi si patratul momentului de ordinul intai

al variabilei, dupa cum urmeaza :

V(X)= M(X2)-(M(X))2

5.Varianta sumei a doua variabile X si Y este egala cu suma variantelor acestor variabile,

daca cele doua variabile sunt independente.

V(X+Y)=V(X)+V(Y)

6.Varianta unei variabile X fata de o constanta x0 este mai mare decat varianta acestei

variabile fata de media sa, cu patratul diferentei dintre valoarea medie si constanta

respectiva.

- 108 -

M(X-x0)2=M(X

7.Varianta produsului dintre o constanta si o variabila este egala cu produsul dintre

constanta la patrat si varianta :

V(a X)= a2 V(X)

8.Varianta diferentei dintre doua variabile independente este egala cu suma variantelor

acelor variabile.

V(X-Y)=V(X)+V(Y)

9.Varianta sumei a doua variabile dependente este egala cu suma variantelor celor doua

variabile plus covarianta dintre cele doua variabile.

V(X+Y)=V(X)+V(Y)+2M((X-

10.Varianta mediei aritmetice a n variabile independente care urmeaza aceeasi lege de

distributie este egala cu varianta uneia dintre variabile impartita la numarul variabilelor

considerate.

11.Varianta unor variabile normate este unu, iar media este zero.

Pentru o variabila X oarecare, variabila normata atasata este :

Z=

De medie M(Z)=0.

Si varianta

12.Regula de adunare a variantelor.

Varianta in intreaga populatie, care masoara variatia totala in raport cu X, este egala cu

suma a doua variante, din care una masoara variatia in cadrul grupelor, iar cealalta

variatia dintre grupe.

Parametrii variatiei in raport cu valoarea mediana

- 109 -

Cand intervalele marginale ale unei serii sunt deschise, valoarea medie neputind fi

calculata, valoarea mediana joaca rolul valorii medii.

In acest scop, trebuie caracterizat gradul de reprezentativitate a valorii medii, care

se realizeaza cu ajutorul urmatorilor parametrii ai variatiei:

- abaterea interquartila

- abaterea interdecila

- abaterea interquantila

Abaterea interquartila

Abaterea interquartila , prin definitie este media aritmetica simpla a segmentelor

Me-Q1 si Q3-Me, respectiv:

si arata cu cat se abat in medie in plus sau in minus, de la mediana cele 50% din valorile

variabilei cuprinse intre Q1 si Q3.

Forma relativa a acestui indicator , notat cu Qr este :

se numeste coeficient de variatie interquartilic si arata cu cat se abat in medie de la

mediana ( considerata egala cu 100), valorile variabilei inregistrate pentru cele 50% din

unitatile populatiei cuprinse intre Q1 si Q3.

Abaterea interdecila

Acest parametru ofera o imagine mult mai concludenta privind gradul de

reprezentativitate.

Parametrul abaterea interdecila permite caracterizarea gradului de

reprezentativitate a valorii mediane peste 80% din populatia supusa studiului si care

inregistreaza valori pentru variabila, in raport cu care este studiata, cuprinse intre decila

intai si decila a noua.

- 110 -

Abaterea interdecila se noteaza cu D si avem :

D=

Reprezentand forma absoluta a parametrului.

Raportind abaterea interdecila D la mediana si inmultind cu 100 se obtine forma

relativa a acestui parametru notata cu Dr :

care se mai numeste coeficient de variatie interdecilic.Acest coeficient masoara

dispersarea in medie a celor 80% din unitatile populatiei fata de valoarea medianasi

serveste la compararea gradului de reprezentativitate a valorilor mediane calculate pentru

diferite serii.

Gradul de reprezentativitate a medianei este cu atat mai mare cu cat abaterea

interdecila este mai mica.

Abaterea interquantila caracterizeaza gradul de reprezentativitate a valorii mediene.

Pentru acest parametru sub forma absoluta, avem :

iar sub forma relativa, denumita si coeficient de variatie interquantilic este :

Cu cat abaterea interquantilica este mai mica, cu atat valoarea mediana este mai

reprezentativa.

3.4.Parametrii concentrarii

- 111 -

Daca la baza unei serii se afla o variabila numerica, atunci caracterizarea sintetica

a concentrarii valorilor sale in jurul valorii medii se realizeaza in principal cu ajutorul

parametrilor adecvati ai variatiei.

In cazul in care seria are insa la baza o variabila nenumerica, caracterizarea

sintetica a concentrarii starilor variabilei se poate realiza prin:

- lungimea vectorului de structura

- energia informationala

- entropia informationala

Lungimea vectorului de structura

Prin definitie intr-un spatiu cu R dimensiuni , norma vectorului f , notata cu , se

exprima astfel:

Seria prezinta o concentrare maxima daca toate unitatile populatiei sunt repartizate intr-o

singura clasa a carei frecventa relativa va fi 1, iar pentru celelalte clase frecventele

relative vor fi 0.

Energia informationala

Acest parametru a fost introdus de academicianul Octav Onicescu.Prin definitie :

E= , unde s-a notat cu E, energia informationala.

In cazul unei populatii caracterizate de un grad de concentrare maxim, va exista o clasa

care va avea frecventa relativa egala cu 1, iar celelalte vor avea frecvente relative 0 si ca

urmare Emax=1.

Daca populatia este caracterizata de o concentrare minima, atunci :Emin=1/R.

Forma relativa a acestui parametru, notata cu Er, se deduce astfel :

- 112 -

, de unde .

Referitor la populatia data , studiata in raport cu o variabila X, se calculeaza Er,

iar daca :

-Er se apropie de 1,atunci populatia respectiva este caracterizata de un inalt grad

de concentrare

- Er se apropie de 0,atunci populatia respectiva este caracterizata printr-o

concentrare minima.

Entropia informationala

Pentru o serie cu frecvente relative, entropia informationala, notata cu H se

defineste astfel :

H=

In cazul unei concentrari minime, entropia informationala inregistreaza o valoare

maxima, deoarece :

In cazul unei concentrari maxime, entropia informationala inregistreaza o valoare

minima, deoarece :

H=1 ln1+ (R-1)*0*ln 1/0

Ca urmare entropia informationala verifica urmatoarea dubla inegalitate :

- 113 -

Formula relativa a entropiei informationale, notata cu Hr, se determina astfel :

3.5.Parametrii formei

Parametrii formei unei serii de repartitie, dupa continut, se clasifica in doua grupe ;

-parametrii asimetriei

-parametrii boltirii

Parametrii asimetriei

Asimetria unei serii se defineste in raport cu dispunerea unitatilor intr-o parte sau alta a

valorii medii.

In acest sens o serie de repartitie este simetrica in raport cu media sa daca

frecventele valorilor variabilei X, egal departate de valoarea medie, sunt egale intre ele,

adica :

),

oricare ar fi astfel incat sa se afle printre valorile lui X.

O serie de repartitie este asimetrica in raport cu valoarea sa medie daca exista cel putin o

pereche de valori ale variabilei X, egal departate de valoarea medie, pentru care

frecventele corespunzatoare sa nu fie egale intre ele, adica :

)

oricare ar fi astfel incat sa se afle printre valorile lui X.

Coeficientul de asimetrie a lui Pearson

- 114 -

Conform acestui parametru, o serie are o asimetrie cu atat mai pronuntata cu cat

diferenta dintre valoarea medie si valoarea modala este mai mare.

Expresia de calcul pentru coeficientul de asimetrie a lui Pearson, notat cu

In raport cu valoarea obtinuta pentru , se poate aprecia gradul de asimetrie precum si

sensul acesteia.

In acest sens avem :

1.daca =0, atunci , iar seria respectiva este simetrica

2.daca >0, atunci >M0 si ca urmare, valoarea modala este situata la stinga mediei,

ceea ce imprima distributiei o asimetrie pozitiva.

Coeficientul de asimetrie a lui Fisher

Acest parametru se noteaza cu 3, iar expresia sa de calcul este :

Calculand valoarea acestui parametru, in functie de semnul ei, avem urmatoarele cazuri :

1. , ceea ce inseamna ca , adica suma tuturor abaterilor cu

semnul minus, este egala cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a

treia.In acest caz, seria este simetrica.

2. >0, ceea ce inseamna ca >0.Aceasta este echivalent cu faptul ca

pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare decat suma

abaterilor cu semnul minus si ca urmare seria prezinta o asimetrie pozitiva.

3. <0, deci <0. Aceasta este echivalent cu faptul ca pe total suma

abaterilor cu semnul minus de la valoarea medie este mai mare decat suma abaterilor cu

semnul plus si ca urmare seria prezinta o asimetrie negativa..

Parametrii boltirii

- 115 -

Aprecierea boltirii unei serii este utila in caracterizarea gradului de

reprezentativitate a valorii medii cat si pentru compararea reprezentativitatii a doua sau

mai multe valori medii ce reprezinta serii diferite.

Parametrul da o caracterizare numerica sub forma absoluta a gradului

de boltire a unei serii.

Sub forma relativa gradul de boltire a unei serii se masoara cu parametrul :

sau

unde , expresie cunoscuta sub denumirea de exces al seriei.

Urmatoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii :

- daca ( adica B4=3) atunci seria in cauza prezinta aceeasi boltire cu a curbei

normale(excesul este nul)

- >0, atunci boltirea corespunzatoare curbei respective este mai inalta si mai

ascutita decat curba normala

- <0, atunci boltirea corespunzatoare curbei respective este mai plata ( mai joasa

si mai lata) decat curba normala.

PROBLEME PROPUSE

P1.In vederea studierii situatiei actuale pe piata actiunilor, s-a format un esantion

reprezentativ de volum 40, a carui repartitie in raport cu pretul ( in mii lei) este :

X :

Se cere :

- 116 -

a) pretul mediu

b) pretul inregistrat de cele mai multe actiuni din esantion

c) acel pret care divide esantionul in doua parti egale

d) reprezentativitatea pretului mediu

e) sa se calculeze cu cat se abate in medie pretul unei actiuni din esantion de la

pretul mediu

f) folosind valorile quartile sa se studieze structura actiunilor in raport cu pretul.

P2.Intr-o firma s-au realizat 40 de produse in cadrul unui trimestru.Acestea au fost

propuse prelucrarii in mod secvential in doua sectii de productie.

Repartitia produselor realizate in raport cu costurile ( in mii lei) din cele doua sectii a

fost :

C2

C1

100-108 108-116 116-124 124-132

62-66 2 1 1

58-62 3 5 3

54-58 1 10 5 1

50-58 1 3 1 3

Folosind proprietatea conform careia “ media sumei a doua variabile este egala cu

suma mediilor acestora”, calculati costul mediu pe produs.

P.3.Distributia a 100 de angajati din trei ramuri de activitate diferite, in raport cu salariul

primit este :

R

S

R1 R2 R3 Total

8,0-8,5 6 8 7

7,5-8,0 6 7 8

- 117 -

7,0-7,5 7 10 5

6,5-7,0 11 5

6,0-6,5 10 10

Total 40 30 30 100

Folosind proprietatea de aditiune a mediei aritmetice sa se calculeze salariul

mediu pe angajat.

P.4.Se considera o populatie statistica a agentilor ec. Studiata in raport cu volumul

vinzarilor.Distributia populatiei in raport cu aceasta variabila este :

X :

Se cere :1)Sa se determine valoarea modala a seriei si interpretati rezultatul

2)Gasiti valoarea mediana si interpretati-o corespunzator.

3) Calculati abaterea medie patratica si interpretati rezultatul.

P.5. Se da urmatoarea repartitie unidimensionala avand la baza o variabila discreta,

relativ la care se cere :

a) Valoarea medie si caracterizarea reprezentativitatii acesteia

b) Valoarea mediana si caracterizarea reprezentativitatii acesteia

c)Valoarea modala

d)Analiza statistica a asimetriei

e)Analiza gradului de concentrare a unitatilor

X : unde X-este numarul de copii

P.6. Se da urmatoarea repartitie statistica unidimensionala avand la baza o variabila

continua, relativ la care se cere :

a) Valoarea medie si caracterizarea reprezentativitatii acesteia

b) Valoarea mediana si caracterizarea reprezentativitatii acesteia

- 118 -

c)Valoarea modala

d)Analiza statistica a asimetriei si a boltirii

X-reprezinta nr. de agenti economici care au inregistrat profit :

X :

BIBLIOGRAFIE

1. Biji, E.M., Gogu, E., - Teoria şi Tehnica Sondajului Statistic, Editura Oscar Print, 2009.

2. Boboc, C., Analiza statistică multidimensională. Aplicaţii în cadrul produselor şi serviciilor, Editura Meteor Press, 2007.

3. Buiga Anuţa, Statistică inferenţială, Editura Universităţii ,,Babeş-Bolyai’’, Cluj Napoca, 2009

3. Câmpeanu, A.S., - Statistică pentru afaceri (Statistică II), Bucureşti, 2006.

4. Florea I., Statistică II, Curs litografiat în tipografia Universităţii ,,Babeş-Bolyai’’, Cluj Napoca,1996;

5. Florea I., Parpucea I., Buiga A., Statistică descriptivă, Teorie şi aplicaţii, Ed. Aisteda, Alba Iulia, 1998.

6. Jaba, E., Grama, A., - Analiza statistică cu SPSS sub Windows,Editura Polirom, Bucureşti, 2004.

7. Merce E., Urs Fl., Merce C., Statistică, Ed. AcademicPres, Cluj – Napoca, 2001;

8. Institutul Naţional de Statistică şi Studii Economice, România şi Uniunea Europeană, Integrarea statisticii româneşti în sistemul statistic european, Bucureşti, februarie 2001 ;

9. Institutul Naţional de Statistică, Integrarea Statisticii româneşti în sistemul statistic

european, Iaşi, mai 2001;

- 119 -