ELEMENTE DE STATISTICA APLICATA - PUBLICATA CU RUS.doc

357
1 ELEMENTE DE STATISTICĂ APLICATĂ Lect. Univ. drd. MIHAELA SANDU

Transcript of ELEMENTE DE STATISTICA APLICATA - PUBLICATA CU RUS.doc

INTRODUCERE IN SPSS versiunea 19

PARTEA NTI- ELEMENTE DE STATISTIC -

Cuvnt nainte

Statistica a devenit elementul sine qua non al cunoaterii n condiii de manifestare probabilistic a fenomenelor. Utilizarea statisticii permite att descrierea fenomenelor i modelarea lor, ct i aplicarea practic a acestora, accentul punndu-se att pe prezentarea raionamentului statistic ct i a tehnicilor fundamentale de analiz a datelor experimentale.

Lucrarea de fa constituie o introducere concis i clar n statistica aplicat n tiinele de factur social i economic, ca produs al faptului social. Tehnicile statistice prezentate sunt vzute ca instrumente folosite pentru a rspunde unor probleme de cercetare specifice. Cu alte cuvinte, acest material nu se adreseaz statisticianului profesionist, ci psihologului, economistului, i mai larg, oricrui debutant n studiul tiinelor omului, precum i altor persoane ale cror profesii sunt legate ntr-un fel sau altul de aceste tiine.Acest carte conine elemente practice. Fiecare capitol i propune obiective precise i abund de exemple i exerciii. n definitiv, este important s se stpneasc practica statisticii, s fie utilizat n activitatea de zi cu zi i nu s se fac doar speculaii teoretice pe aceast tem.

Cartea este dedicat studenilor, n special celor din anul I (i nu numai) i are ca scop iniierea acestora n demersul statistic i formarea gndirii statistice necesare nelegerii fenomenelor de mas.

Prima parte conine pe VIII capitole, fiecare capitol divizndu-se n 4 seciuni. Prima seciune const n prezentarea coninutului tematic. A doua seciune Alegei rspunsul corect permite s se verifice nsuirea corect a subiectelor tratate i aprofundarea elementelor particular dificile. Seciunea a treia Probleme permite deprinderea tehnicilor de calcul statistic i a modului de interpretare statistic a fenomenelor.A patra seciune Rspunsuri corecte permite autoevaluarea, prezentnd rspunsurile pentru testele prezentate n seciunea a doua. Partea a doua este structurat pe XVII capitole, oferind astfel posibilitatea parcurgerii pas cu pas a informaiilor prezentate dar i o privire de ansamblu asupra procedurilor de calcul din SPSS (Statistical Package for the Social Sciences).

Carte prezint un mod de abordare a analizei statistice folosind SPSS for Windows i este destinat studenilor care doresc s analizeze date din psihologie, sociologie, criminologie, sau date similare i se dorete a fi un ndrumtor pentru analiza datelor, fiind o carte complet, de sine stttoare care satisface nevoile studenilor la toate nivelele. Ca obiective i propune s faciliteze:

Asimilarea noiunilor eseniale ale acestei discipline tiinifice i descrierea ntr-un mod clar i concis a unei colectiviti, folosind informaia din datele obinute prin observri statistice asupra fenomenelor studiate;

Familiarizarea studenilor cu limbajul i cerinele cercetrii tiinifice, din cadrul tiinelor politice, psihologiei, pedagogiei, sociologiei, precum i cu procedeele informaionale de studiu i cercetare folosind Internetul.

Se urmrete nelegerea ideilor care stau la baza statisticii, a principiilor de organizare i analiz a datelor, precum i de evaluare statistic. S-a urmrit folosirea ct mai multor exemple practice astfel nct, la finalul fiecrui capitol, sunt prezentate un set de ntrebri i probleme care s v ajute s nelegei mult mai bine materialul prezentat. Informaiile prezentate aici nu sunt originale, ci ele se bazeaz pe afirmaiile unor specialiti n domeniu.

n sperana c lucrarea va fi util, mulumim celor care vor veni cu sugestii i observaii att de necesare mbuntirii oricrui lucru supus perfecionrii.

I. NOIUNI INTRODUCTIVE

_________________________________________________________________________________________________________________

Psihologia a fost acceptat ca tiin de sine stttoare abia n sec. al XIX-lea, o dat cu accentuarea laturii ei experimentale. Astfel, s-a recurs la acumularea de observaii i date, care, comparate cu celelalte tiine (care aveau un statut epistemologic clar delimitat i acceptat de comunitatea tiinific), apar deficitare sub aspectul interpretrii lor.Cuvntul statistic are semnificaii multiple. Astfel poate s ne duc cu gndul la indicele preurilor de consum, la cifra medie de afaceri a unor firme, la rata omajului, la datele publicate ntr-o revist sau ntr-un buletin oficial etc.

ncercnd s definim statistica, putem spune c este un corp de metode pentru a colecta, a descrie i a analiza date numerice din observaii sau investigaii tiinifice. (Clocotici, Stan, 2000, p.13)Obiectul de studiu al statisticii l constituie variaia curent-continu, n timp i spaiu i din punct de vedere calitativ, al fenomenelor de tip stochastic din orice domeniu al vieii economico-sociale sau naturale. (Jaba, 2002, p. 13-16)Statistica a fost folosit pentru rezolvarea unor nevoi practice ale vieii sociale din cele mai vechi timpuri i pn astzi, o regsim att n primele forme de eviden a populaiei i bunurilor materiale ct i n rezolvarea celor mai variate i complexe probleme de conducere.

Statistica se refer la msurare i probabiliti. Cuvntul statistic, provine din latinescul statista i desemna, pe vremuri, persoanele care se ocupau cu afacerile statului, care numrau populaia sau alte aspecte ce ajutau statul s gestioneze mai bine politica de taxe i costurile rzboaielor. n perioada medieval, prin statistic, armatorii i calculau costurile echiprii corbiilor, incluznd n calculele lor i probabilitatea ca acestea s fie atacate de pirai sau de a naufragia. (Opariuc, 2009, apud Lungu 2001).

Forma cea mai veche a statisticii moderne este statistica practic folosit n scopuri demografice, administrative i fiscale. nc din mileniile IV i III en chinezii dispuneau de date cu privire la numrul populaiei, structura terenurilor i chiar utilizau tabele statistice pentru unele aspecte ale activitii agricole. Recensmintele populaiei efectuate, ncepnd cu anul 550 en, de romani, greci i egipteni sunt, de asemenea, exemple pentru rdcinile istorice ale statisticii practice (etapa prestatistic).

Dezvoltarea statelor feudale a dus la evoluia i perfecionarea evidenelor privind situaia geografic, economic i politic. Se elaboreaz lucrri n care se prezint detaliat situaia social-economic folosind date statistice. Apare, astfel, statistica descriptiv care se ocup de culegerea datelor despre un fenomen i cu nregistrarea acestor date.

Fondatorul colii descriptive i autorul primului Curs de Statistic, n 1660, a fost Herman Conring (1606-1681) profesor la Universitatea din Helmstedt. Relund ideile lui Conring, un secol mai trziu, Gottfried Achenwall (1719-1772), profesor la Universitatea din Gttingen, definete statistica drept o tiin descriptiv folosit pentru prezentarea particularitilor unui stat, introducnd pentru prima oar termenul de statistic (statistik). (Benea, Munteanu, 2007, p. 11.)Bazele statisticii descriptive au fost puse de ctre Dimitrie Cantemir prin monografia, de talie european, Descriptio Moldavie, aprut n 1716. O alt lucrare de referin poate fi considerat i Expunere statistic asupra Moldovei ntocmit n 1782 de ctre un nalt funcionar al Curii de la Viena, Wenzel von Brognard.Statistica s-a dezvoltat i s-a perfecionat odat cu dezvoltarea societii romneti i n deplin concordan cu alte tiine cu care se afl n permanent legtur (Psihologia, Contabilitatea, Finanele, Econometria, Informatica, etc.)

I.1. NOIUNI I CONCEPTE DE BAZ UTILIZATE N STATISTIC

Pentru a putea ilustra principalii termeni utilizai n statistic, ncercm s lum n considerare situaia unui cercettor psihosocial care investigheaz o colectivitate uman urmnd criteriile:

Mediul de provenien a persoanelor;

Statutul socio-economic;

Genul biologic;

Vrsta.

Aceast colectivitate poate fi numit populaie statistic. 1. Prin populaie (colectivitate) statistic se nelege totalitatea persoanelor, faptelor, etc, care constituie obiectul de interes al cercetrii. (Clocotici, Stan, 2001, p. 13). Ea reprezint totalitatea manifestrilor sau totalitatea fenomenelor de aceeai natur (de aceeai esen calitativ, ale unui fenomen sau proces economic), care au trsturi esenial comune i care sunt supuse unui studiu statistic.

Exemple de populaii statistice: 1. Colectivitatea studenilor din primul an de facultate, din Centrul universitar Constana;

2. Colectivitatea persoanelor cu vrst egal sau mai mare de 45 de ani, din Romnia;Colectivitatea statistic specific vieii economico-sociale are un caracter obiectiv, concret i finit strict determinat n timp i spaiu.

Statistica abordeaz colectivitile fie static, fie dinamic. Colectivitile statice exprim o stare i au o anumit ntindere n spaiu la un momonet dat, iar colectivitile dinamice caracterizeaz un proces, o devenire n timp (nregistrarea elementelor componente fcndu-se pe un interval de timp).

Exemplu: 1. Persoanele care au starea civil cstorit la sfritul anului curent reprezint o colectivitate static;

2. Colectivitatea evenimentelor de cstorie din anul curent reprezint o colectivitate dinamic.

2. Unitatea statistic reprezint elementul constitutiv al unei colectiviti statistice i este purttorul unui nivel al fiecrei trsturi supuse observrii i cercetrii statistice. (Benea, Munteanu, 2007, p. 20)Unitile statistice pot fi:

- statice = unitile compun efectivul masei de fenomene existente la un moment dat. (un copil nscut viu n luna mai n Constana unitate static.- dinamice = unitile aparin aceleiai structuri organizatorice, au acelai coninut, dar se produc n condiii diferite de timp (trebuie nregistrate pe perioade de timp).

- simple = elemente constitutive ale colectivitii (persoana, muncitorul).

-complexe = sunt rezultatul organizrii sociale i economice ale colectivitii (familia, echipa, anul de studiu). 3. Inferena statistic reprezint o decizie, o estimare, o predicie sau o generalizare privitoare la o colectivitate general, bazat pe informaiile statistice obinute pe un eantion. Astfel, procesul de cercetare statistic va cuprinde dou etape. O prim etap descriptiv, n care se vor colecta i prelucra date privitoare la eantion, obinndu-se indicatori statistici. n a doua etap, etapa de inferen statistic, rezultatele se vor extinde la colectivitatea general.

Discutnd despre sensul termenului de a msura, acceptm definiia dat de S. S. Stevens (1959), prin care, n sensul su larg, msurarea nseamn atribuirea de numere obiectelor sau evenimentelor, potrivit unor reguli. Astfel, msurarea este o funcie, prin care unui obiect i corespunde un numr i numai unul, la o anumit msurare. Aceast funcie de atribuire a unui obiect unui numr va trebui s fie suficient de clar, pentru a permite ca unui obiect s i se atribuie un numr i numai unul i s permit s decidem concret i corect, ce numr va fi atribuit fiecrui obiect, dar i suficient de simpl pentru a putea fi aplicat. (Vasilescu, Puiu, 1992.)4. Variabile statistice.

Definiie: Caracteristica (variabila) statistic reprezint trstura, proprietea, nsuirea comun tuturor unitilor unei colectiviti i care variaz ca nivel, variant sau valoarea de la o unitate a colectivitii la alta. (Vasilescu, Puiu, 1992.)

Variabilitatea se refer la proprietatea obiectului de studiu de a lua valori diferite (Popa, 2008, p. 23).Fiecare dintre criteriile de difereniere este o variabil, adic o entitate care ia valori diferite pentru componenii colectivitii i este comun tuturor elementelor colectivitii.Exemplul 1. mediul de provenien este o variabil care poate lua trei valori: urban, rural variabil categorial; Exemplul 2. Variabila gen biologic poate lua 2 valori: feminin i masculin. variabil categorial;

Exemplul 3: Vrsta poate lua valori de la 0 ani la peste 100 de ani. variabil numeric;

Variabila Vrsta poate fi i variabil categorial i lua diferite valori in funcie de categoriile stabilite. (se stabilesc categorii de vrste).

Exemplu: 1. 10-20 ani

2. 21-30 ani

3. 31-40 ani.

O variabil, reprezint un concept cheie n statistic i nu este altceva dect un nume pentru un element a crui proprietate principal este aceea c variaz, i modific parametrii. (Opariuc, 2009) Mulimea valorilor nregistrate pentru o caracteristic particular constituie distribuia variabilei respective.

Modalitatea de realizare a unei variabile (modul n care i sunt atribuite valorile) constituie un eveniment ntmpltor (probabilistic), de aceea variabila se mai numete i variabil aleatoare. Definiie: Varianta/valoarea reprezint nivelul concret pe care l poate lua o variabil la nivelul unei uniti sau grup de uniti statistice. (Benea, Munteanu, 2007, p. 22).Exemplu: nlimea elevilor dintr-o clas poate lua aleatoriu diferite valori pe care le pot avea elevii la aceast caracteristic.

valorile pe care le poate lua variabila, se grupeaz ntr-un anumit interval de valori.O variabil aleatoare poate fi discret sau continu, dup cum mulimea de definiie a valorilor sale poate fi numrabil (discontinu) sau nenumrabil (continu). a. Variabile discrete.

Variabilele discrete sunt cele care sunt exprimate prin numere ntregi (numr finit de valori pe care le poate lua). (Popa, 2008). Exemplu:

numrul de copii pe care i are o familie;

numrul de orae dintr-un jude;

genul biologic;

Gradul didactic;

n cazul variabilelor discrete, mulimea de definiie a valorilor sale este o mulime discontinu iar ntre dou valori nu poate fi interpus o valoare intermediar.Variabilele discrete pot fi categoriale sau de rang. b. Variabile continue

Sunt variabile de tip numeric (cantitativ, de tip interval/raport) care au un numr teoretic infinit de niveluri de msurare...poate lua orice valoarea (exprimabil i prin numere fracionate), permind utilizarea zecimalelor (Popa, 2008, p. 25).Exemplu:

greutatea ntre un subiect de 76 kg i un subiect de 78 kg putem gsi oricnd un subiect de 77,5 kg; cifra de afaceri a unei firme;

nlimea subiecilor. n cazul acestor variabile, mulimea de definiie a valorilor sale este una continu, ne-numrabil. Aceste variabile se mai numesc i variabile scalare (de interval sau de raport). Deoarece cercetarea unei colectiviti numeroase poate implica valori mari, putem extrage din colectivitatea iniial o subcolectivitate (sau mai multe) al crui studiu este mai simplu. n acest caz vorbim despre eantion reprezint un subset de elemente selectate dintr-o colectivitate statistic.Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv studiate (Popa, 2008, p. 38).

Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie din care a fost extras se numeste reprezentativitate (Popa, 2008, p. 39).

Dup Rotariu (2006), reprezentativitatea este capacitatea eantionului de a reproduce ct mai fidel structurile i caracteristicile populaiei din care a fost extras.Gradul de reprezentativitate al unui esantion depinde de:

caracteristicile populaiei; mrimea eantionului; procedura de eantionare folosit.Definiie: Frecvena de apariie a unei variante/valori reprezint numrul de apariii ale acestei variante/valori n colectivitate. (Benea, Munteanu, 2007, p. 23) Exemplu:

Nivelul individual al salariului de 700 RON, nregistrat pentru un angajat al societii X, reprezint valoarea conneacret a variabilei salariu. Dac 15 salariai primesc acest salariu rezult c frecvena de apariie a valorii 700 RON este 15.

I.2. Alegei rspunsul corect1. De peste 6 milenii, statistica este atestat ca*:

a. tiin a descrierii statului cu ajutorul cifrelor;

b. activitate de strngere a datelor;

c. tiin a gestionrii resurselor umane i materiale;

d. metod de estimare a speranei medii de via.

2. n etapa prestatistic, statistica este cunoscut sub form de:

a. numrtoare a populaiei i eviden a bunurilor materiale;

b. instituie a statului;

c. tiin.

3. Ca disciplin tiinific, statistica are*:

a) un pronunat caracter metodologic

b) un pronunat caracter teoretic

c) o sfer de cunoatere limitat la nivelul individului

d) o sfer de investigare a fenomenelor repetabile

4. Obiectul de studiu al statisticii l constituie*:

a. micrile curente continue ale fenomenelor i proceselor ce i au existena sub form de colectiviti;

b. latura cantitativ a colectivitilor statistice;

c. latura calitativ a colectivitilor statistice;

d. aspectul stochastic al populaiei.

5. Colectivitile statistice sunt*:

a) asociaii finite de elemente unite ntre ele prin omogenitate

b) asociaii infinite de elemente unite ntre ele prin omogenitate

c) elemente eterogene dintr-un spaiu dat

d) grupuri de elemente difereniate ntre ele dup o carateristic statistic

6. Variabilele statistice reprezint*:

a) trsturi eseniale purtate la toate elementele unei colectiviti

b) valoarea nregistrat la nivelul unei uniti statistice

c) varianta de apariie a unei uniti statistice

d) probabilitatea de apariie a unei valori posibile xi7. Elementele fizice pot fi*:

a. direct msurabile cantitativ;

b. msurabile cu aproximaie; c. nemsurabile.8. Opinia unei persoane poate fi*:

a. direct msurabil cantitativ;

b. msurabil cu aproximaie; c. nemsurabil.9. Crearea cuvntului statistic este atribuit lui:

a. Gottfried Achenwall;

b. Dionisie Pop Marian;

c. John Graunt;

d. John Halley.

10. O unitate statistic poate fi*:

a. o persoan interogat ntr-o anchet;

b. salariul unei persoane angajate ntr-o firm;

c. ansamblul salariailor unei firme din localitatea X la un moment dat.

11. O colectivitate poate fi*:

a) ansamblul persoanelor nregistrate pe teritoriul Romniei la 18 martie 2002;b) opiniile electoratului nregistrate n noiembrie 2004;c) ansamblul cererilor de angajare depuse la firma B, n anul 2004. 12. Sunt variabile calitative atributive (nominale)*:

a) talia, greutatea, salariul;b) sexul persoanelor, starea civil, domiciliul;c) sperana de via, numr de locuitori ai unei ri. 13. Sunt variabile discrete:

a) sperana de via;b) numrul de copii pe familie, numrul de camere ale unui apartement, numrul de piese defecte dintr-un lot de rulmeni;c) sexul persoanelor, starea civil, domiciliul.

14. Sunt variabile continue*:

a) talia, greutatea, salariul;b) numrul de copii pe familie, numrul de camere ale unui apartament, numrul de piese defecte dintr-un lot de rulmeni;c) ansamblul persoanelor interogate ntr-o anchet. 15. Pentru urmtorul exemplu, precizai unitatea statistic, identificai variabile statistic studiat i tipul de variabil:

Exemplu: absenteismul angajailor exprimat n zile;

16. Un om de afaceri observ c, n ultimele 3 luni, concurentul su acord cte un interviu unui ziar de specialitate n fiecare zi de joi. El trage concluzia c n paginile ziarului de joia viitoare va aprea un nou articol al concurentului su. Eantionul pe baza cruia se face aceast inferen este*:

a) numrul ziarului de joia viitoare;

b) numrul ziarului de joia trecut;

c) numerele ziarelor din toate zilele de joi;

d) numerele ziarelor din toate zilele de joi deja aprute;

e) numerele ziarelor din zilele de joi din ultimele 3 luni.

Precizai unitatea statistic, identificai variabila statistic studiat i tipul de variabil. Precizai dac variabila este cantitativ sau calitativ, dac ea este continu sau discret.

17. Care din urmtoarele variante reprezint un eantion i nu o colectivitate total pentru ncasrile zilnice din anul trecut ale unui magazin*:

a. lista ncasrilor zilnice din anul trecut;

b. lista ncasrilor zilnice cu doi ani n urm;

c. lista ncasrilor previzionate pentru anul trecut;

d. lista ncasrilor din fiecare zi de mari a anului trecut;

18. Pentru caracterizarea unei grupe de studeni din anul I al Facultii de tiine Economice, n funcie de media la admitere, unitatea de observare este*:

a) grupa;

b) studentul;

c) media la admitere;

d) facultatea;

e) anul de studiu

19. O companie de asigurri dorete s determine proporia medicilor care au fost implicai n ultimul an n una sau mai multe aciuni judiciare de rele practici. Compania selecteaz ntmpltor 500 de medici care au practicat n ultimul an i determin proporia(.

Identificai populaia de interes i eantionul.

I.3. Rspunsuri corecte I.2. Rspunsuri corecte.

1. b - activitate de strngere a datelor;2. a - numrtoare a populaiei i eviden a bunurilor materiale;3. a - un pronunat caracter metodologic;4. a - micrile curente continue ale fenomenelor i proceselor ce i au existena sub form de colectiviti;5. a - asociaii finite de elemente unite ntre ele prin omogenitate;6. a - trsturi eseniale purtate la toate elementele unei colectiviti;

7. a - direct msurabile cantitativ;8. b - msurabil cu aproximaie;9. a - Gottfried Achenwall;10. a - o persoan interogat ntr-o anchet;11. a - ansamblul persoanelor nregistrate pe teritoriul Romniei la 18 martie 2002;12. b - sexul persoanelor, starea civil, domiciliul;13. b - numrul de copii pe familie, numrul de camere ale unui apartement, numrul de piese defecte dintr-un lot de rulmeni;

14. a - talia, greutatea, salariul;

15. - unitatea = angajatul; - variabila = nr de zile=cantitativ discret 16. e - numerele ziarelor din zilele de joi din ultimele 3 luni; 17. - unitatea= ntreprinderea; - variabila= nr personalului =cantitativ, discret;

18. d - lista ncasrilor din fiecare zi de mari a anului trecut;

19. b studentul; 20. - Populaia = medicii care au practicat n ultimul an; - Eantionul = cei 500 de medici care au practicat n ultimul an;II. OBSERVAREA DATELOR STATISTICE_________________________________________________________________________________________________________________________Definiie: Culegerea datelor i valorificarea informaiilor obinute din acestea prin mulimea operaiilor de prelucrare i analiz se numete cercetare statistic (Benea, Munteanu, 2007, p. 26)Cercetarea statistic se desfoar n trei faze: observarea statistic; prelucrarea datelor primare i obinerea indicatorilor statistici; analiza i interpretarea rezultatelor prelucrrii. De modul n care se realizeaz observarea depinde n continuare calitatea celorlalte etape.

Definiie: Observarea statistic reprezint aciunea de culegere de la unitile statistice a informaiilor referitoare la caracteristicile urmrite, dup criterii riguros stabilite. (ibdem). Ca etap a cercetrii, observarea statistic este condiionat de scopul cercetrii, de particularitile obiectului studiat i de tehnica de calcul folosit n procesul de prelucrare ulterioar a datelor observrii.

II.1. METODE DE OBSERVARE STATISTIC.

Metodele statistice utilizate cu predilecie n practic sunt: recensmntul, sondajul statistic, ancheta de opinie, panelul, monografia statistic.

Recensmntul - este o metod de observare (total), cu caracter periodic, care surprinde un fenomen n mod static. Este una din cele mai vechi metode de observare, ntlnit nc din antichitate (la romani). Recensmntul asigur o surprindee a unui fenomen ntr-un anumit moment de timp (moment critic). Momentul critic este ales, uzual, n timpul iernii, evitndu-se vacanele colare, astfel ca populaia s fie surprins n momentele ei cele mai stabile.

Definiie: n mod oficial, recensmntul populaiei este un proces de culegere, prelucrare i publicare a datelor demografice, economice i sociale, la un timp specificat i valabile pentru toate persoanele din ara respectiv sau de pe un teritoriu delimitat. (Benea, Munteanu, 2007, p. 34)Recensmntul este reglementat de ctre stat, prin acte legislative i respect principiile universalitii, simultaneitii i comparabilitii.

Din domeniul populaiei, recensmntul s-a extins i asupra altor domenii: exist recensmnt al locuinelor, al animalelor, al unitilor de industrie, transport, agricultur etc. (recensmnt economic).

2. Sondajul statistic (selecia statistic) - este o metod parial de observare statistic. Sondajul se folosete pentru a nlocui o observare total, de mare amploare, mai dificil de realizat, care presupune angajarea unor cheltuieli ridicate de resurse materiale, financiare i umane.

Sondajul poate asigura o informare operativ, prin prelucrarea rapid a informaiilor i cu costuri mai sczute.

n cazul sondajului se vor culege date de la o subcolectivitate, numit eantion, care trebuie s ndeplineasc condiia de reprezentativitate fa de colectivitatea general pentru ca rezultatele sondajului s reflecte realitatea. Eantionul trebuie s reproduc aceleai trsturi eseniale pe care le are i colectivitatea general. Formarea eantionului nu trebuie s fie subiectiv, ci s se efectueze dup procedee probabilistice aleatoare, care s asigure, fiecrei uniti, anse egale de a ptrunde n eantion (procedeele de eantionare sunt prezentate n capitolul V).Culegerea datelor statistice de la uniti se poate face prin documentare, observaie, chestionare trimise prin pot, interviu direct sau prin telefon. 3. Ancheta statistic este o metod parial de observare, fr ca eantionul pe baza cruia se realizeaz ancheta, s fie obligatoriu reprezentativ fa de colectivitatea general (se poate forma i nealeator prin alegere raional). Ancheta de opinie are drept scop cunoaterea prerilor persoanelor asupra diferitelor probleme (Exemplu: anchete sociologice, demografice, psihosociale, de marketing, etc).

4. Panelul este o metod de observare parial, bazat pe un eantion fix, stabil, format dintr-un numr de persoane de la care se obin date prin chestionare la diferite momente de timp. 5. Monografia statistic este o metod de observare parial, special organizat, avnd ca obiectiv cunoaterea multilateral i n profunzime a unei singure uniti complexe (Jaba, Pintilescu, 2005, p. 36) Ea are, de regul, un caracter multidisciplinar (monografia unei localiti, jude, firm).

Monografia este realizat de ctre o echip complex de specialiti, echip care efectueaz toate etapele cercetrii.II.2. EROAREA STATISTIC.

CONTROLUL DATELOR STATISTICE.

Definiie: Prin eroare statistic se nelege diferena dintre nivelul real al unui indicator i cel rezultat din investigaia statistic. (Benea, Munteanu, 2007, p. 36).Erorile statistice pot apare n toate etapele cercetrii statistice i pot fi:

( erori de observare (nregistrare):

se ntlnesc n procesul de culegere a datelor statistice.

Pot fi de dou feluri:

erori ntmpltoare (aleatorii) au caracter nepremeditat i se pot datora neateniei sau unor cauze accidentale i pot afecta valorile n orice sens. erori sistematice sunt produse cu bun tiin i au o influen negativ asupra rezultatelor prelucrrii; pot influena valorile ntr-un anumit sens (mai mare sau mai mic) fa de scorul adevrat.Exemplu: n nregistrrile demografice populaia are tendina de a declara, n loc de vrsta real exact, o vrst rotunjit terminat cu 0 sau 5.

Erorile de observare pot fi nlturate prin control statistic.( erori de reprezentativitate:

Sunt specifice sondajului i nu pot fi eliminate total, ci doar diminuate i inute sub control.

( erori de modelare:

Se produc atunci cnd se alege n mod nejustificat un mod de calcul, fapt ce determin obinerea unor indicatori fr coninut real. II.2. Alegei rspunsul corect

1. Reprezentativitatea este urmarit n mod deosebit n cazul culegerii datelor prin:

a) Recensmnt;

b) sondaje statistice;

c) anchete statistice;

d) monografia statistic.

2. Panelul, ca metod de observare parial urmrete:

a) aplicarea unui chestionar mai multor persoane n acelai timp;

b) aplicarea unor chestionare diferite la momente diferite de timp;

c) aplicarea aceluiai chestionar unui singur lot de subieci la momente diferite de timp.

3.Recensmntul ca metod de observare statistic:

a. nu presupune culegerea datelor de la toate unitile populaiei statistice bine determinate;

b. are exclusiv un caracter demografic;

c. se ncadreaz n sfera observrilor cu caracter permanent;

d. se organizeaz cu o anumit periodicitate.

4. Ancheta statistic:

a) este o metod de observare total;

b) este o metod de observare parial care numai ntmpltor poate s ndeplineasc condiia de reprezentativitate;c) este o metod de observare parial, care, n mod obligatoriu, trebuie s ndeplineasc condiia de reprezentativitate;

d) este o metod de observare parial, care se bazeaz pe obligativitatea

completrii chestionarelor;

e) mai este denumit i sondaj statistic. 5. Lucrri statistice prin sondaj sunt:

a. anchetele prin sondaj;

b. recensmntul;

c. rapoartele statistice.

6. Atunci cnd se nregistreaz la un moment critic populaia unei ri se efectueaz:

a. un recensmnt;

b. o nregistrare curent continu;

c. o anchet de opinie.

7. nregistrarea opiniei electoratului se nregistreaz prin:

a. recensmnt;

b. nregistrare curent-continu;

c. sondaj statistic.

8. Se observ populaia unei ri la 10 momente de recensmnt. Colectivitatea studiat este:

a. momentele de recensmnt;

b. populaia rii;

c. ara.

9. Se observ populaia unei ri la 10 momente de recensmnt. Variabila studiat este:

a. momentele de recensmnt;

b. populaia rii;

c. ara.

II.3. Rspunsuri corecte

1. b - sondaje statistice;

2. c - aplicarea aceluiai chestionar unui singur lot de subieci la momente diferite de timp.

3. d - se organizeaz cu o anumit periodicitate.

4. c - este o metod de observare parial care numai ntmpltor poate s ndeplineasc condiia de reprezentativitate;

5. a - anchetele prin sondaj;6. a - un recensmnt;

7. c - sondaj statistic.

8. b - populaia rii;

9. a - momentele de recensmnt;

III. SCALE DE MSURARE

_________________________________________________________________________________________________________________________Gruparea statistic reprezint prima sistematizare a unor date individuale care au fost obinute n urma unei observri. Sistematizarea datelor se face n scopul identificrii fenomenelor de care aparin aceleiai esene social-economice i prezint o serie de proprieti comune.

Prin prelucrarea statistic se nelege etapa cercetrii statistice n care se trece de la datele individuale obinute n etapa observrii pentru fiecare unitate a colectivitii, la indicatori care caracterizeaz colectivitatea n ntregul ei.

Nivelul nominal de msurare (clasificare) i nivelul ordinal (de rang sau ierarhic) se grupeaz n scala neparametric de msurare.

Nivelul de interval (intervale egale) i nivelul de raport (proporii) formeaz scala parametric de msurare.

Reprezentarea schematic a nivelurilor de msurare (Figura 1).(dup Opariuc, 2009).III.1. SCALE NEPARAMETRICE

III.1.1. Scala nominal (de clasificare)

Reprezint primul nivel de msurare i const n clasificarea obiectelor n funcie de existena sau inexistena unei caracteristici. Aceast clasificare presupune existena unor categorii disjuncte, astfel nct fiecare obiect s-i gseasc locul ntr-o categorie i numai n una. (Opariuc, 2009 apud Vasilescu, 1992).Scala nominal este cunoscut i sub numele de scal calitativ, categorial sau de clasificare, este cel mai simplu tip de scal i presupune doar diferenierea calitativ a fenomenelor i a obiectelor msurate. Scala nominal const n categorii care permit clasificarea (sortarea) obiectelor sau fenomenelor dup o caracteristic sau un atribut.O msurare pe scal nominal nseamn plasarea obiectelor n difeite clase (categorii), situaie n care, o valoarea nu este cu nimic mai mare sau mai mic dect o alt valoarea (Popa, 2008, p. 29).

Exemplu: Categoria profesional, sexul, tipul bio-constituional etc.

Pentru ca scala s aib sens, trebuie s existe cel puin dou categorii.

O variabil nominal cu dou categorii poart numele de dihotomie sau clasificare dihotomic.

Exemplu: mprirea subiecilor n brbai i femei.Dac exist mai multe categorii, vorbim despre polihotomii sau clasificri multiple (polihotomice).Exemplu: mprirea n funcie de profesie, culoarea ochilor sau a prului, grupa sanguin, etc.Observaie: Variabilele care sunt msurate pe scale de tip nominal, pun n eviden diferenele calitative ntre valori! Proprietile scalei nominale:

Transformrile permise la nivelul acestei scale sunt (Vasilescu, 1992):

Redenumirea atribuirea unor noi nume (n loc de masculin/feminin putem spune brbat/femeie); Permutarea schimbarea ordinii elementelor, deoarece nu se poate stabili o ierarhe ntre valorile unei variabile pe aceast scal. Aceast proprietate este caracteristic doar scalei nominale.

Operaii statistice permise n principal operaiile de baz, derivate din numrare, astfel (Opariuc, 2009 , p. 24). Frecvena absolut i relativ (procentul), cte observaii au fost incuse n fiecare categorie (de exemplu 50 de brbai i 50 de femei sau 50% brbai i 50% femei);

Valoarea modal (modul), categoria cu frecvena cea mai mare (de exemplu din 100 de subieci, 80 au ochi albatri, aceasta fiind categoria cu frecvena cea mai mare modul);

Exemplu: Alegem cele 4 tipuri de temperament pe care le codificm astfel:

Coleric 1

Sangvinic 2

Melancolic 3

Flegmatic 4Observaie: ntre toate categoriile (gradaiile) unei scale nominale nu exist relaie de ierarhie, ordinea prezentrii lor fiind indiferent, lipsit de importan din punctul de vedere al consistenei scalei (utilizarea codificrii poate crea iluzia unei ierarhii (1 este mai mic dect 2 etc.), dar aceasta este doar o iluzie, utilizat uneori n scopuri de manipulare).Ne propunem s caracterizm 150 de indivizi dup apartenena la un tip de temperament. Dup investigaie, rezult 32 de colerici, 48 de sangvinici, 37 melancolici, 33 de flegmatici. Potrivit codificrii date pot fi prezentate astfel:

TIP TEMPERAMENTALNUMR DE INDIVIZI

132

248

337

433

Ansamblul numerelor din coloana a II-a se numete distribuie de frecvene a tipurilor temperamentale n grupul studiat. Fiecare numr constituie frecvena absolut a diviziunii respective a scalei notat ni.Definiie: Frecvena absolut indic numrul total de uniti statistice.

Definiie: Frecvena relativ indic proporia din numrul total de uniti care se ncadreaz n grup.

n*i =

III.1.2. Scala ordinal (de rang sau topologic)

Reprezint al doilea nivel de msurare i const n ierarhizarea n funcie de mrimea unei caracteristici, fr ns a se putea preciza cu ct un nivel ierarhic este superior sau inferior altuia i nici de cte ori. (Opariuc, 2009, p. 35)

Scala ordinal este cunoscut i sub numele de scal de ordine, de rang, scal ierarhic. O scal ordinal permite ordonarea observaiilor, persoanelor, situaiilor de la mic la mare, de la simplu la complex, atunci cnd n empiricul relativ se introduc, pe lng relaiile de echivalen i relaiile de ordine.

Spre deosebire de scala nominal (ale crei proprieti le include), scala ordinal permite stabilirea unei relaii de ordine ntre date.

Observaie: n cazul scalelor ordinale se poate stabili ierarhia a n gradaii ale variabilei, dar nu se poate preciza valoarea diferenei dintre dou gradaii.Valorile de tip ordinal, ne spun dac o valoare este mai mare sau mai mic dect alta, dar este limitat la raportul de msime, adic, nu ne poate preciza care este diferena de cantitate a caracteristicii msurate. Crearea unei scale ordinale presupune, cu prioritate, stabilirea unei relaii de ordine ntre valorile posibile ale variabilei studiate.

Proprietile scalei:

Proprietile specifice scalei ordinale le includ pe cele ale scalei nominale, dar se adaug (Vasilescu, 1992): Operaii statistice permise:

Frecvena sumelor n valori cumulate i procentuale;

Coeficieni de corelaie de rang: Spearman, sau Kendall.

Ordinea este de la simplu la complex. Prin aceast scal putem caracteriza manifestrile unei persoane n funcie de gradul de saturare motivaional.

Observaie: Dac se neglijeaz ordinea dintre categorii, datele obinute n urma utilizrii unei scale de msur ordinale sunt identice, din punct de vedere formal, cu datele nominale.

Pentru a realiza ordonarea datelor prezentate sub form de tabel calculm i frecvenele cumulate.Definiie: Frecvena cumulat pentru o categorie este suma tuturor frecvenelor anterioare plus frecvena curent. Cuvntul anterior se refer la sensul de parcurgere a categoriilor scalei ordinale. Dac parcurgerea se face de la categoriile mici spre cele mari, se formeaz frecvene cumulate ascendent (cresctor). Dac parcurgerea se face de la categoriile mari spre cele mici se formeaz frecvene cumulate descendent (descresctor).

Observaie: Se pot prezenta sub form de frecvene cumulate att frecvenele absolute ct i cele relative.

Fci = frecvene absolute cumulate

F*ci = frecvene relative cumulate

Fci = (3) F*ci = (4)

Exemplu: S presupunem c analiznd produsele creative dintr-o anumit zon geografic, pe o anumit perioad de timp, s-a obinut urmtoarea distribuie de valori pe scara Taylor.Scara Taylor privind clasificarea creativitii dup criteriul efectivitii comunicrii:

1. creativitate expresiv;2. creativitate productiv;3. creativitate inventiv;4. creativitate inovatoare;5. creativitate emergent.Nivel creativFrecvena absolutFrecvena relativ (%)Frecvena absolut cumulat ascendentFrecvena absolut cumulat descendentFrecvena relativ cumulat ascendentFrecvena relativ cumulat descendent

17547,87515747,8100

25233,11278280,952,2

32012,71473093,619,1

463,81531097,16,4

542,615741002,6

T157100

Reprezentrile grafice ale datelor ordinale trebuie s reflecte proprietatea de ordonare specific scalei, s denote faptul c scala de msur este discret i se sugereaz ct mai puin luarea n considerare a distanei dintre categoriile scalei.

Din aceste considerente utilizm diagramele sub form de bare verticale. Vizualizrile pot s aib drept obiect att frecvenele absolute ct i cele relative.III.2. SCALE PARAMETRICE

III.2.1. Scala de interval (intervale egale)

Reprezint a treilea nivel de msurare i deriv din scala ordinal, la care se adaug proprietatea c, intervalele dintre un nivel de valori i altul sunt egale. Este un tip de msurare n care distanele dintre treptele scrii sunt distane egale sub aspectul cantitii caracteristicii de msurat. (Opariuc, 2009, p. 37)Scala de interval are proprietile scalei ordinale, dar intervalul dintre dou variante este exprimat n termenii unei uniti de msur fixe. Prin aceasta operaia de msurare a observaiilor pe o scal de intervale determin cantitatea exact de caracteristic existent n observaii.Exemplu: temperatura msurat pe o scal Celsius: dac ntr-o zi se msoar 10 grade, iar a doua zi se msor 20 de grade, se poate spune cu precizie c a doua zi a fost cu 10 grade mai cald.O caracteristic a valorilor msurate pe scala de interval este absena unei valori zero absolute (Popa, 2008). Din acest motiv, nu se poate spune c temperatura de 20 de grade este de dou ori mai mare dect temperatura de 10 grade.

O variabil msurat pe o scal de interval ofer informaii att la ordinea de mrime ct i la marimea exact a caracteristicii msurate (Popa, 2008).Realizarea unei scale de interval presupune parcurgerea mai multor etape:

1. Se calculeaz amplitudinea variaiei caracteristicii

Numim amplitudine de variaie (Range) diferena dintre valoarea maxim i valoarea minim a distribuiei de date. (A = Max Min).

A xmax - xmin (5)

2. Se stabilete numrul de grupe r n care vor fi sistematizate datele

Observaie : Se recomand utilizarea unui numr moderat de grupe (ntre 4 i 10).3. Se calculeaz mrimea aproximativ a intervalelor de grupare:h = (6)

4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o valoare mai mic).xmin+h; xmin+2h; ; xmin+rh

Fie c desfurm o evaluare psihologic, un experiment sau o cercetare experimental, fie c iniiem un proces de colectare a datelor prin observaie, rezultatul const ntr-o colecie de date brute. La acest nivel nu avem nici o modalitate prin care putem trage concluzii asupra semnificaiei datelor pe care le avem la dispoziie. (Opariuc, 2009).

De aceea, prima etap n iniierea unei proceduri statistice de analiz a datelor const n clasificarea, ordonarea, condensarea acestora n vederea conturrii unei imagini ct mai precise. (idem)

Valorile msurate trebuie aezate ntr-o anumit ordine (cresctoare sau descresctoare) care s permit i o eventual reprezentare grafic a acestora.Exemplu: Urmtoarele date reprezint cheltuielile pentru cumprarea unbui produs (ron), cheltuieli efectuate de 25 de familii ntr-o sptmn: 222, 284, 321, 248, 235, 265, 254, 312, 321, 298, 274, 286, 312, 288, 286, 245, 222, 234, 238 ,254, 265, 231, 254, 233, 265.

Xmin = 221

Xmax = 321.A = Xmax- Xmin = 321 221 = 100r = 4

h =

IntervaleFrecven

221 - 2468

246 - 2718

271 - 2965

296 - 3214

Proprietile scalei (Vasilescu, 1992): Operaii statistice permise:

Calculul mediei aritmetice, abaterii standard, boltirii i simetriei (indicatorii statistici sunt prezentai la capitolul IV);

Statistici parametrice: testul t Student, F Fisher, analiza de varian;

Toate tipurile de corelaii: r-Pearson, raport de corelaie (R), coeficientul de regresie (b)

III.2.2. Scala de raport (proporii)

Ultimul nivel de msurare i este reprezentat de scala de raport care are toate caracteristicile unei scale de interval la care se adaug existena unui zero absolut. Aceast scal permite s rspundem la ntrebarea de cte ori, deoarece existena unui zero absolut face posibil compararea proporiilor.(Opariuc, 2009, p. 38) Scala de raport are proprietile scalei de interval, iar raportul dintre dou puncte ale scalei dup care unitile sunt clasificate are semnificaie, indiferent de unitatea de msur utilizat n stabilirea scalei.

Pe scala de raport numerele ofer nu numai informaii asupra ordinii de rang a obiectelor (i a mrimii relative a diferenelor) ci i despre relaiile rapoartelor.Exemplu: dac un subiect are greutatea de 80 de kilograme iar un altul are greutatea de 160 kilograme, putem spune c al doilea subiect este cu 80 de kilograme mai greu dect primul, dar i c al doilea subiect este de dou ori mai greu dect primul, ambele afirmaii avnd sens.

Exemplu: - Rata lunar a omajului;

- cursul valutar zilnic al leului n raport cu euro.

Proprieti ale scalei:

Sunt permise toate operaiile statistice, inclusiv calculul mediei geometrice i al coeficientului de variaie.

III.3. Alegei rspunsul corect

1. Scala nominal:

a. nu permite redenumirea unor noi nume;

b. permite schimbarea ordinii elementelor;

c. este cunoscut i sub numele de scal cantitativ.

2. Scala nominal are ca proprietate:a. identitatea categoriilor unei variabile;b. ordinea categoriilor unei variabile;c. diferenele ntre numere au un sens;d. raportul dintre dou puncte de scal este acelai.3. Operaiile statistice permise n cadrul scalei nominale sunt:

a. frecvenele absolute i relative;

b. modul, mediana, media;

c. frecvenele cumulate.4. n cazul scalei nominale:a. ntre coduri exist un raport de echivalen i ordinea codurilor numerelor sau simbolurilor atribuite categoriilor este oarecare;b. diferenele ntre 2 valori ale unei variabile nu au sens;c. ntre categoriile variabilelor atributive exist un raport de preferin.

5. Proprietatea de identitate, specific scalei nominale, presupune:

a. un interval ntre numere, care s permit compararea diferenelor dintre numere; b. un raport de preferin, desemnat prin >, care permite msurarea cu ranguri; c. apartenena elementelor la o categorie.6. Scala ordinal:

a. permite ordonarea observaiilor, persoanelor sau situaiilor de la complex la simplu;

b. permite ordonarea observaiilor, persoanelor sau situaiilor de la mic la mare;

c. poate precuza valoarea diferenei dintre dou gradaii;

d. nu presupune stabilirea unei relaii de ordine ntre valorile posibile ale variabilei studiate.

7. n cazul scalei ordinale:

a. se poate preciza valoarea dintre dou gradaii;

b. se poate stabili o relaie de ordine ntre valorile posibile ale variabilelor studiate;

c. este cunoscut i sub numele de scal calitativ.

8. Frecvena cumulat ascendent se calculeaz ca fiind:

a. numrul total de uniti statistice;

b. numrul total de uniti care se ncadreaz n grup;

c. suma frecvenelor anterioare minus frecvena curent,

d. suma frecvenelor anterioare plus frecvena curent.

9. Scala de interval:

a. presupune stabilirea unei relaii de ordine ntre valorile studiate;

b. presupune ca intervalul dintre dou variante s fie exprimat n termenii unei uniti de msur fixe;

c. nu poate determina cantitatea exact de caracteristic existent n observaii;

d. nu are ca extensie scala de interval.10. Scala de interval este folosit n cazul:

a. variabilelor atributive

b. variabilelor nenumerice

c. variabilelor cantitative

11. Scala de interval

a. are toate caracteristicile scalelor ordinale i de raport;b. are toate caracteristicile scalei ordinale i, n plus, distana sau diferena dintre dou numere ale scalei are semnificaie concret;c. este o scal numeric i, n plus, raportul dintre dou puncte ale scalei este independent de unitatea de msur;d. prezint multe dintre caracteristicile scalei ordinale;e. mai este numit i scal de raport sau scal discret.12. Ordinea n care sosesc alergtorii dintr-o curs reprezint o variabil statistic ale crei valori pot fi msurate pe o scal:

a. nominal;

b. proporional;

c. de interval;

d. ordinal;

e. cardinal.

13. Temperatura la sol msurat n 10 zile consecutive n Bucureti, ca variabil statistic, are valori ce pot fi msurate pe o scal*:

a. de raport;

b. de interval;

c. ordinal;

d. pe nici una din scalele menionate14. Identificai 3 tipuri diferite de date statistice ce pot fi colectate pentru a reflecta popularitatea a cinci publicaii periodice similare. Precizai scala de msurare a fiecrui tip de date*.

a. numr de abonamente;

b. numr de exemplare vndute;

c. tiraj.

15. Precizai care dintre urmtoarele asocieri ntre variabilele statistice i scala de msurare nu este adevrat(:

a. marca de calculator cumprat cel mai curnd de 20 de oameni de afaceri scal nominal;

b. salariul mediu pe ramuri ale economiei naionale scal de raport;

c. punctajul obinut de ctre 10 concureni la un concurs de cultur general scal nominal;

d. afilierea la un partid politic a 50 de directori executivi selectai aleatoriu scal nominal.

III.4. Probleme

1. Ne propunem s studiem 200 de persoane pentru a vedea care este profesia lor. Dup investigaie au rezultat:

32 avocai 50 economiti 66 juriti

21 contabili 31 psihologi

Cerine:

a. Identificai frecvena absolut;

b. Calculai frecvena relativ2. n urma controlului de calitate, ntr-un lot de 500 de piese, se gsesc ni=30 piese rebut.

S se calculeze procentul mediu al pieselor de rebut din lot.

3. Populaia ocupat (mii persoane) pe sectoare de activitate n Romnia, n anii 1993 i 2001, se prezint astfel:

Sectorul de activitate 1993 2001

Indistrie

30302017

Construcii574340

Agricultur i silvicultur36143498

Alte ramuri28442708

Total100628563

S se calculeze ponderea populaiei ocupate n sectorul de construcii, n anul 2001.

4. Populaia ocupat (mii persoane) pe sectoare de activitate n romnia, n anii 1993 i 2001, se prezint astfel:

Sectorul de activitate 1993 2001

Indistrie30302017

Construcii574340

Agricultur i silvicultur36143498

Alte ramuri28442708

Total100628563

S se afle cu ct s-a modificat structura populaiei ocupate n industrie, n anul

2001 fa de 1993.

5. Distribuia a n familii dintr-un bloc, dup numrul de copii (x), la un moment dat, se prezint astfel(:

Xi01234567

ni618232014621

Fci624476781878996

S se calculeze numrul de familii care au cel mult 4 copii.

6. Urmtoarele date reprezint cheltuielile (mii lei) efectuate de 50 de copii ntr-o sptmn:

50, 82, 84, 56, 114, 115, 118, 58, 64, 86, 89, 66, 69, 144, 135, 78, 98, 94, 76, 80, 134, 128, 126, 79, 96, 100, 112, 113, 84, 87, 96, 99, 146, 155, 159, 157, 166, 178, 174, 176, 169, 178, 158, 155, 156, 174, 84, 94, 110, 112.Calculai:

a) Amplitudinea;

b) Marimea intervalului avnd r = 4 (numrul de intervale);

c) Frecvena absolut;7. Distribuia pe grupe de vrst a unui eantion de 100 de persoane dintr-un cartier de locuine, la un moment dat, este:Grupa de vrst- 2020-3030-6060-8080-100

Efectivul1761221518

S se calculeze limita inferioar a primului interval de variaie.

8. Directorul unui post de radio comand o cercetare statisitic n scopul determinrii audienei de care se bucur postul su. Cercettorul culege date privind numrul de ore audiate pe un eantion i afl c 10% din persoane ascult postul de radio mai puin de 2 ore, 25% ntre 2 i 4 ore, 40% ntre 4 i 6 ore, 20% ntre 6 i 8 ore, iar restul peste 8 ore. El urmrete s determine numrul mediu de ore de audiie pe o persoan. III.5. Rspunsuri corecte

III.3. Rspunsuri corecte.1. b - permite schimbarea ordinii elementelor;2. a - identitatea categoriilor unei variabile;3. a - frecvenele absolute i relative;4. a - ntre coduri exist un raport de echivalen i ordinea codurilor numerelor sau simbolurilor atribuite categoriilor este oarecare;5. c - apartenena elementelor la o categorie;6. b - permite ordonarea observaiilor, persoanelor sau situaiilor de la mic la

mare;

7. b - se poate stabili o relaie de ordine ntre valorile posibile ale variabilelor studiate;

8. d - suma frecvenelor anterioare plus frecvena curent; 9. b - presupune ca intervalul dintre dou variante s fie exprimat n termenii unei uniti de msur fixe;

10. c - variabilelor cantitative;

11. b - are toate caracteristicile scalei ordinale i, n plus, distana sau ; 12. d - ordinal;

13. b - de interval;

14. a. numr de abonamente scal de raport;

b. numr de exemplare vndute scal de raport;

c. tiraj scal de raport. 15. c. punctajul obinut de ctre 10 concureni la un concurs de cultur general scal nominal;

III.4. Rspunsuri corecte.1. Rspuns.

ProfesiiNiNi*

Avocai3216

Contabili2125

Economiti5033

Psihologi3110,5

Juriti6615,5

2. Rspuns: Nivelul mediu n cazul unei variabile alternative se calculeaz dup relaia:

EMBED Equation.3 Interpretare: Rezultatul obinut arat c n medie, la fiecare 100 de piese observate, 6 piese sunt rebut.

3. Rspuns. Se calculeaz frecvena relativ.

Ni*=

Interpretare: Ponderea populaiei ocupate n sectorul de construcii, n anul 2001, este de 3,97%

4. Rspuns. ni*=

Ni0*=

Ni1*=

Interpretare: Structura populaiei ocupate n industrie a sczut, n anul 2001 fa de 1993, cu 6,56%. 5. Rspuns. Aflarea numrului de familii care au cel mult 4 copii presupune calcularea frecvenei absolute cumulate. Ne vom opri la 81 deoarece problema, cere numrul de familii care au cel mult 4 copii. Astfel, un numr de 81 de familii din colectivitatea considerat au cel mult 4 copii.

7. Rspuns: Exemplul dat prezint o distribuie pe intervale inegale de variaie. n acest caz, limita inferioar a primului interval de variaie se nchide, i vom lua n consideratie mrimea intervalului urmtor.

h= xi-xi-1= limsup - limin f = 30-20 =10

Prin urmare, primul interval are ca limit inferioar 10, adic (10-20)

8. Rspuns. Se va utiliza media aritmetic ponderat, calculat pe baza frecvenelor relative.

Intervale de variaie a numrului de ore de audiieNumr de persoane (%)

Sub 210

2 - 425

4 - 640

6 - 820

8 i peste5

total

Astfel n medie o persoan din eantionul studiat audiaz 4,7 ore de program la postul de radio respectiv.

IV. INDICATORI STATISTICI________________________________________________________________________________________________________________Noiunea de indicator i funciile indicatorilor

Cercetarea statistic a fenomenelor i proceselor socio-economice are ca obiectiv principal analiza aspectelor cantitative nemijlocit sesizabile pentru a afla i caracteriza esena i calitatea acestora.

Definiie: Indicatorul statistic reprezint expresia numeric a unor fenomene i procese social-economice, definite n timp, spaiu i structur organizatoric.17 Indicatorii statistici pot fi primari sau derivai.

Indicatorii primari exprim direct nivelul real de dezvoltare a caracteristicii cercetate, caracteriznd fenomenul/procesul la modul cel mai general din punct de vedere cantitativ. Ei rezult n urma observrii i centralizrii statistice a datelor individuale de mas, fie prin nregistrarea curent, fie prin nsumare parial sau total a datelor individuale de acelai fel.

Indicatorii derivai se obin prin prelucrarea mrimilor absolute ale indicatorilor primari. Prelucrarea se face prin comparare, abstractizare, generalizare i alte procedee de calcul statistic.

Compararea se face prin diferen sau prin raport. Prin diferen se compar numai indicatorii absolui cu acelai coninut i exprimai n aceeai unitate de msur. Prin raport se pot compara indicatorii cu acelai coninut sau coninut diferit, dar aflai n relaie de interdependen.

IV.1. INDICATORI AI TENDINEI CENTRALE

Indicatorii tendinei centrale sunt indicatori sintetici cu ajutorul crora se exprim ntr-o singur msur ceea ce este tipic, esenial, stabil, obiectiv i caracteristic ntr-o serie de date numerice.

Un indicator al tendinei centrale trebuie s ndeplineasc urmtoarele condiii:

( s fie definit n mod precis i obiectiv, eliminnd aprecierea subiectiv a cercettorului; ( s fie expresia tuturor observaiilor fcute; ( s nu aib caracter matematic prea abstract i s posede proprieti simple i evidente;

( s poat fi calculat cu uurin;

(s fie ct mai puin afectat de fluctuaiile de selecie (la extragerea mai multor eantioane dintr-o colectivitate general, mediile s nu fie sensibil diferite).

Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic, modul i mediana.

IV.1.1. Media aritmetic ()

Considerm c termenul de medie este cel mai uor de neles din ntreaga statistic.

Au fost nenumrate situaiile n care am ntlnit media: media la fizic pe trimestru sau semestru s vedem dac am rmas corigeni sau am luat premiu, media de la bacalaureat care ne ridic sau ne coboar ansele de admitere la facultate, la fel ca i media anilor de studiu sau media cheltuielilor zilnice care ne ajut s ne planificm mai bine bugetul. (Opariuc, 2009)Deci ce este media? Media aritmetic este indicatorul care se utilizeaz cel mai frecvent pentru caracterizarea tendinei centrale. Media reprezint valoarea care nlocuind toi termenii unei serii nu modific nivelul totalizator i se calculeaz ca suma valorilor unei variabile raportat la numrul msurtorilor. Aceasta este media aritmetic (Opariuc, 2009, p. 75), deoarece n statistic mai discutm i de media geometric, media caracteristicilor alternative, media ptratic, media rangurilor etc. Aceste concepte le ntlnim ns mai rar n domeniul tiinelor socio-umane i prin urmare nu vom face dect s le amintim. Media este un model ipotetic , un model statisatic care reprezint tendina, direcia spre care connverg datele (ibidem).

(1) - pentru serie simpl

Exemplu: Vrsta a 7 studeni de la facultatea de psihologie este de 25, 26, 32, 33, 40, 22, 26, 24. Vrsta medie este:

n cazul n care datele au fost sistematizate ntr-o serie de distribuie de frecvene n care valorile/centrele intervalelor de variaie apar cu frecvenele ni, atunci media aritmetic, numit i medie aritmetic ponderat este:

(2) pentru o serie cu distribuie de frecvene.

Exemplu: Salariile date angajailor (mil. lei) de ctre 70 de firme n anul 2005 a avut urmtoarea distribuie:

Intervalni

20 - 4010

40 - 60 15

60 - 8010

80 - 1005

S se calculeze media.

Rspuns: Fiind o serie cu distribuie de frecvene vom aplica urmtoarea formul:

unde:

Xi = centrul de interval

Ni =frecvena absolut

Observm c n formul avem i necunoscute, adic Xi (centrul de interval) i va trebui s-l calculm.

IntervalniXi

20 401030

40 - 601550

60 - 801070

80 - 100590

Xi=

Xi =

Xi =

.

Xi =

Avnd toate datele problemei, putem nlocui n formul, astfel:

Salariul mediu oferit este de 55 mil lei.Not: Pentru o serie de distribuie de frecvene, media calculat pe baza frecvenelor relative este egal cu media aritmetic determinat pe baza frecvenelor absolute.

Proprietile mediei aritmetice (Popa, 2008, p. 59): adugarea / scderea unei constante la fiecare valoare a distribuiei mrete / scade media cu acea valoare;

mulirea / mprirea fiecrei valori a distribuiei cu o constant multiplic / divide media cu acea constant;

suma abaterii valorilor de la medie este ntotdeauna egal cu zero;

IV.1.2. Modul (M0 )

Modul este categoria cu frecvena cea mai mare, el reprezint valoarea cel mai des ntlnit ntr-o serie statistic sau cea care are cea mai mare frecven de apariie. Modul se mai numete i dominanta seriei sau valoarea modal.

Grafic, ntr-o histogram ori poligon al frecvenelor el reprezint valoarea de pe abscis corespunztoare vrfului reprezentrii.

n cazul datelor cantitative, n determinarea modului se ine cont de felul n care

acestea au fost sistematizate.

Pentru o serie statistic simpl de forma valoarea modal, M0 = 32.Pentru o serie de distribuie de frecvene alctuit dup o variabil cantitantiv discret, determinarea modului se face prin identificarea valorii creia i corespunde frecvena maxim.

n cazul seriilor de distribuie de frecvene pe intervale de variaie, determinarea modului presupune mai nti identificarea intervalului cu frecven maxim:

unde:

reprezint limita inferioar a intervalului modal;

reprezint mrimea intervalului modal; d1 = diferena dintre frecvena intervalului modal i a celui precedent;

d1= ; d2 = diferena din frecvena intervalului modal i a celui urmtor;

d2 =;Dac d1 = d2 atunci modul va fi egal cu centrul intervalului modal.O serie de date statistice poate s aib una sau mai multe valori modale. O distribuie cu un singur mod se numete unimodal, dac are dou valori dominante se numete bimodal, iar dac are mai mult de dou moduri se numete multimodal.Exemplu: Salariile date angajailor de ctre 70 de firme n anul 2005 a avut urmtoarea distribuie:

Intervaleni

10-2020

20-3010

30-4010

40-5015

50-6025

60-7010

M0 =

Intmod = 50-60 (intervalul a crui frecven absolut este cea mai mare)

= 50

d1 =

= frecvena intervalului modal

= frecvena intervalului anterior celui modal

d1 = 25 15 = 10

d2 =

= frecvena intervalului modal

= frecvena intervalului urmtor celui modal

d2 = 25 - 10 = 15

Mo =58IV.1.3. Mediana (Me)Mediana este o alt msur a tendinei centrale i reprezint valoarea care mparte irul de msurtori n dou pri egale; jumtate din irul de date vor avea valori mai mici dect mediana n timp ce cealalt jumtate vor avea valori mai mari dect mediana (Opariuc, 2009, p. 79).Mediana prezint valoarea/varianta din mijlocul unei serii de date, serie n care observaiile au fost ordonate cresctor (sau descresctor). Mediana este situat n centrul (mijlocul) seriei.

Mediana poate fi folosit n caracterizarea tendinei centrale pentru o serie de date msurate pe o scal ordinal. Mediana ia n considerare doar poziia observaiilor n serie, nu i magnitudinea lor efectiv.

Pentru a determina mediana introducem noiunea de ranguri, adic, numere de ordine asociate observaiilor (cea mai mic rang 1; cea mai mare rang n).

Locul medianei (LocMe) va fi rangul unitii din mijlocul distribuiei.

LocMe =

Pentru seriile simple la determinarea valorii din mijloc trebuie s lum n consideraie situaiile:

a) Dac n este un numr impar

pentru date cantitative mediana este exact valoarea din mijlocul seriei Exemplu: n cazul unui ir impar, mediana este valoarea de la mijlocul unui ir. Dac relum exemplul anterior, i mai adugm un scor, obinem:

20, 17, 14, 9, 18, 15, 19

irul are 7 valori. Ordonnd cresctor irul de mai sus, obinem: 9, 14, 15, 17, 18, 19, 20

De data aceasta, la mijlocul acestui ir gsim valoarea 17, valoarea medianei.

Observm c n = 7.

LocMe = =

LocMe =4 a 4-a valoarea din irul de numere ordonate crector sau descresctor reprezint mediana Me =17

Ordonnd un ir, putem preciza poziia fiecrui element n cadrul acelui ir.

Altfel spus, mediana nu este altceva dect poziia rangului din mijloc n irul ordonat de date. ntr-o serie de la 1 la 7, poziia din mijlocul irului este evident, poziia 4. Acesta este de altfel i locul n care gsim mediana.Scoruri:9, 14, 15, 17, 18, 19, 20

Poziia: 1, 2, 3, 4, 5, 6, 7

b) Dac n este un numr par, exist dou valori situate n mijlocul seriei.

dac datele sunt cantitative, mediana este media celor dou valori din mijlocExemplu: Se consider urmtorul ir de date:

20, 10, 15, 18, 21, 22

Pentru a calcula mediana, primul pas este acela de a ordona cresctor sau descresctor aceste date. Ordonnd cresctor irul de mai sus, obinem:

10, 15, 18, 20, 21, 22

S se calculeze mediana.

Se ordoneaz datele cresctor, astfel: 10, 15, 18, 20, 21, 22.

LocMe = = mediana se situeaz ntre a treia i a patra valoare din serie.

Me =

Dup definiia medianei, n cazul nostru avem 6 valori. Prin urmare, mediana va fi valoarea care mparte acest ir ordonat n dou pri egale. Fiind 6 valori, mediana este situat la limita primelor 3 valori. Deoarece irul este un ir par, mediana se situeaz, n cazul nostru, ntre valoarea 18 i valoarea 20, mai precis la valoarea 19.c. Pentru o serie de distribuie de frecvene variate determinarea medianei presupune calcularea mai nti a frecvenelor cumulate. Prima frecven cumulat mai mare dect (n+1)/2 (locul medianei) ne indic varianta median.Exemplul 1: Pentru 80 de familii dintr-un bloc s-au sistematizat date privind numrul membrilor de familie, rezultnd distribuia:

Numrul membrilor de familieNumrul de familii

niFrecvene cumulate

Fci

11212

22335

33065

4873

5780

80

LocMe = adic, ntre a 40-a i a 41-a familie prima frecven cumulat mai mare dect 40,5 este 65 varianta trei membrii de familie reprezint varianta median situat n mijlocul distribuiei.

Pentru o serie de repartiie de frecvene pe intervale de variaie, mediana se va ncadra n intervalul median, primul interval cu frecvena cumulat mai mare dect LocMe.Exemplul 2: Se d distribuia:

IntervaleniFci

10-202020

20-301030

30-401040

40-501555

50-602580

60-701090

LocMe = ; n = 90

Me = unde:

- limita inferioar a intervalului median

hMe mrimea intervalului median

Fc(Me-1) - frecvena cumulat a intervalului anterior celui median

nMe frecvena absolut a intervalului median

Me = = 43,66

Me = 43,66Mediana prezint unele avantaje fa de medie:

( este mai puin afectat de valorile extreme, lund n considerare doar poziia valorilor nu i magnitudinea lor efectiv;

( poate fi folosit ntr-o distribuie pe intervale chiar i n cazul n care primul sau ultimul interval sunt deschise;( este un indicator ce poate fi folosit i pentru date ordinale;Dezavantajele medianei:

( mediana nu poate fi supus la fel de uor calculelor algebrice;

( media este preferabil n procesul de inferen statistic.

IV.2. INDICATORI SINTETICI AI MPRTIERIIIV.2.1. AMPLITUDINEA ABSOLUT (A) Cuvntul amplitudine provine de la termenul englezesc range i se calculeaz ca diferena ntre nivelul maxim i nivelul minim al caracteristicii.

A = xmax - xminAmplitudinea absolut are dezavantajul c poate fi influenat de o singur valoare

aflat la extremitatea distribuiei (Popa, 2008).

IV.2.2. AMPLITUDINEA RELATIV A VARIAIEI (A%) Se exprim n procente i se calculeaz ca raport ntre amplitudinea absolut a variaiei i nivelul mediu al caracteristicii.

A% =

Amplitudinea se folosete la controlul calitii produselor prezentnd importan i din punct de vedere metodologic, fiind folosit n prima faz a prelucrrii statistice la stabilirea numrului de grupe i a mrimii intervalului de grupare. IV.2.3. QUARTIELEQuartilele (Q) sunt percentile care mpart distribuia n patru segmente egale, ele delimitnd cele 25% din observaii. Quartilele sunt n numr de trei: Q1 (percentila 25), Q2 (percentila 50 sau mediana), Q3 (percentila 75).

Q1 este cuartila inferioar;Q2 este egal ntotdeauna cu mediana;Q3 este cuartila superioar;

Abaterea quartil este dat de diferena dintre valoarea corespunztoare quaertilei 3 i valoarea corespunztoare quartilei 1 (Popa, 2008).Determinarea valorilor quartilelor se face adoptnd formulele medianei:

Q1 =

unde:

= limita inferioar a intervalului quartilic;

= mrimea intervalului quartilic;

= ;

= locul quartilei, primele 25% valori;

= frecvena cumulat a intervalului anterior celui quartilic;

= frecvena absolut a intervalului quartilic;

;

;

= locul quartilei, ultimele 25% din valori;Exemplul 1: Salariile date angajailor de ctre 70 de firme n anul 2005 a avut urmtoarea distribuie:

IntervaleniFci

10-202020

20-301030

30-401040

40-501555

50-602580

60-701090

Q1 =

Intervalul primul interval care are frecvena cumulat mai mare dect locul quartilei Q1

Q3 = primele 25% din firmele care ofer cele mai mari salarii.

Intervalul quartilei Q3 =

Q3= 155,3 primele 25% din firmele care ofer cele mai mici salarii.

IV.2.4. Abaterea medie liniar ()

Se mai numete variaie medie, deviaie medie, abatere absolut medie sau abatere liniar medie i se poate calcula atunci cnd media este un bun indicator al tendinei centrale. Acest indicator informeaz asupra modului n care se abat, n valori absolute, rezultatele de la medie, acordnd aceeai pondere tuturor variabilelor. Abaterea medie se poate calcula pe date grupate sau pe date discrete. (Opariuc, 2009, p. 123).Se calculeaz ca medie aritmetic simpl sau ponderat a abaterilor termenilor seriei de la media lor, luat n valoare absolut.Pentru o serie simpl:

Pentru o serie de distribuie de frecvene absolute:

Pentru o serie cu frecvene relative, exprimate n procente:

Exemplu:

Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului rezultnd:

Timp (min)Numr de persoane nixixi*nixi -

*ni

0-30

(Pn la 30)4715705-57,7557,752714,25

30-6051452295-27,7527,751415,25

60-90767557002,252,25171

90-12024105252032,2532,25774

120 -150213527062,2562,25124,5

T=5260,2S se calculeze abaterea medie liniar.

IV.2.5. Dispersia (variana) unei caracteristici ()

Atunci cnd putem utiliza media, un indicator frecvent este indicatorul dispersiei sau indicatorul varianei (atenie, nu variaie ci varian) notat cu sigma ptrat pentru populaie sau s2 n cazul unui eantion.

Se calculeaz ca medie aritmetic simpl sau ponderat a ptratelor abaterilor termenilor seriei fa de media lor.

Formula de calcul a dispersiei este urmtoarea, n care xi reprezint valoarea msurat, x barat media iar N numrul de msurtori.

- pentru o serie simpl

pentru o serie cu frecvene absolute

pentru o serie cu frecvene relative, exprimate n procente

Exemplu: Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului rezultnd:

Timp (min)Numr de persoane nixixi*nixi -

(xi-)2(xi-)2*ni

0-30

(Pn la 30)4715705-42,45180284694

30-6051452295-12,451557905

60-907675570017,5530823408

90-12024105252047,55226154264

120 i peste213527077,55601412028

T=11490 T=182299

S se calculeze dispersia.

, =57,45

IV.2.6. Abaterea medie ptratic (abaterea tip sau abaterea standard)

Se noteaz cu s n cazul unui eantion sau cu sigma n cazul unei populaii i o putem ntlni sub numele de abatere etalon, abatere tip, abatere ptratic medie. Acest indicator este cel mai precis i inteligibil pentru msura gradului de mprtiere

a rezultatelor n jurul tendinei centrale i contribuie la definirea distribuiei normale. Poate fi calculat i dobndete semnificaie numai atunci cnd poate fi calculat media. Abaterea patratic medie este radacina patrat din media aritmetic a ptratelor abaterilor valorilor observate n raport cu media lor aritmetic 22. Ea msoar modul n care rezultatele se mprtie n jurul mediei, valorile mari indicnd un grad mare de mprtiere. Cu alte cuvinte, abaterea standard este un indicator care ne arat n ce msur modelul statistic se potrivete cu modelul real (Opariuc, 2009, p. 129). Relaiile de calcul ale abaterii mediei ptratice sunt:

pentru o serie simpl

Dac privim cu atenie aceast formul, constatm c expresia de sub radical nu este altceva dect variana. Prin urmare, dup ce calculm variana, putem afla uor abaterea standard extrgnd radicalul de ordin doi din varian.

pentru o serie de frecvene absolute

pentru o serie de frecvene relative, exprimate n procente

Exemplu:

30.19 minute

Abaterile mici, indic faptul c valorile sunt uor distanate de medie, n timp ce abaterile mari, arat c datele sunt distanate, mprtiate n jurul mediei, care, nu mai este reprezentativ. Abaterea standard se exprim n aceleai uniti de msur ca i mediaProprietile abaterii standard (Popa, 2008, p. 70): dac se adaug /scade o constnt la fiecare valoare a unei distribuii, abaterea standard nu este afectat;

dac se multiplic/divide fiecare valoarea a unei distribuii cu o constant, abaterea stabdard se multiplic/divide cu acea constant.IV.2.7. Coeficientul de variaie ()

Prezint, mai intuitiv dect abaterea standard, gradul de mprtiere al rezultatelor n jurul mediei, deoarece este o expresie procentual a mpririi abaterii standard la medie (Opariuc, 2009, p. 130).Se calculeaz ca raport ntre abaterea medie ptratic i nivelul mediu al seriei, deoarece abaterea standard se folosete frecvent pentru msurarea abaterii medii.Formula de calcul este:

sau (dac s-a calculat abaterea medie liniar )Valoarea coeficientului de variaie exprim un raport procentual dintre abaterea standard i medie. Cu ct este mai mare, cu att se poate spune c media este mai puin reprezentativ pentru distribuia respectiv. (Popa, 2008).

Dup Popa (2006), sunt propuse anumite limite de interpretare a coeficientului de variaie: dac 15%, mprtierea este mic, deci media este reprezentativ; dac este cuprins ntre 15 i 30%, mprtierea este mijlocie i media este sufucient de reprezentativ; dac 30%, mprtierea este mare, iar media are o reprezentativitate redus.Cu ct nivelul lui este mai apropiat de zero cu att variaia este mai redus, colectivitatea este mai omogen, media avnd un grad mai ridicat de reprezentativitate; cu ct valoarea sa este mai departe de zero, cu att variaia este mai intens, colectivitatea mai eterogen, iar media are un nivel de semnificaie mai sczut.Alegerea indicatorului mprtierii (Popa, 2008, p. 72): abaterea standard este cea mai utilizat pentru scalele de msurare interval /raport, deoarece realizeaz cea mai bun combinaie ntre calitatea estimrii i posibilitatea de a fundamenta inferene statistice; amplitudinea - este un indicator nesigur, care nu poate fi calculat n cazul scalelor nominale; IV.4. INDICATORI AI FORMEI DISTRIBUIEI

n cazul variablelor continue ce pot fi sistematizate n distribuii de frecvene cu ajutorul intervalelor de grupare pe lng determinarea indicatorilor tendinei centrale i variabilitii se pune problema s studiem i modul n care valorile individuale sunt deplasate i centralizate comparativ cu tendina central.Forma unei distribuii de frecvene se analizeaz comparativ cu distribuia ideal, normal prin indicatori asimetrici (oblicitii) i indicatori ai boltirii (excesului).

IV.4.1. Indicatori ai asimetriei (oblicitii)

Asimetria se observ prin reprezentarea grafic prin histogram sau poligonul frecvenelor, dar poate s fie msurat prin indicatori specifici.

Poziia indicatorilor tendinei centrale n funcie de forma distribuiei (Popa, 2008, p. 72):

perfect simetrice: (fig. 1);

cu asimetrie pozitiv: (fig. 2);

cu asimetrie negativ: (fig.3).

Mo me medie Fig.1 fig.2

Medie Me mo Fig.3

n cazul distribuiilor perfect simetrice, modul, mediana i media se plaseaz n aceeai poziie. Dac distribuiile sunt asimetrice, atunci cei trei indicatori au poziii diferite: mediana se plaseaz ntotdeauna ntre mod i medie, motiv pentru care, ea este cea mai reprezentativ valoare pentru distribuiile simetrice.Media este afectat de valorile extreme i din aceast cauz, ea nu est un indicator veridic al tendinei centrale atunci cnd este vorba de distribuii puternic asimetrice. (Popa, 2008).

Asimetria n valoarea absolut se poate msura cu indicatorii:

Dar o distribuie este caracterizat i prin variabilitatea datelor. O serie care are variabilitatea mai mic va fi mai pronunat oblic, iar ntr-o serie mai mprtiat oblicitatea se va atenua. Pentru aceasta vom calcula coeficientul de asimetrie Pearson:

coeficientul care ia valori pozitive n cazul curbelor alungite spre dreapta (asimetrie pozitiv) i valori negative n cazul curbelor alungite spre stnga (asimetrie negativ).

Coeficientul de asimetrie este nul pentru o distribuie simetric. El mai poate fi exprimat: . Exemplu: Presupunem c pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului, rezultnd:

Timp (min)Numr de persoane nixixi*ni

0-30

(Pn la 30)4715705

30-6051452295

60-9076755700

90-120241052520

120 i peste2135270

T=11490

Mo =xinfMo-hMo

Mo=60+30

ceea ce semnific o asimetrie negativ moderat (coada mai lung a distribuiei tinde spre valori mici).IV.4.2. Coeficientul Yule

Coeficientul msoar gradul de asimetrie prin raportul dintre diferena i suma abaterilor quartile i se calculeaz dup formula alturat. Observm c, pentru a calcula acest coeficient, este necesar s calculm pur i simplu cele trei quartile, dup metoda prezentat ntr-unul dintre capitolele anterioare.

unde Q1= Me-Q1 Q2=Q3-Me

Coeficientul poate lua, n general, valori de la -1 la +1 i indic mrimea asimetriei negative sau pozitive. Cu ct valorile sunt mai apropiate de 0, cu att distribuia este mai simetric. Cu ct se apropie de -1 sau de +1, ea devine tot mai asimetric spre stnga sau spre dreapta.

Acest coeficient este foarte uor de calculat, ns ine cont doar de cteva valori valorile quartile i nu de toate valorile din distribuie, fapt care i limiteaz precizia i se consider c este doar un coeficient elementar al simetriei.Exemplu:

Pentru o distribuie s-au stabilit urmtoarele rezultate:

Q1= 150

Me= 130

Q3=140.

S se calculeze valoarea coeficientului de asimetrie Yule.

Rspuns. Coeficientul de asimetrie yule se calculeaz dup relaia:

Casq= = = = = -3

Q1= Me-Q1=130-150= -20

Q2=Q3-Me= 140-130= 10

Interpretare: Valoarea obinut, Casq= -3 3, curba este mai ascuit dect cea normal (distribuie leptocurtic). Dac 2 < 3, curba este mai turtit dect cea normal (dispoziie platicurtic).

Boltirea se mai poate msura i cu indicatorul: , care va avea valoarea zero dac distribuia este normal, valoare pozitiv pentru distribuie leptocurtic i valoare negativ pentru distribuie platicurtic.

Exemplu: Distribuia a 380 de firme dup numrul de zile de ateptare pn la realizarea fuzionrii este: Interval de variaie a numrului de zileNumr de firme

40-8050

80-12070

120-16090

160-200100

200-24050

240-28020

380

S se calculeze oblicitatea i excesul repartiiei.

Rezolvare:

a. Coeficientul Yule

Asimetria este negativ moderat.

(Oblicitatea cu ajutorul momentelor centrate de ordinul 3 )b. Boltirea

Curba este slab platicurtic (aplatizat) deoarece

Momentele de ordin r sunt valori ale caractersiticii urmrite care mpart distribuai observaiilor n r pri egale i au acelai efectiv 1/r din numrul unitilor .

Exemplu: mediana = quartila 2 = moment de ordin 2

quartila = quartila de ordin 4

IV.5. Alegei rspunsul corect1. Media aritmetic, ca indicator fundamental al tendinei centrale*:

a) reprezint valoarea care modific nivelul totalizator al seriei;

b) se folosete cel mai frecvent i reprezint suma valorilor raportat la numrul lor;

c) se calculeaz adunnd valorile existente;

d) nu poate determina numrul de uniti din colectivitate.

2. Media aritmetic reprezint*:

a) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar fi eterogen;b) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar fi omogen;c) valoarea pe care ar purta-o fiecare variabil statistic dac distribuia ar fi omogen.

3. Media aritmetic a unei sume dintre dou variabile este egal cu suma mediilor celor dou variabile, cnd*:

a) cele dou variabile se afl ntr-o relaie de interdependen;

b) cele dou variabile se afl ntr-o relaie de invers proporionalitate;

c) cele dou variabile se refer la aceeai colectivitate;

d) cele dou variabile sunt independente;

e) cele dou variabile sunt direct proporionale.

4. Care dintre urmtoarele afirmaii privind media aritmetic este adevrat*:

a) suma ptratelor tuturor abaterilor individuale ale termenilor seriei de la media lor aritmetic este zero;

b) mrimea mediei aritmetice este cuprins ntre xmin i xmax doar dac seria prezint o tendin clar de asimetrie;

c) pentru o serie de distribuie de frecvene, media aritmetic, calculat pe baza frecvenelor reduse de c ori, este mai mic dect media seriei iniiale de c ori;

d) media produsului a dou variabile aleatoare este egal cu produsul mediilor celor dou variabile;

e) pentru o serie de distribuie de frecvene, media calculat pe baza frecvenelor relative este egal cu media aritmetic determinat pe baza frecvenelor absolute.5. Mediana, ca indicator statistic:

a) prezint valoarea din mijlocul unei serii de date n care observaiile au fost ordonate cresctor sau descresctor;

b) nu poate fi folosit n caracterizarea tendinei centrale pentru o serie de date msurate pe o scal ordinal;

c) nu are nici o legatur cu noiunea de rang.

6. 25% din salariatii unei inteprinderii au un salariu de cel mult 4 milioane lei. Aceasta valoare reprezint:

a) quartila unu;

b) mediana; c) quartila trei.7. 75% din salariatii unei intreprinderii au un salariu de cel mult 7 milioane lei. Aceasta valoare reprezint:

a) quartila unu;

b) mediana; c) quartila trei. 8. 50% din salariatii unei ntreprinderii au un salariu de cel mult 5 milioane lei. Aceasta valoare reprezint:

a) quartila unu;

b) mediana; c) quartila trei.9. ntr-o repartiie normal valoarea fa de care 25% din valorile individuale sunt mai mici iar 25% din valorile individuale sunt mai mari este:

a. quartila a doua;

b. quartila a treia;

c. quartila nti;

d. valoarea modal.

10. Media este o mrime generalizat, adic, nlocuind fiecare nivel individual al caracteristicii de distribuie cu nivel mediu*:

a. suma termenilor seriei rmne aceeai;

b. suma termenilor seriei se modific;

c. suma termenilor seriei este nul.

11. Variana (dispersia) de grup msoar*:

a) variaia sub influena factorilor aleatori (variaia rezidual)

b) variaia sub influena factorilor eseniali

c) variaia sub influena factorilor aleatori i eseniali12. Dac dorim s obinem un indicator al tendinei centrale pentru date msurate pe orice scal, vom determina:

a) media aritmetic;

b) modul;

c) media geometric;

d) media ponderat.

13. Modul se afla dup relatia:

a) Mo = xi - hMo * ;b) Mo = xi + hMo * ;c) Mo = xi-1 + hMo

14. Care dintre urmtoarele variante nu reprezint un indicator al tendinei centrale?

a) mod;

b) distribuie de frecvene;

c) median;

d) medie;

e) medie ponderat.

15. Dac dorim s obinem un indicator al tendinei centrale care s nu fie afectat de valorile extreme, s poat fi calculat pentru date msurate pe orice scal (cu excepia celei nominale) i s aib o singur valoare, vom calcula*:

a) media aritmetic

b) modul;

c) media geometric;

d) mediana;

e) media ponderat.

16. Modul se utilizeaz pentru caracterizarea:

a. tendinei generale i gradului de asimetrie;

b. gradului de boltire;

c. gradului de concentrare.

17. Quartilele sunt mrimi de poziie care mpart colectivitatea n:

a. n-1 pri egale;

b. 4 pri egale;

c. 5 pri egale;

18. n distribuia de mai jos:

Interval0 - 55 - 1010 - 1515 - 20

ni371520

Intervalul (15 20) reprezint:

a. intervalul median;

b. intervalul modal;

c. intervalul quartilic.

19. Rolul indicatorilor tendintei centrale ai unei distributii statistice este de a*:

a) sintetiza datele

b) calcula marimile relative

c) aprecia gradul de dispersie al colectivitatii.

20. Asimetria se calculeaz dup relaia:

a) As=+Mo

b) As= 3(-Me)

c) As= 2(-Mo)

21. Coeficientul de asimetrie Yule, se calculeaz dup relaia:

a) Casq=

; unde: Q1= Me-Q1

Q2=Q3-Me

a) b) Casq=

b) c) Casq=

22. Coeficientul de boltire se calculeaz dup relaia:

a) 2=

c) 2=

b) 2=

23. O distribuie este mezocurtic atunci cnd:

a) 2 = 3, 2 = 0

b) 2 > 3, 2 >0

c) 2 < 3, 2 < 0

24. O distribuie este leptocurtic atunci cnd:

a) 2 = 3, 2 = 0

b) 2 > 3, 2 > 0

c) 2 < 3, 2 < 0

25. O distribuie este platicurtic atunci cnd:

a) 2 = 3, 2 = 0

b) 2 > 3, 2 >0

c) 2 < 3, 2 < 0

26. Abatarea medie liniar se calculeaz dup relaia:

a)

c)

b)

27. Coeficientul se utilizeaz pentru analiza statistic a:

a) asimetriei;

b) variaiei;

c) boltirii;

d) tendinei centrale;

e) indicatorilor medii de poziie.28. ntr-o serie de repartiie pe intervale format dup o anumit variabil, valoarea sa modal este influenat de(:

a) limitele inferioare i superioare ale intervalelor extreme;

b) de frecvenele de apariie ale intervalelor egale sau inegale; c) de mrimea egal sau inegal a intervalelor de variaie;

d) de limita inferioar a intervalului modal;

e) de limita inferioar, de frecvenele intervalului modal, premodal i postmodal;

IV.6. Probleme

1. Valoarea vnzrilor nregistrate de firma A pe parcursul a apte (7)

zile, se prezint astfel (n milioane lei) : 200, 250, 750, 1001, 1520, 1800, 2300.

S se calculeze valoarea medie zilnic a vnzrilor realizate de firma A.

2. Distribuia dup volumul vnzrilor zilnice (milioane lei) a unitilor comerciale dintr-un jude n luna Ianuarie 2004, se prezint astfel:

Volumul vnzrilor0 - 10

10 - 20 20 - 30 30 - 40

Numrul unitilor comerciale 50 20 10 5

- S se calculeze nivelul mediu al vnzrilor zilnice.

3. Se d urmtoarea distribuie:

Intervalni

10-155

15-2010

20-2512

25-306

30-358

35-404

S se calculeze modul.

4. O firm nregistreaz, ntr-o perioada de 5 zile, urmtoarele date privind volumul vnzrilor (milioane lei) : 5, 7, 20, 14, 9.

- s se afle valoarea medianei (locul medianei)

5. O firma nregistreaz, ntr-o perioad de 6 zile, urmtoarele date privind volumul vnzrilor (milioane lei) : 10, 40, 20, 15, 22, 35.

- s se afle valoarea medianei .

6. Distribuia familiilor dintr-un bloc dup numrul de copii se prezint astfel:

Numr copiiNumr familii (ni)

04

18

215

34

42

51

Total34

S se calculeze valoarea medianei.

7. . Distribuia muncitorilor unei firme dup timpul consumat pentru realizarea produsului A, se prezint astfel:

Timp necesar- 3030-6060-9090-120120-15150 -

Numr muncitori25506045155

S se calculeze valoarea medianei.8. Distribuia muncitorilor unei firme dup timpul consumat, pentru realizarea produsului A se prezint astfel:Timpul necesar

(minute)

x (i-1) ; x (i)Numr muncitori

NiXiF(ci)

0-30251525

30-60504575

60-906075135

90-12045105180

120-15015135195

150-1805165200

total200

Sa se calculeze valoarea quartelei unu.

9. Distribuia muncitorilor firmei A dup timpul consumat pentru realizarea produsuluiX se prezint astfel(:

Timp necesar- 3030-6060-9090-120120-15150 -

Numr muncitori25506045155

S se calculeze valoarea quartilei trei10. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n mil lei, n anul 2004, este prezentat astfel*:

Xi-1; Xi ni

176-17820

178-18025

180-18240

182-18435

184-18630

186-18810

Total160

S se calculeze abaterea medie liniar.11. Dac: Q1= 128,13 mil. lei

Me= 137,86 mil. lei

Q3= 147,92 mil. lei

Atunci, coeficientul de asimetrie Yule este egal cu:a) 141 i arat o distribuie simetric

b) 0, 016 i arat o distribuie moderat asimetric

c) 0,016 i arat o distribuie puternic asimetric.

12. Pentru o distribuie s-au stabilit urmtoarele rezultate:

Q1= 150

Me= 130

Q3=140.

S se calculeze valoarea coeficientului de asimetrie Yule.

13. Pentru o distribuie s-au obinut urmtoarele rezultate:

m4 = 40.000 ; m2 = 100.

S se calculeze valoarea coeficientului de boltire.14. Dac: m4 = 54059,44

m2 = 162,