curs statistica 1

40
Statistică Lect. univ. dr. Claudiu HERŢELIU http://www.hertz.ase.ro Duminica, 15 februarie 2009

Transcript of curs statistica 1

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 1/40

Statistică

Lect. univ. dr. Claudiu HERŢELIU

http://www.hertz.ase.ro

Duminica, 15 februarie 2009

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 2/40

Finalitate

Probă de verificare – Test 1: Vineri 20 martie 2009 (50% din nota finală);

 – Test 2: Duminică 5 aprilie 2009 (50% din nota finală);

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 3/40

Bibliografie

Orice manual/ tratat recomandat la secţiunea Bibliografie de pe site

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 4/40

Istoria statisticii în România

 În România, nu se poate vorbi despre o statistică organzată înainte desecolele XVIII-XIX.

 În aprilie 1859, Al. I. Cuza aprobă înfiinţarea unui birou de statistică înŢara Românească, sub conducerea lui Dionisie Pop Mar ţian.

 În luna iulie a aceluiaşi an, a Direcţiei de Statistică din Moldova, subconducerea lui Ion Ionescu de la Brad.

La 4 august 1859, cele două direcţii se reunesc sub denumireaOficiului Statistic pentru Principatele Unite având la conducere peDionisie Pop Mar ţian.

Pe scheletul acelei instituţii s-a constituit şi consolidat Instituţia

Statisticii Publice ce avea să poarte numele de Institutul Central deStatistică, Direcţia Centrală de Statistică, Comisia Naţională pentruStatistică sau Institutul Naţional de Statistică şi Studii Economice.

 În prezent denumirea este: Institutul Naţional de Statistică (http://www.insse.ro ).

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 5/40

Ce este statistica?

Conform DEX, Statistica are următoareleaccepţiuni:

 – Evidenţă numerică, situaţie cifrică referitoare ladiverse fenomene, numărotoare;

 – Culegere prelucrare şi valorificare a unor datelegate de fenomene generale;

 –   Ştiinţă care culege, sintetizează, descrie şi

interpretează date referitoare la fenomenegenerale.

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 6/40

Etapele cercetării statistice

1. Observarea statistică a fenomenuluistudiat

2. Prelucrarea şi modelarea datelorculese

3. Analiza şi interpretarea datelorculese

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 7/40

Elemente fundamentale

Obiectul de studiu al Statisticii îl reprezintă analizadatelor ce descriu comportamentul fenomenuluistudiat

Fenomenele studiate trebuie să fie bine localizate înspaţiu şi timp

Datele ce descriu fenomenul pot fi cantitative sau

calitative Rezultatele trebuie ancorate (validate) într-un

sistem teoretic 

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 8/40

Tipuri de metode statistice

Statistica descriptivă / analiza primar ă a

datelor statistice (clasificări, reprezentări

grafice, tendinţa centrală, analizadispersională)

Statistica inferenţială (extinderea

rezultatelor obţinute prin cercetări par ţiale,verificarea ipotezelor statistice, elemente deprognoză)

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 9/40

Noţiunile de bază a statisticii (1)

Unitatea statistică reprezintă elementul debază supus analizei statistice. Există unităţisimple (de ex.: persoane, obiecte etc.) şiunităţi complexe (de ex.: gospodăria).

Populaţia statistică este compusă dintr-omulţime finită de unităţi statistice.

Variabila (caracteristica) statistică este oaplicaţie definită pe populaţia studiată şi cuvalori într-o anumită mulţime.

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 10/40

Noţiunile de bază a statisticii (2)

Parametrul statistic este o ilustrare (deobicei cantitativă) a stării variabile statistice

Estimatorul este o funcţie statistică utilizată pentru aproximarea unui parametrunecunoscut la nivelul unei populaţii statistice

Eşantionul statistic o mulţime dedimensiuni reduse a unităţilor statistice dintr-o populaţie

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 11/40

Tipuri de variabile statistice

 În funcţie de natura mulţimii în care ia valori funcţiadefinită pe populaţia studiată există:

Variabile numerice (cantitative) şi nenumerice

(calitative)

Variabile discrete (mulţimea este una numărabilă)sau continue

Variabile binare/ alternative (mulţime cu două elemente) şi variabile cu mulţimi asociate compusedin mai mult de două elemente

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 12/40

Teoria scalării

Variabilele statistice pot fi măsurate pe patruscale de măsurare:

Scala nominală Scala ordinală

Scala de interval

Scala de raport

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 13/40

Metode de observare statistică

 În funcţie de periodicitate avem: observări curente şiperiodice

 În funcţie de volumul unităţilor statistice observateavem: cercet

ări exhaustive (de tip recens

ământ)

şi

cercetări selective (sondaje sau anchete statistice)  În funcţie de modalitatea de declanşare a

evenimentului avem: observări clasice şi observăriprovocate (proiectarea experimentelor)

 În funcţie de modul de administrare: observăridirecte şi observări indirecte (din surse publicateanterior: anuare, buletine, rapoarte etc.)

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 14/40

Prelucrarea primar ă a datelor

statistice

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 15/40

De ce prelucrare primar ă?

din considerente practice (prezentaresintetică, publicare, diseminare etc.)

pentru a studia pe baza graficelor ulterioare forma funcţiilor de repartiţie

pentru a “cur ăţa” datele de valorile

aberante sau de “non-r ăspunsuri”

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 16/40

Gruparea statistică

grupări simple – pe variante

după o variabilă calitativă – după o variabilă binar ă – după o variabilă polihotomică

după o variabilă cantitativă – după o variabilă binar ă – după o variabilă discretă cu un număr rezonabil de variante.

 – după un criteriu geografic – după criteriul cronologic

grupări combinate

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 17/40

Gruparea pe variante (1)

După o variabilă calitativă binar ă

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 18/40

Gruparea pe variante (2)

După o variabilă calitativă polihotomică

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 19/40

Gruparea pe variante (3)

După o variabilă cantitativă binar ă

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 20/40

Gruparea pe variante (4)

După o variabilă cantitativă discretă

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 21/40

Grupare după un criteriu geografic

Sursa de date:

 Anuarul statistic 2006,

pag. 24

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 22/40

Grupare după criteriul cronologic

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 23/40

Grupări combinate (1)

Tabele de contingenţă (bidimensionale)

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 24/40

Grupări combinate (2)

Tabele cu mai mult de două dimensiuni

Sursa de date:

 Anuarul statistic 2006,

pag. 56

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 25/40

Elemente necesare unui tabel statistic

Titlu sugestiv şi concis (cu precizarealocalizării în timp şi spaţiu)

Unităţi de măsur ă Sursa de date

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 26/40

Tipuri de reprezentări grafice a datelorprelucrate primar (1)

MBAC

10,00

9,75

9,50

9,25

9,00

8,75

8,50

8,25

8,00

7,75

7,50

7,25

7,00

6,75

6,50

6,25

6,00

5,75

5,50

1400

1200

1000

800

600

400

200

0

Std. Dev = ,80

Mean = 8,78

N = 8831,00

Histograma pentru o variabilă cantitativă continuă

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 27/40

Tipuri de reprezentări grafice a datelorprelucrate primar (2)

Sursa de date:

 Anuarul statistic 2006,

pag. 39

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 28/40

Tipuri de reprezentări grafice a datelorprelucrate primar (3)

ARAD 

CARAS- SEVERIN 

BIHOR 

HUNEDOARA

ALBA

CLUJ

GORJ

MEHEDINTI 

DOLJ

VALCEA

TELEORMAN

ARGES

DAMBOVITA

GIURGIU

SIBIU

BRASOV

PRAHOVA

BUCURESTI

COVASNA

BUZAU

CALARASI

IALOMITA

BRAILA

CONSTANTA 

TULCEA 

GALATI

VRANCEA

BACAU

VASLUI

IASI

NEAMT

HARGHITA

BOTOSANI

SUCEAVABISTRITA-

NASAUD

MARAMURES

MURES

SATU MARE

 

SALAJ

TIMIS

 

2005   sub 1%

1-3%

3-5%

5-10%

10% si peste

OLT

Sursa de date: Prelucr ări ale

informaţ iilor bazei de date a

admiterii ASE şi a informaţ iilor 

referitoare la examenele deBacalaureat 

Figura 1.3.2. Zonele de provenienţă (ca procent din total absolvenţ i)a candidaţ ilor la concursul de admitere al ASE 

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 29/40

Mărimi relative (MR)

Clasificare:

Mărimi relative de structur ă (MRS)

Mărimi relative de dinamică (MRD) Mărimi relative de coordonare (MRC)

Mărimi relative de intensitate (MRI)

Mărimi relative ale planului (MRP)

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 30/40

Reprezentarea grafică a MRS (1)

Diagrama prin cerc (plăcinta – “pie chart”)

Gradul de mulţumire a studenţilor ASE faţă de modul de desf ăşurare a practicii

20,8%42,9%

24,0%

11,0%

1,3%

Foarte multumit

Multumit

NemultumitFoarte nemultumit

Non-raspunsuri Sursa de date:  Ancheta I,chestionarul F1 – întrebarea 4

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 31/40

Reprezentarea grafică a MRS (2)

Diagrama prin dreptunghi

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 32/40

Indicatorii tendinţei centrale

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 33/40

Caracteristici ale indicatorului tendinţeicentrale ideal (Yule 1945)

Să fie definit în mod obiectiv

Să depindă de toate valorile individuale

Să aibă o semnificaţie concretă (uşor de înţeles chiar şi de către nespecialişti)

Să fie simplu şi rapid de calculat

Să fie puţin sensibil la fluctuaţiile de selecţie Să se preteze la calcule algebrice

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 34/40

Tipuri de indicatori ai tendinţei centrale

Mediile – Media aritmetică

caz particular (media variabilei de tip binar) – Media pătratică

 – Media geometrică – Media armonică – Media cronologică (se va discuta despre ea la capitolul Serii

cronologice)

Indicatorii medii de poziţie – Mediana – Valoarea modală

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 35/40

Media aritmetică

Se poate calcula doar pentru variabilecantitative

Se mai numeşte momentul de ordin 1 – pentru un şir simplu de valori

 – Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare

n

 x x

  i∑=

∑=

i

ii

n

n x x

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 36/40

Media variabilei de tip binar 

Distribuţia după culoarea ochilor unei populaţii de100 de persoane este:

Observaţie: orice variabilă se poate “binariza”

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 37/40

Media pătratică

Se mai numeşte momentul de ordin 2

 – pentru un şir simplu de valori

 –

Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare

∑=

i

ii

 pn

n x x

2

n

 x x

  i

 p

∑=

2

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 38/40

Media armonică

Se mai numeşte momentul de ordin -1

 – pentru un şir simplu de valori

 –

Pentru o serie de frecvenţe sau de date grupatepe intervale de grupare

∑=

i

i

i

h

n

 x

n x

1

∑=

i

h

 x

n x

1

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 39/40

Media geometrică

Se foloseşte pentru calculul unor medii în cazul mărimilorrelative de dinamică – pentru un şir simplu de valori

 – Pentru o serie de frecvenţe sau de date grupate pe intervale degrupare

Observaţie: MRD trebuie să fie exprimate sub formă de indici (nuritmuri) şi coeficienţi (nu procente)

nig   x x ∏=

∑=   ∏i   i

n   n

ig   x x

7/26/2019 curs statistica 1

http://slidepdf.com/reader/full/curs-statistica-1 40/40

Relaţia de ordine între cele patru tipuride medii

 pgh   x x x x   ≤≤≤