MA Curs 1 Statistic 1
STATISTIC
Statistica se ocup cu colectarea, prelucrarea i interpretarea datelor.
- Statistica descriptiv - culegerea i nregistrarea datelor asupra unui fenomen
- Statistica matematic gruparea, analizarea i interpretarea datelor n vederea elaborrii
unor previziuni privind evoluia viitoare a fenomenului.
Aplicaii.
- Fizic, inginerie, biologie, psihologie, economie, sociologie
- Monitorizarea proceselor industriale
- Teoria fiabilitii
- Risc i prognoz
Definiii.
- populaie statistic = orice mulime care formeaz obiectul unei analize statistice (mulimea
studenilor dintr-o serie , populaia unei ri sau a unui ora, o mulime de piese).
- volumul populaiei statistice = numrul elementelor mulimii.
- unitate statistic = un element din populaie ( un student, un locuitor, o pies)
- caracteristic = o trstur comun tuturor unitilor unei populaii care ne intereseaz n
cadrul analizei statistice ( nota la un examen , vrsta , diametrul piesei, nr ore de funcionare ).
- selecie = alegerea la ntmplare a unor uniti statistice dintr-o populaie statistic i cercetarea
lor din punct de vedere al caracteristicii. Selecia poate fi cu sau fr ntoarcere.
- volumul seleciei = numrul elementelor seleciei
Analiza se poate face dup una sau mai multe caracteristici (ex: gruparea unor indivizi dup vrst i
dup venit). O caracteristic poate fi
o cantitativ, dac se poate msura
o calitativ, n caz contrar (mult, puin, bun,ru)
- variabila statistic = valoarea numeric a unei caracteristici cantitative. Ea poate fi
- discret dac ia un numr finit de valori sau
- continu dac poate lua orice valoare dintr-un interval.
Selecia poate fi total (n cazul unui recensmnt) sau parial. n practic, pentru a studia o
anumit caracteristic a unei populaii statistice nu se examineaz toat populaia, ci numai un numr
finit de uniti statistice. Se presupune c rezultatele obinute sunt caracteristice pentru toat populaia.
Metodele de a alege un eantion reprezentativ nu fac obiectul acestui curs.
Tipuri de probleme practice
1. Se verific 200 de microcircuite dintr-un lot mai mare. Se gsesc 3 defecte. Putem afirma cu
probabilitate 95% c 99% dintre microcircuite sunt bune?
2. O firm produce un tip de piese. Probabilitatea s se produc o defectare n timpul primelor
1000 de ore de funcionare este 0,02. Prin aplicarea unei tehnologii mbuntite s-au produs 20
MA Curs 1 Statistic 2
de piese care au fost urmrite timp de 1000 de ore i s-a notat numrul defectrilor. Putem
spune c se produc piese mai fiabile? Cu ce probabilitate?
Pentru a rezolva probleme practice procedm n modul urmtor:
- stabilim populaia statistic;
- stabilim caracteristica (caracteristicile) : cantitativ sau calitativ;
- realizm o selecie de volum n, adic studiem n uniti statistice i obinem un ir de valori
n21 x,...,x,x ;
- analizm aceste valori: le reprezentm grafic, calculm indicatori statistici;
- modelm fenomenul fizic printr-unul teoretic: pe baza observaiilor statistica matematic ofer
metode pentru a stabili care variabil aleatoare teoretic X se poate asocia fenomenului studiat.
Aceast variabil aleatoare (sau repartiie) teoretic are o lege de repartiie (dat de repartiia
probabilitilor sau de densitatea de repartiie) ce depinde de unul sau mai muli parametrii;
- statistica matematic ofer metode pentru a estima (a aproxima) parametrii i pentru a verifica
ipotezele fcute;
- interpretm rezultatele, eventual realizm predicii.
1. Elemente de statistica descriptiv
Gruparea datelor
Presupunem c n urma a n observaii independente realizate n condiii identice s-a obinut un ir de
valori. Acestea se ordoneaz i se aeaz ntr-un tablou.
Exemplul 1. S presupunem c s-a msurat o mrime fizic pentru 20 de piese alese la ntmplare
dintr-o mulime mai mare i s-a obinut urmtorul ir statistic simplu 33 32 35 34 37 35 36 37 34 36
33 37 33 35 36 35 35 34 37 33. Se observ c unele valori se repet, deci putem alctui
urmtorul tablou:
X 32 33 34 35 36 37
nr apariii 1 4 3 5 3 4
Reprezentarea variabilelor statistice discrete
Printr-un tablou
X 1x 2x kx
Frecvene absolute 1
2
k
Frecvene relative n
1
n
2
n
k
MA Curs 1 Statistic 3
Frecvene absolute
cumulate 1
1 2
k21
...
Frecvene relative
cumulate n
1
n
1
n
2
n
...nn
k21
n care jx , k,1j sunt valorile distincte , n este volumul seleciei , j este frecvena absolut a
valorii jx , adic numrul de apariii, k21 ...n , iar n/j este frecvena relativ.
Prin bastoane
Observaie. Tabelul
n...
nn
x...xx
k21
k21
este asemntor cu o variabil aleatoare
k21
k21
p...pp
x...xx:X .
Indicatori statistici
1. Media de selecie
Pentru variabil statistic discret
k
1j
jj
not
xn
1X , k este numrul valorilor distincte
2. Mediana - mparte irul ordonat n dou pri egale ca numr.
Pentru variabil statistic discret
dac 1p2n atunci 1pxMe ( valoarea din mijloc)
- dac p2n atunci 2
xxMe
1pp
3. Modul
pentru o variabil statistic discret este valoarea cu frecven maxim;
4. Amplitudinea absolut a unei serii statistice este minmax xxA .
5. Dispersia 2k
1j
j
2
j
k
1j
j
2
j Xxn
1Xx
n
1XD
, unde k este numrul valorilor distincte.
6. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei) D
O
y
x 1x kx
1
MA Curs 1 Statistic 4
7. Coeficientul de variaie X
V
.
Exemplul 1. Relum exemplul de la pagina 1. S se reprezinte datele ntr-un tablou i s se calculeze
indicatorii statistici.
Rezolvare.
X 32 33 34 35 36 37( )
N1
20
4
20
3
20
5
20
3
20
4
20
32 33 34 35 36 37
0.1
0.2
N
X
- Media este 85,3420
697
20
437336535334433132X
- Mediana 2
xxMe 1kk
, unde 10
2
nk . Considernd irul ordonat al valorilor avem
35x10 , 35x11 35Me .
- Amplitudinea absolut este 103242A .
- Dispersia este
X 32 33 34 35 36 37
Frecvene
absolute 1 4 3 5 3 4 20
Frecvene
relative 20
1
20
4
20
3
20
5
20
3
20
4 1
Frecvene
absolute
cumulate
1 5 8 13 16 20
Frecvene
relative
cumulate 20
1
20
5
20
8
20
13
20
16 1
MA Curs 1 Statistic 5
328,2X20
437...334433132D 2
2222
- Abaterea medie ptratic 526,1D
- coeficientul de variaie 043,0X
V
Pentru a calcula indicatorii statistici cu programul Mathcad
Metoda 1. Introducem vectorul Z ce conine toate valorile:
Z 32 33 33 33 33 34 34 34 35 35 35 35 35 36 36 36 37 37 37 37( )
media este mean Z( ) 34.85 mediana este median Z( ) 35
dispersia var Z( ) 2.328
abaterea medie patratica stdev Z( ) 1.526
1 3.322 log 20( ) 5.322 histogram 5 Z( )
32.5
33.5
34.5
35.5
36.5
1
4
8
3
4
Metoda 2.
X
32
33
34
35
36
37
N
1
20
4
20
3
20
5
20
3
20
4
20
media este m mean X N( ) m 34.85
dispersia este mean X2
N m2 2.327
abaterea medie patratica este 2.327 1.525
Dac numrul datelor e foarte mare se realizeaz o grupare pe intervale. Se consider cea mai
mic i cea mai mare valoare ce determin un interval 1k1 x,x ce se mparte ntr-un numr de
subintervale 21 x,x , 32 x,x ,, 1kk x,x . Lungimile intervalelor se pot calcula cu formula lui
Sturges
MA Curs 1 Statistic 6
nlg322,31
xx minmax
numrul intervalelor fiind nlg322,31 .
Observaie. Dac avem un ir mare de date pe care dorim s le grupm n intervale cu ajutorul
programului Mathcad folosim funcia histogram(n,X), n care n este numrul intervalelor, iar X este
vectorul ce conine datele. Funcia returneaz o matrice n care prima coloan reprezint mijloacele
intervalelor, iar a doua coloan frecvenele absolute corespunztoare fiecrui interval.
Reprezentarea variabilelor statistice continue
Printr-un tablou
X 21 x,x 32 x,x 1kk x,x
Frecvene absolute 1
2
k
Frecvene relative n
1
n
2
n
k
Frecvene absolute
cumulate 1
1 2
k21
...
Frecvene relative
cumulate n
1
n
1
n
2
n
...nn
k21
Prin histogram: lum pe axa orizontal segmente de lungimi egale ce reprezint amplitudinea
claselor i construim pe aceste segmente dreptunghiuri cu nlimi proporionale cu frecvenele
absolute sau relative. Dac din mijlocul fiecrui segment de pe axa orizontal ridicm
segmente proporionale cu frecvenele i unim printr-o linie poligonal aceste puncte obinem
poligonul frecvenelor.
Indicatori statistici
1. Media de selecie
MA Curs 1 Statistic 7
Pentru variabil statistic continu
k
1j
j
*
j
not
xn
1X , unde k este numrul intervalelor, iar *jx
sunt mijloacele intervalelor.
2. Modul - pentru o variabil statistic continu este o valoare din intervalul cu frecven maxim
3. Amplitudinea absolut a unei serii statistice este minmax xxA .
4. Dispersia
Pentru variabil aleatoare continu 2k
1j
j
2*
j
k
1j
j
2*
j Xxn
1Xx
n
1XD
, unde k
este numrul intervalelor, iar *
jx sunt mijloacele intervalelor.
5. Abaterea medie ptratic (indic gradul de mprtiere a valorilor n jurul mediei)
D
6. Coeficientul de variaie X
V
.
Exemplul 2. Relum exemplul de la pagina 1. S se mpart datele n intervale, s se reprezinte grafic i
s se calculeze indicatorii statistici.
Rezolvare. Numrul intervalelor este 5)20log(322,31 iar lungimea unui interval
1)20log(322.31
3237
. Reprezentm datele ntr-un tabel
X [32,33) [33,34) [34,35) [35,36) [36,37]
Frecvene
absolute 1 4 3 5 7
Frecvene
relative 20
1
20
4
20
3
20
5
20
7
Frecvene
absolute
cumulate
1 5 8 13 20
Frecvene
relative
cumulate 20
1
20
5
20
8
20
13 1
*
jx 32,5 33,5 34,5 35,5 36,5
MA Curs 1 Statistic 8
33 34 35 36 37
[32,33) 1
[33,34) 4
[34,35) 3
[35,36) 5
[36,37) 7
0
1
2
3
4
5
6
7
8
fre
cve
nte
valori
Histograma
[32,33)
[33,34)
[34,35)
[35,36)
[36,37)
Pentru calculul indicatorilor statistici alctuim urmtorul tabel:
intervale
[32,33) 32.5 1 32.5 7.0225
[33,34) 33.5 4 134 10.89
[34,35) 34.5 3 103.5 1.2675
[35,36) 35.5 5 177.5 0.6125
[36,37] 36.5 7 255.5 12.7575
20 703 32.55
media 35.15 abaterea 1.276
dispersia 1.628
j2*
j Xx j*
jx *
jx j
- Media de selecie este 15,3520
703x
20
1X
5
1j
j
*
j
, unde *
jx sunt mijloacele intervalelor
- dispersia 628,120
55,32Xx
20
1D
5
1j
j
2*
j
- abaterea medie ptratic 276,1D
- coeficientul de variaie 036,0X
V
.
Se observ c rezultatele difer uor n cele dou cazuri. Calculele se pot face n Excel sau
Mathcad.
Top Related