CUPRINS II. Date statistice cu referire la elevii institu ...
Distribuții Statistice (II)
-
Upload
magdalena-sviriniuc -
Category
Documents
-
view
33 -
download
0
description
Transcript of Distribuții Statistice (II)
Distribuții statistice (II)
Variabile aliatoare continui:
normală (standard /Gauss şi generală), uniformă, exponențială
Variabila aliatoare – reprezintă valorile numerice asociate unui element al spațiului de selecție (eveniment elimentar), atribuirea unui număr real.
O variabilă aleatoare este continuă atunci când variază în mod continuu într-un interval şi poate lua o mulţime nenumărabilă de valori. Deci, poate lua orice valoare fiind condiționată doar de acuratețea tehnicii de observare, măsurare.
Exemple: timp necesar pentru a finaliza o sarcină; temperatura într-o încăpere; Venituri din vinzări, etc.
Variabila aliatoare continuăLegea normală de distribuție
Forma unui clopot; Simetrică; Media, mediana și valoarea
modală sunt egale.
Tendința centrală este determinată de medie, E(X)=μ. Variația este definită de abaterea medie pătratică, Var(X)=σ. Variabila aliatoare continuă ia valori de la - .
X
f(X)
μ
σ
Distribuția normală
Pentru diferiți parametri μ și σ, v-om obține diferite reprezentări grafice a distribuțiilor normale.
Schimbarea lui μ mută distribuția în stânga sau în dreapta
X
f(X)
μ
σ
Distribuția normală
Schimbarea lui σ crește sau scade gradul de împrăștiere
Curba normală reprezintă grafic densitatea de probabilitate a repartiţiei normale.
Expresia analitică a densității de repartiție, în cazul unei distribuții normale cu parametrii şi , este:
unde:
e = constanta matematică aproximată ca 2.71828 = constanta matematică aproximată ca 3.14159 = media colectivității generale;
σ = abaterea media pătratică a colectivității generale;
x = valorile variabilei aliatoare.
Distribuția normală
𝒇 (𝒙 )= 𝟏𝝈√𝟐𝝅
𝒆−(𝒙−𝝁 )𝟐
𝟐𝝈𝟐
Legea normală redusăEste evident că există o gamă infinită de legi normale, care corespund câte unei perechi de parametri ( şi ). Toate aceste distribuţii normale se pot reduce la una singură, având media 0 şi abaterea standard 1, cu ajutorul unei schimbări de variabilă, numită standardizare.
Orice distribuție normală poate fi transformată într-o distribuție normală standardizată (Z), aplicând relația de calcul:
σ
μXZ
Legea normală redusă va avea densitatea de probabilitate definită de funcția:
2
2
Z
e2π
1f(Z)
Exemplu:
Variabila X este normal distribuită având media 100 și abatere medie pătratică 50, valoarea standardizată Z pentru un X=200 va fi:
Rezultatul dat ne spune că X=200 are două abateri standard (2 cu pasul 50) față de nivelul mediu.
2.050
100200
σ
μXZ
Compararea valorilor X și Z
De reținut, distribuția este aceiași, numai scara sa schimbat!
Putem exprima variabila în valori originale (X) sau în valori standardizate (Z).
Z100
2.00200 X (μ = 100, σ = 50)
(μ = 0, σ = 1)
Probabilitatea este măsurată prin aria de sub curbă:
)P a ≤
(
a b X
f(X) X b( ≤
P a X b)<<=
Aria totală de sub curbă este egală cu 1.
Fiind o distribuție simetrică față de medie, jumătate se va prezenta până la această valoare, jumătate peste.
Regula empiricăCe putem spune despre distribuția valorilor în jurul mediei?
Există câteva reguli generale:f(X)
Xμ μ+1σμ-1σ
σσ
68.26%
μ ± 1σ cuprinde aproximativ 68% din valorile variabilei X
Regula empirică μ ± 2σ cuprinde aproximativ 95% din
valorile variabilei X
μ ± 3σ cuprinde aproximativ 99.7% din valorile variabilei X
xμ2σ 2σ
95.44%
xμ
3σ 3σ
99.73%
Tabelul cu valorile repartiției normale standardizate (Funcția Gauss-Laplace)
.9772
P(Z < 2,00) = 0,9772
Z 0.00 0.01 0.02 …
0.00.1
Valorile din capătul coloanelor prezintă al doilea punct zecimal al valorii Z
Valorile din capătul liniilor prezintă primul punct zecimal al valorii Z
Valoarea din tabel prezintă probabilitatea până la valoarea Z
Procedura de găsire a probabilității
Pentru a găsi P (a <X <b) atunci când X este distribuit în mod normal:
trasați curba normală; transformați valorile X în valori Z;utilizați tabelului teoretic al valorilor standardizate
normale pentru identificarea probabilității.
Găsirea probabilității:
presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;
care va fi P(X < 8,6)?
X
8,6
8,0
Standardizăm valoarea caracteristicii X (calculăm z):
0,125,0
8,08,6
σ
μXZ
X8,68,0
z0,120
μ = 8
σ = 10
μ = 0
σ = 1
P(X < 8,6) P(Z < 0,12)
Soluție: P(Z < 0,12)Tabelul valorilor standardizate (secvență)
:
z0,120
,5478
= P(Z < 0,12)P(X < 8,6)
Z .01
0.0 .5000 .5040 .5080
.5398 .5438
0.2 .5793 .5832 .5871
0.3 .6179 .6217 .6255
.02
0.1 .5478
0.0
Calculul probabilității, zona de maxim
presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;
care va fi P(X > 8,6)?
X
8,6
8,0
Calculul probabilității, zona de maxim
Găsim P(X > 8,6)… P(X > 8,6) = P(Z > 0,12) = 1,0 - P(Z ≤ 0,12) = 1,0 – 0,5478 = 0.4522
0,4522
Z
0,12
0
1,000
Z
0,12
0
0,54781,0 – 0,5478 = 0,4522
Calculul probabilității între două valori
presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;
care va fi P(8<X< 8,6)?Calculăm valorile Z:
05
88
σ
μX1
Z
0,125
88,6
σ
μXZ2
Z0,12 0
X8,6 8
P(8 < X < 8,6)= P(0 < Z < 0,12)
Soluție: P(0< Z < 0,12)
Tabelul valorilor standardizate (secvență)
Z .01
0.0 .5000 .5040 .5080
.5398 .5438
0.2 .5793 .5832 .5871
0.3 .6179 .6217 .6255
.02
0.1 .5478
0.0 = P(0 < Z < 0.12)P(8 < X < 8.6)
= P(Z < 0.12) – P(Z ≤ 0) = 0.5478 - .5000 = 0.04780.0478
Z0.12
0.0478
0.00
0.5000
Calculul probabilității, zona de minim
presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;
care va fi P(7,4<X< 8)?
X
7.48.0
Calculul probabilității, zona de minim Găsim P(7,4<X <8)…P(7,4 < X < 8) = P(-0,12 < Z < 0)= P(Z < 0) – P(Z ≤ -0,12)= 0,5000 – 0,4522 = 0,0478
Distribuția normală este simetrică astfel probabilitatea este aceiași ca și în cazul când se determină
P(0 < Z < 0.12)
Evaluarea normalității distribuției
Nu toate variabilele aliatoare continui sunt normal distribuite astfel este important de a evalua dacă setul de date este distribuit aproximativ normal.
Cum? prin prisma prezentării grafice:
pentru seturi de date mici, graficul stem-and-leaf, se prezintă aproape simetric;
pentru seturi de date mari, histograma&poligonul frecvențelor au forma de clopot.
prin prisma statisticilor descriptive: valoarea medie, mediană, modală sunt egale; amplitudinea intercuartilică (Q3-Q1) este aproximativ 1,33σ; Amplitudinea absolută este aproximativ 6σ.
o observând modul de distribuție a setului de date: sunt cca 2/3 din observații cuprinse în limitele intervalului definit
de medie 1 abatere medie pătratică? sunt cca 80% din observații cuprinse în limitele intervalului definit
de medie 1,28 abateri medii pătratice? sunt cca 95% din observații cuprinse în limitele intervalului definit
de medie 2 abateri medii pătratice?o în baza graficului de probabilitate:
graficul de probabilitate construit între valorile variabilei X și valorile standarde Z corespondente ale acestora va fi aproximativ liniar.
Graficul probabilității normale
30
60
90
-2 -1 0 1 2 Z
X
Graficul probabilității normale
Forma non-liniară a graficului indică deviație de la normalitate
Asimetrie de stînga Asimetrie de dreapta
Rectangular
30
60
90
-2 -1 0 1 2 Z
X
30
60
90
-2 -1 0 1 2 Z
X
30
60
90
-2 -1 0 1 2 Z
X
Variabila aliatoare continuă uniformă
Distribuția uniformă este o distribuție de probabilitate care are probabilități egale pentru toate rezultatele posibile ale variabilei aleatoare. De asemenea, se mai numește distribuție rectangulară.
Variabila aliatoare continuă uniformă
Expresia analitică a densității de repartiție, în cazul unei distribuții uniforme este:
unde:
f(x) = valorile funcției de densitate pentru oricare X;
a = valoarea minimă a lui X;
b = valoarea maximă a lui X.
cazuri alte 0
bXa dacăab
1
f(X) =
Proprietățile distribuției uniforme
Valoarea medie se va determina după relația:
Abaterea medie pătratică se va calcula după formula:
2
baμ
12
a)-(bσ
2
Distribuție uniformă
Exemplu: Fie este cunoscut că variabila X este uniform distribuită și ia valori între 2 ≤ X ≤ 6,astfel:
2 6
0.25
X
f(X)
42
62
2
baμ
1547.112
2)-(6
12
a)-(bσ
22
Distribuție uniformă
Exemplu: Utilizând distribuția de probabilitate uniformă definită în slid-ul precedent, calculăm P(3 ≤ X ≤ 5):
P(3 ≤ X ≤ 5) = (lungimea)(înălțimea) = (2)(0.25) = 0.5
2 6
0.25
X
f(X)
3 54
Distribuția exponențială
Distribuția exponențială se folosește pentru a modela intervalul de timp dintre două apariții ale unui eveniment (timpul scurs între sosiri).
Exemple: timpul între tranzacții de la un bancomat; timpul între apelurile telefonice la serviciul de urgență,
etc.
Distribuția exponențială
este definită doar în baza unui parametru:
media notată prin λ (lambda)
probabilitatea că momentul sosirii este mai mic decât timpul specificat X se va calcula după relația:
unde:
e = 2.71828;
λ = numărul mediu de sosiri per unitate timp;
X = valoarea variabilei aliatoare în diapazonul 0 < X <
Xe1X)sosirii P(momentul λ
Distribuția exponențială
Exemplu:
Se cunoaște că pe parcursul unei ore sunt deserviți cca 15 clienți de către angajații ghișeului de documentare a populației. Care este probabilitatea că timpul de sosire între clienții ce au fost deserviți consecutiv este mai puțin de 3 minute?
media clienților deserviți per oră este 15, astfel λ = 15
3 minute constituie 0,05 ore
P(timpul de sosire < .05) = 1 – e-λX = 1 – e-(15)(0.05) = 0.5276
Astfel, cu o probabilitate de 52,76% putem afirma că între clienții deserviți consecutiv este mai puțin de 3 minute.