Distribuții Statistice (II)

38
Distribuții statistice (II)

description

nnn

Transcript of Distribuții Statistice (II)

Page 1: Distribuții Statistice (II)

Distribuții statistice (II)

Page 2: Distribuții Statistice (II)

Variabile aliatoare continui:

normală (standard /Gauss şi generală), uniformă, exponențială

Page 3: Distribuții Statistice (II)

Variabila aliatoare – reprezintă valorile numerice asociate unui element al spațiului de selecție (eveniment elimentar), atribuirea unui număr real.

O variabilă aleatoare este continuă atunci când variază în mod continuu într-un interval şi poate lua o mulţime nenumărabilă de valori. Deci, poate lua orice valoare fiind condiționată doar de acuratețea tehnicii de observare, măsurare.

Exemple: timp necesar pentru a finaliza o sarcină; temperatura într-o încăpere; Venituri din vinzări, etc.

Page 4: Distribuții Statistice (II)

Variabila aliatoare continuăLegea normală de distribuție

Forma unui clopot; Simetrică; Media, mediana și valoarea

modală sunt egale.

Tendința centrală este determinată de medie, E(X)=μ. Variația este definită de abaterea medie pătratică, Var(X)=σ. Variabila aliatoare continuă ia valori de la - .

X

f(X)

μ

σ

Page 5: Distribuții Statistice (II)

Distribuția normală

Pentru diferiți parametri μ și σ, v-om obține diferite reprezentări grafice a distribuțiilor normale.

Page 6: Distribuții Statistice (II)

Schimbarea lui μ mută distribuția în stânga sau în dreapta

X

f(X)

μ

σ

Distribuția normală

Schimbarea lui σ crește sau scade gradul de împrăștiere

Curba normală reprezintă grafic densitatea de probabilitate a repartiţiei normale.

Page 7: Distribuții Statistice (II)

Expresia analitică a densității de repartiție, în cazul unei distribuții normale cu parametrii şi , este:

unde:

e = constanta matematică aproximată ca 2.71828 = constanta matematică aproximată ca 3.14159 = media colectivității generale;

σ = abaterea media pătratică a colectivității generale;

x = valorile variabilei aliatoare.

Distribuția normală

𝒇 (𝒙 )= 𝟏𝝈√𝟐𝝅

𝒆−(𝒙−𝝁 )𝟐

𝟐𝝈𝟐

Page 8: Distribuții Statistice (II)

Legea normală redusăEste evident că există o gamă infinită de legi normale, care corespund câte unei perechi de parametri ( şi ). Toate aceste distribuţii normale se pot reduce la una singură, având media 0 şi abaterea standard 1, cu ajutorul unei schimbări de variabilă, numită standardizare.

Orice distribuție normală poate fi transformată într-o distribuție normală standardizată (Z), aplicând relația de calcul:

σ

μXZ

Page 9: Distribuții Statistice (II)

Legea normală redusă va avea densitatea de probabilitate definită de funcția:

2

2

Z

e2π

1f(Z)

Page 10: Distribuții Statistice (II)

Exemplu:

Variabila X este normal distribuită având media 100 și abatere medie pătratică 50, valoarea standardizată Z pentru un X=200 va fi:

Rezultatul dat ne spune că X=200 are două abateri standard (2 cu pasul 50) față de nivelul mediu.

2.050

100200

σ

μXZ

Page 11: Distribuții Statistice (II)

Compararea valorilor X și Z

De reținut, distribuția este aceiași, numai scara sa schimbat!

Putem exprima variabila în valori originale (X) sau în valori standardizate (Z).

Z100

2.00200 X (μ = 100, σ = 50)

(μ = 0, σ = 1)

Page 12: Distribuții Statistice (II)

Probabilitatea este măsurată prin aria de sub curbă:

)P a ≤

(

a b X

f(X) X b( ≤

P a X b)<<=

Page 13: Distribuții Statistice (II)

Aria totală de sub curbă este egală cu 1.

Fiind o distribuție simetrică față de medie, jumătate se va prezenta până la această valoare, jumătate peste.

Page 14: Distribuții Statistice (II)

Regula empiricăCe putem spune despre distribuția valorilor în jurul mediei?

Există câteva reguli generale:f(X)

Xμ μ+1σμ-1σ

σσ

68.26%

μ ± 1σ cuprinde aproximativ 68% din valorile variabilei X

Page 15: Distribuții Statistice (II)

Regula empirică μ ± 2σ cuprinde aproximativ 95% din

valorile variabilei X

μ ± 3σ cuprinde aproximativ 99.7% din valorile variabilei X

xμ2σ 2σ

95.44%

3σ 3σ

99.73%

Page 16: Distribuții Statistice (II)

Tabelul cu valorile repartiției normale standardizate (Funcția Gauss-Laplace)

.9772

P(Z < 2,00) = 0,9772

Z 0.00 0.01 0.02 …

0.00.1

Valorile din capătul coloanelor prezintă al doilea punct zecimal al valorii Z

Valorile din capătul liniilor prezintă primul punct zecimal al valorii Z

Valoarea din tabel prezintă probabilitatea până la valoarea Z

Page 17: Distribuții Statistice (II)

Procedura de găsire a probabilității

Pentru a găsi P (a <X <b) atunci când X este distribuit în mod normal:

trasați curba normală; transformați valorile X în valori Z;utilizați tabelului teoretic al valorilor standardizate

normale pentru identificarea probabilității.

Page 18: Distribuții Statistice (II)

Găsirea probabilității:

presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;

care va fi P(X < 8,6)?

X

8,6

8,0

Page 19: Distribuții Statistice (II)

Standardizăm valoarea caracteristicii X (calculăm z):

0,125,0

8,08,6

σ

μXZ

X8,68,0

z0,120

μ = 8

σ = 10

μ = 0

σ = 1

P(X < 8,6) P(Z < 0,12)

Page 20: Distribuții Statistice (II)

Soluție: P(Z < 0,12)Tabelul valorilor standardizate (secvență)

:

z0,120

,5478

= P(Z < 0,12)P(X < 8,6)

Z .01

0.0 .5000 .5040 .5080

.5398 .5438

0.2 .5793 .5832 .5871

0.3 .6179 .6217 .6255

.02

0.1 .5478

0.0

Page 21: Distribuții Statistice (II)

Calculul probabilității, zona de maxim

presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;

care va fi P(X > 8,6)?

X

8,6

8,0

Page 22: Distribuții Statistice (II)

Calculul probabilității, zona de maxim

Găsim P(X > 8,6)… P(X > 8,6) = P(Z > 0,12) = 1,0 - P(Z ≤ 0,12) = 1,0 – 0,5478 = 0.4522

0,4522

Z

0,12

0

1,000

Z

0,12

0

0,54781,0 – 0,5478 = 0,4522

Page 23: Distribuții Statistice (II)

Calculul probabilității între două valori

presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;

care va fi P(8<X< 8,6)?Calculăm valorile Z:

05

88

σ

μX1

Z

0,125

88,6

σ

μXZ2

Z0,12 0

X8,6 8

P(8 < X < 8,6)= P(0 < Z < 0,12)

Page 24: Distribuții Statistice (II)

Soluție: P(0< Z < 0,12)

Tabelul valorilor standardizate (secvență)

Z .01

0.0 .5000 .5040 .5080

.5398 .5438

0.2 .5793 .5832 .5871

0.3 .6179 .6217 .6255

.02

0.1 .5478

0.0 = P(0 < Z < 0.12)P(8 < X < 8.6)

= P(Z < 0.12) – P(Z ≤ 0) = 0.5478 - .5000 = 0.04780.0478

Z0.12

0.0478

0.00

0.5000

Page 25: Distribuții Statistice (II)

Calculul probabilității, zona de minim

presupunem că X este normal distribuit de medie = 8,0 și abatere medie pătratică =5,0;

care va fi P(7,4<X< 8)?

X

7.48.0

Page 26: Distribuții Statistice (II)

Calculul probabilității, zona de minim Găsim P(7,4<X <8)…P(7,4 < X < 8) = P(-0,12 < Z < 0)= P(Z < 0) – P(Z ≤ -0,12)= 0,5000 – 0,4522 = 0,0478

Distribuția normală este simetrică astfel probabilitatea este aceiași ca și în cazul când se determină

P(0 < Z < 0.12)

Page 27: Distribuții Statistice (II)

Evaluarea normalității distribuției

Nu toate variabilele aliatoare continui sunt normal distribuite astfel este important de a evalua dacă setul de date este distribuit aproximativ normal.

Cum? prin prisma prezentării grafice:

pentru seturi de date mici, graficul stem-and-leaf, se prezintă aproape simetric;

pentru seturi de date mari, histograma&poligonul frecvențelor au forma de clopot.

Page 28: Distribuții Statistice (II)

prin prisma statisticilor descriptive: valoarea medie, mediană, modală sunt egale; amplitudinea intercuartilică (Q3-Q1) este aproximativ 1,33σ; Amplitudinea absolută este aproximativ 6σ.

o observând modul de distribuție a setului de date: sunt cca 2/3 din observații cuprinse în limitele intervalului definit

de medie 1 abatere medie pătratică? sunt cca 80% din observații cuprinse în limitele intervalului definit

de medie 1,28 abateri medii pătratice? sunt cca 95% din observații cuprinse în limitele intervalului definit

de medie 2 abateri medii pătratice?o în baza graficului de probabilitate:

graficul de probabilitate construit între valorile variabilei X și valorile standarde Z corespondente ale acestora va fi aproximativ liniar.

Page 29: Distribuții Statistice (II)

Graficul probabilității normale

30

60

90

-2 -1 0 1 2 Z

X

Page 30: Distribuții Statistice (II)

Graficul probabilității normale

Forma non-liniară a graficului indică deviație de la normalitate

Asimetrie de stînga Asimetrie de dreapta

Rectangular

30

60

90

-2 -1 0 1 2 Z

X

30

60

90

-2 -1 0 1 2 Z

X

30

60

90

-2 -1 0 1 2 Z

X

Page 31: Distribuții Statistice (II)

Variabila aliatoare continuă uniformă

Distribuția uniformă este o distribuție de probabilitate care are probabilități egale pentru toate rezultatele posibile ale variabilei aleatoare. De asemenea, se mai numește distribuție rectangulară.

Page 32: Distribuții Statistice (II)

Variabila aliatoare continuă uniformă

Expresia analitică a densității de repartiție, în cazul unei distribuții uniforme este:

unde:

f(x) = valorile funcției de densitate pentru oricare X;

a = valoarea minimă a lui X;

b = valoarea maximă a lui X.

cazuri alte 0

bXa dacăab

1

f(X) =

Page 33: Distribuții Statistice (II)

Proprietățile distribuției uniforme

Valoarea medie se va determina după relația:

Abaterea medie pătratică se va calcula după formula:

2

baμ

12

a)-(bσ

2

Page 34: Distribuții Statistice (II)

Distribuție uniformă

Exemplu: Fie este cunoscut că variabila X este uniform distribuită și ia valori între 2 ≤ X ≤ 6,astfel:

2 6

0.25

X

f(X)

42

62

2

baμ

1547.112

2)-(6

12

a)-(bσ

22

Page 35: Distribuții Statistice (II)

Distribuție uniformă

Exemplu: Utilizând distribuția de probabilitate uniformă definită în slid-ul precedent, calculăm P(3 ≤ X ≤ 5):

P(3 ≤ X ≤ 5) = (lungimea)(înălțimea) = (2)(0.25) = 0.5

2 6

0.25

X

f(X)

3 54

Page 36: Distribuții Statistice (II)

Distribuția exponențială

Distribuția exponențială se folosește pentru a modela intervalul de timp dintre două apariții ale unui eveniment (timpul scurs între sosiri).

Exemple: timpul între tranzacții de la un bancomat; timpul între apelurile telefonice la serviciul de urgență,

etc.

Page 37: Distribuții Statistice (II)

Distribuția exponențială

este definită doar în baza unui parametru:

media notată prin λ (lambda)

probabilitatea că momentul sosirii este mai mic decât timpul specificat X se va calcula după relația:

unde:

e = 2.71828;

λ = numărul mediu de sosiri per unitate timp;

X = valoarea variabilei aliatoare în diapazonul 0 < X <

Xe1X)sosirii P(momentul λ

Page 38: Distribuții Statistice (II)

Distribuția exponențială

Exemplu:

Se cunoaște că pe parcursul unei ore sunt deserviți cca 15 clienți de către angajații ghișeului de documentare a populației. Care este probabilitatea că timpul de sosire între clienții ce au fost deserviți consecutiv este mai puțin de 3 minute?

media clienților deserviți per oră este 15, astfel λ = 15

3 minute constituie 0,05 ore

P(timpul de sosire < .05) = 1 – e-λX = 1 – e-(15)(0.05) = 0.5276

Astfel, cu o probabilitate de 52,76% putem afirma că între clienții deserviți consecutiv este mai puțin de 3 minute.