Post on 02-Nov-2021
โStiinta se cladeste cu fapte, asa cum o casa se construieste cu pietre.Dar o colectie de fapte nu e stiinta, la fel cum un morman de pietrenu e o casa.โ
Henri Poincare
9Variabile aleatoare continue
Sistemul Elo de calculare a ratingului
In jocurile cu suma nula, de exemplu sah, poker, fotbal, apare nevoia dea cuantifica performanta, de a masura nivelul relativ al abilitatilor jucato-rilor/echipelor. Din aceasta cauza s-a ajuns la ideea unui sistem de coeficientipentru a putea realiza o ierarhizare mondiala sau pentru a putea indica nivelulrelativ de performanta atins.
In sah, maestrul Arpad Elo, in dorinta de a realiza un astfel de sistem, apornit de la urmatoarele presupuneri
1. Performanta este o variabila aleatoare2. Performanta medie a unui jucator se modifica greu3. Rezultatul anticipat in fiecare joc are o distributie normala
1
Prin urmare, acesta a propus prin anii โ60 un sistem care se baza pe odistributie normala a rezultatelor anticipate. Ulterior federatia americana desah (USCF) si cea internationala (FIDE) au argumentat ca datele culese dinistoria jocului sugereaza ca performanta in sah este mai bine modelata de odistributie logistica.
Sistemul propus a primit numele de sistem Elo si in prezent asigura creareade ierarhii in: sah, baschet, fotbal, fotbal american, chiar si e-sports. In par-ticular in sah, puterea unui jucator este estimata pe o scara de la 1200 (noviciisunt sub 1200) pana la un maxim, atins de actualul campion mondial MagnusCarlsen, de 2882. Ca un punct de referinta, cel mai bun jucator roman al ul-timelor decenii Liviu-Dieter Nisipeanu a atins un nivel maxim al coeficientuluiElo de 2707. Celebrul soft Chessmaster, in cea mai buna versiune a sa, a ajunsla un coeficient Elo de aproximativ 2718. Cele mai cunoscute softuri de sah alemomentului au ajuns la ratinguri de peste 3000. De exemplu, Stockfish 12 areun rating estimat de aproximativ 3500. O crestere a calitatii jocului poate fiobtinuta si prin cresterea puterii de calcul. In anii 2000 supercomputerul Hydraparea de neinvins, chiar daca nu dispunea de cel mai bun soft de sah.
Creativitatea umana este insa greu de cuantificat. In anul 2001, intr-o seriede meciuri memorabile, psihiatrul american (!!) Ernest Pecci a anihilat unuldintre cele mai bune softuri ale acelor vremuri. Cheia succesului: in spateleoricarui soft se afla mintea omului, care este predispusa la generarea unor tiparece pot fi speculate. In acelasi timp, programele de tipul AlphaZero, care au labaza inteligenta artificiala, sunt greu de incadrat cu ajutorul coeficientului Elo,atat din cauza modului in care gandesc jocul (analizeaza mai putine variante, instilul caracteristic omului) cat si datorita conditiilor in care se realizeaza testareaacestora.
Presupunerea fundamentala a sistemului Elo este ca fiecare jucator are unnivel al jocului necunoscut, dar care poate fi estimat printr-un rating ๐ . Acestrating se modifica de la meci la meci si dupa un numar suficient de mare dejocuri va converge la nivelul adevarat al jucatorului. Intr-un meci intre doiadversari, ๐ด contra lui ๐ต, avand nivelul ๐ ๐ด si ๐ ๐ต estimat prin ratingul lor,rezultatul preconizat al jocului va fi
๐ธ๐ด๐ต =1
1 + 10โ(๐ ๐ดโ๐ ๐ต)/400(1)
Valoarea ๐ = 400 este scara logistica corespunzatoare lumii sahului, in altesporturi fiind adecvate alte valori. Functia logistica va transforma orice diferentade ratinguri ๐ ๐ด โ๐ ๐ต intr-o valoare din intervalul [0, 1]. De amintit ca in sah ovictorie valoreaza 1 punct, o remiza 0.5 puncte iar infrangerea 0 puncte. Prinurmare, scorul preconizat ๐ธ๐ด๐ต trebuie interpretat in modul urmator: valoareaobtinuta reprezinta probabilitatea de a castiga plus jumatate din probabilitateade a realiza o remiza. Din aceasta cauza ๐ธ๐ด๐ต = 0.75 poate insemna ca ๐ด are75% sanse sa castige si 0% sanse sa obtina o remiza sau 50% sanse sa castige si50% sanse sa obtina o remiza.
In figura de pe pagina urmatoare, pentru diverse valori ale lui ๐ , sunt esti-mate sansele de castig in functie de diferenta de valoare dintre jucatori, folosindfunctia logistica corespunzatoare.
2
Dupa terminarea unui turneu ratingul unui jucator se modifica conform for-mulei
๐ ๐๐๐ข = ๐ ๐๐๐ + ๐พ ยท (๐ โ ๐๐๐๐ก๐๐๐๐๐๐ก) (2)
unde ๐ ๐๐๐ este ratingul dinaintea inceperii turneului, ๐ ๐๐๐ข este noul rating,๐ este scorul inregistrat si ๐๐๐๐ก๐๐๐๐๐๐ก este scorul preconizat inaintea turneului.Scorul anticipat se calculeaza folosind ratingul jucatorului dinaintea turneului siratingurile adversarilor. Acest scor se calculeaza adunand valorile rezultatelor๐ธ๐ด๐ต๐ anticipate impotriva fiecarui adversar ๐ต๐, conform formulei (1).
Pentru constanta ๐พ se considera ca pentru jucatori cu ratingul peste 2400(marii maestri) o valoare buna este ๐พ = 16. Pentru cei cu rating intre 2100 si2400 se alege standard valoarea ๐พ = 24 iar pentru ratinguri mai mici ๐พ = 32.Ideea de baza este ca jocul marilor maestri este stabil si forma lor sportiva nusufera multe fluctuatii intr-un timp scurt. In prezent, unele federatii preferaalegerea unei valori ๐พ care sa depinda de numarul de meciuri jucate intr-unturneu sau de numarul de jocuri pe baza caruia s-a estimat ratingul anterior.
Sistemul Elo prezinta si unele defecte. Printre altele s-a remarcat o inflatie aratingurilor la nivelul superior. In anii โ70 unul sau doi jucatori aveau un ratingmai mare de 2700, insa in prezent sunt 38 de jucatori cu un astfel de ratingconform clasamentului actual al FIDE. Aceasta inseamna ca un rating de 2700in anul 2021 nu este la fel de impresionant precum ar fi fost in anul 1980.
Sistemul utilizat in sah ofera un avantaj nedorit jucatorilor care doresc sa-sicreasca in mod artificial ratingul, pentru a putea participa la turneele puternice.Acestia pot alege sa participe la multe turnee mai putin renumite, unde vorintalni adversari mai slab cotati, impotriva carora sunt favoriti. In acest fel sepoate obtine o creste artificiala, cu cateva zeci de puncte, a ratingului.
In ultima perioada au aparut sisteme de rating superioare dar si mai sofisti-cate, cum ar fi sistemul TrueSkill dezvoltat de Microsoft, sistemul Glicko dez-voltat de statisticianul Mark Glickman sau sistemul Chessmetrics. Oricat deprecise ar fi aceste sisteme toate se bazeaza pe acelasi principiu: evalueaza abili-tatile relativ la o populatie (de exemplu jucatorii de sah ai federatiei de careapartine respectivul jucator). In consecinta, sunt greu de comparat jucatoriifara experienta internationala, care au jucat doar la nivel national.
In profida acestor limitari, aceasta abordare matematica pentru masurareaperformantei este mai buna decat cea bazata pe opinie. โToate modelele suntgresite, unele sunt folositoareโ spunea marele statistician George Box.
3
Variabile aleatoare continue
O variabila aleatoare continua poate avea ca valori orice numar dintr-uninterval dat, de exemplu: variabila aleatoare ๐ care masoara timpul necesarpentru a realiza ceva. Daca pentru variabilele aleatoare discrete verbul era โanumaraโ, acum acesta devine โa masuraโ.
โ ๐ este o variabila aleatoare continua daca exista o functie ๐(๐ฅ), numitadensitate de probabilitate, astfel ca pentru orice โโ โค ๐ โค ๐ โค โ
๐ (๐ < ๐ < ๐) =
๐โซ๐
๐(๐ฅ)๐๐ฅ
โ densitatea de probabilitate satisface proprietatile definitorii
โโซโโ
๐(๐ฅ)๐๐ฅ = 1 si ๐(๐ฅ) โฅ 0
โ functia de repartitie definita prin ๐น (๐ฅ) := ๐ (๐ โค ๐ฅ) poate substituirolul densitatii de probabilitate in calculul probabilitatilor
๐ (๐ < ๐ โค ๐) = ๐น (๐) โ ๐น (๐)
โ pentru o variabila aleatoare continua ๐, cand ๐น va fi continua, vom avearelatiile
๐ (๐ โค ๐ < ๐) = ๐ (๐ โค ๐ โค ๐) = ๐ (๐ < ๐ < ๐) = ๐ (๐ < ๐ โค ๐) = ๐น (๐) โ ๐น (๐)
In general avemโ ๐น โฒ(๐ฅ) = ๐(๐ฅ) (unde derivata exista)
โ ๐น (๐ฅ) =
๐ฅโซโโ
๐(๐ก)๐๐ก
โ ๐น (๐ฅ1) โค ๐น (๐ฅ2) daca ๐ฅ1 < ๐ฅ2
โ lim๐ฅโโ
๐น (๐ฅ) = 1 si lim๐ฅโโโ
๐น (๐ฅ) = 0
โ de remarcat faptul ca ๐ (๐ = ๐) = 0 pentru orice constanta ๐ โ R, spredeosebire de cazul discret
โ valoarea medie ๐(๐) si dispersia ๐ท2(๐) unei variabile aleatoare continuecu densitatea de probabilitate ๐(๐ฅ) se calculeaza prin:
๐(๐) =
โซ โ
โโ๐ฅ๐(๐ฅ) ๐๐ฅ,
4
๐ท2(๐) =
โซ โ
โโ(๐ฅโ๐(๐))2๐(๐ฅ) ๐๐ฅ.
โ momentele de ordin ๐ notate prin ๐๐ sunt
๐๐(๐) =
โซ โ
โโ๐ฅ๐๐(๐ฅ) ๐๐ฅ
iar momentele centrate de ordin ๐
๐๐(๐) =
โซ โ
โโ(๐ฅโ๐(๐))๐๐(๐ฅ) ๐๐ฅ
โ se pastreaza proprietatile valorii medii sau ale dispersiei din cazul discretiar covarianta si coeficientul de corelatie se definesc la fel
Variabile aleatoare continue clasice
โ cele mai utilizate distributii ale unei variabile aleatoare continue suntprezentate pe scurt in cele ce urmeaza
1. Variabile aleatoare uniforme
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =
{1
๐โ๐ , daca ๐ฅ โ [๐, ๐]
0, in rest
spunem ca ๐ are distributia uniform continua si scriem ๐ โผ ๐(๐, ๐).
โ ๐ se numeste parametru de localizare iar ๐โ ๐ de scara
โ se verifica prin calcul ca ๐(๐) = ๐+๐2 si ๐ท2(๐) = (๐โ๐)2
12
Aplicatii=โ utila in simularea variabilelor aleatoare, discutie in seminariile viitoare=โ daca numaru ๐ nu era suficient de misterios, aflati ca cifrele sale sunt
distribuite uniform=โ timpul de asteptare dupa un autobuz, intr-o statie, este distribuit
uniform
2. Variabile aleatoare normal distribuite
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =1โ
2๐๐2๐โ
(๐ฅโ๐)2
2๐2
spunem ca ๐ are distributia normala si scriem ๐ โผ ๐(๐,๐2).
5
โ functia de repartitie ๐น๐(๐ฅ) este exprimata prin intermediul functiei derepartitie ฮฆ corespunzatoare unei distributii standard normale
โ pentru o astfel de variabila avem ๐(๐) = ๐ si ๐ท2(๐) = ๐2.
3. Variabile aleatoare normale standard distribuite
โ o variabila cu distributia normala standard ๐ este o variabila normal dis-tribuita corespunzatoare valorilor ๐ = 0 si ๐ = 1, ๐ โผ ๐(0, 1).
โ functia ei de repartitie merita o notatie distincta
ฮฆ(๐ฅ) =1โ2๐
โซ ๐ฅ
โโ๐โ
๐ก2
2 ๐๐ก
si are valorile intr-un tabel al scorurilor ๐ง.โ in manevrarea variabilelor aleatoare normal distribuite folosim frecvent
urmatorul argument de standardizareโ pentru o variabila ๐ โผ ๐(๐,๐2) calculam probabilitatile in felul urmator
๐ (๐ฅ1 โค ๐ โค ๐ฅ2) = ๐
(๐ฅ1 โ๐
๐โค ๐ โค ๐ฅ2 โ๐
๐
)= ฮฆ
(๐ฅ2 โ๐
๐
)โฮฆ
(๐ฅ1 โ๐
๐
)
unde ๐ :=๐ โ๐
๐este o variabila aleatoare cu distributia normala standard
iar valorile ฮฆ
(๐ฅ2 โ๐
๐
), ฮฆ
(๐ฅ1 โ๐
๐
)se citesc din tabelul scorurilor ๐ง.
โ de fapt, identitatile de mai sus afirma ca valorile functiei de repartitie aleunei variabile aleatoare normal distribuite
๐ โผ ๐(๐,๐2)
se calculeaza prin
๐น๐(๐ฅ) = ฮฆ
(๐ฅโ๐
๐
)
Aplicatii=โ inaltimea sau greutatea indivizilor sunt considerate a fi normal dis-
tribuite=โ IQ-ul populatiei este considerat a fi normal distribuit=โ tensiunea arteriala corespunzatoare unei populatii este normal dis-
tribuita=โ erorile de masurare sunt in general normal distribuite
6
4. Variabile aleatoare exponential distribuite
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =
{๐๐โ๐๐ฅ, pentru ๐ฅ โฅ 0
0, in rest
spunem ca ๐ are distributia exponentiala si scriem ๐ โผ ๐ธ๐ฅ๐(๐).
โ functia de repartitie este
๐น (๐ฅ) =
{1 โ ๐โ๐๐ฅ, pentru ๐ฅ โฅ 0
0, in rest
โ prin calcul se verifica ๐(๐) = 1๐ si ๐ท2(๐) = 1
๐2
Aplicatii
=โ timpul necesar dezintegrarii unei particule radioactive, sau timpulscurs intre doua clickuri ale unui contor Geiger
=โ timpul scurs pana la urmatorul tau apel telefonic urmeaza o distributieexponentiala
=โ cat timp ii ia unui functionar bancar sa serveasca un client ? putemestima folosind o distributie exponentiala
5. Variabile aleatoare logistic distribuite
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =๐โ(๐ฅโ๐)/๐
๐ (1 + ๐โ(๐ฅโ๐)/๐
)2spunem ca ๐ are distributia logistica si scriem ๐ โผ ๐ฟ๐๐๐๐ ๐ก๐๐(๐, ๐ ).
7
โ ๐ โ R se numeste locatie iar ๐ > 0 se numeste scaraโ functia de repartitie este functia logistica
๐น (๐ฅ) =1
1 + ๐โ(๐ฅโ๐)/๐
โ media unei astfel de variabile este ๐(๐) = ๐ iar varianta ๐ท2(๐) = ๐ 2๐2
3
Aplicatii=โ in hidrologie modeleaza debitul raurilor in decursul unei luni/an=โ in sah e utilizata pentru calculul ratingului sahistilor=โ spre deosebire de variabilele normal distribuite, are avantajul ca valorile
functiei de repartitie pot fi calculate analitic nu doar aproximate prin metodenumerice
6. Variabile aleatoare Erlang si gamma
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =
{๐๐ ๐ฅ๐ โ1๐โ๐๐ฅ
ฮ(๐ ) , pentru ๐ฅ > 0
0, in rest
spunem ca ๐ are distributia gamma si scriem ๐ โผ ฮ(๐ , ๐).
8
โ parametrul ๐ > 0 se numeste rata iar ๐ > 0 se numeste forma (shape)โ pentru ๐ intreg se obtine distributia Erlangโ functia de repartitie este functia gamma incompleta regularizata
๐น (๐ฅ) =๐พ(๐ , ๐๐ฅ)
ฮ(๐ )
unde
๐พ(๐ , ๐ฅ) =
โซ ๐ฅ
0
๐ก๐ โ1๐โ๐ก ๐๐ก
este functia gamma incompleta inferioaraโ prin calcul se verifica ๐(๐) = ๐
๐ si ๐ท2(๐) = ๐ ๐2
Aplicatii=โ in comunicatiile wireless, distributia gamma este folosita pentru a
modela fadingul propagarii multicale=โ in exprimarea genetica bacteriala (fluxul de informatie de la acizii
nucleici la proteine), numarul de proteine intr-o populatie de celule de obiceiurmeaza o distibutie gamma, unde parametrii rata (r) si forma (s) sunt, respec-tiv, numarul mediu de citolize per ciclu celular si numarul mediu de moleculede proteina produse de un singur ARN mesager in timpul vietii sale
7. Variabile aleatoare beta
โ este o variabila care are o distributie flexibila si valori nenule restrictionatela un interval [0, 1], fiind utila in multe modele probabiliste.
โ proportia de radiatie solara absorbita de un material sau proportia (dintimpul maxim) necesara realizarii unei sarcini sunt exemple de variabile continuecu valori in intervalul [0, 1]
โ daca ๐ are densitatea de probabilitate
๐(๐ฅ) =
{ฮ(๐+๐)ฮ(๐)ฮ(๐)๐ฅ
๐โ1(1 โ ๐ฅ)๐โ1, pentru ๐ฅ โ [0, 1]
0, in rest
spunem ca ๐ are distributia beta si scriem ๐ โผ ๐ฝ(๐, ๐).
9
โ functia de repartitie este functia beta incompleta regularizata
๐ผ๐ฅ(๐, ๐) =๐ฝ(๐, ๐, ๐ฅ)
๐ฝ(๐, ๐)
unde
๐ฝ(๐, ๐, ๐ฅ) =
โซ ๐ฅ
0
๐ก๐โ1(1 โ ๐ก)๐โ1 ๐๐ก
este functia beta incompletaโ prin calcul se verifica ๐(๐) = ๐
๐+๐ si ๐ท2(๐) = ๐๐(๐+๐)2(๐+๐+1)
Aplicatii=โ distributia beta poate fi folosita pentru a modela evenimente care sunt
restrictionate sa aiba loc intr-un interval definit de o valoare minima si unamaxima
Aproximari normale ale variabilelor discrete
โ teorema limita centrala are un rol practic deosebit in teoria probabilitatilorpermitand aproximarea unor variabile discrete prin intermediul uneia normaldistribuita
โ daca ๐ este o variabila aleatoare cu distributie binomiala ๐ โผ ๐ต๐(๐, ๐) si ๐este suficient de mare, atunci ๐ poate fi aproximata printr-o variabila aleatoarenormal distribuita ๐ โผ ๐(๐๐, ๐๐(1 โ ๐))
โ de obicei se aplica si corectiile de continuitate pentru a imbunatati esti-marea
๐ (๐ = ๐) โ ๐
(๐ โ 1
2< ๐ < ๐ +
1
2
)intrucat aici ๐ este discreta are sens sa calculam probabilitatea evenimentului๐ = ๐, in plus avem
๐ (๐ โค ๐) = ๐ (๐ < ๐ + 1) โ ๐
(๐ < ๐ +
1
2
)
๐ (๐ โฅ ๐) = ๐ (๐ > ๐ โ 1) โ ๐
(๐ > ๐ โ 1
2
)๐ (๐1 โค ๐ โค ๐2) โ ๐
(๐1 โ
1
2< ๐ < ๐2 +
1
2
)โ daca ๐ este o variabila aleatoare cu distributie Poisson de parametru ๐ si
๐ este mare, atunci ๐ poate fi aproximata printr-o variabila aleatoare normaldistribuita ๐ โผ ๐(๐, ๐)
=โ se pot aplica aceleasi corectii de continuitate=โ pentru a putea exploata aceasta aproximare normala, in ambele cazuri,
va fi nevoie de argumentul de standardizare descris in sectiunea dedicata varia-bilelor normal standard distribuite
10
Probleme rezolvate
Problema 1
Suprarezervarea locurilor pentru zborurile intercontinentale este o prac-tica comuna in cadrul companiilor aeriene, vezi cazul United Airlines.Aeronave care sunt capabile sa transporte 300 de pasageri accepta panala 320 de rezervari. Daca 10% dintre pasagerii care au o re- zervare nu seimbarca in cele din urma in avion, care este probabilitatea ca cel putinun pasager, care are bilet de avion, sa sfarseasca fara un loc in avion ?Care este probabilitatea ca intre 25 si 45 de pasageri cu loc rezervat sanu se prezinte la poarta de imbarcare ?
Solutie: Inainte de toate trebuie sa recunoastem ca este vorba despre unexperiment binomial. Sunt ๐ = 320 de repetari: un pasager cu o rezervare facutaincearca sa se imbarce in avion la fiecare asa-zisa repetare. Numim โsuccessโsituatia in care un pasager care are o rezervare nu reuseste sa se imbarce pentruzborul sau. Probabilitatea unui succes este ๐ = 0.10
Notam prin urmare cu ๐ variabila aleatoare care numara pasagerii cu re-zervare care nu reusesc sa se imbarce in avion. ๐ este o variabila aleatoarediscreta cu distributie binomiala ๐ โผ ๐ต๐(320, 0.10) si va trebui sa calculam๐ (๐ โค 19) si ๐ (25 โค ๐ โค 45).
Putem face asta folosind distributia binomiala dar va conduce la o muncade chinez batran, de exemplu
๐ (๐ โค 19) =
19โ๐=1
๐ถ๐320(0.10)๐(0.90)320โ๐
O idee mai buna este sa aproximam variabila discreta ๐ printr-una continua ๐care este normal distribuita
๐ โผ ๐(๐๐, ๐๐(1 โ ๐)) = ๐(32, 28.8)
conform teoremei limita centrala.Folosim apoi corectiile de continuitate:
๐ (๐1 โค ๐ โค ๐2) โ ๐
(๐1 โ
1
2< ๐ < ๐2 +
1
2
)si
๐ (๐ โค ๐) โ ๐
(๐ < ๐ +
1
2
)Deci
๐ (25 โค ๐ โค 45) โ ๐
(25 โ 1
2< ๐ < 45 +
1
2
)si
๐ (๐ โค 19) โ ๐
(๐ < 19 +
1
2
)11
Avem nevoie si de o reducere a lui ๐ la o variabila aleatoare cu distributia
standard normala prin tranformarea๐ โ๐
๐= ๐. Au loc relatiile
๐ (๐ฅ1 โค ๐ โค ๐ฅ2) = ๐
(๐ฅ1 โ๐
๐โค ๐ โค ๐ฅ2 โ๐
๐
)= ฮฆ
(๐ฅ2 โ๐
๐
)โฮฆ
(๐ฅ1 โ๐
๐
)pentru ๐ โผ ๐(0, 1).
๐ (24.5 < ๐ < 45.5) = ๐
(24.5 โ 32
5.36โค ๐ โค 45.5 โ 32
5.36
)= ฮฆ (2.51) โ ฮฆ (โ1.39)
= 0.9940 โ 0.0823 = 0.92 = 92%
si
๐
(๐ < 19 +
1
2
)= ๐
(๐ โค 19.5 โ 32
5.36
)= ฮฆ (โ2.33) = 0.0102 = 1%
Mai sus am citit scorurile ๐ง din tabelul scorurilor z.
Problema 2
Variabila aleatoare ๐ are densitatea de probabilitate
๐(๐ฅ) =
{12 , if โ 1 < ๐ฅ < 1
0, otherwise
a) Aflati functia de repartitie ๐นb) Aflati densitatile de probabilitate corespunzatoare variabilelor ๐ = ๐๐
si ๐ = 2๐2 + 1.
Solutie: a) Functia ๐ este o densitate de probabilitate deoarece satisfaceproprietatile definitorii
โโซโโ
๐ (๐ฅ) ๐๐ฅ =
1โซโ1
1
2๐๐ฅ =
๐ฅ
2|1โ1= 1
si are doar valori pozitive. Prin definitie functia de repartitie va fi
๐น๐ (๐ฅ) =
๐ฅโซโโ
๐ (๐ก) ๐๐ก =
โงโชโชโชโจโชโชโชโฉ0, ๐ฅ < โ1
๐ฅ+12 , โ1 โค ๐ฅ < 1
1, 1 โค ๐ฅ
,
deoarece
๐ฅ < โ1 โ ๐น (๐ฅ) =
๐ฅโซโโ
0 ๐๐ก = 0,
๐ฅ โ [โ1, 1) โ ๐น (๐ฅ) =
โ1โซโโ
0 ๐๐ก +
๐ฅโซโ1
1
2๐๐ก =
๐ฅ
2+
1
2=
๐ฅ + 1
2,
12
1 โค ๐ฅ โ ๐น (๐ฅ) =
โ1โซโโ
0 ๐๐ก +
1โซโ1
1
2๐๐ก +
โโซ1
0 ๐๐ก = 1.
b) Pentru inceput sa aflam functia de repartitie ๐บ (๐ฅ) corespunzatoare lui๐ . Intrucat ๐ > 0 pentru orice ๐ฅ โค 0, obtinem ๐บ (๐ฅ) = ๐ (๐ โค ๐ฅ) = 0. Daca๐ฅ > 0 atunci
๐บ (๐ฅ) = ๐ (๐ โค ๐ฅ) = ๐(๐๐ โค ๐ฅ
)= ๐ (๐ โค ln๐ฅ) = ๐น (ln๐ฅ)
Asamblate impreuna
๐บ (๐ฅ) =
โงโชโจโชโฉ0, ln๐ฅ < โ1 si ๐ฅ โค 01+ln ๐ฅ
2 , โ1 โค ln๐ฅ < 1
1, 1 โค ln๐ฅ
=
โงโชโจโชโฉ0, ๐ฅ โ
(โโ, 1
๐
)1+ln ๐ฅ
2 , ๐ฅ โ[1๐ , ๐
)1, ๐ฅ โ [๐,โ)
Densitatea de probabilitate corespunzatoare va fi
๐(๐ฅ) = ๐บโฒ(๐ฅ) =
{12๐ฅ , ๐ฅ โ
(1๐ , ๐
)0, altfel
Deoarece ๐ este nenul doar pe intervalul (โ1, 1), ๐ = 2๐2 + 1 va fi nenulape intervalul (1, 3). Pentru ๐ฅ โ (1, 3), functia de repartitie ๐ป (๐ฅ) a lui ๐ va fi
๐ป (๐ฅ) = ๐ (๐ โค ๐ฅ) = ๐(2๐2 + 1 โค ๐ฅ
)= ๐
(๐2 โค ๐ฅโ 1
2
)=
= ๐
[โโ
๐ฅโ 1
2โค ๐ โค
โ๐ฅโ 1
2
]= ๐น
[โ๐ฅโ 1
2
]โ ๐น
[โโ
๐ฅโ 1
2
]
=1
2
[1 +
โ๐ฅโ 1
2
]โ 1
2
[1 โ
โ๐ฅโ 1
2
]=
โ๐ฅโ 1
2.
Densitatea de probabilitate, obtinuta prin โ (๐ฅ) = ๐ป โฒ (๐ฅ), e data de
โ (๐ฅ) =
{1
2โ2๐ฅโ2
, ๐ฅ โ (1, 3)
0, altfel
Problema 3
Densitatea de probabilitate corespunzatoare unei variabile aleatoare con-tinue ๐ este data prin
๐ (๐ฅ) =
โงโจโฉ1
2cos๐ฅ, ๐ฅ โ
(โ๐
2,๐
2
)0, altfel
a) Calculati valoarea medie si dispersia lui ๐.
b) Aflati functia de repartitie si calculati probabilitatea ๐(๐
4< ๐ <
๐
3
).
13
Solutie: a) Valoarea medie
๐ (๐) =
+โโซโโ
๐ฅ ยท ๐ (๐ฅ) ๐๐ฅ =1
2
๐2โซ
โ๐2
๐ฅ cos๐ฅโ โ f este impara
๐๐ฅinterval
=simetric
0,
iar dispersia
๐ท2 (๐) =
+โโซโโ
[๐ฅโ ๐ธ (๐)]2๐ (๐ฅ) ๐๐ฅ =
๐2โซ
โ๐2
(๐ฅโ 0)2๐ (๐ฅ) ๐๐ฅ =
=1
2
๐2โซ
โ๐2
๐ฅ2 cos๐ฅโ โ f e para
๐๐ฅinterval
=simetric
2 ยท 1
2
๐2โซ
0
๐ฅ2 cos๐ฅ๐๐ฅ,
prin urmare
๐ท2 (๐) =๐2
4โ 2.
b) Functia de repartitie este definita prin
๐น (๐ฅ) =
๐ฅโซโโ
๐ (๐ก) ๐๐ก.
Astfel, pentru ๐ฅ < โ๐
2=โ ๐น (๐ฅ) =
๐ฅโซโโ
0 ๐๐ก = 0.
Pentru ๐ฅ โ[โ๐
2,๐
2
)se obtine
๐น (๐ฅ) =
๐ฅโซโโ
๐ (๐ก) ๐๐ก =
โ๐2โซ
โโ
0 ๐๐ก +
๐ฅโซโ๐
2
1
2cos ๐ก ๐๐ก =
1
2+
1
2sin๐ฅ.
iar daca ๐ฅ โฅ ๐
2avem
๐น (๐ฅ) =
๐ฅโซโโ
๐ (๐ก) ๐๐ก =
โ๐2โซ
โโ
0 ๐๐ก +
๐2โซ
โ๐2
1
2cos ๐ก ๐๐ก +
๐ฅโซ๐2
0 ๐๐ก = 1.
deci
๐น (๐ฅ) =
โงโชโชโชโจโชโชโชโฉ0, ๐ฅ โค โ๐
21
2+
1
2sin๐ฅ, ๐ฅ โ
(โ๐
2,๐
2
)1, ๐ฅ โฅ ๐
2
.
Pentru o variabila aleatoare continua putem folosi densitatea de probabilitatesau functia de repartitie pentru a calcula probabilitati
๐(๐
4< ๐ <
๐
3
)=
๐3โซ
๐4
๐ (๐ฅ) ๐๐ฅ =
๐3โซ
๐4
1
2cos๐ฅ ๐๐ฅ = ๐น
(๐3
)โ ๐น
(๐4
)=
โ3 โ
โ2
4.
14
Problema 4
Lipsa memoriei unei variabile exponential distribuiteFie ๐ timpul scurs intre detectarea particulelor cu un contor Geiger si sapresupunem ca ๐ are o distributie exponentiala cu ๐(๐) = 1.4 minute.Aflati probabilitatea de a detecta o particula in primele 30 de secundede la pornirea contorului. Sa presupunem ca am asteptat 3 minute farasa fi detectat o particula. Care este probabilitatea sa detectam apoi oparticula in urmatoarele inca 30 de secunde ?
Solutie: Pentru o variabila cu distributia exponentiala ๐ โผ ๐ธ๐ฅ๐(๐) stim ca๐(๐) = 1
๐ . Prin urmare ๐ = 11.4 si apoi probabilitatea de a detecta particula
in primele 30 de secunde va fi estimata prin
๐ (๐ < 0.5) =
โซ 0.5
โโ๐(๐ฅ) ๐๐ฅ =
โซ 0.5
0
๐๐โ๐๐ฅ ๐๐ฅ = 1 โ ๐โ0.51.4 โ 30%
unde am folosit minutul ca unitate de masura si formula densitatii de proba-bilitate pentru variabilele exponential distribuite. Vom folosi pentru compararevaloarea exacta 1 โ ๐โ
0.51.4 si nu cea aproximativa, afectata de erorile de aproxi-
mare.Daca nu vom detecta nicio particula timp de trei minute, senzatia generala
este ca probabilitatea de detectare ar trebui sa fie mai mare in cele 30 de secundescurse dupa aceste trei minute. Insa vom demonstra matematica contrariu.Probabilitatea ceruta se exprima matematic prin ๐ (๐ < 3.5|๐ > 3) =? Adicatimpul scurs sa fie mai mic decat 3min 30 sec daca stim ca e sigur mai maredecat 3min. Conform formulei probabilitatilor conditionate
๐ (๐ < 3.5 | ๐ > 3) =๐ (3 < ๐ < 3.5)
๐ (๐ > 3)
caci consideram cele doua evenimente ๐ > 3 si ๐ < 3.5 iar intersectia lor seexprima prin evenimentul 3 < ๐ < 3.5. Folosind densitatea de probabilitate adistributiei exponentiale gasim
๐ (3 < ๐ < 3.5) =
โซ 3.5
3
1
1.4๐โ
๐ฅ1.4 ๐๐ฅ = โ๐โ
3.51.4 + ๐โ
31.4
si
๐ (๐ > 3) =
โซ 3.5
3
1
1.4๐โ
๐ฅ1.4 ๐๐ฅ = ๐โ
31.4
In consecinta
๐ (๐ < 3.5 | ๐ > 3) =โ๐โ
3.51.4 + ๐โ
31.4
๐โ3
1.4
= 1 โ ๐โ0.51.4 = ๐ (๐ < 0.5)
Aceasta lipsa de memorie reprezinta o proprietate specifica variabilelor expo-nential distribuite, fiind singurele variabile aleatoare continue cu aceasta pro-prietate, si poate fi exprimata general prin relatia
๐ (๐ < ๐ก1 + ๐ก2 | ๐ > ๐ก1) = ๐ (๐ < ๐ก2).
15
Problema 5
Cand se defecteaza proiectorul?Timpul pana la defectarea unui proiector (in ore) este modelat printr-o variabila aleatoare Weibull de parametrii ๐ฝ = 1
2 si ๐ฟ = 5000 de ore.Determinati timpul mediu pana la defectare si estimati probabilitatea caacesta sa functioneze cel putin 12000 de ore, fara sa se defecteze.
Solutie: O distributie Weibull este utilizata pentru o modelare satisfacatoarea fiabilitatii unui produs. O variabila aleatoare cu o distributie Weibull aredensitatea de probabilitate
๐(๐ฅ) =
{๐ฝ๐ฟ
(๐ฅ๐ฟ
)๐ฝโ1๐โ( ๐ฅ
๐ฟ )๐ฝ
, pentru ๐ฅ > 0
0, in rest
Parametrii ๐ฝ si ๐ฟ ai distributiei furnizeaza o mare flexibilitate in modelareasistemelor a caror deterioare creste in timp (uzura rulmentilor), descreste intimp (unii semiconductori), sau ramane constanta in timp (avarii cauzate desocuri externe). Cateva posibile comportari ale lui ๐(๐ฅ) sunt afisate mai jos.
Fie ๐ variabila aleatoare care masoara timpul pana la defectarea proiectoru-lui. Valoarea medie a variabilei ๐ este
๐(๐) =
โซ โ
โโ๐ฅ๐(๐ฅ) ๐๐ฅ =
โซ โ
0
๐ฅ ยท 1
10000
( ๐ฅ
5000
) 12โ1
๐โ( ๐ฅ5000 )
12๐๐ฅ
intai facem schimbarea de variabila ๐ฆ =(
๐ฅ5000
) 12 si aplicand a doua metoda de
schimbare a variablei obtinem ๐๐ฅ = 10000๐ฆ ๐๐ฆ apoi
๐(๐) = 5000
โซ โ
0
๐ฆ2๐โ๐ฆ ๐๐ฆ = 5000 ยท ฮ(3) = 10000 (ore)
Probabilitatea cautata se estimeaza folosind aceeasi schimbare de variabila
๐ (๐ โฅ 12000) =
โซ โ
12000
1
10000
( ๐ฅ
5000
) 12โ1
๐โ( ๐ฅ5000 )
12๐๐ฅ
=
โซ โ
โ2.4
๐โ๐ฆ ๐๐ฆ = ๐โโ2.4 โ 0.21 = 21%
16
Probleme propuse
B. Tehnica de calcul
Problema B.1. Un radar masoara vitezele masinilor pe o autostrada. Vitezelesunt normal distribuite cu media de 90 km/ora si deviatia standard 10 km/ora.Care este probabilitatea ca o masina aleasa aleator sa circule cu o viteza maimare de 100 km/ora?
Problema B.2. Consideram functia
๐(๐) =
{๐ cos2 ๐, daca ๐ โ (โ๐
2 ,๐2 )
0, in rest
i) Aflati ๐ astfel ca ๐ sa fie densitatea de probabilitate a unei variabile aleatoarecontinue ๐
ii) Determinati valoarea medie ๐(๐) si dispersia ๐ท2(๐) acestei variabilealeatoare
iii) Aflati functia de repartitie ๐น (๐ฅ) si calculati probabilitatea ๐ (โ1 < ๐ < 1)
Problema B.3. Densitatea de probabilitate pentru amplitudinea ruliului uneinave are urmatoarea forma, conform legii lui Rayleigh
๐(๐ฅ) =๐ฅ
๐2๐โ
๐ฅ2
2๐2 , ๐ฅ โฅ 0
Daca nava ar transporta oi, am dori ca acestea sa calatoreasca in conditiilipsite de stres, vezi in link la ce situatii se poate ajunge. Aflati probabilitatea caamplitudinea miscarii sa depaseasca o valoarea critica ๐0. Determinati valoareaasteptata a amplitudinii ๐ธ(๐), deviatia standard ๐(๐) si momentul centrat ๐3.
Problema B.4. Intrarea la Universitatea Politehnica University se realizeazain urma unui test de selectie. Punctajele sunt normal distribuite cu o mediede 500 si o deviatia standard de 100. Popescu vrea sa fie admis la aceastauniversitate si el stie sa trebuie sa obtina un punctaj mai bun decat cel putin70% dintre contracandidatii sai. Popescu da testul si obtine 585 puncte. Va fiadmis la universitate cu acest punctaj ?
Problema B.5. Functia de repartitie corespunzatoare unei variabile aleatoarecontinue ๐ este
๐น (๐ฅ) =
โงโชโจโชโฉ0 ๐ฅ < โ5(๐ฅ+5)2
144 โ5 โค ๐ฅ < 7
1, ๐ฅ โฅ 7
Aflati media, dispersia, deviatia standard si momentul de ordin 3 al lui ๐.Aflati apoi mediile ๐(๐3) si ๐(๐๐ + 1).
17
Problema B.6. O persoana arunca de 1000 ori o moneda. Aflati probabilitateaca numarul de โstemeโ obtinute sa fie intre 475 si 525, inclusiv.
Problema B.7. Biletele pentru festivalul โUntoldโ sunt vandute online potrivitunei distributii Poisson cu o medie de 25 pe zi. Care este probabilitatea ca:
a) mai mult de 20 de bilete sa fie vandute intr-o zi ?
b) intre 20 si 30 de bilete sa fie vandute intr-o zi ?
Problema B.8. Un club de fotbal asigura transportul cu autobuzul al fanilorsai. Un autobuz soseste intr-o anumita statie la fiecare 15 minute intre ora4 si 12 p.m. in ziua meciului. Fanii sosesc in statie in momente de timpaleatoare. Timpul petrecut de catre un fan in asteptarea autobuzului este o vari-abila aleatoare uniform distribuita cu valori de la 0 la 15 minute. Care estetimpul mediu de asteptare ? Care este probabilitatea ca un fan sa astepte maimult de 12 minute ? Care este probabilitatea ca un fan sa fie nevoit sa astepteintre 5 si 10 minute ?
Problema B.9. Timpul maxim disponibil pentru a realiza o sarcina intr-unproiect este de 2.5 zile. Presupunem ca timpul necesar realizarii sarcinii, caproportie din timpul maxim, este o variabila aleatoare beta cu ๐ = 2 si ๐ = 3.
Cat se estimeaza ca va dura realizarea sarcinii? (Valoarea asteptata)Care este probabilitatea ca realizarea sarcinii sa dureze mai mult de doua
zile?
18
Bibliografie
[1] R. Yates and D. Goodman. Probability and Stochastic processes,Wiley&Sons, 2005.
[2] D. Montgomery and G. Runger. Applied Statistics and Probability forEngineers, Wiley, 2014.
[3] R. Negrea. Curs Matematici Speciale, 2021.
[4] C. Hedrea. Notite seminar Matematici Speciale, 2021.