Colectarea Si Prelucrarea Datelor in Transporturi

107
1. PRELIMINARII PROBABILITĂȚI. VARIABILE ALEATOARE Definiția clasică a probabilității Probabilitatea a fost privită, fie dintr-un punct de vedere „psihologic” ca măsurând gradul de siguranță al observatorului, relativ la producerea sau neproducerea unui fenomen, fie “statistic” ca frecvență de apariție a unui fenomen într-un număr mare de experimente independente. Din punct de vedere clasic, definiția care s-a dovedit cea mai eficientă în calcule, a fost aceea care a plecat de la conceptul de egală posibilitate. Acest lucru înseamnă că numărul de posibilități într-un experiment este finit și toate posibilitățile au aceeași șansă. Probabilitatea unui eveniment care constă din mai multe astfel de posibilități este raportul dintre numărul cazurilor favorabile și numărul cazurilor posibile. Utilizarea acestei definiții presupune că 1

description

Curs despre Colectarea si Prelucrarea datelor in transporturi rutiere

Transcript of Colectarea Si Prelucrarea Datelor in Transporturi

1. PRELIMINARIIPROBABILITI. VARIABILE ALEATOARE

Definiia clasic a probabilitii

Probabilitatea a fost privit, fie dintr-un punct de vedere psihologic ca msurnd gradul de siguran al observatorului, relativ la producerea sau neproducerea unui fenomen, fie statistic ca frecven de apariie a unui fenomen ntr-un numr mare de experimente independente.

Din punct de vedere clasic, definiia care s-a dovedit cea mai eficient n calcule, a fost aceea care a plecat de la conceptul de egal posibilitate. Acest lucru nseamn c numrul de posibiliti ntr-un experiment este finit i toate posibilitile au aceeai ans.

Probabilitatea unui eveniment care const din mai multe astfel de posibiliti este raportul dintre numrul cazurilor favorabile i numrul cazurilor posibile. Utilizarea acestei definiii presupune c ntr-un fel sau altul putem numra strile posibile i pe cele favorabile.

Exemplu Se arunc un zar de dou ori. S se determine probabilitile evenimentelor:

Suma feelor celor dou zaruri este 6.Ambele zaruri au faa cu acelai numr.

Soluie

Cazurile posibile n cele dou situaii sunt: , n numr de 36.

Cazurile favorabile sunt: , deci 5.

atunci .

Cazurile favorabile sunt: ,deci 6

atunci .

Definiia axiomatic a probabilitii

n general evenimentele se exprim prin propoziii.Propoziiile, obinute prin operaiile logicii matematice , ntre propoziii care exprim evenimente; exprim la rndul lor alte evenimente.

Probabilitatea este definit pe o mulime de evenimente care o dat cu evenimentele A i B conine i evenimentele urmtoare exprimate prin operaiile logice

i

sau

- non A , .E - evenimentul sigur (cert)

- evenimentul imposibil.De asemenea presupunem c au loc urmtoarele relaii:

Comutativitatea

Asociativitatea

Distributivitatea ;

Absoria

Legile lui de Morgan

Evenimentele cert i imposibil se caracterizeaz prin:

Evenimentul non A sau contrar lui A are proprietile:

Definiie: O mulime de evenimente cu proprietile de mai sus se numete cmp de evenimente sau algebr de evenimente sau algebr Boole.

Relaiile de mai sus nu sunt independente , deci nu formeaz un set minimal de axiome pentru algebrele Boole. Pe de alt parte ele implic alte relaii importante , cum ar fi Urmtoarea teorem descrie asemenea cmpuri de evenimente prin submulimi.

Teorema lui Stone:

Fie M o mulime de evenimente cu proprietile de mai sus. Atunci exist o mulime E i o submulime ce verific la proprietile:

;

;

;

i o bijecie astfel ca:

;

; .

.

Teorema arat n esen c orice cmp de evenimente poate fi reprezentat prin submulimi ale aceleai mulimi . Operaiei ntre evenimente i corespunde mulimilor , operaiei i corespunde mulimilor, iar negaiei i corespunde complementara, evenimentul sigur sau certcorespunde mulimii totale , iar evenimentul imposibil corespunde mulimii vide .

Definiie: O mulime cu proprietile i din teorema lui Stone se numete clan,algebr de evenimente sau cmp de evenimente. Uneori se mai numete i algebr de mulimi.

Propoziie: Fie un cmp de evenimente:

Dac atunci i ;

Dac atunci .

Definiia axiomatic a probabilitii:

Fie un cmp de evenimente. Se numete probabilitate pe , o funcie ce satisface la proprietile:

;

dac ;

, .

Tripletul l vom numi cmp de probabilitate.

Teorem: Fie un cmp de probabilitate. Atunci:

Dac i pentru atunci ;

, ;

.

VARIABILE ALEATOARE

Definiie: O funcie se numete variabil aleatoare (pe scurt v.a.) , dac pentru orice interval deschis , avem . O funcie se numete variabil aleatoare dac i sunt variabile aleatoare reale.

Variabilele aleatoare care iau un numr finit de valori se numesc variabile aleatoare simple.

Fie valorile distincte ale lui i fie . n aceste condiii variabila aleatoare se scrie:

.

Fiecrei variabile aleatoare i vom asocia o diagram , notat tot cu :

, numit distribuia sau repartiia variabilei aleatoare.

Valorile sunt n general distincte, iar evenimentele ,, formeaz o partiie a lui , dac sunt disjuncte pentru i . Este clar atunci c .

Pentru o variabil aleatoare simpl definim:

Definiie:

valoarea medie a lui f: ;

momentul de ordinul k: ;

momentul centrat de ordinul k: ;

dispersia: ;

funcia caracteristic: sau

funcia de repartiie: , .

Vom nota n general cu evenimentul , iar probabilitatea acestuia cu .

Teorem (proprietile valorii medii)

Fie un cmp de probabilitate finit i variabile aleatoare pe X. Atunci:

Dac

Dac

i de aici i ;

; constante ;

Dac i sunt independente atunci ;

Dac ;

Dac ;

.

Teorem (proprietile dispersiei)

a.p.t.(constant) ;

,a fiind o constant;

Dac , sunt independente .

Definiie: Dac este o v.a. atunci expresia se numete deviaia standard a lui f.

Definiie: Fie un cmp de probabilitate. O funcie se numete variabil aleatoare , dac pentru , mulimea este un eveniment din . Adesea vom nota mulimea de mai sus prin sau .

Propoziie: este o v.a. este ndeplinit una din condiiile:

;

;

;

;

.

Teorem:

Dac i sunt v.a. atunci i sunt v.a. .

Fie . Atunci valoarea medie a lui se definete prin:

.

Vom nota aceast expresie prin sau .Avem proprietile mediei:

Dac ;

;

;

Dac i sunt independente atunci ;

Dac ;

;

.

Momentul de ordinul se definete ca pentru v.a. simple

.

Momentul centrat de ordinul k :.

Dispersia se definete de asemenea ca pentru v.a. simple:

.

Unei v.a. generale nu-i putem ataa distribuia sau repartiia ca n cazul v.a. simple, ele lund n general o infinitate de valori. n cazul particular cnd mulimea valorilor v.a. este numrabil iar evenimentele au probabilitile , putem spune c are repartiia sau distribuia:

.

n acest caz , iar .

Funcia de repartiie. Densitatea de probabilitate

Fie o v.a. definit pe spaiul probabilizat . Asociem lui , o funcie , definit prin formula . Funcia nu mai apare ca depinznd explicit de . Ea conine informaii probabilisticedespre , independent de natura elementelor din . Este posibil ca aceeai funcie s corespund la v.a. diferite, definite pe acelai spaiu sau pe spaii diferite.

Definiie: Funcia , cu , fiind o v.a. se numete funcia de repartiie a acestei v.a. .

Definiie: Fie o variabil aleatoare cu funcia de repartiie . O funcie , integrabil cu probabilitatea c :

, se numete densitatea de repartiie a v.a. .

Teorem: Funcia de repartiie are urmtoarele proprieti:

este monoton cresctoare;

; ;

este continu la stnga;

;

Reciproc dac o funcie are proprietile de mai sus , atunci un cmp de probabilitate i o v.a. pe , care are pe ca funcie de repartiie.

Teorem: Densitate de probabilitate a unei v.a. are proprietile:

;

;

;

Reciproc dac o funcie integrabil are proprietile , atunci un cmp de probabilitate i o v.a. pe , care admite pe ca densitate de probabilitate Avem c:

; .

;

.

LEGI CLASICE DE PROBABILITATE

n cele ce urmeaz vom studia cteva legi frecvent ntlnite n aplicaii. Cnd discutm o asemenea lege , subnelegem c un cmp de probabilitate i o v.a. , care are ca funcie de repartiie pe i ca densitate de probabilitate pe .

1) REPATIIA BINOMIAL

Fie v.a. simpl ,

unde , , . O asemenea v.a. se numete binomial.

Funcia caracteristic este :

, .

De aici se obine:

2) REPARTIIA POISSON

Spunem c este o v.a. de tip Poisson dac ia valori ntregi pozitive i , unde . Repartiia unei astfel de variabile aleatoare este:

.

- se numete parametrul variabilei aleatoare.

Funcia caracteristic este .

Prin urmare:

;

;

.

3) REPARTIIA NORMAL

Spunem c o v.a. admite o repartiie normal de parametrii i , dac densitatea ei de probabilitate este:

.

V.a. cu repartiia normal, de valoare medie i dispersie - o vom numi de tipul . Legea normal a aprut n legtur cu teoria erorilor de msurare.

4) REPARTIIA EXPONENIAL NEGATIV

Se numete astfel o v.a. cu densitatea de probabilitate:

, unde .

Plecnd de la definiie obinem:

5) REPARTIIA GAMMA

Se numete astfel o repartiie cu densitatea de probabilitate:

, unde .

Cel mai frecvent se utilizeaz cazul , cnd avem:

.

Funcia gamma se definete prin:

, pentru .Urmtoarele proprieti se cunosc de la cursul de analiz matematic:

; .

Funcia caracteristic se calculeaz astfel :

.

Caracteristicile numerice sunt:

;

;

.

n cazul , , se obine , valoarea medie, dispersia.

2. NOIUNI DE STATISTIC MATEMATIC I PROBABILITI UTILIZATE N TRAFICUL RUTIER

Evalurile de perspectiv efectuate pentru caracterizarea traficului rutier sunt de cele mai multe ori bazate pe prognoze i estimri. n aceste condiii se pune problema obinerii datelor de pornire (intrare n algoritm) care s ofere credibilitate maxim i s fie suficient de representative pentru fenomenul de trafic analizat.

n ce msur datele pe care le utilizm sunt de ncredere? La aceast ntrebare se poate rspunde numai apelnd la instumentul statistic de analiz , capabil s asigure extrapolarea unor observaii punctuale la ntreg fenomenul sau la evenimentul analizat. Astfel evaluarea statistic, rezultat al investigrii strii de trafic la un moment dat , sau ntr-un interval de timp determinat, constitue un instrument necesar i de neeludat n dezvoltarea prognozelor i estimrilor.

Necesitatea de a obine valori credibile i n acelai timp reprezentative pentru starea traficului la un moment dat, a impus acest instrument de lucru. Este important caracterizarea statistic a traficului, pentru a obine datele de pornire pertinente, care s asigure o dezvoltare credibil a studiilor sau programelor destinate modelrii fluxurilor de vehicule sau ierarhizrii acceselor ntr-o intersecie dat.

n acest sens, datele obinute prin observaii (sondaj) sau prin colectare automat trebuie supuse unui proces de prelucrare statistic, care are n vedere att identificarea unor tendine probabile a irurilor de valori, ct i gruparea lor funcie de tendinele probabile demonstrate prin criterii matematice stabile.

2.1.1. INDICATORI STATISTICI

irurile de date obinute n urma monitorizrii traficului constitue eantioane ce cuprind valori nregistrate n intervale de timp impuse . Prelucrarea statistic a acestor eantioane de valori const n identificarea tendinelor principale de evoluie a fenomenelor observate (monitorizate).

Sunt evideniate trei importante categorii de parametrii statistici, care pot fi utilizai n evaluarea datelor de trafic, astfel:

(a) parametrii de grupare (denumii i de tendin) care exprim tendina irului de a coverge cresctor sau descresctor spre o anumit valoare, inclus n irul de date.(b) parametrii de mprtiere (denumii i de dispersie) care arat proprietatea natural a irului de date de a se distribui n mod aleatoriu sau predilect n intervalul n care irul ia valori.(c) parametrii speciali destinai caracterizrii coplexe a irului de date, n scopul identificrii tendinelor de probabilitate a irului.

Eantionul de date rezultat n urma monitorizrii indicatorilor de trafic formeaz un ir de valori caracterizat prin:

valoarea minim care reprezint cea mai mic nregistrare numeric a irului de date. valoarea maxim care reprezint nregistrarea cu valoarea cea mai mare din irul de date format de eantion. lungimea irului de date reprezint numrul de date din eantion.

domeniul de valori al eantionului limitat superior i inferior de , respective de .

Parametrii de grupare sau de tendin sunt urmrtorii:

media de sondaj a irului de date, care reprezint valoarea ponderat a datelor din ir. Sunt definite matematic i au utilitate n evalurile de trafic rutier, urmtoarele medii statistice:

media aritmetic de sondaj este un indicator de poziie, care ofer o informare global privind valoarea cea mai credibil a irului de date, spre care tind cresctor sau descresctor celelalte date din ir i se determin cu relaia:

, (1)

unde - este numrul de date din eantion supus prelucrrii statistice, -valoare a irului de date din eantion, .

Media aritmetic de sondaj reprezint valoarea cea mai utilizat n evalurile specifice traficului rutier i permite evidenierea caracteristicei predominante de raportare a indicatorilor de trafic analizai.Acest indicator are proprietatea c suma algebric a abaterilor diferitelor valori de la medie este nul.

media geometric reprezint un indicator caracteristic seriilor de numere positive i permite evaluarea irului de date n raport cu produsul acestora , conform relaiei:

. (2)

media armonic reprezint inversul mediei artitmetice de sondaj i arat caracterul de variaiea al valorilor inverse din ir , fiind dat de:

. (3)

media de ateptare reprezint valoarea combinat a parametrului evaluat statistic de un indicator ce definete puterea valorii medii. Se determin cu relaia:

. (4)

n cazul evalurilor de trafic rutier, media de ateptare poate reprezenta rezultatul evalurii simultane a:

timpilor de sosire ntr-un punct de traseu cu viteza nregistrat de fiecare vehicul. durata parcursului i viteza medie nregistrat. durata staionrilor i numrul de vehicule staionate ntr-un areal determinat.

Acest indicator se exprim n uniti de msur specifice variabile, factorul de ateptare avnd o contribuie materializat n cuantificarea valorii variabile.

Mediana de sondaj a irului de date este considerat ca fiind valoarea fa de care frecvena valorilor mai mici dect aceasta , este egal cu frecvena valorilor mai mari dect aceasta. Practic mediana de sondaj divide irul iniial n dou subiruri care conin acelai numr de date . Pentru determinarea medianei de sondaj, valorile se distribuie n ordine cresctoare sau descresctoare . Mediana de sondaj este un indicator al irului ordonat de valori. Se determin cu relaii distincte, funcie de caracterul irului (par sau impar) astfel:

pentru n numr impar: , (5) pentru n numr par: . (6)

-Modul de sondaj al irului de date, exprim legtura statistic a tendinei de grupare, existent ntre media de sondaj i median, exprimat prin relaia:

. (7)

-Valoarea central mparte domeniul n care irul de date ia valori, n dou zone egale, n care ns frecvena de repartiie a valorilor nu este aceeai. Se determin cu relaia:

. (8) Referitor la parametrii tendinei de grupare, analiza comparat a acestora ofer o imagine de ansamblu privind caracterul simetric al repartiiei dispunerii datelor din ir, constituind din acest punct de vedere un instrument valoros n evaluarea legii de distribuie probabile ce guverneaz fenomenul analizat.

Parametrii tendinei de mprtiere sunt n msur s arate modul n care valorile din eantion sunt distribuite n ntreg domeniul corespunztor irului. n mod curent, aceti indicatori arat poziia datelor din eantion, fa de valoarea mediei aritmetice de sondaj. Principalii parametrii statistici ai ascestei tendine sunt:

Abaterea medie ptratic de sondaj se determin cu relaia:

. (9)

Dac se consider un ir din valori (fig.2.1), a cror dispunere ntr-un sistem de coordonate indic un nivel de mprtiere aleatoriu, abaterea medie patratic (sau deviaia standard) ofer o imagine orientativ a degenerrii grupriidatelor.

n practica curent statistic, deviaia standard arat cu nivel de ncredere ridicat, n ce msur datele din eantion sunt credibile, adic pot fi luate n considerare la evaluarea fenomenelor observate.

Astfel de estimri statistice arat n ce msur datele din eantion se ncadreaz n intervale caracteristice din domeniul de valori, acoperite de secvena (tab.2.1).

Tabelul 2.1.

Cuantumul procentual al valorilor din ir acoperite prin dispersie.

Nr.crt. Interval Procent din gradul de acoperire al irului

1. 68.27%2. 1.645 90%3. 1.960 95%4. 2 95.450%5. 2.576 99%6. 3 99.7300%7. 3.2906 99.9%8. 4 99.993666%9. 5 99.99994267%10. 6 99.9999998027%11. 7 99.9999999997440%

Dispersia irului de date sau dispersia de sondaj se determin cu relaia:

. (10)

Dispersia de sondaj poate fi utilizat i ca estimare a dispersiei din populaia originar, considerndu-se n acest caz relaia:

. (11)

n mod analog, se definete i abaterea medie ptratic, corespunztoare estimaiei din populaia originar cu relaia:

. (12)

Amplitudinea irului de date este dat de diferena dintre valoarea cea mai mare i valoarea cea mai mic din irul de date:

. (13)

PARAMETRII SPECIALI ofer informaii suplimentare privind tendina de ncadrare a observaiei ectuate n legi de distribuie discrete sau continue. Totodat arat n ce msur sunt fezabile abordri privind caracterul aleatoriu sau predictibil al fenomenului analizat. Aceast grup de parametrii stabilete conexiuni ntre cele dou grupe statistice i permite analiza concomitent a influenei parametrilor din grupele de indicatori detaliai anterior.Aceti parametri permit estimarea cu un grad mai bun de aproximare a prognozei de trafic (distribuia fluxului de autovehicule).

Momentul de ordin r reprezint o modalitate de caracterizare (n anumite condiii) a distribuiei variabilei aleatoare evaluate statistic. Se determin cu relaia:

. (14)

Coeficientul de variaie al irului de sondaj , face legtura ntre cei doi indicatori de baz ce exprim tendinele opuse ale irurilor de valori (convergena cresctoare-descresctoare spre valoarea medie i dispersia n ntreg domeniul n care irul ia valori). Se determin cu relaia:

. (15)

Raportat la teoria traficului rutier, acest indicator este utilizat la determinarea zgomotului parametrilor dinamici ai autovehiculului singular.

Abaterea medie absolut a irului de date este determinat cu relaia:

, (16)

unde -este frecvena absolut a valorii n intervalele de observare.

Abaterea normat este un indicator de observare punctual a unor intervale din eantion. Se determin cu relaia:

. (17)

Coeficientul de asimetrie , definete tendina de asimetrie a dispunerii valorilor n interval, prin evaluarea gradului de nclinare a pantei curbei densitii de probabilitate n vecintatea modului de sondaj . Se determin cu relaia:

, (18)

unde - reprezint momentul centrat de ordinul trei, determinat cu relaia:

. (19)

Coeficientul de boltire se obine prin particularizarea relaiei coeficientului de asimetrie:

, (20)

- fiind momentul centrat de ordinul patru.

APLICAIA 1.

Se consider datele obinute n urma efecturii unui sodaj de trafic pe o arter principal de intrare ieire ntr-un ora, n aceeai perioad a zilei, dar n zile diferite i luni calendaristice dintr-un an prezentate n tabelul 2.2.Se solicit evaluarea statistic a eantionului de date pentru analiza caracteristicii vitezei de deplasare n zona de observare.

Tabelul 2.2. Eantion valori viteze n trafic

Nr.obs. Vit Nr.obs. Vit Nr.obs. Vit1. 49 11. 59 21. 172. 48 12. 47 22. 703. 22 13. 41 23. 534. 30 14. 59 24. 555. 28 15. 41 25. 546. 44 16. 42 26. 497. 48 17. 45 27. 448. 43 18. 46 28. 489. 45 19. 66 29. 4410. 88 20. 72 30. 43

Algoritm de rezolvare

O prim remarc referitoare la irul de date este aceea c reprezint rezultatul unei observri discrete. n consecin nu exist o localizare n timp a valorilor msurate i conform enunului, nu se face referire la identificarea continuitii momentului nregistrrii vitezelor. Asfel n vederea prelucrrii statistice a datelor este necesar o ordonare cresctoare a valorilor din ir, obinndu-se un nou ir de valori care are o proprietate distinct: valorile au pierdut semnificaia momentului nregistrrii n timp, dar sunt ordonate dup un criteriu statistic (tab.2.3.).

Tabelul 2.3. irul ordonat de valori.

Nr.crt. Vit Nr.crt. Vit Nr.crt. Vit1. 17 11. 44 21. 492. 22 12. 44 22. 533. 28 13. 45 23. 544. 30 14. 45 24. 555. 41 15. 46 25. 596. 41 16. 47 26. 597. 42 17. 48 27. 668. 43 18. 48 28. 709. 43 19. 48 29. 7210. 44 20. 49 30. 88

Calcul mediei statistice de sondaj nu necesit aceast ordonare a valorilor. De altfel, cu excepia medianei de sondaj, nici ceilali indicatori statistici nu ar necesita operaia efectuat. Totui, n virtutea celor enunate anterior, operaia nu aduce prejudicii evalurii setului de date i proprietilor irului iniial. Grafic, cele dou iruri de valori sunt prezentate n fig.2.2.Indicatorii statistici calculai se prezint mpreun cu observaiile aferente nlocuirii numerice necesare, n talelul 2.4.

Tabelul 2.4. Indicatorii statistici calculai

Indicatorul U.M. Valoare Observaii

Media de sondaj km/h 48.000 Se aplic relaia (1)

Media geometric km/h 45.757 Se aplic relaia (2).

Media armonic h/km 0.021 Se aplic relaia (3).

Mediana de sondaj km/h 46.500 Se aplic (5)

Modul de sondaj km/h 43.500 Se aplic relaia (7).

Valoarea central km/h 52.50 Se aplic relaia (8).

Abaterea medie km/h 14.088 Se aplic relaia (9).ptratic

Dispersia 198.467 Se aplic relaia (10).

Amplitudinea irului km/h 71.000 Se aplic relaia (13).

Coeficientul de 0.293 Se aplic relaia (15).variaie

Momentele centrate 48.000 ; de ordinul 1 i 3 Se aplic (18); (19) i (20).

Analiza indicatorilor statistici ofer o serie de informaii utile privind particularitile fenomenului observat. Compararea valorilor obinute dup anumite criterii ofer posibilitatea orientrii etapelor urmtoare de prelucrare matematic n vederea determinrii legii de variaie a observrii i caracterizrii ( n acest caz : tendina de distribuie a vitezei pe artera de drum monitorizat ) tendinelor specifice irului de valori.

O prim cocluzie ce reiese din compararea rezultatelor este c indicatorii tendinei de grupare sunt mai apropiai de media geometric dect de cea aritmetic, fapt ce denot c fenomenul observat nu are caracterul de normalitate ce indic un trafic fluent i stabil.De asemenea exist o suspiciune c sondajul de trafic nu este suficient pentru a caracteriza regimul de vitez. Dac analizm valorile indicatorilor tendinei de grupare, abaterea maxim fa de media de sondaj este de 4,5 i aceasta este simetric att superior ct i inferior (fig.2.3.).Raportat ns la media geometric, abaterea maxim este doar de 2,25 (exceptnd valoarea central care arat o deviere 7,25). Totui n valori absolute abaterile sunt compatibile att n cazul comparrii cu media aritmetic ct i pentru media geometric.Constatarea este un argument al faptului c datele de trafic nregistrate sunt credibile i pot constitui referina privind caracteristicile de vitez.De asemenea se poate afirma c sondajul efectuat a surprins momente caracteristice din repartiia regimului de viteze (fig.2.4.).

O evaluare comparat a mediei de sondaj i a abaterii medii ptratice arat faptul c fa de irul ordonat de valori, gruparea datelor este suficient de bun (deci concludena eantionului poate fi acceptabil), deoarece intervalul: media de sondajabaterea medie ptratic cuprinde aproape n totalitate irul ordonat de valori (fig.2.5.).

2.1.2. GRUPAREA DATELOR STATISTICE I FRECVENE CARACTERISTICE

Indicatorii statistici nu ofer n totalitate informaii privind evaluarea eantionului rezultat n urma observrii de trafic. Determinrile bazate pe observaii discrete, permit efectuarea unor asocieri, care nu altereaz setul de valori sau interpretarea rezultatelor. Identificarea unei normaliti a distribuiei valorilor, este necesar pentru a putea fi intrepretate seturi mari de date.

n acest scop, datele sunt grupate, n aa numitele clase de valori. Caracteristic acestor grupri este tendina tuturor valorilor din interiorul unei clase de a converge spre o valoare central din interiorul intervalului de clas. n cele mai multe cazuri, statistica de trafic, face raportarea direct la variaia orar sau n intervale de timp mai mici de ordinul a 10, 15, sau 30 de minute.

Acest gen de reprezentare a variaiilor de trafic rutier sunt cele mai comune i predomin n toate activitile ce sunt destinate modelrii fluxurilor rutiere sau n vederea optimizrii acceselor n intersecii semaforizate. Spre exemplificare s considerm rezultatul unei monitorizri de viteze pe o arter urban (fig.2.6.). Datele furnizate prin intermediul observrii radar sunt prezentate n Anexa 1.

Sunt ns situaii n care pentru o evaluare corect i n scopul obinerii unor date primare ct mai credibile, necesare modelrilor de trafic, acest gen de evaluare statistic nu este cel mai potrivit i d natere la erori de proiect care au repercursiuni asupra aciunilor de normalizare a traficului.

Desigur, a se lucra direct pe setul de date colectate n urma observrii-monitorizrii de trafic este facil i mai rapid, eliminndu-se ns astfel o important etap din pregtirea statistic a eantionului: gruparea lor funcie de tendine i valori de referin. Aceasta poate aduce prejudicii privind identificarea corect a valorilor ce indic reala tendin privind variaia parametrului (sau parametrilor) de trafic analizat.

ndeosebi cnd eantioanele de date provin din observaii discrete, ce au fost efectuate n perioade de timp dispersate de-a lungul unui an calendaristic, sau n cazul necesitii identificrii tendinelor de macrofluctuaie a traficului, gruparea n clase de distribuie a irurilor de valori, constitue o etap obligatorie n evaluarea eantioanelor de date.

Aceste tendine constitue i un bun indicator privind legea de distribuie probabil, care modeleaz ct mai fidel evoluia parametrilor msurai.

Particularitatea este din plin exploatat n cazul determinrilor efectuate pentru un anumit regim stabil de trafic (pentru care, se spune c artera de circulaie prezint o tendin de ncrcare normal).

Ordonarea i gruparea datelor, se face prin distribuirea acestora n clase de valori, care cuprind toate rezultatele observaiei sau msurtorilor efectuate, ce se ncadreaz ntr-un interval de mrime impus i corelat cu volumul de date disponibil.

Numrul k de clase n care se grupeaz valorile supuse unei prelucrri statistice se determin funcie de mrimea n a eantionului. Relaia recomandat pentru determinarea numrului de clase este:

. (21)

Din valoarea calculat cu relaia (21), se extrage partea ntreag, fr a se efectua rotunjiri inferior sau superior, indiferent de tendina prii zecimale.

Pentru un numr redus de date (sub 25 de valori), gruparea n clase este puin semnificativ, suplimentul de informaie obinut fiind neconcludent.

n cazul n care setul de valori este relativ ridicat (>100), este recomandat pentru determinarea numrului de clase relaia:

. (22)

Shapiro-Wald, recomand n cazul eantioanelor statistice de volum mare, relaia:

. (23) Valori orientative ale numrului de clase, determinat funcie de dimensiunea n a eantionului prelucrat, pentru seturi de date de volum distinct, se prezint n tabelul 2.5.

Tabelul 2.5. Valori pentru numrul de clase determinate funcie de mrimea eantionului

Mrimea eantionului

(Shapiro-Wald)

Nr.Valori Nr.clase Nr.Val. Nr.clase Nr.Val. Nr.clase