CAPITOLUL 1
CONSIDERAŢII GENERALE
1.1. OBIECTUL DISCIPLINEI „TEORIA PRELUCRĂRII MĂSURĂTORILOR
GEODEZICE”
În diversele ştiinţe ale măsurătorilor de precizie, în general (statistică,
industrie, finanţe, mecanică, etc.) şi ale măsurătorilor terestre, în special
(astronomie, geodezie, fotogrametrie, teledetecţie, topografie aplicată),
atunci când se tratează problemele din punct de vedere al măsurătorilor de
precizie ridicată, trebuie luate în consideraţie erorile care le depreciază.
Se numesc erori, micile diferenţe rezultate între valorile aproximative
obţinute în urma unor măsurători şi valorile mai precise ce ar trebui să se
obţină (altfel spus, diferenţa dintre valoare măsurată şi valoarea de referinţă
– valoarea etalon). Valoarea mărimii măsurate reprezintă raportul dintre
mărimea măsurată şi o altă mărime de aceeaşi natură, luată ca etalon.
1.2. PROBLEMELE FIUNDAMENTALE ALE TEORIEI ERORILOR
MĂSURĂTORILOR
Erorile inerente, care însoţesc diversele măsurători efectuate în
scopurile şi domeniile mai sus amintite, generează trei probleme
fundamentale ale teoriei erorilor, şi anume:
să se găsească valorile cele mai juste (cele mai probabile) ale
mărimii sau mărimilor de interes măsurate faţă de diversele
măsurători efectuate în număr superior numărului de măsurători
necesare, pe care le vom nota cu ;
să se stabilească gradul de precizie pentru valorile găsite adică să
se stabilească un număr care să caracterizeze precizia medie a
uneia dintre măsurătorile efectuate pe care îl vom numi eroare
medie (abaterea standard) a unei singure măsurători, notată cu
;
cum se poate găsi un număr care să caracterizeze precizia valorii
pe care o vom considera drept cea mai bună, notată cu i.
1
Teoria erorilor este ştiinţa care studiază modul de apariţie şi de
propagare a erorilor şi încearcă soluţii de înlăturare a acestora, propunând o
metodă riguroasă de ajustare1 denumită „metoda celor mai mici pătrate”.
Ca tratare riguroasă, teoria erorilor se bazează pe calculul probabili-
tăţilor. În cadrul prezentului curs, vom aborda minimum de cunoştinţe
matematice de ordin statistic ce stau la baza teoriei erorilor necesare
înţelegerii tehnicilor utilizate de teoria prelucrării măsurătorilor geodezice. În
domeniul măsurătorilor terestre, studiul aprofundat al erorilor este necesar
deoarece ne ajută să efectuăm întotdeauna măsurători adecvate gradului de
precizie cerut, astfel: în unele cazuri nu este economic să efectuăm
măsurători mai precise decât este strict necesar iar în altele, dimpotrivă, nu
este permis să efectuăm măsurători şi calcule mai puţin precise decât ar
trebui.
1.3. ERORILE DE MĂSURARE. CLASIFICĂRI ŞI PROPRIETĂŢI
Se numeşte eroare sau greşeală, cantitatea mai mică sau mai mare cu
care valoarea aproximativă, măsurată, diferă de valoarea de referinţă care ar
trebui obţinută.
Pentru început, în scopul stabilirii acelor erori care por fi prelucrate
matematic şi în consecinţă sunt de interes direct în cadrul prezentului curs,
vom clasifica erorile logice aparente după mărimea şi cauzele lor. Astfel,
după ordinul de mărime putem avea:
erori mari, evitabile, numite şi greşeli;
erori propriu-zise (inevitabile) care sunt erori cu valori mici;
Erorile mari sunt sesizabile imediat, atunci când una dintre valorile
obţinută în măsurători repetate diferă mult, cu o cantitate inacceptabilă, de
celelalte, motiv pentru care se mai numesc şi greşeli grosolane. Acestea
trebuie eliminate imediat, neputându-se lua în considerare la calculul mediei
măsurătorilor.
În continuare, în cadrul tuturor consideraţiilor teoretice asupra erorilor,
se va presupune că toate erorile grosolane sunt evitabile, fiind descoperite şi
eliminate anterior trecerii la calculul valorilor celor mai probabile ale
mărimilor măsurate.
Drept consecinţă, vom subclasifica numai erorile propriu-zise
(inevitabile) rămase în urma acestui proces de selecţie.
1 în limbaj consacrat se numesc soluţii riguroase de compensare
2
1.3.1. Clasificarea erorile propriu-zise (inevitabile) după cauzele lor
Din acest punct de vedere luăm în considerare o serie de cauze:
imprecizia aparatelor sau a metodelor aplicate, grupate sub denumirea de
erori instrumentale, imperfecţiuni fizice sau greşeli ale operatorului, grupate
în erori umane, precum şi influenţa factorilor de mediu climatic (favorabili sau
mai puţin favorabili), grupate în erori fizice.
Erorile instrumentale sunt prezente din construcţie (imperfecţiuni care
diferă de la un aparat la altul al aceleiaşi serii) şi persistă în pofida faptului că
s-a efectuat verificarea şi rectificarea acestora. Erorile de acest tip cresc o
dată cu uzura aparatului şi pot fi reduse sau eliminate uneori prin metoda de
lucru adoptată, aspecte cunoscute din cadrul cursurilor de Topografie,
respectiv Aparate şi instrumente.
Erorile umane depind, atât de acuitatea şi coordonarea mişcărilor
operatorului precum şi de atenţia, gradul de pregătire teoretică, experienţa
practică a acestuia. Nu în ultimul rând, depind şi de condiţiile de lucru
inadecvate (presiuni, stres, etc.) sau de gradul de oboseală al operatorului.
Erorile fizice apar şi sunt influenţate în condiţiile schimbării
temperaturii, presiunii, umidităţii, luminozităţii, poluării atmosferei şi a
turbulenţei (schimbării valorilor locale sau de moment ale concentrării unor
componente ale aerului (particulele de praf, fumul).
1.3.2. Clasificarea erorile în funcţie de valoarea de referinţă:
a) erori adevărate:
(1.1)
unde
εi este eroare adevărată;
xi este valoare măsurată;
μi este valoarea adevărată a mărimii măsurate.
Acest punct de vedere este însă strict teoretic deoarece, în practică, nu
cunoaştem valoarea adevărată a mărimii de măsurat şi în consecinţă nu
putem determina valoarea adevărată a mărimii măsurate. Putem obţine însă
o valoare probabilă a mărimii respective, ceea ce ne duce la concluzia că noi,
încercăm, în permanenţă, să determinăm o eroare probabilă, care se mai
numeşte şi aparentă, definită prin relaţia (1.2).
3
b) erori aparente (probabile):
(1.2)
unde
este valoare aparentă (probabilă);
este valoare măsurată;
este valoare probabilă.
După cum vom vedea ulterior, valoarea cea mai probabilă a mărimii
măsurate, în aproximaţia în care se lucrează, în cazul măsurătorilor de
aceeaşi precizie, este chiar media aritmetică simplă (neponderată) a valorilor
individuale, conform (1.3) iar în cazul măsurătorilor de precizie diferită este
media ponderată:
(1.3)
sau, utilizând notaţia lui Gauss pentru sumă:
(1.4)
1.3.3. Clasificarea erorile propriu-zise (inevitabile) după modul lor de
acţionare
Din acest punct de vedere există:
erori sistematice;
erori întâmplătoare.
Erorile sistematice apar datorită unor cauze permanente, care
acţionează într-un mod constant, sau după legi în general, cunoscute. De
exemplu, dacă măsurăm la temperatura de etalonare o lungime cu o ruletă
(panglică) din oţel, cu o diferenţă în plus (mai lungă) de 0,02 m faţă de
lungimea pe care ea o reprezintă (datorită imperfecţiunii citate), rezultatul
final, va fi în mod sistematic greşit în minus, cu de n ori eroarea de 0,02 m a
instrumentului de măsurare directă a distanţelor utilizat. Rezultatul just al
măsurătorii se va obţine prin eliminarea erorii adică, aplicând, de fiecare dată
corecţia necesară (de etalonare), aşa după cum se va vedea ulterior, pe baza
statisticii matematice, aplicând teoria corelaţiei.
4
1.4. CLASIFICAREA MĂSURĂTORILOR
Se realizează, în general, funcţie de trei criterii:
1.4.1. După modul de determinare a mărimii care ne interesează se
disting:
măsurători directe;
măsurători indirecte;
măsurători condiţionate.
În cazul măsurătorilor directe, mărimile de interes se obţin prin
aplicarea directă a etalonului de măsurat peste acestea, fiecare măsurătoare
indepen-dentă generând câte o valoare pentru respectiva mărime.
Exemple de măsurători directe clare sunt: măsurarea distanţei dintre
două puncte cu ruleta, măsurarea unghiurilor verticale şi zenitale. Uneori, se
consideră măsurători directe funcţiile simple, explicite, de mărimi măsurate
direct, de exemplu: diferenţele de nivel în cazul nivelmentului geometric (cu
nivela), măsurarea unghiurilor azimutale (orizontale) ca diferenţă între două
direcţii sau chiar distanţele măsurate cu aparatură electro-optică, în cazul în
care sunt orizontale. Funcţiile simple pot avea una dintre expresiile (1.5):
în cadrul cărora , reprezintă mărimi măsurate direct
(1.5)
În cazul măsurătorilor indirecte, mărimile care ne interesează se obţin
prin intermediul altor mărimi măsurate direct, între mărimile determinate şi
cele măsurate direct existând anumite relaţii matematice (funcţii implicite).
Exemple de măsurători indirecte sunt: calculul diferenţelor de nivel prin
nivelment trigonometric (cu aparatura electro-optică), calculul coordonatelor
punctelor reţelei geodezice de sprijin (φ, λ, X, Y, Z, x, y, H), calculul para-
metrilor elipsoidului de referinţă, etc. De exemplu, în cazul coordonatelor
planului de proiecţie cartografică carteziene absolute (x, y) sau relative,
numite şi creşteri de coordonate (Δx, Δy) acestea se determină din
coordonatele polare topografice (D, θ) conform relaţiilor cunoscute (de
exemplu, atunci când sistemul cartezian plan are ordonata Ox cu sensul
pozitiv spre Polul Nord): (1.6), (1.7), (1.8):
(1.6)
5
respectiv coordonatele polare cartografice (ρ, δ), conform (1.9):
(1.7)
(1.8)
(1.9)
Măsurătorile condiţionate reprezintă un caz particular al măsurătorilor
directe numai în situaţia în care mărimile măsurate direct nu sunt mărimi
independente şi sunt legate prin anumite relaţii de condiţie. Condiţiile sunt
exprimate sub formă de relaţii matematice generate de proprietăţile
geometrice sau fizice ale mărimilor măsurate direct sau indirect.
De exemplu, în cazul măsurării unghiurilor unui triunghi plan, ABC
trebuie satisfăcută condiţia simplă, scrisă sub forma relaţiei:
(1.10)
care ne impune ca suma unghiurilor compensate ale triunghiului să fie de
200G. Diferenţa în plus sau în minus a sumei unghiurilor măsurate provizorii,
notate cu A0, B0, C0 faţă de această valoare, este neînchiderea, notată cu w,
conform cunoscutei relaţii (1.11) care, la compensare neriguroasă, se
împarte în mod egal la cele trei valori unghiulare determinate prin măsurători
indirecte (1.13), calculându-se astfel aşa-numitele erori de neînchidere vA, vB,
vC, egale şi de semn contrar corecţiei, notată generic c i care se va aplica,
conform celor ştiute de la topografie, tot prin distribuire în mod egal (1.14).
(1.11)
(1.12)
Suma acestor corecţii este egală şi cu semn contrar cu neînchiderea:
(1.13)
În domeniul topografic, erorile sunt considerate egale, şi anume, în exemplul
nostru reprezintă o treime din valoarea neînchiderii (1.14):
(1.14)
Dacă însă întru-un triunghi plan se măsoară direct toate elementele
liniare şi unghiulare (trei laturi şi trei unghiuri), adică un număr de n mărimi 6
(în cazul acesta n 6) dintre care un număr de r (în cazul acesta n 3) sunt
executate în excedent (în plus) sau suplimentar (se mai numesc măsurători
supraabundente) atunci, mărimile măsurate trebuie să satisfacă un număr de
r ecuaţii de condiţie. Din punct de vedere strict topografic însă, ar fi fost
suficiente fie măsurarea unei laturi şi două unghiuri adiacente acesteia fie
două laturi şi unghiul dintre ele situaţie în care, compensarea riguroasă a
măsurătorilor este imposibilă (în afară de compensarea în tur de orizont) şi
nu s-ar cunoaşte cu precizie ridicată valorile cele mai probabile ale
elementelor (unghiuri şi laturi).
1.4.2. După condiţiile de precizie:
măsurători de aceeaşi precizie;
măsurători de precizii diferite.
Condiţiile de precizie sunt rezultatul direct al condiţiilor practice de
măsurare iar în acest sens, măsurătorile de aceeaşi precizie sunt acele
măsurători efectuate cu acelaşi instrument, de către acelaşi operator, în
aceleaşi condiţii fizico-atmosferice şi orare, cu aceeaşi metodă iar dacă, de la
o sesiune de măsurare la alta, diferă unul sau mai mulţi factori dintre cei mai
sus amintiţi, măsurătorile devin măsurători de precizii diferite în cadrul
cărora, influenţa mai mare sau mai mică a acestor factori stabileşte o
pondere corespunzătoare, motiv pentru care se numesc măsurători
ponderate.
1.4.3. În funcţie de necesitate:
măsurători strict necesare;
măsurători suplimentare.
Cazul măsurătorilor strict necesare este acela în care, pentru
determinarea mărimii cerută se efectuează strict numărul de măsurători prin
care este posibilă obţinerea informaţiei căutate (vezi exemplul anterior). În
practica măsurătorilor geodezice se efectuează însă întotdeauna, măsurători
suplimentare pentru a se ridica gradul de precizie al poziţionării punctelor
sau al determinării unor parametri fizici. Numărul măsurătorilor suplimentare,
notat anterior cu r, le defineşte gradul de libertate şi conferă posibilitatea de
compensare riguroasă a lor, prin tehnicile Teoriei prelucrării măsurătorilor
geodezice, în majoritatea cazurilor prin metoda celor mai mici pătrate.
1.4.4. Funcţie de legătura de dependenţă (interdeterminare) dintre
măsurători:7
măsurători independente;
măsurători corelate.
CAPITOLUL 2
NOŢIUNI DE STATISTICĂ ŞI TEORIA PROBABILITĂŢILOR
2.1. TEORIA PROBABILITĂŢILOR
Erorile de măsurare şi observaţie au un caracter întâmplător (aleatoriu)
motiv pentru care Teoria prelucrării măsurătorilor topo-geodezice le
prelucrează după principii probabilistice situaţie în care ne vom familiariza cu
câteva noţiuni din acest domeniu interesat numai de experimente aleatoare,
adică numai de acele experimente în care intervine întâmplarea.
Unul dintre conceptele de bază ale teoriei probabilităţilor este
evenimentul. Este definit ca fiind fenomenul care se poate produce sau nu în
cadrul unui experiment şi despre care se poate spune cu certitudine dacă s-a
produs sau nu numai după efectuarea experimentului.
2.1.1. EVENIMENTE: DEFINIŢIE ŞI CARACTERISTICI. OPERAŢII CU
EVENIMENTE
Pentru o mai bună înţelegere considerăm exemplul experimentului
aruncării unui zar care are, în mod evident, un caracter aleatoriu. În acest caz
evenimentele pot fi: apariţia unei feţe cu număr par, apariţia unei feţe cu un
anumit număr, de exemplu 6, apariţia unei feţe cu număr mai mic de 3, mai
mare de 4, etc.
Fiecărui experiment îi corespunde un eveniment sigur, care se
realizează cu certitudine, notat cu E, şi un eveniment imposibil, notat cu ,
care nu se poate realiza la nici o efectuare a experimentului. Fiecărui
eveniment, notat cu A, îi corespunde un eveniment contrar, notat cu a
cărui realizare constă, prin definiţie, în nerealizarea primului şi deci aceste
evenimente sunt contrare unul altuia.
Două evenimente A şi B se numesc incompatibile dacă nu se pot realiza
simultan, respectiv compatibile dacă se pot realiza simultan.
8
Fiind date două evenimente, notate cu A, respectiv B se pot efectua
următoarele operaţii şi, de asemenea se pot stabili următoarele tipuri de
relaţii între evenimente:
2.1.1.1. Reuniunea
Se defineşte reuniunea lor, evenimentul a cărui realizare reclamă
realizarea a cel puţin unuia dintre evenimentele A, B.
2.1.1.2. Intersecţia
Se defineşte intersecţia lor, evenimentul a cărui realizare
reclamă realizarea simultană a evenimentelor A şi B. Dacă evenimentele
sunt:
compatibile expresia matematică este:
incompatibile expresia matematică este:
2.1.1.3. Diferenţa
Se defineşte diferenţa lor, evenimentul are se realizează atunci şi
numai atunci când se realizează A şi nu se realizează B şi matematic se
exprimă:
2.1.1.4. Incluziunea (implicarea)
În cadrul unei experienţe aleatoare se spune că evenimentul A implică
evenimentul B, dacă realizarea evenimentului A are drept consecinţă
realizarea evenimentului B şi matematic se exprimă: Se observă
imediat că orice eveniment implică evenimentul sigur, iar prin generalizarea
unor anumite rezultate se admite că evenimentul imposibil implică orice
eveniment, fapt ce se poate exprima prin următoarele tipuri de relaţii:
2.1.1.5. Echivalenţa
Evenimentele A şi B sunt echivalente dacă şi ce se poate
scrie
Evenimentul care nu este implicat în nici un eveniment diferit atât de el
însuşi cât şi de evenimentul imposibil se numeşte eveniment elementar al
unei experienţe aleatoare. Celelalte evenimente se numesc evenimente
compuse.
Notând cu K o clasă de submulţimi ale lui E care are următoarele
proprietăţi:
1. dacă atunci
2. dacă atunci
9
şi unde elementele lui K sunt evenimente, în cazul în care mulţimea E este
infinită se admite în plus că:
3. dacă atunci
Cuplul se numeşte câmp de evenimente. În acest câmp,
elementele lui E sunt evenimente elementare, evenimentul sigur este E, iar
evenimentul imposibil este .
2.1.2. Probabilitate: definiţie şi proprietăţi. Câmp de probabilitate
Fiind dat un câmp de evenimente , funcţia se numeşte
probabilitate dacă:
(2.1)
Dacă pentru şi I este o familie cel mult numărabilă de
indici.
Tripletul se numeşte câmp de probabilitate complet aditiv sau
câmp borelian de probabilitate.
Dacă E conţine un număr finit de elemente: se observă că:
În acest caz, orice eveniment
se va scrie: Presupunând că toate
evenimentele elementare, notate cu ei au aceeaşi probabilitate se deduce
imediat că:
(2.2)
Relaţia (2.2) este exprimarea matematică a definiţiei clasice2 a
probabilităţii conform D. Roşculeţ: probabilitatea este raportul dintre
numărul cazurilor favorabile şi numărul cazurilor egal posibile.
O altă definiţie rezultă mai simplu dacă considerăm un eveniment,
notat cu A, care poate avea un număr de n rezultate posibile, situaţie în care,
se numeşte probabilitate a acestuia şi se notează cu P(A), raportul dintre
numărul rezultatelor favorabile producerii evenimentului, notate cu m, şi
numărul total de rezultate, conform cu N. Fotescu:
(2.3)
2 Raportul dintre numărul cazurilor favorabile şi numărul cazurilor posibile într-un experiment în care toate rezultatele au şanse egale de apariţie, conform lui Jaques Bernoulli (1705)
10
Din definiţia probabilităţii îi rezultă implicit proprietăţile:
1. Probabilitatea evenimentului sigur este 1: (în urma experimentului
se produce cu certitudine unul din evenimentele câmpului)
2. Probabilitatea evenimentului imposibil este 0: .
3.
4. Probabilitatea unui eveniment întâmplător este cuprinsă între 0 şi 1.
5. Dacă atunci:
6. Dacă atunci:
7. Dacă atunci:
8. Dacă atunci:
9. Dacă atunci: rezultând produsul
probabilităţilor.
9. Dacă un şir de evenimente din K, atunci:
(probabilitatea reuniunii mai multor evenimente este egală cu suma
probabilităţilor evenimentelor).
10. , pentru orice eveniment X.
2.1.3. FORMULE UTILIZATE ÎN CALCULUL UNOR PROBABILITĂŢI
2.1.4. Variabile aleatoare
Variabila aleatoare sau variabila stochastică este o mărime care, în
funcţie de rezultatul unui experiment, poate lua o valoare dintr-o mulţime
bine definită de valori (mulţimea valorilor posibile). Ea poate fi continuă sau
discretă.
Se numeşte continuă, o variabilă aleatoare ale cărei valori posibile
umplu un interval finit sau infinit.
Se numeşte discretă, o variabilă aleatoare care poate lua numai valori
izolate. Numărul posibil al unei variabile aleatoare discrete se consideră în
general a fi finit (sau cel mult numărabil).
2.1.4.1. Repartiţia unei variabile aleatoare discrete
Se numeşte repartiţie a unei variabile aleatoare discrete, enumerarea
valorilor posibile ale variabilei aleatoare şi a probabilităţilor corespunzătoare
acestora. De obicei această repartiţie se scrie sub forma unui tablou în care,
prima linie conţine toate valorile posibile, iar a doua linie conţine
probabilităţile corespunzătoare:
11
, unde 1 i n(2.4)
Deoarece variabila X, care ia valorile X1, X2, …, Xn, formează un sistem
complet de evenimente, avem:
Densitatea de repartiţie – a unei variabile aleatoare X este definită de
derivata funcţiei de repartiţie:
Legătura dintre funcţiei de repartiţie şi densitatea de repartiţie este
exprimată prin:
şi este reprezentată de aria zonei delimitate de axa x şi curba
Probabilitatea ca variabila aleatoare X sa ia valori în intervalul (a,b] este:
Deoarece probabilitatea ca variabila aleatoare X să ia valori între
este 1 (certitudinea), rezultă:
(adică suprafaţa cuprinsă între curbă şi axa absciselor rămâne întotdeauna
egală cu unitatea).
Distribuţii utilizate în studiul erorilor de măsurare
...................
Fiecare eroare de măsurare iε este rezultantă a n erori individuale
.
...........................
Densitatea de repartiţie a erorii aleatoare este:
Înlocuind mărimea cu rezultatul măsurării , relaţia devine
12
şi se spune că x urmează legea de repartiţie normală de parametri ,
notată
....................
Proprietăţile densităţii normale de repartiţie:
1) Curba ................... şi scade treptat..............
2) Deoarece curba erorilor normal...........
3)
4) .................
......................
13
Fig.2.1Reprezentarea grafică a densităţii de repartiţie
normală
0,15
42,842,8
34,1 34,1
68,2
95,6
99,7
0,15
f(x)
Se poate calcula probabilitatea ca variabila aleatoare să ia valori într-un
interval dat. În particular sunt calculate următoarele probabilităţi:
.....................
Dacă în cazul distribuţiei normale se face schimbarea de variabilă:
, se obţine distribuţia Laplace. În acest caz variabila Z are media 0
şi dispersia 1 şi se notează , cu densitatea de repartiţie:
Funcţia este dată de relaţia:
Media variabilei este n, iar varianţa 2n.
Repartiţia (n) şi repartiţia normală sunt legate prin teoremele:
Fig. 2.2Curbele densităţii de repartiţie normal având acelaşi centru de dispersie şi erori medii
pătratice diferite
)
14
a) dacă variabilele aleatoare sunt distribuite normal cu N(0,1)
atunci variabilele aleatoare este repartizată
b) dacă X este o variabilă aleatoare repartizată
este o estimaţie a varianţei populaţiei respective, atunci variabila aleatoare
este repartizată (se citeşte hi pătrat cu n-1 grade de
libertate).
Distribuţia t (student)...........
...............
Daca reprezintă media unei selecţii de volum n asupra unei variabile
aleatoare x repartizate atunci variabila aleatoare
urmează o repartiţie t(n-1)
Distribuţia F (Fisher) – Varianta aleatoare x urmează o repartiţie Fischer cu
grade de libertate,notata daca are densitatea de repartiţie:
Media variabilei aleatoare este , iar varianţa
pentru
Repartiţia Fischer este legata de repartiţia normala prin teorema:
15
Daca X si Y sunt doua variabile aleatoare independente repartizate
, atunci, variabila este repartizată
Pe baza legăturilor stabilite între repartiţiile rezultă:
- repartiţia t descrie repartiţia mediei;
- repartiţia descrie repartiţia variantei;
- repartiţia F permite compararea variantelor a două selecţii din aceeaşi
populaţie.
2.1.4.2. Funcţia de repartiţie a unei variabile aleatoare
Este funcţia care exprimă probabilitatea ca valorile acestei variabile să
fie mai mici decât un număr real, notat cu x: şi care are
următoarele proprietăţi:
1.
2.
3.
4. Dacă
5. În cazul variabilelor aleatoare discrete, funcţia de repartiţie este:
adică suma probabilităţilor valorilor situate la stânga lui
x.
2.1.4.3. Operaţii cu variabile aleatoare discrete
1. Adunarea variabilelor aleatoare discrete
Fiind date două variabile aleatoare X şi Y, vom numi suma lor, variabila:
, unde 1 i n; 1 j m(2.5)
unde Pij este probabilitatea realizării simultane a egalităţii: şi în
acest caz:
(2.6)
2. Produsul variabilelor aleatoare discrete
Prin definiţie acesta este Z = X · Y şi are distribuţia:
16
(2.7)
2.1.4.4. Variabile aleatoare independente
Variabilele X şi Y se numesc independente dacă pentru i şi j, 1 i n;
1 j m, evenimentele (X Xi) şi (Y Yj) sunt independente, caz în care avem:
(2.8)
2.2. STATISTICĂ MATEMATICĂ
Statistica matematică este o ramură a matematicii aplicate care se
ocupă cu gruparea, analiza şi interpretarea datelor referitoare la un anumit
fenomen de masă, precum şi unele previziuni privind producerea lui viitoare.
Se numeşte populaţie statistică sau mai simplu populaţie, orice
mulţime de elemente care este supusă unei prelucrări statistice.
Pentru a putea forma o populaţie, toate aceste elemente trebuie să
satisfacă o proprietate comună. Fiecare element al populaţiei poartă numele
de unitate statistică sau individ, iar proprietatea comună care interesează
statistica se numeşte caracteristică. Dacă informaţiile statistice sunt luate de
la fiecare individ al unei populaţii, se realizează o enumerare completă.
Datorită condiţiilor concrete referite la cost, timp, probleme de organizare, de
cele mai multe ori enumerarea completă este impracticabilă, preferându-se
prelevarea informaţiei de la un număr oarecare de indivizi, luaţi la întâmplare
din populaţia respectivă, realizându-se astfel o selecţie.
De exemplu, populaţia este o mulţime ale cărei elemente au anumite
caracteristici comune iar selecţia reprezintă o submulţime a populaţiei
extrasă după anumite reguli. Simplificând, putem spune că în domeniul
statistic se evaluează cantitativ şi calitativ pe lângă mulţimi şi submulţimi iar
pentru a caracteriza elementele populaţiei se utilizează o serie de indicativi
cantitativi şi calitativi.
În domeniul topo-geodezic ne interesează numai indicatorii cantitativi
dintre care sunt necesari şi suficienţi doi: media şi dispersia.
După ce, în urma observaţiilor s-au obţinut datele necesare sub formă
numerică, primul pas în interpretarea şi analiza datelor constă în
reprezentarea lor grafică.
17
În funcţie de caracterul materialului şi problema care trebuie rezolvată
se folosesc următoarele tipuri de grafice:
a. hărţi rectilinii
Două caracteristici ale unui individ sunt reprezentate sub forma unui
punct într-un sistem de axe de coordonate rectangular3. Diferite serii de date
asemănătoare, clasificate după aceeaşi caracteristică, pot fi reprezentate pe
acelaşi grafic.
b. grafice circulare şi dreptunghiulare
Graficul circular este un cerc împărţit în diferite sectoare circulare cu
unghiurile la centru proporţionale cu diferite componente ale totalului. În
graficul dreptunghiular cantităţile sunt reprezentate prin arii sau lungimi
aşezate orizontal sau vertical.
Pentru o mai uşoară interpretare a rezultatelor şi pentru simplificarea
calculelor se poate face o grupare a observaţiilor efectuate asupra unei
singure caracteristici comună unui număr mare de indivizi. În acest scop se
împarte intervalul de variaţie într-un număr de intervale egale şi se
înregistrează numărul de observaţii încadrate în fiecare interval, număr ce se
numeşte frecvenţa absolută a intervalului. Tabela care ne arată repartiţia
frecvenţelor în intervale se numeşte tabelă de frecvenţă.
Dacă frecvenţa absolută se notează cu fi atunci frecvenţele relative se
definesc prin:
unde n reprezintă numărul total de observaţii(2.8)
De exemplu, dacă asupra unei mărimi se execută un număr de n
măsurători sau determinări, obţinem, în general, un număr de n valori, notate
cu xi, unde valori care constituie o variabilă aleatoare.
Distribuţia acestei variabile este complet definită dacă se prezintă într-un
tablou atât valorile respective cât şi frecvenţele de apariţie ale acestor valori
(tabelul nr. 1), în cadrul căruia:
x1, x2, x3, ….., xn sunt valori ale variabilei aleatoare;
fi reprezintă frecvenţa absolută de apariţie, având forma:
(2.9)
dacă notăm:
ni numărul cazurilor;
3 se înţelege un sistem cartezian ortogonal
18
n numărul total al măsurătorilor (încercărilor).
Tabelul nr. 1
xi x1 x2 x3 …… xn
fi f1 f2 f3 …… fn
Dacă împărţim în mai multe intervale valoarea variabilei aleatoare x i şi
adoptăm un sistem cartezian plan de coordonate xOy, în care pe axa
absciselor vom marca mărimea intervalului iar pe axa ordonatelor frecvenţa
de apariţie vom obţine o reprezentare grafică a distribuţiei numită diagrama
frecvenţelor sau histogramă.
În cazul reprezentărilor intervalele pot fi alese egale sau inegale dar
este recomandabil totuşi să fie egale. De asemenea, se recomandă ca pe axa
ordonatelor să se aleagă scara astfel încât suprafaţa fiecărui dreptunghi
(format de mărimea intervalului şi frecvenţa de apariţie) să genereze
frecvenţe relative. În aceste condiţii se ajunge ca, în final, însumând toate
suprafeţele frecvenţelor de apariţie să realizăm suprafaţa totală egală cu
unitatea. Suma acestor suprafeţe reprezintă o formă geometrică denumită
poligonul frecvenţelor. Dacă mărimea intervalului tinde către 0, numărul
măsurătorilor tinde către ∞, atunci poligonul frecvenţelor tinde către o curbă
continuă, curbă ce se numeşte densitatea de probabilitate a variabilei
aleatoare respective. Această curbă este complet definită de către o funcţie
de aspectul:
(2.10)
unde:
P(xi) reprezintă probabilitatea de apariţie a valorii respective;
F(xi) reprezintă densitatea de probabilitate.
2.3. Valori tipice folosite în măsurători
Pentru o mai bună înţelegere a noţiunilor de bază cu care se lucrează în
cadrul Teoriei Prelucrării Măsurătorilor şi Geodezice vom prelua câţiva
indicatori din cadrul statisticii matematice şi le vom studia proprietăţile.
2.3.1. Indicatori cantitativi
2.3.1.1. Media
În cazul variabilelor aleatoare continue, expresia mediei este:
19
(2.21)
unde se mai numeşte operator de medie.
În cazul valorilor discrete, expresia mediei este:
(2.22)
unde fi este frecvenţa de apariţie şi are expresia (2.4).
Un caz particular îl reprezintă situaţia în care variabila aleatoare x i
apare o singură dată, expresia mediei fiind:
(2.23)
Proprietăţile mediei sunt următoarele:
1) unde a const.
2)
3)
4) dacă
(2.24)
2.3.1.2. Dispersia (varianţa)
Dispersia teoretică, notată cu D, este un parametru care caracterizează
gradul de împrăştiere a valorilor individuale în jurul mediei sau varianţa.
În cazul variabilelor aleatoare continue, dispersia are expresia:
(2.25)
În cazul valorilor discrete, dispersia are expresia:
(2.26)
Un caz particular îl reprezintă situaţia în care variabila aleatoare, notată
cu xi, apare o singură dată, expresia dispersiei fiind:
(2.27)
Deoarece dispersia reprezintă o măsură medie a abaterilor individuale
faţă de medie, nu pot fi luate ca măsuri a împrăştierii, expresii de forma
(1.28):
sau (2.28)
20
Deoarece în practică, numărul de măsurători este întotdeauna finit, se
obişnuieşte să se folosească dispersia de selecţie în locul celei teoretice:
(2.28)
Pentru a putea însă exprima abaterea medie în aceeaşi unitate de
măsură ca şi variabila, în practică se utilizează rădăcina pătrată a dispersiei
ce reprezintă abaterea standard numită şi abatere standard sau eroare
medie pătratică:
(2.29)
Proprietăţile dispersiei sunt următoarele:
1) , unde a const.
2)
3)
4) , dacă
5) , dacă
(2.30)
2.3.2. Momente
Prin moment de ordinul k al unei variabile aleatore se înţelege:
pentru funcţii continue, expresia:
(2.31)
pentru valori discrete, expresia:
(2.32)
Pentru cazul particular în care valoarea xi apare o singură dată avem:
(2.33)
Pentru relaţia (1.33) defineşte media aritmetică.
Momentul centrat de ordin k:
(2.34)
2.3.3. Covarianţa coeficientului de corelaţie
21
Covarianţa exprimă gradul de interdependenţă dintre variabilele întâm-
plătoare (în aceeaşi măsură atunci când una se îndepărtează de media sa se
îndepărtează şi celelalte de media lor).
Dacă x şi y sunt două variabile aleatoare se numeşte covarianţă
(corelaţie) a numărului lor, una dintre cele două relaţii de mai jos:
(covarianţa teoretică)
(2.34)
sau
(covarianţa de selecţie)
(2.35)
Coeficientul de corelaţie se utilizează pentru a determina gradul de
interdependenţă dintre două componente x şi y. Considerând schimbarea de
variabilă:
; (2.36)
avem:
(2.37)
Coeficientul de corelaţie, notat cu rxy, caracterizează legătura dintre
două variabile aleatoare studiate simultan, valorile pe care le preia fiind
cuprinse între 1 şi ‒1. Se exprimă cu relaţia:
pentru ‒1 r 1(2.38)
Dacă r 1, între cele două variabile există o legătură liniară, ele fiind
complet corelate (pozitiv sau negativ). Cu cât r ia valori mai apropiate de 1
sau ‒1 cu atât corelaţia dintre mărimile studiate este mai puternică. Un
coeficient de corelaţie egal cu 0 arată că cele două variabile sunt
independente.
Aplicaţii
1. Dispersia unei variabile aleatoare
În unele aplicaţii practice este mai comod să se opereze cu expresia dispersiei sub forma
următoare:
(2.39)
22
2. Normarea unei variabile aleatoare
Considerând variabila:
(2.40)
unde Z este variabila normalizată, iar expresia mediei este:
(2.41)
iar expresia dispersiei, atunci când este:
(2.42)
3. Dispersia mediei aritmetice
Media aritmetică are expresia:
(2.43)
Dacă, au aceeaşi dispersie, adică:
(2.44)
4. Media şi dispersia vectorului aleator
(2.45)
2.3.4. Media şi dispersia unei funcţii de n variabile aleatoare
2.3.4.1. Funcţii liniare
2.3.4.1.1. Media unei funcţii liniare
Fie o funcţie liniară:
(2.46)
iar, conform proprietăţilor mediei, rezultă:
(2.47)
2.3.4.1.2. Dispersia unei funcţii liniare
Fie o funcţie liniară Z cu doua variabile aleatoare x şi y:
23
(2.48)
În mod similar, funcţiei: îi corespunde
următoarea exprese de calcul a dispersiei:
(2.48)
care se numeşte eroarea liniară a funcţiei.
2.3.4.2. Funcţii neliniare
Fie funcţia neliniară:
(2.49)
pe care o considerăm continuă pe domeniul D şi stabilim că ea admite
derivate parţiale de orice ordin. Funcţia poate fi adusă la forma liniară prin
aplicarea unei dezvoltări în serie Taylor în jurul unor valori aproximative, din
care reţinem numai termenii de ordinul I.
Figura nr. 1. Interpretarea geometrică a dezvoltării în serie Taylor
(2.50)
2.3.4.2.1. Media unei funcţii neliniare
(2.51)
2.3.4.2.2. Dispersia unei funcţii neliniare
Dispersia se poate scrie sub forma:
F(X)
x
24
(2.52)
Dacă variabilele sunt independente, atunci:
şi
Uneori se dă eroarea funcţiei şi se cer erorile parametrilor. În acest caz,
pentru a determina erorile medii pătratice se aplică principiul influenţelor
egale ale erorilor.
Atunci când în expresie ne intervin şi funcţii trigonometrice ale căror
erori sunt exprimate în secunde (centezimale sau sexagesimale), pentru ca
funcţia să fie liniară acestea trebuie exprimate în radiani, operaţie ce se
realizează prin aplicarea coeficientului de transformare ρcc, respectiv ρ″.
2.3.5. Matricea de varianţă – covarianţă
Fiind daţi un număr de n vectori aleatori: X1, X2, ….., Xn pentru care se
calculează varianţele şi covarianţele în toate combinaţiile dintre cei n vectori,
apoi aceste valori se ordonează într-un tablou se obţine matricea de varianţă
‒ covarianţă, de forma generală:
(2.53)
elementele de pe diagonala principală reprezentând varianţa iar cele
dinafară reprezentând covarianţa.
De exemplu, matricea de varianţă ‒ covarianţă pentru trei variabile: x, y şi z se
scrie sub forma:
(2.54)
Elementele de pe diagonala principală reprezintă varianţa iar cele dinafară
reprezintă covarianţa şi se determină cu relaţia:
(2.55)
Dacă i j, atunci varianţa este egală cu media dispersiei:
(2.56)
Proprietăţile matricei de varianţă ‒ covarianţă sunt următoarele:
25
1. Este o matrice pătrată, simetrică şi pozitiv definită:
2. Dacă toate covarianţele sunt nule: pentru i, j; i j, atunci
variabilele respective sunt independente (sau vectorii X1, X2,…., Xn sunt
independenţi).
3. Dacă toate covarianţele sunt nule şi varianţele sunt diferite:
măsurătorile sunt independente de precizii diferite.
4. Dacă toate covarianţele sunt nule şi varianţele sunt egale:
atunci vectorii sunt de aceeaşi precizie, vorbim despre măsurători
independente de aceeaşi precizie.
În unele cazuri, pentru a determina gradul de corelaţie dintre componente, se calculează
matricea de corelaţie care are următorul aspect:
unde (2.57)
2.3.6. Ponderile
2.3.6.1. Definirea ponderilor
Se numeşte pondere expresia numerică a încrederii acordate unei
valori măsurate. Dacă mai multor măsurători li se atribuie aceeaşi pondere,
acestea sunt considerate măsurători de aceeaşi precizie. Uneori însă, în
cadrul aceleiaşi lucrări, se prelucrează măsurători care prezintă diferite grade
de încredere, adică au ponderi diferite, situaţie în care este necesar să se
stabilească un procedeu de determinare a ponderii.
Considerăm două măsurători x1 şi x2, executate asupra aceleiaşi mărimi
care au varianţele respectiv Considerăm că p1 şi p2 reprezintă
ponderile celor două măsurători adică expresiile numerice ale încrederii
acordate acestora, se poate sune că ponderea este invers proporţională cu
varianţa:
(2.5)
unde c este o constantă de proporţionalitate oarecare. Dacă se consideră
atunci relaţia (2.) poate fi scrisă pentru o măsurătoare oarecare x i sub
forma:
26
(2.59)
Factorul de proporţionalitate, notat cu este numit variaţia unităţii de
pondere (varianţa unei măsurători cu ponderea 1 sau factor de varianţă.
Dimensiunea ponderii este inversa dimensiunii varianţei respectivei
măsurători adică, inversa pătratului dimensiunii valorii măsurate. De
exemplu, dacă valoarea măsurată este exprimată în metri (m), varianţa se
exprimă în m2, iar ponderea în m-2.
În practica lucrărilor de specialitate se calculează însă inversa ponderilor:
(2.60)
Ţinând seama de expresia lui avem:
(2.61)
unde:
(2.62)
deci putem scrie relaţia care reprezintă cazul cel mai general al ponderii unei funcţii:
(2.63)
Dacă variabilele aleatoare sunt independente, atunci:
(2.64)
Expresia de calcul a ponderea va fi:
(2.65)
În cazul unei selecţii, variaţia unităţii de pondere, notată cu are expresia
de calcul:
1-n
x-xps
n
1i
2
ii20
(2.66)
Rădăcina pătrată din varianţa unităţii de pondere (1.71) se numeşte abaterea
standard a unităţii de pondere sau eroare medie pătratică a unităţii de
pondere:
27
(2.67)
2.3.6.2. Legătura dintre matrice ponderilor şi matricea de varianţă ‒
covarianţă
În unele probleme, nu sunt cunoscute valorile efective ale varianţelor şi
covarianţelor, motiv pentru care sunt înlocuite cu nişte cantităţi proporţionale
cu acestea numite coeficienţi de pondere, notaţi cu qii, factorul de
proporţionalitate fiind varianţa unităţii de pondere:
Astfel:
, unde şi (2.68)
sau unde (2.69)
Cu toate aceste condiţii, matricea de varianţă ‒ covarianţă devine:
(2.70)
unde Qxx este matricea coeficienţilor de pondere.
Varianţa unităţii de pondere este adimensională, iar coeficienţii unităţii
de pondere au aceeaşi unitate de mărime ca şi varianţa sau covarianţa.
Dacă se exprimă ponderea pi şi se consideră vectorii aleatori
independenţi (variabilele independente), atunci matricea de varianţă ‒
covarianţă devine:
(2.71)
28
(2.71)
p, matricea ponderilor este o matrice simetrică de forma:
(2.72)
Dacă variabilele aleatoare independente sunt de aceeaşi precizie:
iar în matricea de varianţă – covarianţă, avem:
se obţine, cazul variabilelor aleatoare independente de aceeaşi precizie,
unde, matricea de varianţă – covarianţă are expresia:
cu I este notată matricea unitate.
Exemplu: transmiterea erorilor în unele lucrări topo–geodezice
1. Eroarea unui unghi în funcţie de eroarea direcţiilor.
Se consideră direcţiile măsurate d1 şi d2. Unghiul se obţine ca
diferenţă a celor două direcţii. Funcţia de mărimi măsurate direct va fi:
.
29
iar dispersia acesteia va fi:
dacă se consideră şi măsurătorile ca fiind
independente
30
Top Related