teza doctorat..

117
ROMÂNIA MINISTERUL APĂRĂRII NAŢIONALE Academia Tehnică Militară mr. ing. ALEXEI Adrian-Mihai REZUMAT TEZĂ DE DOCTORAT TEMA: CONTRIBUŢII PRIVIND CULEGEREA SEMIAUTOMATĂ A DATELOR CARTOGRAFICE DIGITALE CONDUCĂTOR ŞTIINŢIFIC: gl. bg. (r) prof. univ. dr. ing. NIŢU Constantin - BUCUREŞTI 2005 - © Academia Tehnică Militară (ATM) CUPRINS 3 CUPRINS CUPRINS............................................................................................................... ...................3 1. INTRODUCERE ...................................................................................................... .............5 2. STADIUL ACTUAL PRIVIND EVOLUŢIA SIG................................................................6 2.1 Evoluţia Sistemelor Informaţionale Geografice....................................................... ................ 6 2.2 Evoluţia metodelor de culegere a datelor cartografice..................................................... ....... 7 3. METODE DE CULEGERE A DATELOR...........................................................................9 3.1 Tipuri de date cartografice .................................................... .................................................... 9 3.2 Structuri de date în SIG ............................................................. .............................................. 10

Transcript of teza doctorat..

ROMNIA MINISTERUL APRRII NAIONALE Academia Tehnic Militarmr. ing. ALEXEI Adrian-Mihai

REZUMAT TEZ DE DOCTORAT

TEMA: CONTRIBUII PRIVIND CULEGEREA

SEMIAUTOMAT A DATELOR CARTOGRAFICE DIGITALE CONDUCTOR TIINIFIC: gl. bg. (r) prof. univ. dr. ing. NIU Constantin - BUCURETI 2005 Academia Tehnic Militar (ATM)CUPRINS

3

CUPRINSCUPRINS................................................................................. .................................................3 1. INTRODUCERE ........................................................................ ...........................................5 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG................................................................62.1 Evoluia Sistemelor Informaionale Geografice....................................................................... 6 2.2 Evoluia metodelor de culegere a datelor cartografice............................................................ 7

3. METODE DE CULEGERE A DATELOR...........................................................................9

3.1 Tipuri de date cartografice .................................................................................... .................... 9 3.2 Structuri de date n SIG ................................................................................................. .......... 103.2.1 Structuri de date de nivel inferior........................................................................................................ 10 3.2.2 Structuri de date de nivel nalt ............................................................................................................ 11

3.3 Surse de date................................................................................................ ............................. 12

3.4 Evaluarea preciziei metodelor de digitizare ........................................................................... 13

4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTERVECTOR .................15

4.1 Algoritmi de vectorizare...................................................................................... ..................... 154.1.1 Algoritmi de vectorizare ntr-un singur pas ........................................................................................ 15 4.1.2 Algoritmi de vectorizare n doi pai.................................................................................................... 16

4.2 Prelucrri post vectorizare ..................................................................................... ............... 16 4.3 Algoritm propus pentru vectorizare ..................................................................................... .. 164.3.1 Vectorizarea elementelor liniare prin algoritmul propus .................................................................... 17 4.3.2 Vectorizarea elementelor areale prin algoritmul propus ..................................................................... 20

4.4 Analiza performanelor algoritmilor de vectorizare ............................................................. 21

5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE.............................23

5.1 Segmentarea imaginii .......................................................................................... ..................... 23 5.2 Generarea descriptorilor formei pentru interpretarea automat ........................................ 24 5.3 Recunoaterea semnelor convenionale punctuale................................................................. 285.3.1 Recunoaterea automat a semnelor convenionale punctuale pe baza semnturii formei ................. 28 5.3.2 Recunoaterea automat a semnelor convenionale punctuale pe baza descriptorilor Fourier............ 30

5.4 Algoritm propus pentru identificarea semnelor convenionale punctuale .......................... 32

6. SURSE DE ERORI N SIG ........................................................................................ ........34

6.1 Precizia hrilor ........................................................................................... ............................. 346.1.1 Eroarea de poziionare ..................................................................................................................... ... 34 6.1.2 Eroarea atributelor (datelor tematice) ................................................................................................. 35

6.1.3 Eroarea conceptual ................................................................................................................... ......... 35 6.1.4 Eroarea de consisten..................................................................................................................... ... 35

6.2 Surse de erori ............................................................................................... ............................. 36 6.3 Verificarea preciziei datelor spaiale....................................................................................... 376.3.1 Testarea preciziei de poziie................................................................................................................ 38 6.3.2 Testarea preciziei atributelor............................................................................................................... 44CUPRINS

4

6.4 Propagarea i cumularea erorilor n SIG ............................................................................... 466.4.1 Propagarea erorilor............................................................................................................................ .47 6.4.2 Cumularea erorilor ........................................................................................................................... ...47

7. STUDII I CERCETRI EXPERIMENTALE................................................................. 487.1 Testarea scanerului CONTEX Chameleon TX ........................................................................ 49 7.2 Rectificarea imaginii scanate........................................................................................... ......... 50 7.3 Culegerea datelor cartografice cu ajutorul algoritmilor propui ......................................... 547.3.1 Vectorizarea originalului de editare cu relieful ...................................................................................55 7.3.2 Vectorizarea originalului de editare cu hidrografia.............................................................................57 7.3.3 Recunoaterea semnelor convenionale prin algoritmul propus..........................................................58

7.4 Editarea / Corectarea datelor culese ....................................................................................... 59 7.5 Generarea bazei de date geografice....................................................................................... .. 607.5.1 Proiectarea bazei de date .....................................................................................................................60 7.5.2 Popularea cu atribute a bazei de date geografice.................................................................................61 7.5.3 Propunere de structur de date ............................................................................................................61

7.6 Determinarea preciziei bazei de date ...................................................................................... 63

7.7 Software de gestiune a bazelor de date geografice ................................................................. 64

8. CONCLUZII FINALE.................................................................................... .................... 67 GLOSAR DE TERMENI................................................................................. ....................... 73 BIBLIOGRAFIE SELECTIV.............................................................................. ................ 75CAPITOLUL 1. INTRODUCERE

5

1. INTRODUCERESistemele Informaionale Geografice, prescurtat SIG, sunt vzute de muli ca un caz special de sisteme informatice generale. Informaia este derivat din interpretarea datelor care sunt reprezentri simbolice ale caracteristicilor. Valorile informaiilor depind de mai multe elemente, incluznd temporalitatea, contextul n care sunt aplicate precum i costul de colectare, stocare, prelucrare i prezentare. Din costul total de realizare a unui sistem informaional geografic, culegerea datelor reprezint aproximativ 70 %. Dispunnd de mijloace moderne de calcul, nu se mai pune problema realizrii de documente cartografice analogice, ci aceea de culegere a datelor n vederea realizrii unor baze de date geografice complexe, cu ajutorul crora s se redea pe terminale documente text i grafice, cu soluii ale problemelor pe care utilizatorul trebuie s le rezolve. Datele folosite ntr-un sistem informaional geografic pot proveni dintr-o mare varietate de surse, att analogice ct i digitale: cataloage i tabele de

coordonate, hri tiprite sau originale de editare, msurtori n teren, nregistrri fotogrammetrice i de teledetecie, baze de date cartografice existente etc. Sursa primar pentru ncrcarea bazei de date a unui SIG o constituie hrile topografice existente. Prin urmare, principalul pas n generarea datelor unui SIG este procesul de conversie analog-digital. Lucrarea de fa abordeaz mai multe aspecte teoretice i practice privind dezvoltarea unor metode i algoritmi pentru culegerea automat/semiautomat a datelor cartografice i pentru validarea acestora. Pentru rezolvarea acestor probleme, cercetrile autorului au fost orientate pe urmtoarele direcii: - elaborarea unor metode i algoritmi pentru vectorizarea automat; - elaborarea unor algoritmi pentru culegerea automat a datelor reprezentate prin semne convenionale punctuale; - elaborarea unor metode pentru testarea preciziei unei baze de date geografice.CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG

6

2. STADIUL ACTUAL PRIVIND EVOLUIA SIGCeea ce reprezint astzi domeniul SIG are o istorie destul de recent, ale crei nceputuri pot fi localizate n jurul anului 1960, odat cu aplicarea tehnicii de calcul n realizarea unor hri simple. Aceste hri puteau fi stocate i modificate n calculator i vizualizate, fie prin afiare pe ecran, fie prin imprimare pe hrtie. Conceptul de SIG apare pentru prima dat pe continentul nord-american

(Canada i Statele Unite), n urm cu mai bine de 40 de ani. Primul SIG este cel dezvoltat de canadieni n anul 1963, n cadrul unei operaiuni de inventariere a resurselor naturale. Realizat la o scar foarte mic i cunoscnd o continu perfecionare de-a lungul anilor, Canada Geographic Information System (CGIS) se afl i astzi n funciune. Dezvoltarea sa a adus numeroase contribuii conceptuale i tehnice la evoluia general a sistemelor informaionale geografice: - utilizarea scanrii materialelor cartografice analogice; - vectorizarea imaginilor scanate; - structurarea datelor geografice pe straturi tematice; - conceptul de tabel de atribute. Principala problem pe care ncearc s o rezolve un SIG const n realizarea automat a analizelor geografice, utiliznd n acest scop calculatorul electronic. Un SIG poate furniza rspunsuri la ntrebrile referitoare la: - localizare (ce se gsete la ... ?); - condiionare (unde se poate gsi ... ?); - evoluie (ce s-a schimbat de la ... ?); - simulare (ce s-ar ntmpla dac ... ?). Pe harta analogic, analizele menionate mai sus nu pot fi fcute dect de ctre om, pe baza unei imagini personale a spaiului geografic. Corectitudinea deciziilor rezultate n urma unei analize geografice depinde att de calitatea hrii disponibile, ct i de cunotinele i experiena acumulate, n domeniul specific studiului efectuat de ctre persoana care face acea analiz. 2.1 Evoluia Sistemelor Informaionale Geografice Dezvoltarea SIG dup 1990 s-a bazat pe trei elemente principale

dezvoltarea tehnologiei, nevoile utilizatorilor i ideile creative de dezvoltare de noi instrumente de analiz. Respectnd evoluia istoric, o clasificare a sistemelor informaionale geografice poate fi: - a) pachete SIG de "generaia nti": 1. fr sisteme de fiiere atribut; 2. cu sisteme de fiiere "flat";CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG

7

- b) pachete SIG de "generaia a doua": 1. sisteme duale; 2. sisteme integrate; - c) pachete SIG de "generaia a treia": 1. sisteme SGBDR extinse; 2. sisteme orientate obiect.Figura 2-1. Evoluia Sistemelor Informaionale Geografice.

n urma unui studiu efectuat n anul 2001 de Daratech Inc. (firm din SUA renumit n domeniul studiului de pia al produselor IT inginereti) reiese c produsele ESRI i Intergraph sunt cele mai populare sisteme informaionale geografice la ora actual. 2.2 Evoluia metodelor de culegere a datelor cartografice Calitatea cea mai important a unui sistem informaional geografic este aceea c poate combina i analiza diferite tipuri de date obinute dintr-o multitudine de surse. Principalele surse de obinere a datelor geografice sunt: msurtori geodezice, scanarea i vectorizarea hrilor, fotograme aeriene, nregistrri de teledetecie, cataloage de coordonate, importul de date de la alte programe sau sisteme, alte surse. Msurtorile topografice se execut din cele mai vechi timpuri i au

reprezentat principala surs de date pentru realizarea hrilor. n anul 1669 s-aCAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG

8

executat prima triangulaie pentru realizarea hrii coastelor Franei, la ordinul regelui Ludovic al XIV-lea. n anul 1985 a devenit operaional sistemul GPS. Acest sistem a devenit i mai popular dup deschiderea care a avut loc n anul 2000, cnd toi utilizatorii au avut acces la msurtori de precizie, prin eliminarea disponibilitii selective (SA). O dat cu apariia primelor sisteme informaionale geografice comerciale la nceputul anilor 80, s-au dezvoltat i au luat amploare noi metode de culegere a datelor: digitizarea vectorial a hrilor i, odat cu dezvoltarea hardware-lui, digitizarea raster. Programele de conversie raster-vector au evoluat foarte mult n ultimul timp, o dat cu dezvoltarea inteligenei artificiale, dar, cu toate acestea, nc nu s-a putut realiza un sistem complet automat de culegere a datelor de pe hrile scanate. Fotogrammetria ofer metode de culegere a datelor geografice. A aprut nainte de anul 1900, dar s-a dezvoltat foarte mult prin anii 60, odat cu dezvoltarea platformelor aeriene, a camerelor fotogrammetrice i a aparatelor de fotoredresare i stereorestituie. Teledetecia reprezint un ansamblu de tehnici care au fost dezvoltate pentru cercetarea de la distan a pmntului, i exploateaz faptul c toate obiectele i fenomenele pot fi analizate dac se folosesc senzorii corespunztori

care nregistreaz radiaia electromagnetic reflectat sau emis. Teledetecia s-a dezvoltat foarte mult, odat cu disponibilitatea primelor imagini comerciale la nceputul anilor 80.Figura 2-2. Evoluia metodelor de culegere a datelor geografice.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

9

3. METODE DE CULEGERE A DATELORDoi factori principali influeneaz eficiena unui SIG, cantitatea datelor stocate n baza de date i calitatea acestora. Lund ca unitate costul hardwareului, atunci costul dezvoltrii programelor este 10, iar cel al culegerii datelor, 100 [Guptill, 1988]. Aadar, o problem foarte important o reprezint crearea bazelor de date geografice digitale, care constituie baza oricrui SIG. 3.1 Tipuri de date cartografice Datele cartografice reprezint totalitatea informaiilor ce descriu semantic, sintactic i pragmatic geoimaginea cartografic (dar i obiectele i fenomenele geosferei) [Niu, 1992]. Baza de date a unui sistem informaional geografic este de fapt o harta digital, adic o colecie de date geografice organizate ntr-o form care s fac posibil prelucrarea lor de ctre calculatorul electronic. O entitate geografic este definit de urmtoarele elemente [Goodchild, 1991]: - poziia (unde se afl ?), exprimat prin coordonate. - atributele (ce este.?), exprimate prin valori numerice, alfanumerice sau logice (categorie de sol, denumire, nlime, etc.). - relaiile sunt exprimate prin date numerice [Niu, 1995]. Relaiile dintre elementele geosferei sunt naturale, economice, sociale etc. Dup numrul

elementelor participante relaiile pot fi binare, unul la mai muli, mai muli la unul i mai muli la mai muli. Alte tipuri de relaii sunt cele geometrice, topologice, ierarhice etc. - timpul (cnd a fost observat entitatea ?) este o component important a datei geografice, avnd n vedere dinamica specific spaiului n care trim. Exist dou modele principale sub care sunt stocate datele geografice n baza de date a unui SIG: vectorial i raster. n modelul vectorial (figura 3-1), se consider c orice entitate geografic poate fi reprezentat ca punct, linie (arc) sau poligon (suprafa). Entitile geometrice enumerate au ataate mai multe atribute definite de utilizator, reprezentnd caracteristici ale fenomenelor sau obiectelor reprezentate. n modelul raster (figura 3-2) este suprapus o reea regulat pe spaiul datelor continue i este determinat o medie a celei de a 3-a dimensiuni (densitatea optic, reflectana spectral, cota, temperatura etc.) pentru suprafaa fiecrei celule (pixel). Aceast valoare se atribuie centrului celulei i se consider constant pe ntreaga sa suprafa.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

10 Figura 3-1. Reprezentarea vectorial a unei imagini. Figura 3-2. Reprezentarea raster a unei imagini.

3.2 Structuri de date n SIG Natura datelor spaiale determin o mulime de modele teoretice, fiecare dintre ele putnd fi mai mult sau mai puin adecvat descrierii unei clase de

fenomene. De pild, sunt abordate mai multe ci pentru modelarea variaiilor n altitudine a suprafeei topografice. Ele difer din punct de vedere al eficientei, n funcie de gradul de accidentare al terenului. Odat ce a fost ales un model teoretic, este necesar gsirea unei metode eficiente de reprezentare numeric. 3.2.1 Structuri de date de nivel inferior Structurile de date de nivel inferior reprezint implementarea conceptelor geometrice i urmresc eficiena, att la stocarea informaiilor ct i la regsire. Aceste structuri stau la baza realizrii unor structuri complexe de nivel nalt. Proiectarea eficienta a unei structuri de date presupune separarea structurii abstracte de implementarea fizic. Structura abstract a datelor se definete ca o mulime compus din elementele care trebuie stocate, operaiile care trebuie aplicate asupra lor, precum i posibilele condiionri.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

11

a) Secveniale. Aceast structur de date este suficient scopurilor grafice, dar se dovedete insuficient pentru cea mai mare parte a operaiilor nongeometrice i pentru toate operaiile geometrice complexe. Aplicaii n cartografie: digitizarea vectorial a elementelor hrii, schimbul datelor cartografice ntre sisteme n format standardizat. b) Secvenial indexate: legarea articolelor este explicit prin specificarea adresei elementului urmtor. c) Liste dublu nlnuite: fiecare articol conine pe lng informaia util i adresa articolului precedent i a articolului urmtor. Acest tip de liste permite

parcurgerea facil n ambele sensuri, regsirea elementelor dup anumite criterii fcndu-se uor. d) Liste circular nlnuite: ultimul articol din list conine adresa primului articol. Acest tip de structur poate fi folosit pentru stocarea elementelor poligonale. e) Structura raster grosier: domeniul de definiie al bazei de date se mparte n submulimi (ferestre). Aceasta are avantajul accesului uor la elementele dintr-o submulime. Se creeaz liste corespunztoare subdomeniilor definite. n lista fiecrui subdomeniu se trec adresele elementelor (fenomenelor) care trec prin subdomeniul respectiv. f) Structura topologic: spaiul hrii este egal cu spaiul topologic. ntre elementele unui graf planar topologic (noduri, arce, poligoane) se pot stabili relaiile de frontier i cofrontier. Structura evideniaz proprietile grafurilor topologice [Niu, 2002]. 3.2.2 Structuri de date de nivel nalt n literatura de specialitate, structura de date de nivel nalt mai este ntlnit sub denumirea de modelul datelor spaiale. Organizarea datelor spaiale are ca scop optimizarea i eficientizarea operaiilor geometrice i este dependent de experiena observatorului. Modelul datelor spaiale formalizeaz conceptul uman de percepere a spaiului, deoarece calculatoarele sunt sisteme formale care utilizeaz simboluri n concordan cu nite reguli stricte. a) Structura TIN se bazeaz pe elemente triunghiulare, cu vrfurile n

punctele culese, caracteristicile terenului putnd fi incluse cu uurin. n consecin, structurile TIN pot reflecta n mod adecvat densitatea variabil a punctelor. Relaiile topologice trebuie calculate sau nregistrate n mod explicit. b) Structuri relaionale. Conceptele acestei metode de gestiune a datelor au fost stabilite iniial de Codd, ca mijloc de descriere a datelor doar pe baza structurii lor naturale i de asigurare a independenei programelor de gestiune.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

12

n comparaie cu metodele anterioare, sistemele relaionale se caracterizeaz prin simplitate, datele fiind reprezentate n tabele. c) Structuri de date orientate pe obiecte. Un obiect poate fi definit c o entitate care are o stare reprezentat de valorile variabilelor locale (variabile instan) i un set de operaii sau metode (metode instan) care opereaz asupra obiectului [Somerville, 1989]. Obiectele individuale aparin unei clase, care definete un tip de obiect. Clasele pot avea variabile care descriu caracteristici ale clasei respective, privit c ntreg. Fiecare clas are o superclas din care poate moteni att variabile instan ct i metode instan. 3.3 Surse de date Datele folosite ntr-un sistem informaional geografic provin dintr-o mare varietate de surse, att analogice ct i digitale, dintre care se amintesc: - cataloage i tabele de coordonate; - fiiere, liste de date rezultate din prelucrri; - baze de date cartografice existente; - hri topografice i speciale tiprite sau originale de editare ale

acestora; - jurnale i carnete electronice de teren; - nregistrri fotogrammetrice i de teledetecie analogice i digitale; - determinri cu receptoare GPS. Principalele metode de obinere a datelor cartografice sunt: a) Introducerea de la tastatur cu un editor de texte sau cu un program aplicativ. Este o metod greoaie, care necesit un volum mare de munc. b) Importul de date de la alte programe i sisteme. Este necesar ca informaiile s fie stocate n formate standardizate i exist necesitatea unor programe de conversie dintr-un format n altul. Sistemele de poziionare global (GPS) sunt o sursa important de date. c) Digitizarea vectorial a fotogramelor sau ortofotogramelor la un aparat fotogrammetric. Permite obinerea unui volum mare de date ntr-un timp scurt cu costuri minime. d) Digitizarea vectorial a hrilor existente. Folosete ca suport hrile tiprite sau originalele acestor hri cu elemente separate pe culori. Aceast metod folosete digitizoare vectoriale interfaate cu procesoare. Practic se redeseneaz harta dat. e) Digitizarea raster a fotogramelor sau ortofotogramelor. Folosete ca suport nregistrrile digitale de teledetecie sau date fotogrammetrice raster obinute prin scanarea fotogramelor. Necesit un nou hardware i programe complexe de conversie raster - vector.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

13 f) Digitizarea raster a hrilor existente. Este metoda cea mai

utilizat pentru

culegerea datelor cartografice. Suportul l reprezint imaginea scanat a originalului hrii. Pentru obinerea datelor prin aceast metod este necesar un nou hardware (scanner cartografic, calculatoare puternice), sisteme de gestiune a datelor, programe de conversie raster - vector. Metodele de culegere a datelor se clasific, dup Fritsch, n: - metode primare (culegerea datelor se face direct n teren); - metode secundare (culegerea din surse analogice i digitale existente). Metodele primare de achiziie sunt de obicei mai precise i mai actuale dect metodele secundare, dar sunt mai scumpe din punct de vedere economic. Metodele primare de culegere a datelor de poziie sunt: - msurtori cu aparate clasice (teodolit, staie total); - determinri cu receptoare GPS; - exploatare fotogrammetric; - exploatarea nregistrrilor de teledetecie. Metodele secundare de culegere a datelor de poziie sunt: - digitizarea materialelor cartografice; - importul unor baze de date digitale deja existente. Evoluia sistemelor hardware i software destinate culegerii de date a fost deosebit de spectaculoas n anii '80. Dei nu s-a ajuns la un sistem integrat, n ntregime automatizat, avantajele folosirii datelor oferite de fotogrammetria digital i de teledetecie nu pot fi neglijate. Totui sursa primar pentru ncrcarea bazei de date a unui SIG o constituie hrile topografice existente. Prin urmare, principalul pas n generarea datelor unui SIG este procesul de conversie analog-digital [Alexei, 2004c]. Culegerea datelor cartografice digitale se face cel mai simplu folosind ca

surs hrile tiprite sau originalele acestor hri cu elemente separate pe culori. Cele mai simple originale sunt cele ce conin elementele de relief i de sol. Curbele de nivel nu se intersecteaz ntre ele i, ca atare, digitizarea acestora nu pune probleme deosebite. Nici caracteristicile asociate fiecrei curbe de nivel nu sunt numeroase, principala caracteristic fiind altitudinea sau cota. Pe toate originalele separate pe culori se pot distinge elemente cartografice punctuale, liniare, areale i inscripii [Niu, 1996]. 3.4 Evaluarea preciziei metodelor de digitizare n acest studiu s-a fcut o comparaie din punct de vedere al eficienei i al preciziei, ntre metoda de digitizare raster-vector manual i cea automat. S-au comparat i rezultatele digitizrii automate obinute cu modulul ArcScan din ArcMap i cu programul R2V Conversion Toolkit produs de Algolab.CAPITOLUL 3. METODE DE CULEGERE A DATELOR

14

Ca date de intrare s-a folosit originalul de editare cu relieful pentru o hart topografic cu scara 1: 50.000. Acest original a fost scanat la rezoluia de 400 dpi n dou culori, rezultnd un fiier TIF cu dimensiunea de 8.124 Mb. n etapa de preprocesare s-a corectat geometric imaginea rezultat n urma scanrii, folosind modulul Georeferencing din ArcMap. Rectificarea imaginii s-a fcut folosind o transformare afin pe 4 puncte. n cazul imaginilor cartografice nu este necesar aplicarea tuturor transformrilor radiometrice din cazul fotogramei, deoarece imaginea cartografic conine puine culori (de obicei 4

sau 8 culori). Pentru digitizarea raster-vector automat s-a folosit modulul ArcScan din ArcMap. S-a considerat rezultatul digitizrii automate cu acest program drept referin pentru comparaia fcut. Un alt program ce permite digitizarea raster-vector automat este R2V Conversion Toolkit. Acest program este simplu de folosit i dedicat vectorizrii. Permite importul imaginilor raster georefereniate n formate consacrate. Pentru determinarea preciziei digitizrii s-a calculat factorul de deformare DF (vezi subcapitolul 6.3.1, Testarea preciziei de poziie) pentru digitizarea raster-vector manual, i pentru cea automat realizat cu programul R2V Conversion Toolkit. S-a considerat ca referin rezultatul digitizrii automate efectuate cu ArcMap. Rezultatele studiului sunt prezentate n tabelul urmtor.Tabelul 3-1. Comparaie ntre metodele de digitizare.

Metoda de digitizare Timpul necesar digitizrii Factorul de deformare DF Digitizare manual 12 ore 1.6245 Digitizare automat cu R2V 38 secunde 2.5542 Digitizare automat cu ArcMap 24 secunde innd seama de rezultatele obinute mai sus, se poate concluziona c cea mai eficient metod de digitizare este cea automat realizat cu ArcMap. Metoda raster-vector manual, chiar dac este mai precis dect metoda automat efectuat cu R2V, este mare consumatoare de timp i deci eficiena

acesteia este foarte mic, ambele ncadrndu-se n tolerane.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

15

4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER-VECTORAutomatizarea interpretrii unei hri n scopul identificrii elementelor geografice i a relaiilor lor este o misiune dificil ce merge dincolo de transformarea imaginilor raster cartografice ntr-o reprezentare vectorial. Munca de interpretare a hrilor, cum ar fi detectarea morfologiei terenului, selectarea elementelor naturale i artificiale din mediul nconjurtor i recunoaterea formelor, necesit procese de abstractizare i cunoatere profund a domeniului. 4.1 Algoritmi de vectorizare Conversia raster vector const n analiza unei imagini raster n vederea transformrii acesteia dintr-o reprezentare matricial de pixeli ntr-o reprezentare vectorial. Vectorizarea nu trebuie privit ca un ntreg, deoarece aceasta presupune mai multe etape, att premergtoare vectorizrii, ct i post vectorizare. Una din problemele principale ale vectorizrii este aceea dac metodele s aib sau nu la baz un algoritm de scheletizare. Se poate considera conversia raster vector ca o aplicaie tipic pentru scheletizare. Totui, trebuie inut cont de faptul c dei o imagine scheletizat este menit s reprezinte fidel forma

binar analizat, aceasta nu asigur ntotdeauna cea mai bun precizie pentru extremitile liniilor i pentru intersecii. innd seama de aceste consideraii sau dezvoltat dou clase de algoritmi de vectorizare: - algoritmi ntr-un singur pas algoritmi ce se aplic direct imaginii primare; - algoritmi n doi pai algoritmi ce au ca etap preliminar scheletizarea. 4.1.1 Algoritmi de vectorizare ntr-un singur pas Algoritmii de vectorizare ntr-un singur pas au ca date de intrare imaginea raster binar neprelucrat, iar ca rezultat imaginea vectorial. Aceti algoritmi sunt mai compleci, deoarece trebuie s pstreze caracteristicile topologice (pstrarea interseciei, incluziunii etc.), dar nu depind de precizia unei prelucrri preliminare (scheletizarea). Dintre algoritmii de vectorizare ntr-un singur pas sunt prezentai n lucrare algoritmul de vectorizare Pixeli rari SPV i algoritmul de vectorizare a regiunilor nchise.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

16

4.1.2 Algoritmi de vectorizare n doi pai Algoritmii de vectorizare n doi pai au ca date de intrare o imagine binar scheletizat (grosimea oricrei linii din imagine este de un pixel). Etapa premergtoare vectorizrii, scheletizarea, conduce la o imagine care nu pierde din precizia de poziionare a elementelor. Pentru algoritmii de scheletizare exist dou metode de baz: subierea iterativ a imaginii originale pn cnd nu se mai poate ndeprta nici un pixel

fr s se modifice proprietile topologice i morfologice ale formei, i subierea prin calculul unor distane n dou treceri succesive. n timp ce metodele de scheletizare sunt independente de orice informaie a priori despre natura desenului, deseori este necesar s se adauge cunotine contextuale ntr-un anumit stadiu al procesului. n lucrare sunt prezentai n amnunt doi algoritmi de vectorizare prin vecinti. 4.2 Prelucrri post - vectorizare n urma procesului de vectorizare rezult o serie de vectori cu coordonatele punctelor ce descriu ct mai fidel imaginea raster binar. Aceti vectori, pentru a putea fi folosii ca date de intrare pentru un SIG, trebuie s suporte dou tipuri de prelucrri - cele necesare pentru eliminarea unor erori de vectorizare i prelucrri necesare ajustrii formei vectorilor. Prelucrrile din prima categorie nu se pot automatiza n totalitate, operatorul intervenind n luarea deciziilor cu privire la eliminarea zgomotului, completarea unor goluri de vectorizare etc. n a doua categorie de prelucrri se nscriu: - aproximarea conturului presupune eliminarea surplusului de puncte rezultat n urma procesului de vectorizare (de exemplu, un segment de dreapt trebuie memorat doar prin punctele de capt); - constrngeri impuse conturului (de exemplu, colurile unei case, n general, formeaz unghiuri drepte). 4.3 Algoritm propus pentru vectorizare

Algoritmul propus face parte din categoria algoritmilor ntrun singur pas, dar se poate aplica cu succes i imaginilor scheletizate, i poate fi folosit pentru vectorizare automat sau interactiv [Alexei, 1997a]. n vectorizarea interactiv este nevoie de intervenia operatorului pentru rezolvarea ambiguitilor care apar. n vectorizarea automat, algoritmul parcurge ntreaga imagine analiznd fiecare element liniar sau areal.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

17

Acest algoritm poate fi folosit pentru conversia raster-vector a elementelor liniare sau areale din cadrul unei hri. Folosete ca suport un fiier raster binar rezultat n urma scanrii originalelor hrii cu elemente separate pe culori. Rezultatele cele mai bune se obin pentru originalele de editare pentru hidrografie, vegetaie i relief. 4.3.1 Vectorizarea elementelor liniare prin algoritmul propus Prima etap presupune determinarea unui capt al elementului liniar ce urmeaz a fi digitizat. Determinarea unui punct de capt se poate face automat, prin parcurgerea imaginii de sus n jos i de la stnga la dreapta, pn se identific un pixel de culoare neagr, sau interactiv, prin determinarea aproximativ a coordonatelor punctului de nceput cu ajutorul unui locator. Pentru gsirea unui punct de start, se parcurge imaginea cu un pas p = 2r , unde r este raza de analiz n jurul punctului curent, pn se gsete un grup de pixeli cu valoarea 1 i se alege centrul de greutate al acestora (figura

4-1).Figura 4-1. Analiza unei imagini ne scheletizate.

Etapa a II-a const n urmrirea elementului liniar pe baza metodei cercului. Aceast metod presupune analiza pixelilor aflai pe cercul 0 0 C(x ,y ,r), unde 0 0 x , y sunt coordonatele punctului curent. Raza cercului de analiz se consider constant i se alege n funcie de rezoluia de scanare a materialului cartografic i de densitatea de informaii de pe acesta. O raz de analiz mare determin creterea vitezei de analiz, dar poate conduce la pierderea unor informaii. O valoare mic a razei permite analiza tuturor informaiilor, dar duce la creterea timpului de analiz. Raza de analiz pentru elemente liniare nu poate lua o valoare mai mic dect cea mai groas linie din imaginea raster. Dup o explorare complet n jurul punctului curent 0 0 (x ,y ), pot exista mai multe situaii:CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

18

- Se gsete doar un singur pixel setat pe 1 - n acest caz s-a gsit un nou punct al elementului liniar, de coordonate (x, y) . n continuare, punctul curent devine (x,y), 0 0 (x =x,y =y) i se continu aplicarea metodei cercului (figura 4-2 a). - Se gsesc doi sau mai muli pixeli setai pe 1 - n acest caz s-a determinat o intersecie de elemente liniare. n aceast situaie, explorarea traseului liniar poate continua pe o direcie dinainte stabilit sau se poate opri i programul cere utilizatorului s indice direcia pe care urmeaz s o exploreze (figura 4-2 b).

Coordonatele punctului de intersecie se memoreaz ntr-o list, pentru a putea reveni n acest punct. - Nu se gsete nici un pixel setat pe 1 - n acest caz s-a gsit punctul de sfrit al elementului liniar, i se ncheie analiza (figura 4-2 c).Figura 4-2. Cazuri de analiz.

n procesul de analiz pot aprea mai multe tipuri de ambiguiti. Aceste probleme se pot rezolva prin modificarea razei de analiz. Se pot ntlni urmtoarele cazuri: - Dac n urma analizei n jurul punctului curent nu se mai gsete nici un pixel setat pe unu, atunci, n mod eronat, algoritmul consider punctul curent ca punct de capt. Pentru a gsi poziia exact a punctului de capt, raza de analiz se micoreaz iterativ, pn cnd se gsete un nou pixel setat pe 1, pixel ce reprezint poziia exact a punctului de capt. n figura 4-3, n punctul curent, raza de analiz s-a micorat de la valoarea r la valoarea 0 r pentru a gsi poziia exact.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

19 Figura 4-3. Determinarea exact a punctului de capt.

- Dac din punctul curent s-au gsit doi sau mai muli pixeli setai pe unu, n mod normal punctul curent se consider nod (intersecia mai multor drepte). Pentru determinarea exact a poziiei punctului de intersecie se micoreaz raza de analiz pn la o valoare 0 r cnd se gsete un singur pixel setat pe unu (figura 4-4). Acest pixel d poziia exact a punctului de intersecie.Figura 4-4. Determinarea exact a punctului de intersecie a mai multor drepte.

- Pentru determinarea exact a poziiei punctului de start, pentru metoda interactiv, se micoreaz raza de analiz, iterativ, pn la o valoare 0 r cnd nu se mai gsete nici un pixel setat pe unu (figura 4-5). Atunci, pixelul gsit la iteraia precedent determin poziia exact a punctului de start.Figura 4-5. Determinarea exact a punctului de start.

- n cazul n care din punctul curent se gsesc doi sau mai muli pixeli setai pe unu, atunci trebuie verificat fiecare dintre acetia dac aparine aceluiai element liniar. Acest lucru se poate face prin analiza pixelilor de-a lungul segmentului deCAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

20

dreapt determinat de punctul curent i punctul nou determinat. Dac se gsesc pixeli setai pe zero, atunci punctul analizat nu aparine aceluiai element liniar i, pentru a evita ambiguitatea, se micoreaz raza pn la o valoare 0 r cnd se gsesc doar pixeli ce aparin aceluiai element liniar (figura 4-6).Figura 4-6. Elemente liniare foarte apropiate.

Algoritmul propus are capacitatea de a trece peste ntreruperile din elementele liniare dac acestea sunt mai mici dect distana dintre cele mai apropiate elemente. n caz contrar, pot aprea ambiguiti care duc la intervenia operatorului (figura 4-7). Aceast capacitate de a trece peste ntreruperi este util pentru vectorizarea liniilor ntrerupte.Figura 4-7. Trecerea peste golurile din elementele liniare.

4.3.2 Vectorizarea elementelor areale prin algoritmul propus Prima etap presupune determinarea unui pixel de pe conturul arealului ce

urmeaz a fi digitizat. Un pixel de pe contur are proprietatea c nu toi pixelii vecini sunt setai pe 1. Etapa a II-a const n urmrirea conturului elementului areal. Aceasta se desfoar la fel ca n cazul vectorizrii elementelor liniare (situaia 1), cu deosebirea c explorarea n jurul pixelului curent se face pn cnd se gsete pixelul situat pe contur (figura 4-8). Urmrirea elementului areal se termin cnd se ajunge n punctul iniial sau cnd se iese din cadrul hrii.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

21 Figura 4-8. Urmrirea conturului.

Algoritmul propus este uor de implementat i ofer vitez de execuie bun. Un avantaj este faptul c nu necesit scheletizarea prealabil a imaginii ce urmeaz a fi digitizat. n cazul imaginilor nescheletizate, n urma procesului de explorare, se gsesc grupuri de pixeli vecini de aceeai culoare. Pentru a determina coordonatele axului elementului liniar se determin centrul de greutate al acestui grup de pixeli. Procesul de vectorizare decurge ca n cazul imaginilor scheletizate doar c se va lua n calcul centrul de greutate al grupului de pixeli descoperit [Alexei, 2004b]. 4.4 Analiza performanelor algoritmilor de vectorizare n acest studiu s-a fcut o comparaie ntre performanele urmtorilor algoritmi de vectorizare: Pixeli rari SPV; algoritmul de vectorizare prin 8 vecinti; algoritmul de vectorizare prin metoda cercului. Pentru aceasta s-au determinat indicii de performan propui de Liu Wenyin i Dov Dori. Ca date

de intrare s-a folosit o imagine raster care reprezint o poriune din originalul de editare cu relieful pentru o foaie de hart topografic la scara 1: 50.000. Pentru a putea determina indicatorii de performan ai algoritmilor de vectorizare s-a transformat imaginea raster ntr-un grid, fiecrui pixel al imaginii corespunzndu-i o celul a gridului. Aceast transformare ajut la determinarea pixelilor gsii de algoritmi printr-o interogare spaial.Tabelul 4-1. Valori caracteristice pentru algoritmii de vectorizare analizai.

Algoritm Pixeli identificai Pixeli fals identificai Pixeli neidentificai Pixeli negri n imaginea original ArcInfo 23321 80 20138 43459 SPV 1437 13 1636 3073 Prin vecinti 16676 4 26783 43459 Metoda cercului 21788 158 21671 4345922

CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR

Dup cum se observ n tabelul 4-1, numrul de pixeli negri din imaginea original este diferit, deoarece s-a analizat un numr diferit de elemente liniare.Tabelul 4-2. Indicatorii de performan ai algoritmilor de vectorizare analizai.

Algoritm Rata de detecie a pixelilorp

Rata de detecie fals a pixelilorp

D

F

Coeficientul de detecie rasterPRI

ArcInfo 0.536 0.0034 0.7663 SPV 0.468 0.0090 0.7295 Prin vecinti 0.384 0.0002 0.6919 Metoda cercului 0.501 0.0072 0.7469 Conform rezultatelor din tabel, algoritmul de vectorizare prin vecinti are rata de detecie fals a pixelilor cea mai mic, deoarece imaginea original a suferit n prealabil o transformare morfologic de erodare, grosimea fiecrui element liniar fiind de un pixel. Cu algoritmul propus s-au obinut rezultate bune i acesta poate fi folosit cu succes pentru vectorizarea interactiv sau automat a curbelor de nivel i a hidrografiei. Rata de detecie fals a pixelilor poate fi mbuntit prin micorarea razei de analiz, aceasta ducnd la ndesirea punctelor detectate. Pentru a putea determina aceti indici de performan ai algoritmilor de vectorizare s-a realizat un program ce are ca date de intrare gridul corespunztor imaginii raster ce urmeaz a fi vectorizat i imaginea vectorial rezultat dup aplicarea fiecrui algoritm.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

23

5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALERecunoaterea formelor are ca obiect descrierea i clasificarea

msurtorilor preluate din procese fizice sau mentale. Pentru a putea descrie matematic o form dat, principalul aspect l constituie acela de a extrage un set de entiti care caracterizeaz forma i care, prin msurtori corespunztoare, se transform ntr-un set de valori necesare pentru plasarea entitii necunoscute ntr-una din cele M clase predefinite (M 2). Scopul final al aplicaiilor de analiz de imagine este extragerea unor caracteristici importante din imagine, care ajut calculatorul s neleag, s descrie sau s interpreteze o scen. n ultimul timp s-au dezvoltat mai multe metode pentru recunoaterea elementelor grafice, dar nici una dintre acestea nu poate fi considerat perfect. Aceste metode pot fi clasificate n: - metode ntr-un singur pas obiectele grafice sunt recunoscute direct pe imaginea raster; - metode n doi pai mai nti se convertete imaginea raster ntr-o imagine vectorial primar iar apoi, cu ajutorul unor algoritmi ce lucreaz pe imaginea vectorial, se face recunoaterea obiectelor grafice. n prezent, ambele clase de algoritmi s-au dezvoltat foarte mult. 5.1 Segmentarea imaginii Scopul segmentrii imaginii este de a mpri o scen n mai multe zone, conform unor criterii [Creang, 1994]. Folosind metodele segmentrii imaginilor, pot fi extrase din scene complexe diverse obiecte de interes care pot fi apoi analizate.

Contrastul imaginii joac un rol important n segmentare. Una dintre cele mai comune abordri pentru detectarea unor regiuni cu contrast puternic este detectarea muchiei, adic identificarea unor seturi de puncte care corespund celor mai pronunate variaii ale nivelurilor de gri. O muchie reprezint limita dintre dou suprafee cu valori ale nivelului de gri diferite. Segmentarea este o problem deosebit de dificil i succesul (sau insuccesul) oricrui algoritm depinde foarte mult de calitatea imaginii originale. Prin urmare, se obinuiete ca segmentarea s se execute iterativ, rezultatele s fie analizate i mbuntite prin supervizare de ctre experi umani.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

24

5.2 Generarea descriptorilor formei pentru interpretarea automat Coninutul cartografic este descris prin intermediul unui set de caracteristici. Aceste caracteristici pot fi distinse pe baza numrului de argumente pe care le pot lua. Un atribut este o caracteristic ce descrie proprietatea unui obiect spaial i poate fi reprezentat printro funcie unar. O relaie este o caracteristic ce se menine ntre dou sau mai multe obiecte i poate fi reprezentat printr-o funcie. Parametrii de form compun un fel de fi de identitate a formei respective, pe baza creia aceast form poate fi recunoscut n mod unic [Vertan, 1999]. n mod ideal, aceti parametri trebuie s fie invariani la

translaie, rotaie i scalare. Tehnicile de recunoatere a formelor sau de clasificare sunt precedate ntotdeauna de o etap de extragere a parametrilor de form (sau a caracteristicilor formei). Forma unui element liniar O este un atribut geometric i poate avea valorile liniar sau curbiliniu. Elementul liniar O, exprimat prin n perechi de coordonate ( , ) i i x y , este caracterizat de unghiurile de inciden i w (figura 5-1):1 1 ii i ii

w arctgx x yy+ +

= (5.1) i i1 i dw w w + = (5.2) Atributul form, asociat elementului liniar O, poate lua valoarea curbiliniu dac este ndeplinit condiia max( )i c dw > (5.3) unde c - pragul dat.Figura 5-1. Reprezentarea unghiurilor de inciden.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

25

Distana dintre dou elemente liniare paralele O i O reprezentate de n, respectiv m perechi de coordonate, face parte din categoria caracteristicilor geometrice. Algoritmul calculeaz mai nti minh d ca distan minim dintre al hlea punct al lui O i orice punct al lui O (figura 5-2). Atunci, distana dintre O i

O se calculeaz cu relaia:min 1 'h

n h OO

d d n =

=

(5.4)Figura 5-2. Calcularea distanei minime ntre dou elemente liniare paralele.

Semntura formei este o funcie scalar de o variabil, asociat unei forme plane i reprezint distana de la centrul de greutate al formei la fiecare punct de pe contur. Aceast distan d() poate fi exprimat n funcie de unghiul la centru , dintre punctul curent de pe contur i axa orizontal de referin, sau n funcie de abscisa curbilinie . Semntura formei este o reprezentare reversibil cunoscnd semntura se poate reconstrui obiectul. Semnturile sunt caracteristici invariante la translaie, deoarece se calculeaz fa de centrul de greutate. Invariana la factorul de scar se poate obine prin determinarea mediei coeficientului de scar dintre distana ( ) r d , corespunztoare formei de referin, i distana ( ) a d , corespunztoare formei de analizat. Invariana la rotaie se obine efectund o permutare ciclic a semnturii.Figura 5-3. Form convex.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

260

20 40 60 80 100 120 140 160 180 200 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300 310 320 330 340 350

Figura 5-4. Semntura formei funcie de unghiul la centru.

Descriptorii Fourier caracterizeaz conturul unei forme. Cunoscnd conturul, acesta se poate scrie sub form complex (figura 5-5) u(n)=x(n)+iy(n) (5.5) unde: x(n) , y(n) reprezint coordonatele punctului curent; n poziia pixelului de pe contur (n= 0,N1 unde N reprezint numrul total de pixeli ce descriu conturul). Considernd c funcia u(n) , ce descrie conturul, este o funcie continu i periodic, atunci se poate calcula transformata Fourier discret 1D12 0

()1()N i nk N n

Ukune N =

= (5.6) unde U(k) reprezint setul descriptorilor Fourier. Descriptorii Fourier sunt caracteristici de form regenerative [Gavriloaia, 2002]. Numrul descriptorilor necesari pentru reconstrucia formei iniiale depinde de complexitatea acesteia i de precizia dorit. Funcia u(n) care descrie conturul este12 0

()()N i nk N k =

unUke

= (5.7)CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

27

Descriptorii Fourier se determin apriori, pentru semnele convenionale punctuale, tiind forma teoretic a acestora.Figura 5-5. Reprezentarea n spaiul complex a unui contur.

Cunoscnd formula lui Euler i innd seama de relaia (5.5), atunci relaia (5.6) devine:

() ()1 0 1 0

Re ( ) 1 ( ) cos2 ( ) sin 2 Im ( ) 1 ( ) cos2 ( ) sin 2N n N n

U N U N = =

k x n nk y n nk NN k y n nk x n nk NN

=+ =

(5.8) unde Re(U(k)) reprezint partea real iar Im(U(k)) partea imaginar a numrului complex U(k) . Anumite transformri geometrice elementare ale unui contur se reflect n

transformri simple ale descriptorilor Fourier corespondeni. O sintez a acestor proprieti este prezentat n tabelul urmtor:Tabelul 5-1. Proprietile descriptorilor Fourier.

Transformare Conturul transformat Descriptorii Fourier Identitate u'(n) =u(n) U'(k) =U(k) Translaie ( ) ( ) 0 u' n = u n + u U'(0) =U(0) +c U'(k) =U(k) pentru k 0 Scalare u'(n) = u(n) U'(k) = U(k) Modificarea punctului iniial 0 u'(n) =u(nn ) 2 '( ) ( )0

in k

NU

kUke

= Rotaie u'(n) =u(n) ei U'(k) =U(k) ei0

0

CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

28

Aceste proprieti ale descriptorilor Fourier pot fi folosite pentru recunoaterea formelor unor obiecte cunoscute, indiferent de mrimea i orientarea lor. 5.3 Recunoaterea semnelor convenionale punctuale nzestrarea n avans a unui SIG cu toate cunotinele necesare pentru diferitele domenii de aplicare este imposibil. Soluia pentru aceast problem o reprezint lrgirea unui SIG cu faciliti de nvare. Astfel, un utilizator, de fiecare dat cnd dorete s interogheze o baz de date geografic n legtur cu unele obiecte sau fenomene care nu sunt modelate n mod explicit, s poat s instruiasc sistemul. Instruirea se bazeaz pe un set de exemple i

contraexemple. n general sunt dou clase de metode pentru recunoaterea formelor, metode nesupervizate i metode supervizate. n metodele nesupervizate nu exist seturi de date de antrenament i nu se cunoate exact numrul de clase. n clasificarea supervizat, este necesar un set de date pentru antrenament. Pe baza acestor date de antrenament, se gsete o funcie de clasificare. Odat determinat aceast funcie, se va folosi la clasificarea unor elemente ce nu au fcut parte din setul iniial de antrenament. 5.3.1 Recunoaterea automat a semnelor convenionale punctuale pe baza semnturii formei Pentru recunoaterea automat a semnelor convenionale punctuale de pe originalele de editare separate pe culori, pe baza semnturii formei, este necesar s se realizeze n prealabil o baz de date ce conine semntura pentru fiecare semn convenional punctual. Aceast metod de recunoatere face parte din categoria metodelor supervizate. Etapele necesare identificrii unei forme sunt: - segmentarea imaginii; - determinarea conturului formei; - calculul semnturii formei analizate; - compararea semnturii calculate cu semnturile din baza de date; - determinarea coeficientului de corelaie cu relaia (5.9); - forma analizat este similar celei din baza de date dac se gsete un coeficient de corelaie maxim ct mai apropiat de 1. Coeficientul de corelaie este1 22 11

( )( )

(,) ()()n i rnn ii

xxyy CXY xxyy= ==

=

(5.9)29CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

unde: - x - semntura formei de analizat (vector); - x - valoarea medie a vectorului x ; - y - semntura formei din baza de date; - y - valoarea medie a vectorului y .Figura 5-6. Forme de analizat.

Semntura pentru fiecare form din figura 5-6 s-a determinat, automat pe cale analitic, cu ajutorul unui program propriu realizat n limbajul Delphi 7. Linia poligonal ce definete conturul s-a intersectat analitic, succesiv, cu o dreapt. Am considerat pasul unghiului de orientare de 5 . O valoare a pasului prea mic, surprinde toate detaliile formei, dar genereaz o semntur influenat ntr-o msur mai mare de zgomot, pe cnd o valoare mai mare determin o semntur mai puin influenat de zgomot, dar nu surprinde toate detaliile formei. Valoarea optim a pasului unghiului de orientare, determinat

empiric, este cuprins ntre valorile de 1 i 5 .Figura 5-7. Identificarea unei forme rotite i micorat.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

30

n figura 5-7 este prezentat cazul general de identificare a unei forme cu orientare i scar diferit de ale formei de referin. Pentru a putea identifica forma de analizat, se determin coeficienii de corelaie pentru translaii succesive ale formei de analizat de-a lungul axei . Poziia pe axa n care se obine un coeficient de corelaie maxim, mai mare dect un prag prestabilit, d orientarea formei de analizat fa de cea de referin. 5.3.2 Recunoaterea automat a semnelor convenionale punctuale pe baza descriptorilor Fourier Aceast metod de recunoatere de forme face parte din categoria metodelor supervizate, fiind necesar cunoaterea apriori a seturilor de descriptori Fourier pentru semnele convenionale punctuale ce urmeaz a fi identificate pe originalele de editare separate pe culori. Dac se consider seturile de descriptori Fourier U1(k) i U2(k) corespunztoare contururilor diferite u1(n) respectiv u2(n), atunci forma acestor contururi este similar dac0 000

1212 000,,,000 N i unn

( , , , ) min ( ) ( ) 0 d u n u n u n n e u

=

=

(5.10) Un exemplu practic este cel prezentat n figura 5-8, n care se face o recunoatere pe baza descriptorilor Fourier a semnului convenional punctual Locuri de aterizare.Figura 5-8. Analiza unui semn convenional punctual pe baza descriptorilor Fourier.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

31

n figura 5-8, semnul convenional punctual de referin este reprezentat prin culoarea roie i pe baza descriptorilor si Fourier se determin translaia, scara, rotaia i punctul de referin pentru celelalte simboluri. Fie referin f i analizat f transformatele Fourier ale simbolului punctual de referin, respectiv a celui de analizat. Pentru determinarea translaiei se folosesc formulele Re( ) Re( ) Im( ) Im( )x analizat referin y analizat referin

dff dff = = (5.11) unde Re( f ) reprezint partea real a numrului complex f , iar Im( f ) partea imaginar. Aplicnd formula (5.11) pentru o imagine doar translatat, vectorii x d i

d au primul element translaia pe axa X, respectiv translaia pe axa Y, iar restul elementelor 0. Pentru determinarea scrii ntre imaginea de referin i imaginea de analizat se folosesc formulele (5.12). Vectorii x scara i y scara au toate elementele egale cu scara pe axa X, respectiv cu scara pe axa Y Re( ) Re( ) Im( ) Im( )y analizat x referin analizat y referin

scara f f scara f f = = (5.12) Pentru determinarea unghiului de rotaie dintre imaginea de referin i imaginea de analizat, se folosete formula22

Re( )Re( ) Im( )Im( ) arccos Re( ) Im( ) ffff ff

analizat referin analizat referin referin referin

+ = + (5.13)

Fiecare element al vectorului , cu excepia primului element, conine unghiul de rotaie exprimat n radiani. Indicele punctului de start pentru forma de analizat se determin cu formula0

() i2 n lungime i

= (5.14) unde i este elementul i al vectorului dat de relaia (5.13).32

CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

01 001 110 01 000 101 5.4 Algoritm propus pentru identificarea semnelor convenionale punctuale Acest algoritm este o metod simpl de recunoatere a formei semnelor convenionale punctuale cu orientare normal, bazat pe corelaia dintre imaginea teoretic a semnului convenional i imaginea practic rezultat n urma scanrii. Fie f(x,y) imaginea teoretic a semnului convenional punctual i g(x,y) imaginea obinut n urma procesului de scanare. Teoretic, ar trebui s aib loc

relaia f AND g = f (5.15) Tabelul de adevr al funciei logice AND este Relaia (5.15) are loc doar n cazul ideal, ns din cauza erorilor de scanare i a calitii materialului cartografic, aceasta devine: f AND g = f (5.16) unde f f . Pentru a determina dac imaginile f i g sunt n corelaie, se aplic urmtorul algoritm: 1) Se determin deosebirile dintre imaginea teoretic a semnului convenional punctual i imaginea sa rezultat n urma procesului de scanare printr-o operaie logic XOR (sau exclusiv) f XOR g = h (5.17) unde h reprezint imaginea cu deosebirile ntre f i g. Tabelul de adevr al funciei logice XOR este 2) innd seama de relaia (5.17), se determin numrul de pixeli n plus (pP), respectiv cei lips (pM), aplicnd relaiile1 2

h AND g h h AND f h = = (5.18) unde : - h1 reprezint imaginea cu pixelii n plus; - h2 reprezint imaginea cu pixelii lips.33

CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE

Dac numrul pixelilor pP din imaginea h1, respectiv pM din imaginea h2 este mai mic dect o valoare de prag , atunci imaginea g este imaginea influenat de zgomot a semnului convenional punctual a crei reprezentare

raster este imaginea f. Pragul se alege experimental, n funcie de rezoluia la care a fost scanat imaginea i de mrimea zgomotului, astfel nct s nu existe ambiguiti.Figura 5-9. Semne convenionale punctuale.

Imaginea din figura 5-9 a fost analizat cu algoritmul propus, toate semnele convenionale fiind recunoscute. Programul RecSCP care implementeaz acest algoritm determin codul, respectiv punctul legat al fiecrui semn convenional punctual identificat. Dup identificarea semnului convenional punctual programul scrie n baza de date cartografic coordonatele punctului legat corespunztor simbolului i codul acestuia. Se poate determina i orientarea diferitelor semne convenionale punctuale prin construcia unor imagini ideale ale acestora, pentru diferite unghiuri de rotaie. Algoritmul de recunoatere automat a formei semnelor convenionale punctuale este uor de implementat, iar viteza de analiz pentru o clas de obiecte este independent de gradul de ncrcare al imaginii [Alexei, 2004d]. Pentru a mri viteza, se poate adopta soluia de a se indica cu ajutorul unui locator coordonatele aproximative ale elementului, iar algoritmul gsete coordonatele precise i codul asociat. Este necesar s se realizeze o baz de date care conine reprezentarea matricial a semnelor convenionale punctuale, codul fiecrui semn i descrierea acestuia. n baza de date sunt memorai i parametrii de recunoatere pP,

respectiv pM, determinai experimental pentru fiecare semn convenional punctual n parte. Baza de date cu simboluri permite adugarea unor noi semne convenionale punctuale, precum i actualizarea celor existente. De asemenea, este util stocarea formei simbolurilor pentru diferite rezoluii i unghiuri de rotaie (unde este cazul) pentru a mri viteza de analiz.CAPITOLUL 6. SURSE DE ERORI N SIG

34

6. SURSE DE ERORI N SIGHarta este un model bidimensional, la scar, a unei pri din suprafaa pmntului. Hrile reprezint mijloace eficiente de prezentare (n general cu ajutorul unor simboluri) a unei cantiti mari de informaii despre obiecte, fenomene i despre relaiile dintre acestea. 6.1 Precizia hrilor Precizia hrilor a fost analizat i definit n mod diferit. Precizia se refer la corectitudinea relativ a poziiei obiectelor pe o hart fa de poziia lor real pe suprafaa pmntului. Precizia absolut se refer la nivelul de exactitate a poziiei obiectului. Precizia absolut este dat de eroarea estimat pentru un singur punct, relativ la un sistem de referin spaial (Krasovski, WGS84 etc.). Precizia relativ este dat de eroarea estimat pentru o distan ntre dou puncte, sau precizia unui punct n comparaie cu alt punct. Dac erorile a dou puncte nu sunt corelate, eroarea relativ este eroarea medie ptratic a erorilor absolute ale punctelor.

Precizia unei hri digitale nu depinde de scara de afiare. Ea depinde de precizia datelor originale utilizate, de algoritmii de prelucrare i de rezoluia la care este tiprit sau afiat harta. n cazul digitizrii unei hri analogice, rezultatul digitizrii nu poate fi mai precis dect sursele originale [Alexei, 2004a]. n alctuirea hrilor digitale intervin patru tipuri de erori: - eroarea de poziie; - eroarea atributelor (datelor tematice); - eroarea conceptual; - eroarea de consisten. 6.1.1 Eroarea de poziionare Eroarea de poziionare reprezint deplasarea unui obiect pe hart fa de poziia sa real din teren. n instruciunile de realizare a hrilor topografice se specific o precizie planimetric a detaliilor de 0,4 mm la scara hrii cu un nivel de ncredere (1 )=95% (probabilitatea de 0,95). Aceast precizie pentru harta 1:25.000 reprezint 10 m n teren. Pentru estimarea preciziei, se folosete eroarea medie ptratic - relaia (6.1). Precizia se raporteaz ca o valoare n metri, cu un nivel de ncredere deCAPITOLUL 6. SURSE DE ERORI N SIG

35

95%, ceea ce nseamn c 95% din elementele bazei de date au o poziie ce respect precizia raportat.

( )21 n ic i

VV n

=

=

(6.1) unde: Vi - valorile msurate; Vc - valorile adevrate a lui i V ; n - numrul de msurtori. 6.1.2 Eroarea atributelor (datelor tematice) n timp ce poziia elementelor nu se modific n timp, atributele se pot schimba frecvent. Precizia atributelor se analizeaz n diferite moduri n funcie de natura datelor: - pentru valori continue ale atributelor, precizia este exprimat ca eroare de msurare (evaluarea preciziei se face prin metode asemntoare determinrii preciziei de poziionare); - pentru valori discrete ale atributelor, precizia este exprimat ca eroare de clasificare. Evaluarea preciziei de clasificare este influenat de numrul de clase definite n baza de date. 6.1.3 Eroarea conceptual Eroarea conceptual se refer la erorile de omitere a informaiilor din baza de date i este definit de gradul de generalizare i abstractizare (omiterea selectiv). Cea mai generalizat baz de date poate fi considerat complet dac conine toate obiectele descrise n specificaii. Precizia conceptual d o informaie utilizatorului despre volumul disponibil de date spaiale, temporale i tematice. Eroarea conceptual este influenat de scar, generalizarea elementelor bazei de date i regulile de selecie a elementelor i fenomenelor care sunt stocate n baza de date. 6.1.4 Eroarea de consisten

Eroarea de consisten se refer la contradiciile aparente dintr-o baz de date geografic. Precizia de consisten reprezint o msur a validitii interne aCAPITOLUL 6. SURSE DE ERORI N SIG

36

bazei de date. Se pot distinge mai multe tipuri de consisten a bazei de date: - consistena spaial se refer la respectarea regulilor topologice (de exemplu grania comun a dou poligoane trebuie s coincid); - consistena temporal reprezint faptul c, ntr-un punct, la un moment dat, nu poate exista dect un singur eveniment; - consistena tematic (a atributelor) se refer la lipsa contradiciilor din datele tematice (stocnd date despre numrul de locuitori, suprafaa localitilor i densitatea populaiei, pot aprea erori datorit redundanei informaiilor; redundana atributelor este o cale pentru asigurarea consistenei bazei de date); - consistena logic se refer att la aspecte topologice, ct i la validitatea domeniului de definiie al datelor stocate n bazele de date. 6.2 Surse de erori Spre deosebire de geodezie, cartografie i fotogrammetrie, pn n ultimii ani s-a acordat o importan mai mic preciziei datelor SIG. Se tie c datele conin erori sistematice i erori aleatoare, dar nu s-a accentuat asupra felului cum procedurile i soluiile SIG in seama de aceste erori. O bun tratare a acestei probleme permite alegerea celor mai bune surse de date, alegerea celor

mai corecte metode de culegere a datelor i alegerea celor mai corecte proceduri de prelucrare i de realizare a produselor finale. n SIG sunt combinate mai multe tipuri de date din mai multe surse. n funcie de sursele erorilor, acestea se clasific astfel: 1. erori datorate surselor de date: - erori datorate aparatelor de culegere a datelor; - erori datorate materialelor cartografice: vechimea datelor; imprimarea (tiprirea); deformarea materialului cartografic; scara hrii; tipul proieciei; generalizarea i clasificarea cartografic; - erori datorate schimbrilor fizico-geografice ale mediului; - erori datorate definirii granielor; 2. erori datorate introducerii datelor: - erori datorate digitizrii; - erori datorate scanrii;CAPITOLUL 6. SURSE DE ERORI N SIG

37

- erori datorate operatorului; 3. erori datorate metodelor i algoritmilor de prelucrare: - erori numerice; - erori date de densitatea datelor; - erori datorate combinrii datelor; - erori datorate interpretrii cartografice; - erori datorate conversiilor; - erori de prelucrare propriu-zis (generarea topologiei, georefereniere etc.). 6.3 Verificarea preciziei datelor spaiale Toate sursele de date i metodele de introducere a datelor spaiale prezint erori. Tipul, mrimea i implicaiile acestor erori inerente ntr-o baz de date a unui sistem informaional determin precizia datelor spaiale. Este imposibil s se elimine complet erorile datelor spaiale, dar utilizatorii SIG pot reduce i

administra n mod eficient erorile, mbuntind astfel precizia datelor. Identificarea i evaluarea erorilor nu sunt singurii factori care determin precizia datelor. Precizia datelor include toate procesele implicate n crearea, dezvoltarea, utilizarea i actualizarea bazei de date spaiale. Verificarea preciziei datelor spaiale este esenial pentru schimbul i integrarea datelor. Datele geografice i non-geografice trebuie verificate n scopul asigurrii preciziei impuse bazei de date a SIG. Msurtorile calitii datelor verific precizia de poziie, a atributelor, conceptual i cea de consisten. Testarea calitii datelor se poate face prin metode manuale sau automate. Metodele de verificare manual includ imprimri de control, msurtori n teren i teste statistice. Imprimarea de control presupune trasarea datelor geografice la aceeai scar ca materialul cartografic surs. Dup imprimarea hrii digitale, aceasta se suprapune peste harta surs i se verific att poziia elementelor, ct i inscripiile i simbolistica caracteristicilor. Dei aceast metod este rapid i puin costisitoare, este de preferat verificarea prin msurtori n teren. Metodele de verificare automat caut incompatibilitile logice i valorile atributelor care nu respect domeniul de definiie. Incompatibilitile logice se determin prin verificarea topologiei (de exemplu, un strat de poligoane trebuie s conin doar poligoane nchise). Pentru verificarea atributelor este necesar s

se cunoasc modul de clasificare a acestora. Este greu de obinut un consens din partea comunitii SIG pentru dezvoltarea de standarde care s clasifice datele spaiale. Acest fapt depinde de necesitile utilizatorului.CAPITOLUL 6. SURSE DE ERORI N SIG

38

Metodele automate se pot executa de ctre majoritatea pachetelor de programe SIG (ArcInfo, MapInfo, AutoCAD Map etc.). Aceste metode sunt rapide, dar rezultatele sunt mai puin exacte dect n cazul metodelor manuale. Precizia datelor trebuie pstrat n toate stadiile realizrii unei baze de date SIG, mai ales n timpul culegerii i actualizrii. Orice tip de prelucrare asupra datelor afecteaz precizia acestora. 6.3.1 Testarea preciziei de poziie Precizia de poziie se testeaz prin compararea coordonatelor unor puncte de control din baza de date cu coordonatele acelorai puncte extrase din surse independente, de nalt precizie, cum ar fi: - hri la scri mai mari; - msurtori n teren cu ajutorul receptoarelor GPS; - nregistrri satelitare i fotogrammetrice. Minim 20 de puncte de control trebuie testate, distribuia acestora acoperind zona de interes. Testarea a 20 de puncte cu un nivel de ncredere de 95% nseamn c doar un singur punct dintre acestea poate s aib precizia mai slab dect specificaiile impuse. Punctele de control trebuie s fie mai dense n vecintatea elementelor importante [Serediuc, 1997]. a) Precizia planimetric. Eroarea medie ptratic pe cele dou axe se determin cu relaiile2

,, 1

()n date i control i i x

xx n

=

=

2 ,, 1

(6.2) ()n date i control i i y

yy n

=

=

(6.3) unde: - xdate,i , ydate,i - coordonatele punctelor de control din baza de date; -xcontrol,i , ycontrol,i - coordonatele punctelor de control din surse independente de precizie mare; - n - numrul de puncte de control. Eroarea planimetric a unui punct Pi este definit de relaiaCAPITOLUL 6. SURSE DE ERORI N SIG

39

( )2( )2xdate,ixcontrol,i +ydate,i ycontrol,i (6.4) Eroarea medie ptratic n plan este dat de formula

(( ) ( ) )2 2 ,,,, 122

n date i control i date i control i i rxy

xxyy n

=

+ ==+

(6.5) Dac x y = atunci relaia (6.5) devine r= 2x2= 2y2=1.4142x=1.4142y (6.6) Relaiile (6.2)(6.6) sunt valabile dac se consider c au fost eliminate erorile sistematice. Dac erorile au o distribuie normal i componentele acestora pe cele dou axe de coordonate sunt independente, atunci se poate folosi valoarea 2.4477 pentru calculul preciziei planimetrice cu un coeficient de ncredere de 95% [Greenwalt, 1968] Pr 2.4477 2.4477 2.4477 1.4142r

eciziar x y

=== Preciziar=1.7308r (6.7) Dac x y i dac raportul min max are valori ntre 0.6 i 1 (unde min este valoarea minim dintre x i y , i max valoarea maxim) atunci eroarea planimetric cu un coeficient de ncredere de 39.35% poate fi aproximat cu 0.5 x + y [Greenwalt, 1968]. Dac eroarea respect distribuia normal i componentele sale pe cele dou axe sunt independente,

(

)

atunci precizia planimetric se calculeaz cu formula Pr eciziar 2.44770.5 x+ y (6.8) b) Precizia altimetric. Eroarea medie ptratic pe axa z se determin cu relaia

(

)

( )2

,, 1 n date i control i i z

zz n

=

=

(6.9)40CAPITOLUL 6. SURSE DE ERORI N SIG

unde: - zdate,i - coordonata z a punctelor de control din baza de date; - zcontrol,i - coordonata z punctelor de control din surse independente cu precizie mare; - n - numrul de puncte de control. Relaia (6.9) este valabil dac se consider c au fost eliminate erorile sistematice. Dac eroarea altimetric respect distribuia normal, factorul 1.9600 este folosit pentru calculul preciziei pe vertical cu coeficientul de ncredere de 95% [Greenwalt, 1968]: Pr eciziaz=1.9600z (6.10) Coeficientul de ncredere de 90% a fost folosit n vechiul Standard de precizie pentru hri din SUA, actual se folosete coeficientul de 95%. Coeficientul de ncredere de 50% este utilizat n unele aplicaii militare. La noi

n ar se folosete standardul de precizie cu coeficientul de ncredere de 95%. Indicatori de precizie pentru elemente liniare Precizia geometric a unui element liniar poate fi descompus n dou componente: - precizia de poziie a punctelor (n general se face o analiz a preciziei pentru punctele de capt ale elementului liniar); - fidelitatea formei (aceasta se analizeaz n raport cu elementul liniar corespondent obinut din surse cu precizie ridicat). Factorul fuzzy (FF). Se construiete un cerc de raz r n nodul de capt al elementului de verificat i cercul de raz r corespondent n nodul de capt al elementului de referin (vezi figura 6-1). Factorul fuzzy se determin cu formula2 comun

FF S

r

= (6.11) unde:22

22 24

s comun s

S r R r R = (6.12) arccos 22 sR r

=

(6.13)CAPITOLUL 6. SURSE DE ERORI N SIG

41 Figura 6-1. Determinarea factorului FF.

innd seama de relaiile (6.12) i (6.13) relaia (6.11) devine2 2 2

1arccos 2 24 FF Rs Rs r Rs rr = (6.14) unde: s R - distana dintre nodurile de capt corespondente; r raza cercului de analiz (se poate considera precizia hrii).Figura 6-2. Determinarea suprafeei comune.

Factorul FF poate lua valori ntre 0 i 1 (0 cazul cel mai defavorabil, 1 punctele coincid). Factorul de deformare (DF). Acest factor d o informaie despre gradul de fidelitate al formei elementului liniar verificat. Se consider elementele B0BnCAPITOLUL 6. SURSE DE ERORI N SIG

42

i A0An de lungime 1. Fie i B un punct al elementului B0Bn i corespondentul su Ai aparinnd elementului de referin A0An , astfel nct00 00 ii nn

AA BB AA BB = unde i(0,n) (6.15) Ai1Ai AiAi+1 = respectiv Bi1Bi BiBi+1 = (6.16)Figura 6-3. Factorul de deformare.

Factorul de deformare se calculeaz cu formula22 00 nn ii

11 xy DF nn==

= + ++

(6.17) Dac cele dou elemente liniare se suprapun, atunci factorul de deformare este zero. Factorul de generalizare (GF) d o informaie global despre forma elementului liniar. Factorul de generalizare se calculeaz cu formula: ( ' ') () GF lungime A B lungime AB = (6.18)CAPITOLUL 6. SURSE DE ERORI N SIG

43 Figura 6-4. Factorul de generalizare.

Factorul de deplasare (BF). Acest factor d o informaie despre forma elementului liniar. Se calculeaz suma deplasrilor spre dreapta i suma deplasrilor spre stnga (figura 6-5).Figura 6-5. Factorul de deplasare.

Dac dSi = 0 i 0 dDi = nu exist deplasare. Dac 0 dSi = i 0 dDi exist deplasare n dreapta. Dac 0 dSi i 0 dDi = exist deplasare n stnga.

Dac 0 dSi i 0 dDi atuncii

i

S D

d BF d = (6.19) Msurarea preciziei de poziionare pentru un element liniar (metoda buffer-ului). Metoda face o comparaie automat a elementului de interes cu elementul corespondent din surse de precizie nalt, estimnd procentul din lungimea total a segmentului care respect precizia impus. Aceast metod are urmtoarele avantaje: - are la baz metode statistice;CAPITOLUL 6. SURSE DE ERORI N SIG

44

- este invariant la mrimea erorilor; - nu necesit gsirea unor vertexuri corespondente ntre cele dou elemente. n figura 6-6 este prezentat un exemplu de analiz pentru o poriune dintrun drum. Se construiete un buffer de dimensiune x (precizia impus) n jurul elementului liniar de referin i se determin lungimea elementului de testat ce se afl n buffer printr-o simpl operaie de intersecie.Figura 6-6. Verificarea preciziei de poziionare prin metoda buffer-ului.

Fie AA elementul liniar de analizat i BB elementul liniar de referin, atunci corectitudinea elementului AA este dat de formula (6.20). QBB' - buffer-ul elementului liniar BB ( ') 100 ( ' ')% ( ')

Corectitudinea AA lungimea AA QBB lungimea AA = (6.20) 6.3.2 Testarea preciziei atributelor O msur a preciziei de clasificare este coeficientul Kappa (K) a lui Cohen [Niu, 2002]. Pentru o zon dat, se construiete o matrice n x n elemente, unde n reprezint numrul de clase ale SIG. Pentru completarea matricei se parcurg urmtorii pai: - se alege un numr de detalii la ntmplare; - se determin clasa din care fac parte conform bazei de date SIG; - se determin clasa prin verificare la teren; - se completeaz matricea R. Ideal, toate elementele din baza de date fiind clasificate corect, se va completa doar diagonala principal a matricei.CAPITOLUL 6. SURSE DE ERORI N SIG

45

O eroare de omitere apare atunci cnd un detaliu din teren este nregistrat n baza de date incorect. Numrul de elemente aparinnd clasei X nregistrate incorect se determin, folosind matricea R, prin nsumarea elementelor coloanei corespunztoare clasei X, mai puin elementul de pe diagonala principal. O eroare de nregistrare n plus apare atunci cnd un element nregistrat n baza de date a SIG nu are corespondent la teren. Numrul de elemente nregistrate n plus pentru clasa Y se determin prin nsumarea elementelor de pe linia corespunztoare clasei Y, mai puin elementul de pe diagonala principal. Coeficientul Kappa se determin cu formula

() ()

dq K Nq = (6.21)

unde: - d reprezint suma elementelor de pe diagonala principal; - N reprezint suma tuturor elementelor matricei; - q reprezint valoarea scontat pentru fiecare element al diagonalei principale i se calculeaz cu formula (6.22).i,j j,i jj i

rr q N =

(6.22)

unde r este un element al matricei R. Fie matricea R din tabelul 6-1 corespunztoare claselor din figura 6-7.Tabelul 6-1. Matricea R corespunztoare claselor analizate.

Pdure Localiti Lacuri Total Eroarea de utilizare Pdure 6 2 1 9 6/9=67% Localiti 0 7 0 7 7/7=100% Lacuri 0 2 3 5 3/5=60% Total 6 11 4 21 Eroarea de producere 6/6=100% 7/11=64% 3/4=75% Precizia global (pG) se calculeaz prin raportul dintre suma elementelor

clasificate corect (valorile elementelor diagonalei principale) i numrul total de elemente (suma tuturor elementelor matricei)CAPITOLUL 6. SURSE DE ERORI N SIG

46, ,

6 7 3 0.76 21ii i G ji ji

r p r ++ ===

(6.23) unde: rj,i - element al matricei R.Figura 6-7. Clasificarea elementelor. Precizia de utilizare ( ) u p reprezint probabilitatea ca un

element clasificat ntr-o categorie din baza de date a SIG s aib corespondent la teren. Aceast precizie se calculeaz prin raportul dintre valoarea elementului din diagonala principal a matricei R i suma elementelor din coloana corespunztoare, ,i

ii u ij j

r p r =

(6.24)

Precizia de producere ( pp ) reprezint raportul dintre numrul de elemente dintr-o clas clasificate corect i numrul total de elemente din clasa respectiv, ,i

ii p ji j

r p r =

(6.25) Este de ateptat ca precizia atributelor s varieze n cadrul unei hri n format digital, de aceea este util s se determine o variaie spaial a probabilitii de clasificare, nu doar o statistic sumar. 6.4 Propagarea i cumularea erorilor n SIG De obicei, un sistem informaional geografic conine mai multe seturi de date care sunt combinate, comparate i analizate. Este puin probabil ca informaiile coninute n fiecare strat s aib aceeai precizie.CAPITOLUL 6. SURSE DE ERORI N SIG

47

Fie f modelul matematic de combinare a dou seturi de date a i b. Eroarea f a funciei f este afectat de erorile setului a, respectiv b. Considernd c cele dou seturi de date sunt independente i afectate doar de erori aleatoare, eroarea funciei f se calculeaz cu formula22 22 fab

ff ab

= + (6.26) unde: f - eroarea standard a funciei f; a,b - deviaiile standard ale seturilor de date a i b. Dac se consider f =a+b sau f =ab, atunci relaia (6.26) devine22

f = a+b (6.27)

De aici rezult c precizia datelor combinate este mai mic dect precizia fiecrui set n parte. 6.4.1 Propagarea erorilor Propagarea apare atunci cnd o eroare duce la alt eroare. De exemplu, dac un strat cu puncte de control conine un punct eronat (a fost cules de pe o hart la scar mic) i acest strat este folosit la georeferenierea altuia, atunci cel de-al doilea strat propag eroarea din primul. O singur eroare poate conduce la alte erori i se poate rspndi pn va afecta ntreaga baz de date a SIG 6.4.2 Cumularea erorilor Cumularea nseamn c erorile i imprecizia informaiilor distorsioneaz soluia dat de un sistem informatic geografic cnd informaiile sunt combinate selectiv n straturi noi. Efectul cumulrii erorilor poate fi foarte greu de prevzut, acesta putnd fi aditiv sau multiplicativ i depinde de modul de combinare a informaiilor. Din acest motiv este necesar s se determine influena cumulrii pentru diferite soluii date de SIG. De asemenea, este foarte important s se determine efectul asupra datelor de poziie, ct i asupra atributelor.

Un numr foarte mare de factori poate cauza erori. O parte dintre aceste surse de erori poate avea un efect cumulativ: Toate aceste erori prezentate pot avea un efect cumulativ i pot contribui ntr-un mod negativ la rezultatul unei analize SIG.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

48

7. STUDII I CERCETRI EXPERIMENTALEPentru a demonstra posibilitatea culegerii automate i semiautomate a datelor cartografice, precum i pentru a arta beneficiile utilizrii metodelor propuse, am realizat mai multe programe i le-am aplicat pentru foaia de hart L-35-87-B la scara 1: 50.000. Culegerea datelor cartografice prin metodele propuse s-a fcut att pentru foaia de hart, ct i pentru originalele de editare separate pe culori ale acesteia. Foaia de hart aleas pentru studiul de caz cuprinde o zon muntoas din judeul Braov. Relieful din aceast zon este destul de accidentat, cotele variind ntre 540 m i 1920 m. Procesul tehnologic de culegere a datelor cartografice este prezentat n figura 7-1.Figura 7-1. Procesul tehnologic de culegere a datelor cartografice.

n cazul n care nu se dispune de originalele de editare separate pe culori, dup scanarea hrii apar etape suplimentare necesare separrii pe culori i preprocesrii. De calitatea separrii pe culori a hrii scanate depinde calitateaCAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

49

vectorizrii automate i implicit volumul de munc necesar editrii i corectrii datelor culese. n cazul n care nu se poate face o separare corect pe culori, este

de preferat s se foloseasc o metod manual de culegere a datelor. 7.1 Testarea scanerului CONTEX Chameleon TX Se cunoate faptul c nici scanerele cele mai performante nu sunt scutite de erori. Pentru a obine o imagine raster ct mai puin afectat de erori geometrice i radiometrice sunt necesare metode de testare i calibrare a scanerului [Alexei, 1997b]. Pentru determinarea preciziei de scanare s-a folosit o gril pe film de dimensiune 18 cm x 15 cm, cu pasul de un centimetru. Coordonatele nodurilor grilei au fost msurate la STECOMETRU cu o precizie de 0.001 mm. Grila a fost scanat cu rezoluia optic maxim de 800 dpi, n dou culori, rezultnd un fiier BMP de 7.573 Mb. Comparnd dimensiunea grilei nainte de scanare cu dimensiunea grilei dup scanare se obine deformarea introdus de scanner. Cumulnd erorile pe cele dou axe se obine valoarea absolut a deformrii datorate scanrii. Se observ din figura 7-2 c sunt zone mici unde deformarea depete valoarea de 0.1 mm. Deformarea medie este 0.053 mm la scara hrii (figura 7-3). Aceast deformare medie, pentru harta la scara 1: 50.000, reprezint 2.65 m i este mult mai mic dect eroarea grafic.Figura 7-2. Eroarea total rezultat n urma scanrii.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

50 Figura 7-3. Estimatorii statistici ai deformrii totale rezultate n urma scanrii.

7.2 Rectificarea imaginii scanate Rectificarea este procesul de transformare a datelor dintr-un sistem reea

n alt sistem reea utiliznd o transformare polinomial de grad n. Deoarece pixelii din noua reea pot s nu se alinieze cu pixelii din reeaua original, acetia trebuie s fie reeantionai. Rectificarea este necesar n cazurile n care reeaua de pixeli a imaginii trebuie modificat astfel nct s se adapteze la un sistem de proiecie cartografic sau la o imagine de referin. Rectificarea se face n urmtoarele cazuri: - comparaiile pixel cu pixel n aplicaii de detectare a modificrilor; - dezvoltarea bazelor de date SIG; - crearea unor fotohri; - suprapunerea unor date vectoriale peste date raster; - compararea imaginilor aflate iniial la scri diferite; - realizarea unor analize ce necesit locaii geografice exacte; - determinri de distane, arii etc. pe hri raster. n timpul rectificrii se poate pierde ceva din integritatea spectral a datelor. O imagine nerectificat este mai corect din punct de vedere spectral, comparativ cu o imagine rectificat. Georeferenierea se refer la procesul de atribuire a coordonatelor sistemului geodezic terestru datelor imagine. Datele imagine pot fi deja pe planul dorit, nefiind ns raportate la sistemul de coordonate adecvat. Georeferenierea, prin ea nsi, presupune schimbarea doar a informaiilor privind coordonatele cartografice n fiierul de imagine. Reeaua de pixeli nu se modific.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

51

Reeantionarea este procesul de extrapolare a valorilor datelor pentru pixelii dintr-o reea nou obinut n urma procesului de rectificare, de la valorile pixelilor surs. Cele mai folosite metode de reeantionare sunt: - metoda celui mai apropiat vecin - utilizeaz valoarea pixelului cel mai apropiat pentru a atribui valoarea de ieire a pixelului; - interpolarea biliniar - se folosete o fereastr 2 x 2 pixeli pentru a calcula valoarea de ieire a pixelului (se folosete o funcie biliniar); - nfurata cubic - utilizeaz valorile a 16 pixeli dintr-o fereastr 4 x 4 pentru a calcula valoarea de ieire a pixelului cu o funcie cubic. Am realizat programul software MapGEO (figura 7-4) pentru rectificarea hrilor scanate. Programul a fost scris n limbajul Delphi 7.0 i permite rectificarea imaginilor n format BMP cu 256 culori.Figura 7-4. Interfaa programului MapGEO.

Pentru rectificarea imaginilor scanate, programul MapGEO pune la dispoziie transformrile conform, afin i biliniar. n cazul n care numrul de puncte de control este mai mare dect numrul de puncte necesar pentru determinarea coeficienilor transformrii, se calculeaz eroarea medie ptratic n fiecare punct. Coordonatele punctelor de control se pot introduce att de laCAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

52

tastatur, ct i prin identificare i punctare pe alte hri raster sau vector ce sunt importate de program.

Grila scanat, folosit pentru testarea scanerului CONTEX Chameleon TX, s-a rectificat pentru a determina deformrile introduse de acest proces. Deformarea total dup rectificare este prezentat n figura 7-5. Se observ c sunt puine locuri unde deformarea depete 0.1 mm.Figura 7-5. Deformarea total dup rectificare.

Deformarea maxim obinut dup scanarea i rectificarea grilei este de 0.136 mm, media deformrilor fiind de 0.046 mm. De asemenea se observ c numrul punctelor n care deformarea depete 0.1 mm este foarte mic.Figura 7-6. Estimatorii statistici ai deformrii totale dup rectificare.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

53

n urma procesului de rectificare, sunt zone n imagine unde deformarea a crescut (figura 7-7). Se observ c deformarea s-a micorat n marginile imaginii, n apropierea punctelor de control, mrindu-se spre centru.Figura 7-7. Evoluia deformrilor dup rectificare.

n figura 7-8 sunt prezentate deformrile dup scanare respectiv dup rectificare. Se observ c, dup procesul de rectificare, nu mai apar deformri mai mari de 0.15 mm.Figura 7-8. Deformrile dup scanare respectiv dup rectificare.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

54

n tabelul 7-1 sunt prezentai indicatorii statistici ai deformrilor rezultate n urma procesului de scanare, respectiv rectificare. Se observ c eroarea maxim dup rectificare este mai mic dect eroarea rezultat din scanare (0.136 mm comparativ cu 0.180 mm). De asemenea, valoarea medie a erorii s-a

micorat la 0.046 mm, comparativ cu 0.053 mm dup scanare.Tabelul 7-1. Indicatorii statistici ai deformrilor dup scanare respectiv dup rectificare.

Deformri dup scanare [mm] Deformri dup rectificare Indicator statistic [mm] x y Total x y Total Valoare maxim 0,1304 0,1247 0,1805 0,1093 0,1133 0,1361 Valoare medie 0,0265 0,0202 0,0536 0,0002 0,0000 0,0467 Deviaia standard 0,0446 0,0258 0,0299 0,0458 0,0283 0,0267 7.3 Culegerea datelor cartografice cu ajutorul algoritmilor propui Pentru vectorizarea automat prin metoda cercului am realizat programul Vect scris n Delphi 7.0 cu ajutorul bibliotecii grafice MapObjects dezvoltat de ESRI. Aceast bibliotec include funcii performante de vizualizare i gestiune a datelor vector i raster. Programul folosete ca date de intrare un fiier raster georefereniat n format BMP cu 256 culori. Rezultatul vectorizrii este salvat ntr-un fiier n format ESRI Shape. Interfaa programului de vectorizare este prezentat n figura 7-9.Figura 7-9. Interfaa programului de vectorizare.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

55

Programul pune la dispoziie o fereastr de opiuni n care se pot alege raza de analiz i modul de tratare a ntreruperilor dintr-un element liniar. 7.3.1 Vectorizarea originalului de editare cu relieful Originalul de editare cu relieful conine elemente liniare, simboluri

punctuale, inscripii (valorile curbelor de nivel, nlimile movilelor etc.) i rasterul de umplere a detaliilor ce reprezint drumurile i localitile. Din aceast cauz apar erori de vectorizare. Pentru a evita aceste probleme se poate cura imaginea raster de surplusul de informaie naintea procesului de vectorizare sau se poate adopta soluia editrii i corectrii post vectorizare.Figura 7-10. Vectorizarea prin dou metode a originalului de editare cu relieful.

n figura 7-10 este prezentat o comparaie ntre rezultatul vectorizrii prin metoda cercului, i, cu ajutorul programului ArcInfo, a unei poriuni din originalul de editare cu relieful. Se observ c rezultatele sunt comparabile. n cazul atingerii a dou curbe de nivel apar erori de vectorizare, mai ales la digitizarea hrii tiprite (figura 7-11). Deoarece culoarea de umplere pentru elementele areale i liniare reprezentate prin 2 sau 3 linii echidistante este aceeai cu cea a curbelor de nivel, aflndu-se toate n acelai original de editare, apar erori de tipul celor din figura 7-12. Cotele curbelor de nivel determin erori de vectorizare de tipul celor din figura 7-13. Acest tip de erori poate fi evitat printr-o editare preliminar a imaginii raster.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

56 Figura 7-11. Eroarea de vectorizare n cazul atingerii a dou curbe de nivel. Figura 7-12. Eroarea de vectorizare datorit culorii de umplere a localitilor. Figura 7-13. Eroarea de vectorizare a curbelor de nivel datorit inscripiilor.

CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE

57

Erorile de digitizare prezentate mai sus, rezultate n urma procesului de vectorizare automat a originalulu