Ontologii

4
Tematica B Nenu Anda Roxana Facultatea de Automatica si Calculatoare Universitatea Politehnica Bucuresti, Romania [email protected] AbstractAcest document ofera o privire de ansamblu asupra modelelor semantice, a metodelor algoritmice folosite pentru analiza acestor, si a sistemelor emergente pe care le formeaza. Printre tendintele existente in momentul de fata in industrie se numara si miniaturizarea extrema a echipamentelor precum si introducerea unui model de interactiune om-calculator in care prelucrarea de informatii a fost complet integrata in obiectele folosite in activitati uzuale. I. MODELE SEMANTICE (ONTOLOGII) Definitia originala a ontologiei este stiinta care studiaza fiinta, trasaturile generale ale existentei. Desi multe alte definitii exista, cand vorbim in contextul tehnologiei informatiei, in aceasta lucrare, vom considera urmatorul punct de vedere : o ontologie este o specificatie explicita a unui concept. A. Unelte si Limbaje pentru Reprezentarea Cunostintelor Fiecare reprezentare a cunoasterii este o aproximare imperfecta a realitatii, fiecare aproximare punand accentul pe unele caracteristici, si ignorand altele. Astfel, in selectarea unei reprezentari, se cade de acord asupra unui set de ontologii. Acest set de ontologii, pot fi considerate ca o pereche puternica de ochelari care determina ce putem vedea, focusand o parte a lumii, si incetosand alte parti. Fiecare limbaj de reprezentare a cunoasterii este definit de uneltele care il suporta. Astfel, atributele unui limbaj sunt strans legate de atributele uneltei. Fiecare tool de reprezentare a cunoasterii creaza o baza de date a cunoasterii cu informatii cunoscute. Atributele pe care limbajul tool-ului le suporta caracterizeaza tipul informatiei care poate fi gasita in baza de date mentionata mai sus. Limbaje de reprezentare a cunoasteri, si tool-urile care le suporta, pot fi impartite in urmatoarele categorii: 1) Bazate pe cadre: Conform[2], cadrele reprezinta lucruri, actiuni, concepte. Cadrele sunt definite prin relatiile lor cu alte cadre. Relatiile dintre cadre sunt reprezentate folosind sloturi. Daca un cadru f este in relatie r cu cadrul g, atunci se pune valoarea g in slotul r al cadrului f. De exemplu, fie urmatorul arbore genealogic: Adam = Beth Charles Donna Ellen Cadrul care il descrie pe Adam poate arata in felul urmator: Adam: sex: masculin partener: Beth copii: (Charles, Donna, Ellen) unde sex, partener si copii sunt sloturi. Arborele genealogic poate fi descris de (cel putin) sapte cadre, reprezentand urmatorii indivizi: Adam, Beth, Charles, Donna, Ellen. 2) Folosind predicate logice: este o reprezentare care poate fi interpretata de calculator a logicii matematice. Fie urmatorul exemplu: Prince este un mega start. Mega star-urile sunt bogate. Oamenii bogati au masini rapide. Masinile rapide consuma mult petrol. si incercam sa tragem concluzia: Masina lui Prince consuma mult petrol. Pentru a treia axioma, definim relatia car(c, m) care afirma ca c este masina lui m, si functia carof(m). Putem traduce astfel: Ceea ce duce la concluzia: 3) Folosing descrierea logica: este un stil de reprezentare a cunostintelor in care putem clasifica instantele dupa atribute. Principalele structuri folosite sunt a) fapte care au urmatoarea forma: < expresie care il cuprinde pe x >, unde x este un obiect specific b) reguli cu forma: (pentru fiecare x) daca x este o instanta a clasei Y atunci <expresie care il cuprinde pe x> (is true) (pentru fiecare x) daca <expresie care il cuprinde pe x> atunci x este o instanta a clasei Y 4) Bazate pe reguli: structura principala pe care se bazeaza este 'regula': daca <expresie booleana> atunci <actiune> 5) Reprezentare hibrida : Aceasta reprezentare inglobeaza mai multe atribute si functionalitati a reprezentarii bazate pe cadre, a predicatelor logice, a descrierii logice si a celei bazape pe reguli. Reprezentarea hibrida depaseste limitarile impuse de reprezentarile 'pure'.

description

Integrarea sistemelor informationale

Transcript of Ontologii

Page 1: Ontologii

Tematica B

Nenu Anda RoxanaFacultatea de Automatica si Calculatoare

Universitatea Politehnica Bucuresti, [email protected]

Abstract—Acest document ofera o privire de ansamblu asupramodelelor semantice, a metodelor algoritmice folosite pentru analizaacestor, si a sistemelor emergente pe care le formeaza. Printretendintele existente in momentul de fata in industrie se numara siminiaturizarea extrema a echipamentelor precum si introducereaunui model de interactiune om-calculator in care prelucrarea deinformatii a fost complet integrata in obiectele folosite in activitatiuzuale.

I. MODELE SEMANTICE (ONTOLOGII)

Definitia originala a ontologiei este stiinta care studiazafiinta, trasaturile generale ale existentei. Desi multe altedefinitii exista, cand vorbim in contextul tehnologieiinformatiei, in aceasta lucrare, vom considera urmatorul punctde vedere : o ontologie este o specificatie explicita a unuiconcept.

A. Unelte si Limbaje pentru Reprezentarea Cunostintelor

Fiecare reprezentare a cunoasterii este o aproximareimperfecta a realitatii, fiecare aproximare punand accentul peunele caracteristici, si ignorand altele. Astfel, in selectarea uneireprezentari, se cade de acord asupra unui set de ontologii.Acest set de ontologii, pot fi considerate ca o pereche puternicade ochelari care determina ce putem vedea, focusand o parte alumii, si incetosand alte parti.

Fiecare limbaj de reprezentare a cunoasterii este definit deuneltele care il suporta. Astfel, atributele unui limbaj suntstrans legate de atributele uneltei. Fiecare tool de reprezentare acunoasterii creaza o baza de date a cunoasterii cu informatiicunoscute. Atributele pe care limbajul tool-ului le suportacaracterizeaza tipul informatiei care poate fi gasita in baza dedate mentionata mai sus.

Limbaje de reprezentare a cunoasteri, si tool-urile care lesuporta, pot fi impartite in urmatoarele categorii:

1) Bazate pe cadre: Conform[2], cadrele reprezinta lucruri,actiuni, concepte. Cadrele sunt definite prin relatiile lor cu altecadre. Relatiile dintre cadre sunt reprezentate folosind sloturi.Daca un cadru f este in relatie r cu cadrul g, atunci se punevaloarea g in slotul r al cadrului f. De exemplu, fie urmatorularbore genealogic:

Adam = Beth

Charles Donna Ellen

Cadrul care il descrie pe Adam poate arata in felul urmator:

Adam:sex: masculinpartener: Bethcopii: (Charles, Donna, Ellen)

unde sex, partener si copii sunt sloturi. Arborele genealogicpoate fi descris de (cel putin) sapte cadre, reprezentandurmatorii indivizi: Adam, Beth, Charles, Donna, Ellen.

2) Folosind predicate logice: este o reprezentare care poatefi interpretata de calculator a logicii matematice. Fieurmatorul exemplu:

Prince este un mega start. Mega star-urile sunt bogate. Oamenii bogati au masini rapide. Masinile rapide consuma mult petrol.

si incercam sa tragem concluzia: Masina lui Prince consumamult petrol. Pentru a treia axioma, definim relatia car(c, m)care afirma ca c este masina lui m, si functia carof(m). Putemtraduce astfel:

Ceea ce duce la concluzia:

3) Folosing descrierea logica: este un stil de reprezentare acunostintelor in care putem clasifica instantele dupa atribute.Principalele structuri folosite sunt

a) fapte care au urmatoarea forma: < expresie care ilcuprinde pe x >, unde x este un obiect specific

b) reguli cu forma: ▪ (pentru fiecare x) daca x este o instanta a clasei Y

atunci <expresie care il cuprinde pe x> (is true) (pentru fiecare x) daca <expresie care il cuprinde pe x>

atunci x este o instanta a clasei Y

4) Bazate pe reguli: structura principala pe care se bazeazaeste 'regula': daca <expresie booleana> atunci <actiune>

5) Reprezentare hibrida : Aceasta reprezentare inglobeazamai multe atribute si functionalitati a reprezentarii bazate pecadre, a predicatelor logice, a descrierii logice si a celeibazape pe reguli. Reprezentarea hibrida depaseste limitarileimpuse de reprezentarile 'pure'.

Page 2: Ontologii

B. Web Semantic

Web-ul Semantic este o extensie a Web-ului actual cepermite descrierea formală a resurselor existente pe Internet(pagini Web, documente text şi multimedia, baze de date,servicii etc). Dintre avantajele acestuia se impune ca principalăidentificarea rapidă și precisă a resurselor relevante pentruutilizator precum şi exploatarea automată a resurselor de cătreagenţii inteligenţi. In ceea ce priveste limbajele folosite, sedeosebesc familiile Resource Description Framework siDAML. Inca o arie de interes in care s-a investit destul de multsunt Serviciile Web Semantice.

1) Resource Description Framework: este o structurastandard pentru a atasa informatie semantie resurselor de peWorldWideWeb. O resursa este orice corp cu continut careeste accesibil pe Web si identificata printr-un UniformResource Identifier. O resursa poate fi un document, o partedintr-un document, o imagine, etc.

O specificatie RDF este impartita in trei parti:

Modelul si Sintaxa RDF: bazata pe un triplet formatdin subiect, verb si obiect. Subiectul poate fi orice resursa.Obiectul poate fi o resursa, o valoare sau nil. Verbul este unstring care reprezinta un predicat, o proprietate, sau o relatie.Un model RDF poate fi reprezentat grafic printr-un graforientat etichetat. Exemplu, fie propozitia: 'Ora Lassila is the creator of theresource http://www.w3.org/Home/Lassila.' Propozitia areurmatoarele parti: Subiect (resursa) http://www.w3.org/Home/LassilaPredicat (proprietate) creatorObiect (literal) 'Ora Lassila'Arcul incepe la subiect si pointeaza spre obiectul afirmatiei. Odiagrama poate fi citita '<subiect> ARE <predicat> <obiect>'http://www.w3.org/Home/Lassila are creator Ora Lassila.

creator

Schema RDF: defineste termeni (verbe si valori)pentru semantici folosite des, cum ar fi 'este subclasa' careimplica relatia parinte/copil pentru oricare doua clase, adicaorice resursa care este membru a clasei copil este de asemeneamembru si al parintelui.

Model Teoretic RDF: este o definitie formala asemanticii unei scheme RDF, folosite de un motor de gandire.

2) DAML: Defence Agent Markup Language este un limbajbazat pe XML, dar cu o capacitate mai mare pentru a descrieobiecte, relatii intre obbiecte, continut semantic si sa creeze oconexiune mai puternica, din punct de vedere semantic, intrece se gaseste pe web.

3) Servicii Web Semantice: In servicile web semantice,masinile pot selecta, integra si invoca automat diferite serviciiweb pentru a atinge un anumit scop in functie de cerintele,constrangerile userului. Procesul automatizat cuprinde:

Descoperirea unui web service automatizat: gasireaunui serviciu care indeplineste conditiile cererii.

Executarea unui astfel de serviciu: un agent executaserviciul in numele clientului

Compunerea unui web service automatiza: proceseleautomatizate de selectie, compunere si interconectarea mai multor web servicii pentru a completa unanumit task.

C. Ontologii Lightweight

Conform [3], o ontologie, deseori, este reprezentata ca ungraf orientat unde nodurile reprezinta concepte si laturilereprezinta relatii intre concepte.Notiunea de concept reprezintaun set de obiecte sau indivizi. Acest set este numit extensiaconceptului. Structura de backbone a grafului cuprinde relatiile'este un(o)', in timp ce restul structurii include relatii ca 'faceparte din', 'este localizata in', 'este parintele lui' s.a. Simplistputem spune ca, o ontologie lightweight este o ontologieconstituita doar din structura de backbone a grafului. Pe langaasta, generalizam reltia 'este un(o)' pentru a respectaproprietatile grafului ex. extensia unui concept a unui nodcopil este un subset al extensiei conceptului nodului parinte.

Formal, o ontologie lightweight este un tuplu O=(N,E,C),unde N este un numar finit de noduri, E este o multime delaturi, astfel incat (N,E) sa fie un arbore, iar C este un numarfinit de concepte exprimate intr-un limbaj formal F, astfel incat

pentru orice din N, exista un , unic, din C, si daca

este nodul parinte a lui , atunci . Limbajulformal F, apartine familii de limbaje folosing descrierea logica,despre care am vorbit in prima parte a lucrarii.

Comunicarea si integrarea sunt favorizate cand putemidentifica asemenea ontologii lightweight si intelegem ceea ceexprima de fapt: o incercare informala, partiala destandardizare a conceptelor si terminologiilor. Astfel, procesulde integrare poate beneficia de pe urma diferitelor moduri de aintelege si interpreta aceste ontologi. Aceste moduri potcuprinde:

specificatii software dictionare si tezaur interpretabil de calculatoare

(WordNet) effort manual si software specializat pentru

extragerea grafurilor de concepte si a regulilor decomportament din texte.

D. Integrarea Bazata pe Ontologii

1) Abordarea interlingua: Conform[4] ,presupune existentaunei ontologii independenta de restul ontologiilor celorlalteaplicati, cu rol de mediator intre acestea. Cel mai mare avantajpentru aceasta arhitectura il constituie numarul mic detranslatii.

http://www.w3.org/

Home/LassilaOra Lassila

Page 3: Ontologii

Observam ca reteaua punct-la-punct are o complexitate den patrat in ceea ce priveste construirea translatarilor. In schimbcu o abordare interlingua, doar n translatii sunt necesare.

2) Abordarea ontologiilor comune presupune ca fiecareagent are un model de ontologie formalizat, care descrieobiectele si comportamentele care pot aparea la interfetele sale,si cuprinde elemente ale unei librarii ontologice, publice saucare poate fi si locala.

3) Abordarea heuristica este pentru acele situatii in careinformatiile pentru a verifica maparea intre ontologiile a doiagenti sunt insuficiente. Presupune generarea de modalitati demapare ipotetice si folosirea unor strategii de cautare sievaluare pentru a alege care mapare este mai probabil saasigure interactiunile intre agenti.

4) Abordarea traducerea manuala presupune dezvoltareaunei mapari de la elementele relevante pentru ontologiaagentului X, la elementele corespondente ale agentului Y, simaparea inversa, pentru fiecare pereche de agenti (X, Y) carevor interactiona. Aceasta abordare combina metodele formalecu expertiza umana, iar rezultatele nu pot fi validate dacaontologia agentilor nu este data sub forma de axiome.

II. METODE ALGORITMICA ALE INTELIGENTEI ARTIFICIALE

Sistemele de ingeria cunostintelor presupun existenta uneibaze de date a sistemului, care captureaza nu doar fapte, dar sireguli pentru derivarea noilor fapte pornind de la cele introduseinitial. De asemenea presupune existenta si unui motor careefectueaza aceste derivari.

Sistemele expert sunt consilieri automatizati care sugereazaoperatii apropiate pentru mediile de business si inginerieaplicata, iar in unele cazuri, creaza fisierele de date si tranzactiinecesare pentru a efectua acele operatii (ex. Software deconfigurare 'wizard'). Aceste sisteme folosesc un mecanismintrebare-raspuns pentru a consilia un agent uman, iar pe bazalor, sistemul de ingineria cunostintelor, mai precis motorulacestuia determina implicatiile respunsurilor atat pentruintrebarea curenta, cat si pentru urmatoarea pana cand orecomandare sau un rezultat final este gasit.

III. COMPORTAMENT DE TIP INVATARE AUTOMATA SI

EMERGENTA

In sectiunea urmatoare vom vorbi despre tehnoci carepermit componentelor si sistemelor sa isi schimbe propriul

comportament. Aceste tehnologii pot fi folositoare pentru auto-integrare si rezolvarea conflictelor care pot aparea.

A. Neural Nets: se bazeaza pe comportamentul intern al creierul uman. Versiunea software a acestor retele presupun ca unele noduri sa fie responsabile pentru procesarea anumitor informatii, si sa aiba un mecanism ajustabil intern pentru validare sau testare care va cauza lansarea unei functionalizati in executie sau transmiterea unui mesaj mai departe la un set de receptori aflati in alte noduri.Receptorii dintr-un nod reactioneaza la anumite mesaje.Altii reactioneaza doar la conexiuni interne, altii doar la cele externe. Sistemul este in mod repetat expus unei varietati de exemple din spatiul problemei pentru a obtine feedback privind corectitudinea si validitatea rezultatelor, pana cand 'invata' sa raspunda cat mai acurat exemplelor.

B. Agenti de interactiune

Termenul 'arhitectura agentului' include trei tipuri desisteme software care au unele caracteristici in comun:

un sistem construit pe programarea orientata agent,care presupune o constructie software centrata pesonceptul de agent software. Contrar paradigmei deprogramare orientata pe obiect care are obiecte (cufunctii si atribute) la baza, aceasta paradigma sebazeaza pe agenti specifici (cu interfete si mecanismede transmitere a mesajelor bine definite) .

agenti personali: sisteme care inglobeaza tehnici decautare web sau de monitorizarea datelor, si strategiiautomatizate de luare a decizilor pentru a efectuaactiuni low-level, care, in nod normal ar necesitaatentia unui agent uman. De asemenea alerteazaagentul uman cand un eveniment important s-aprodus.

agenti autonomi: sisteme care actioneaza in numeleunei alte entitati, fara vreo interventie din partea aceleientitati. Un exemplu de astfel de agent, este un sistemcare sesizeaza orice schimbare de status a mediului.

In timp ce primele doua componente inglobeaza conceptul de alua decizii pe baza unor reguli, ultima componenta le combinape primele doua cu conceptul de 'bazat pe reguli identice siindependente', ceea ce duce la un comportament emergent.

C. Sisteme adaptive si self-organizing

Conform [1], sistemele adaptive sunt sistemele care au unnumar de comportamente initial implementate, a caroractivitate si parametrii sunt controlate de iesirile unor functiicare analizeaza evenimente si stari ale mediului.Comportamentul unui astfel de sistem se schimba in functie dece se intampla in mediul lor exterior – la care reactioneaza.Intr-un context restrictiv, este posibil sa 'antrenezi' un sistemself-organizing sa se comporte intr-un mod dorit fara a-lprograma in mod explicit.

Fonomenele self-organizing si cele emergente pot fiobservate in multe sisteme din natura. De exemplu, insectele

Page 4: Ontologii

care traiesc in coloni, s-a observat ca integreaza perfectactivitatile individuale, cu toate ca fiecare insecta pare saactioneze in mod individual, fara vreo supervizare centralizata.Interactiunea intre membrii acestor colonii se face prinobservarea modificarilor asincrone si secventiale ale mediuluiin care traiesc.

IV. CONCLUZII

Ontologiile sau modelele semantice ofera o intelegere aunui concept. In functie de reprezentarea lor, mai multe tehnicialgoritmice au fost dezvoltate. O aplicatie puternica estereprezentata de web-ul semantic. Un sistem automatizat pentrua analiza si a oferi o solutie pentru web-ul semantic va trebui sa

se ocupe de urmatoarele probleme: vastitate, neclaritate,incertitudine, inconsistenta folosing metode algoritmice aleinteligentei artificiale, analizand comportamente de tip invatareautomata si emergenta.

V. REFERINTE

[1] Edward J. Barkmeyer, Concepts for Automating SystemIntegration.

[2] Michael S. Hewett, Introduction to Frame Based KnowledgeRepresentation.

[3] Fausto Giunchiglia, Lightweight Ontologies

[4] Michael Gruninger and Joseph B. Kopena, Semantic IntegrationThrough Invariants