Cap7 Baze de Date TIC 2010

241
CAP.7. BAZA DE DATE - RESURS ELECTRONIC DE INFORM Curs: Tehnologia infor în cercetare

description

fwer

Transcript of Cap7 Baze de Date TIC 2010

CAP.7. BAZA DE DATE -

RESURS ELECTRONIC DE INFORM

Curs:

Tehnologia infor n cercetare

Mat. Gabriela MAILAT

Prof.dr.ing. Elena HELER

1

CUPRINS

Baze de date. Defini ie. Clasificare

Modalit i de acces n bazele de date tiin ifi Sisteme de reg sire a informa iei

Exemple de sisteme de reg sire a informa iei

Sistemul de reg sire a informa iei: Opera iile de sto reg sire

Indexarea documentelor Standardizare i sisteme Afi area rezultatelor

Linii directoare pentru afi aj

2

Baze de date. Defini ie. Clasificar

Baza de date este unul dintre instru fundamentale utilizat pentru orga informa iei. Baza de date reprez colec ie de date organizate pentru a c utarea i reg sirea rapid prin inte calculatorului.

3

Baze de date. Defini ie. Clasificare

Reprezint structuri pe care sunt co majoritatea sistemelor informatice.

Bazele de date sunt structurate astf s faciliteze stocarea, reg sirea, mod i tergerea datelor n concordan cu opera ii de procesare a datelor.

4

Baze de date. Defini ie. Clasificare

5

O baz de date o serie de nr fiecare dintre acestea fiind o entitate specifi construite n acela i mod (cu atribute com interconectate.

nregistr rile sunt componentele elemen unei baze de date i pot con ine informa ii n text sau reprezent ri grafice.

O nregistrare cuprinde cmpuri de d elemente de date (numele autorului, titlu e descriu principalele atribute ale unei entit i.

Baze de date. Defini ie. Clasificare

Bazele de date pot fi stocate pe diferite s offline sau online i pot fi accesate prin int re elelor de informare locale, la distan Internet.

Patru criterii importante caracterizeaz c unei baze de date:

volumul informa iei i acoperirea domeniilor d tiin ific,

facilit ile de interogare,

timpii de acces,

grafica ecranului.

6

Baze de date. Defini ie. Clasificare

n procesul de prelucrare i de reg informa iilor o baz de date poate fi folosit p

generarea de indexuri tip rite;

realizarea de cercet ri retrospective;

realizarea bibliografiilor;

diseminarea selectiv a informa iei.

7

Baze de date. Defini ie. Clasificare

O cercetare retrospectiv cercetare la c se realizeaz ntr-un corp de literatur retro pentru a g si titluri privind un subiect gen specific, la cererea utilizatorului.

Un serviciu curent de diseminare sele informa iei are n vedere numai literatura p recent.

8

Baze de date. Defini ie. Clasificare

n

informa iei, interesul utilizatorului pe subiect este convertit n strategie de c numit n mod frecvent profilul utiliza Acest profil se p streaz ntr-un fi ier completeaz pe m sur ce apa suplimentare.

9

Baze de date. Defini ie. Clasificare

Pornind de la structura lor, bazele de da clasificate n:

baze de date ierarhizate i

baze de date rela ionale.

10

Baze de date. Defini ie. Clasificare

Bazele de date ierarhizate

tradi ional structura arborescent pentru informa iei. Ele constau dintr-un fi ier form multe nregistr ri, care la rndul lor sunt din numeroase cmpuri de date. Aceste date sunt mai degrab inflexibile i folo spa iu ntruct datele sunt adesea repetitive

11

Baze de date. Defini ie. Clasificare

Baze de date rela ionale permit d nregistr rilor n mai multe p r i care sunt p diferite fi iere. Aceste p r i sunt legate pentru a forma nregistr ri individuale. informa ie individual este stocat ntr-un si dar ea poate fi utilizat n mai multe nregis ex. numele unui autor poate fi stocat ntr-pentru nume, dar fiecare nregistrare a lucr ri a respectivului autor este afi at mpr numele autorului pe ecran.

12

Baze de date. Defini ie. Clasificare

Bazele de date ndeplinesc numeroase func

pot stra date administrative, colec ii de ima date numerice brute;

pot fi depozite de articole cu text integral;

pot ine eviden a inventarului i a mprumutur Dup func ia ndeplinit , bazele de date pot fi mp r ite n dou categorii:

1. Baze de date bibliografice (de referin )

2. Baze de date tip surs .

13

Baze de date. Defini ie. Clasificare

1. Primele (bibliografice) con in:

informa ii despre literatura or adic date bibliografice i suplim referitoare la c r i, articole din pe documente guvernamentale, ra lucr ri de la conferin e, dizerta ii, b

14

Baze de date. Defini ie. Clasificare

date bibliografice (autor, titlu clasific ri, cuvinte cheie, precum informa ii suplimentare pertinente scurt descriere a con inutului publi

15

Baze de date. Defini ie. Clasificare

n cadrul acestor baze de date bibliografic leg turi (link-uri) sau trimiteri (pointer) spr care se afl n afara respectivei baze de d exemplu, indexul unei reviste (periodic) informa ii despre loca ia i con inutul unor

(lucr ri tiin ifice) care sunt stocate n alt pa

16

Baze de date. Defini ie. Clasificare

Una dintre cele mai cunoscute baze de acest tip este METADEX, pentru domeniu materialelor, care poate fi accesat prin In pagina WEB a re elelor DIALOG sau STN, mari re ele de informare online din domeniul

17

Baze de date. Defini ie. Clasificare

2. Bazele de date tip surs pot fi:

a. full-text care con in textul integ fragmente din documente, ca: articol poeme, eseuri;

b. numerice

financiare, rezultate ale diverselor propriet i fizice sau chimice ale substan

18

Baze de date. Defini ie. Clasificare

Exemplu de baz de date numeric n d atomic i molecular

i.AMDIS (Atomic and Molecular Data

http://dpc.nifs.ac.jp/amdata/am

System)

ncadrulbazei de date AMDIS, s

transversale teoretice i experimentale (ob tehnici de fascicul) pentru procesele de ex ionizare ale atomilor, ionilor i a unor mole impact electronic sunt stocate mpre referin ele.

19

Baze de date. Defini ie. Clasificare

ii. CHART (Charge Transfer between Atoms http://dpc.nifs.ac.jp/amdata/chartlist.html

Sec iunea transversal experimental pentru de sarcin al ionilor n coliziune cu inte d atomic i molecular sunt stocate mp referin ele.

20

Baze de date. Defini ie. Clasificare

c. hibride (mixte)

nregistr ri reprezentnd o combina ie ntre date full-text i cele numerice;

d. faptice spre deosebire de cele bibliografi informa ia primar .

n Germania, GENESIS-Online

de date care ofer date statistice. https://www-genesis.destatis.de/genesis/on

21

Baze de date. Defini ie. Clasificare

Alt exemplu l constituie EUROSTAT, care of statistice privind Comunitatea European .

http://www.esds.ac.uk/international/support/u

des/eurostat/cronos.asp

http://epp.eurostat.ec.europa.eu/portal/page/

urostat/home/

22

Baze de date. Defini ie. Clasificare

e. pentru brevete

Aproape jum tate din cererile de breve lume sunt respinse de c tre birourile de b deoarece conceptul presupusei inven ii nu nou.

Pentru a evita riscul unei investi ii de mil cercetare i dezvoltare, trebuie mai nti co o astfel de baz de date care con ine b existente pn la acea dat .

23

Baze de date. Defini ie. Clasificare

f. pentru rapoarte i proiecte de cercetar furnizeaz informa ii asupra proiecte cercetare i dezvoltare. Un exemplu es (National Technical Information Service)

http://www.ntis.gov/.

C utarea n baza de dat http://www.ntis.gov/products/ntrl.aspx.

24

Modalit i de acces n bazele de date tiin ifice

Accesul la informa iile con inute se poate intermediul produc torului bazei de date distribuitorii de servicii online. Pentr calculator conectat, distribuitorul de serv atribuie un cont, identificat prin nume care asigur confiden ialitatea accesului l

25

Modalit i de acces n bazele de date tiin ifi

Contul se afl localizat pe un calculat (gazd ) situat n Centrul Informatic i se la operator. Calculatorul host

produsele soft implementate i cana comunica ie la care este conectat) activit ile n re ea ale utilizatorului, protocoalele Internet.

26

Figura reprezint schema de principiu a modului de acc baze de date prin re ele de informare online.

27Accesul la bazele de date prin re ele automatiz

Sisteme de reg sire a informa iei

n cele ce urmeaz se vor defini acele eleme s -i familiarizeze pe poten ialii utiliza terminologia i conceptele de baz ale proce reg sire a informa iei. Din cele prezen continuare va rezulta c reg sirea inform implic numai procese specifice sistemului mult, procese care includ chiar utilizatorul.

28

Sistem de reg sire a informa iei

Fiecare sistem de reg sire a informa iei accesul la un set de documente. Un do reprezint un obiect care este reg sit de u de reg sire a informa iei. Acesta poate co con inutul complet al informa iei cerute, n este considerat un document full-text, de ex pagin WEB sau un articol din revist .

29

Sistem de reg sire a informa iei

n cadrul sistemelor de reg sire a i bibliografice, adeseori documentul fu este disponibil, astfel nct se utili rezumat numit document surogat (c care este stocat n locul documentulu Acesta cuprinde date cu rol de identif ar fi informa ii asupra cit rilor biblio rezumate care ajut la ide documentului.

30

Sistem de reg sire a informa iei

Documentele pot fi de lungimi difer exemplu de la scurte pasaje de text opere monografice complete, sau pot a formate media cum ar fi imagini vid sunete.

31

Sistem de reg sire a informa iei

Exist dou metode de c utare:

i. interogarea i

ii. baleierea informa iei, ambele putnd continuare subdivizate.

i. Interogarea poate fi:

a. identificarea (punerea n coresponde baz de fraz sau

b. identificarea prin cuvinte cheie.

32

Sistem de reg sire a informa iei

Identificarea pe baz de fraz const n p unui ir format din caractere de c utare c exact din nregistr rile aflate n sistem (s precis, cu indec ii genera i ). Ace interogare solicit cuvintelor din ir s se reg n aceea i ordine ca n interogarea de c u permite termenilor sau irurilor s se reg s cmpuri diferite.

33

Sistem de reg sire a informa iei

Identificarea prin cuvinte cheie permite term fie dispersa i. C utarea pe baz de cuvin implic punerea n coresponden a unor separate cu indec ii sistemului, recurgnd a operatori booleeni sau la formul ri de pro pentru a-i combina. Cuvintele cheie pot fi unor termeni care apar n mai mult de u cmp sau index.

34

Sistem de reg sire a informa iei

ai. Baleierea informa iei, la rndul ei, poate fi divizat n dou categorii:

a. Baleierea linear pre-secven ial utilizatorilor s scaneze liste de antete/titluri sau scurte titluri pentru teme sau articole de interes. Aceasta abordare structurat , recurgnd la org intern a datelor de c tre sistem.

35

Sistem de reg sire a informa iei

b. Cel de-al doilea tip de baleiere pro Hildreth este neliniar i multidirec ional este tipul de baleiere nestructurat . utilizarea leg turilor/ link-urilor hypertex a naviga ntre diferite articole.

36

Sistem de reg sire a informa iei

Interogarea este preferabil n cazul n care tiu exact ceea ce- i doresc, n timp ce constituie o alternativ n cazul reg sirii nregistr ri ca r spuns la o interogare.

37

Sistem de reg sire a informa iei

De exemplu, dac un utilizator caut un d dup criteriul autor, numele fiind Popescu, cunoa te dect ini iala R. a prenum interogare bazat pe baleiere l va plasa pe caut ntr-un index al tuturor numelor de p cu numele de familie Popescu, n punctul vor ncepe prenumele cu ini iala R. De punct, utilizatorul poate scana nume fie na dup numele introdus.

38

Sistem de reg sire a informa iei

Dac aceast list con ine, adi ional numel i nregistr ri asociate cu numele respectiv utilizatorul poate determina mai u or care reprezint pe R. Popescu c utat. O op baleiere pe subiect

subiecte apropiate cuvntului care a fost intr scopul c ut rii.

39

Sistem de reg sire a informa iei

n cazul n care utilizatorul nu este sigur a ceea ce dore te sau atunci cnd utiliza cunoa te irul exact utilizat n sistem p descrie ceea ce caut , baleierea poate fi o mai adecvat pentru a satisface informa ional a utilizatorului.

40

Sistem de reg sire a informa iei

Procesul de interogare a bazelor de limbajele de comand utilizate includ:

Alegerea bazei de date . serviciul online acces la mai baze de date este necesar alegere de date dorite pentru interogare;

Selectarea termenilor de c utar individual, fie n combina ii cu al ii, u operatori booleeni;

41

Sistem de reg sire a informa iei

C utarea pe cmpuri specific nregistr rii (autor, titlu etc.);

Utilizarea trunchierii termenilor de c ut

C utarea pe baz de fraz sau expres

C utarea termenilor care apar n a propozi ie sau acela i cmp;

C utarea termenilor utiliznd un sist clasificare sau un tezaur;

42

Sistem de reg sire a informa iei

Generarea seturilor de c utare i ut ulterioar a informa iilor reg site;

Salvarea listelor generate n proce c utare;

Printarea referin elor g site;

nc rcarea referin elor pe sistemul pro Abandonarea sesiunii de c utare.

43

Sistem de reg sire a informa iei

O baz de date este interogat instruc iuni sau comenzi concepute p localiza toate nregistr rile care anumi i termeni, combina ii de terme diferite valori.

44

Sistem de reg sire a informa iei

De exemplu la c utarea termenului sistemul de reg sire va afi a num nregistr ri n care este prezent cuvntu Dac ne gndim la o nregistrare bibli termenul c utat poate ap rea n titlu, n r n titlul publica iei etc. Dac se cercetarea poate fi f cut numai pe un cmp, cum ar fi titlul, crescnd astfel gr relevan al rezultatelor.

45

Sistem de reg sire a informa iei

Termenii pot fi asocia i cu indec i documente sau pentru interog ri. n proces rii interog rii,

(interogare) sunt asocia i cu termenii ind care se mai numesc i cuvinte che definesc termenii c utabili din baza de da

46

Sistem de reg sire a informa iei

Interog rile pot avea diferite forme:

Interog rile de tip boolean ter operatorii care definesc contextul termenilor. Cnd se impune c utarea printr-o combi termeni, criteriile de c utare sunt stabilite cu operatorilor booleni AND ( I), OR (SAU (F R ), care se folosesc pentru a pun leg tur logic diferi i termeni. Logica b rezult din aplicarea algebrei lui G. Boole i operarea/ stabilirea a trei tipuri de rela descriptori.

47

Sistem de reg sire a informa iei

Rela ia de intersec ie (produs logic): se u operatorul I (AND) pentru a lega doi descri impune ca ambii termeni s existe n nre reg site. Cei fie pr indexarea documentului, pentru ca doc respectiv s fie considerat pertinent.

48

Sistem de reg sire a informa iei

Cu alte cuvinte, va restrnge c utarea la un n mic de nregistr ri dect dac s-ar c uta penttermen separat.AND

compositewooden

boardsfibres

49

Sistem de reg sire a informa iei

Rela ia de uniune (sum logic ): folosir (OR) presupune ca fie primul, fie al doilea, descriptori s fie prezen i n nregistr rile m rind astfel num rul documentelor preg site.OR

compositeswood

50

Sistem de reg sire a informa iei

Rela ia de excludere (diferen a logic ) operatorului F R (NOT) implic excluderea d rezultate a tuturor nregistr rilor care con i c ruia i se aplic operatorul, dac dorim ca d s fie pertinent.

51

Sistem de reg sire a informa iei

Rezultatul acestor opera ii de coord descriptorilor este ecua ia de cercetare. cteva proceduri care permit s se formule se completeze ecua ia de cercetare.

NO

PALPAP

52

Sistem de reg sire a informa iei

Interog rile n limbaj natural

structura lingvistic i pozi ia cuvinte identificarea contextului.

Anumite sisteme permit introducerea d termeni, caz n care distan a dintre termen rela ia dintre ace tia. n cazul utiliz rii inte limbaj natural, fie f cu limbajele artificiale de interogare car opera iuni de interogare valide.

53

Sistem de reg sire a informa iei

Sistemele de reg sire a informa iilor pot func iunea de c utare liber a textului sau p bazeze pe un vocabular controlat.

C utarea tip text liber nu limiteaz termenii la un set predefinit de termeni. Vocabularul care este implementat de regul ca subject sau descriptori, limiteaz c utarea la un termeni necunoscu i care au fost indexa i.

54

Sistem de reg sire a informa iei

Indicatorul de proximitate (al t Folosirea lui impune ca primul descri fie n imediata apropiere a celui de-al Prin acest indicator se define te apr descriptorilor n textul documentul utilizeaz foarte mult n c utarea tip te (sau se aplic rezumatelor care ncorp descriptori).

55

Sistem de reg sire a informa iei

Cel baza indic d doi descriptori trebuie s fie succesivi se g seasc n aceea i fraz (2) sau fie desp r i i ntre ei n text dect num r determinat de cuvinte (3).

56

Sistem de reg sire a informa iei

Indicatorul de ponderare: se aloc , indexarea documentelor, ct i la c fiec rui descriptor, n func ie de imp conceptului reflectat n document cerere (3,2,1).

57

Sistem de reg sire a informa iei

Trunchierea: permite c utarea unui cuv descriptor, datorit unui grup de litere (r sau radical), f r s inem seama de pre sufixe (de exemplu: document, docum documentarist); dac cercetarea se f descriptorul-document, se vor g si documentele care au fost indexate cu de care au acela i radical.

58

Sistem de reg sire a informa iei

Extensia/expandarea: permite completarea de c utare printr-o comand de ad ugare termen generic (TG), specific (TS) sau asoc iar calculatorul va conduce la corespunz tori din tezaur pentru descrip cauz .

Compara ia numeric : permite desf urar cercet ri n func ie de criterii cantitative.

Exemplu: > 1976 (literatura publicat dup 1

59

Exemple de sisteme de reg sire a informa iei

Sistemele de reg sire a informa iei clasificate dup :

con inut sau

prin modelele utilizate pentru repre rea i extragerea con inutului.

60

Exemple de sisteme de reg sire a informa ie

Datorit cre terii capacit ii de stocare pre a reducerii costurilor se tinde din ce n mult spre reprezentarea i st documentelor, full-text (complet) inclus componentelor non-textuale cum ar fi grafic

Printre aplica iile sistemelor de reg informa iei se num r i bazele de bibliografice.

61

Exemple de sisteme de reg sire a informa ie

Multe sisteme de asisten (help) asociate cu aplica ii software per asemenea c ut ri simple, baza con inutul help-ului.

Internetul a contribuit la mbun sistemelor de reg sire a informa iilor.

62

Exemple de sisteme de reg sire a informa ie

Motoarele de c utare

de reg sire a informa iei care pot fi pentru indexarea con inutului distri WEB-ului i altor p r i ale internetul pot fi folosite numai pentru ind con inutului local.

63

Exemple de sisteme de reg sire a informa ie

Aceste servicii de c utare asigur acc un mare volum de documente f Sistemele de reg sire a informa ie sisteme read-only n care uti efectueaz o simpl c utare, ne modifica con inutul bazei de date.

64

Exemple de sisteme de reg sire a informa ie

Procesul de reg sire a informa iei implic u ntre utilizator i sistemul de reg sire a inform

Caracteristicile principale ale stoc rii infor ale procesului de reg sire sunt preze schema de mai jos :

Apelarea la serviciile unui sistem de reg informa iei este determinat de nevoia de in a utilizatorului.

65

Exemple de sisteme de reg sire a informa ie

Utilizatorul tie c baza de date l sistemul de reg sire asigur accesu con ine resursele care l intere Deoarece utilizatorul cunoa te att do asupra c ruia vrea s se informeze modul de utilizare a sistemului de reg informa iei, el formuleaz o prim inte pe care o transmite sistemului.

66

Exemple de sisteme de reg sire a informa ie

Caracteristicile principale ale informa iei i ale procesului de reg si prezentate n schema de mai jos :

67

Procesul de stocare i reg sire a informa iei68

Exemple de sisteme de reg sire a informa ie

Interac iunea cu sistemul de reg informa iei este asigurat prin int interfe ei cu utilizatorul. n urma pa unor articole eligibile, utilizatorul rafina (detalia) cererea de informa ii i modul de interogare a sistemului

69

Exemple de sisteme de reg sire a informa ie

Aceasta este cunoscut sub denum

relevance feedback.

pn cnd necesarul de informa ie satisf cut ntr-o m sur suficient s cnd utilizatorul realizeaz c sistem poate ndeplini cerin ele, moment procesul de c utare nceteaz .

70

Exemple de sisteme de reg sire a informa ie

Func iunile sistemului sunt invizibile pentru dar sunt importante ntruct de ele capacitatea sistemului de a ndeplini c informa ie.

Nu este posibil includerea ntr-un singur ntregului volum de resurse existent n lume.

Sistemul procedeaz la includere selectiv , atrase informa iile care sunt de cea importan pentru scopul sistemului de Sistemul trebuie s g seasc o mod reprezentare eficient a con inutului informa71

Sistemul de reg sire a informa iei: Opera iile de stocare i reg sire

Subiectele discutate au examinat s de reg sire a informa iei -o pers descriptiv , r a detaliile procesului de reg sire propri

Procesul utare i reg sir genera o sarcin de calcul semnific func ie de modelul de reg sire a inf implementat.

72

Sistemul de reg sire a informa iei:

Opera iile de stocare i reg sire

Stocarea i reg sirea eficien documentelor ca i mecanismele a prezint interes pentru cercetare.

Pot fi folosite diferite tehnici n proce stocare i reg sire.

Procesele discutate n cele ce urme de sisteme de tip Boolean, ce f termeni scri i ntre ghilimele i co metoda de baz utilizat de maj sistemelor.

73

Stocarea i indexarea documente

Documentele stocate ntr-un sistem trebuie procesate pentru a se asigura suficiente pu acces n vederea simplific rii reg sirii.

ntr-un mediu de fi iere inversate terme

folosi ipentrureg sireadocumente

conformitate cu parametrii interog rii.

Termenii care pot fi utiliza i la c utarea ntr-u

se g sesc pe o list , ntr-un fi ier de termen

indec i, care contorizeazrul documen

cadrul setului de documente indexate ce c

74anumit termen.

Stocarea i indexarea documentelor

La introducerea termenului se stabile te o c tre o loca ie dintr-un fi ier de post ri. O reprezint un termen indexat ntr-un do Dup ce s-a stabilit c un document co anumit termen, documentul respectiv p reg sit. Rela iile ntre termeni, post ri i do sunt prezentate n figura de mai jos.

75

Stocarea i indexarea documentelor

Reprezentarea fi ierelor unui sistem de reg sire a info

76

Stocarea i indexarea documentelor

La integrarea unor noi documente sistem de reg sire a informa iei treb nti identifica i prin analiz sin termenii de c utare din ele. Proce analiz sintactic va identifica n termen prin caractere de delimitare v

77

Stocarea i indexarea documentelor

De exemplu, un termen valid poate ncep caracter alfanumeric i va fi delimitat de c nonalfanumerice.

Termenii propu i pentru c utare sunt compara i cu o list de cuvinte omise (sto care identific acele cuvinte care nu indexate.

Cuvintele omise pot fi the, to, a, for cuvinte frecvent utilizate i care apar pe m documente dintr -un domeniu.

78

Stocarea i indexarea documentelor

n numeroase sisteme, exist instruc iun omiterea articolelor ini iale la introducer ir pentru c utare. Utilizatorii manifest t de a urma aceast recomandare instruc iunea se observ u or i dac v zut din c su a de c utare.

Dac utare include totu i articolu poate rezulta una din urm toarele situa ii:

79

Stocarea i indexarea documentelor

Sistemul returneaz un mesaj c utilizat primit rezultate i nu mai sunt incluse d informa ii.

Sistemul utilizatorului un me ndep rta articolul ini ial i de a ncerca din n Sistemul trateaz un articol ini ial de o diferit , depinznd de tipul de c utare, pe cuvnt cheie, baleiere sau echivalen

exact .

Sistemul pur i simplu elimin artico n tiin area utilizatorului i efectueaz c utar

80

Stocarea i indexarea documentelor

Ultima posibilitate din list poate fi bun anumi i utilizatori, ns exist , binen eles, m cnd articolul (sau ceea ce pare a fi un arti cuvnt str in, poate) este necesar pentru o de succes (ex. o carte intitulat A is for Apple

Exist anumi i algoritmi pentru iden variantelor morfologice ale termenilor indexa

81

Stocarea i indexarea documentelor

Variantele acestea pot fi apoi condensat r d cin comun . Excluderea cuvintelor din indexul de termeni poate dimensiunea fi ierului de post ri, n t anumi i algoritmi pot reduce fi ierul de t Termenul ales este apoi c utat n fi i termeni.

82

Stocarea i indexarea documentelor

Dac n fi ier, se creeaz nregistrare, num rul de apari ii sau num rezultate este setat la cifra 1 i se adaug nregistrare n fi ierul de post ri, leg termenul de documentul aflat n fi i documente.

Dac deja n fi ierul de num rul de apari ii este incrementat i nou este ad ugat la fi ierul de post ri.

83

Stocarea i indexarea documentelor

Dac este posibil c utarea dup cmpuri, ad uga un identificator de cmp la fi i termeni.

Dac termenul apare n mai multe cmpu ad ugate intr ri suplimentare pentru acela i fiec rui cmp ndu-i o unic apari

Dac posibilitatea c ut rii prin pro (al turare) trebuie de asemenea repr loca iile multiple ale unui anumit termen n i unui cmp.

84

Stocarea i indexarea documentelor

n acest caz se vor efectua mai multe in postare pentru fiecare apari ie a ter Valoarea offset- ului (decalajului) de la cmpului stabile te loca ia n care terme pozi ionat n interiorul cmpului, de ex. un aflat la nceputul cmpului va avea un offset 0. Termenul urm tor va avea un offset eg .a.m.d. Aceasta poate conduce la c semnificativ a dimensiunii fi ierului de po cmpurile de indexare ale sistemelor dator iruri lungi de texte.

85

Stocarea i indexarea documentelor

86

Frecven a apari iei unui termen ntr-un c ntr-un document serve te la calculul termenului, oferind indica ii asupra importa n cuprinsul documentului.

Strategia de indexare a unui document extrem de simpl prin includerea tuturor te posibili care se identific cu u urin la pro ini ial a documentului.

Proiectan ii de sisteme de reg sire a inform creat rutine de indexare automat care i termenii adecva i.

Standardizare i sisteme

Nu exist standarde reale, numai linii di generale i sugestii.

Din cauza naturii competitive a comercian il pie ele OPAC-urilor, o interfa standard susceptibil de a ap rea curnd.

Sunt dezvoltate s turi i fiecare co plaseaz diferite niveluri de importan pe aspecte ale propriului design de sistem.

Unele au diferite scheme de organizare altele au diferite capacit i de c utare.

87

Standardizare i sisteme

Comercian ii ncearc s dezvolte c atr g toare interfa , caracteristici de c module, n scopul de a c tiga un procent mare de pia .

Aceast competi ie contribuie la lip standardizare din proiectul sistemului ns dat , poate contribui la inova iile i progr termen lung.

88

Standardizare i sisteme

Aceasta ar putea reprezenta o chestiune de echilibrului potrivit ntre standardizare i for e pia .

Indexurile online, de asemenea, sunt cara de o mare varietate i de pu in stand Aceasta este o continuare a unei lungi istorii a standard z rii n indexurile tip rite.

89

Standardizare i sisteme

Cteva arii n care a fost recomandat standardizarea includ:

Afi area rezultatelor

interog rile de c utare fundamentale tratamentul articolelor ini iale

utilizarea operatorilor Booleni, proximit trunchierea

punctua ia

90

Standardizare i sisteme

Afi area

Una dintre ariile cheie n care standardiza cea mai evident este n afi rile sistemului.

Afi rile pot fi divizate n dou categorii:

1) afi area seturilor de rezultate reg site i

2) afi area metadatelor din nregistr rile sur

ambele ncorpornd probleme legate de for ie ire a informa ieie pe ecran i de design.

91

Afi area rezultatelor

1) Afi area rezultatelor reg site

Prima preocupare n problema afi rii este rezultatele c ut rii apar ca

list de nregistr ri individuale sau

list antete/titluri afi ate mai nti, nainte de prezentarea pentru vizualizare a nregistr ri propriu-zise.

92

Afi area rezultatelor

Exemplu

Unele sisteme, ca r spuns la o c utare p autor cu numele de familie Benson, afi e Benson-ii din sistem, grupa i dup prenumelui.

Se poate naviga prin aceast list i se poat titlul/antetul adecvat nainte de a avea lista c de cercetat am nun it.

Alte sisteme rezultate care sunt lucr ri legate de fiecare Benson nainte de Benson exist . Se solicit paginarea prin lis autorilor ct i a titlurilor nainte de a baleianume.93

Afi area rezultatelor

Cea de-a doua preocupare n afi area rez este ordinea n care sunt prezentate acestea

Pe m sur ce sistemele deveneau mai sofis fost acordat utilizatorului mai mult control afi rii.

n anumite sisteme, utilizatorii pot specifica (cel mai adesea dintr-o list scurt , prede op iuni) care s fie utilizat pentru a rezultatelor afi ate ale c ut rii.

94

Afi area rezultatelor

De exemplu, dac se alege s rezultatelor dup autor, atunci i principal este afi at n lista sortat este posibil ca intrarea principal s autorul de care este interesat utilizato nu acel Benson care este un al doilea autor al unui pachet informa ional).

95

Afi area rezultatelor

Exist adesea trei niveluri de afi are ntr-un c online:

o versiune de una sau dou linii o afi are scurt i o afi are integral / complet .

De i complet rareori nseamn c toate inf dintr-o nregistrare codat sunt afi ate, sisteme permit afi area ntregii nregistr ri M

96

Afi area rezultatelor

Afi area implicit , atunci cnd o nregistrare este reg sit ca r spun interogare sau dup ce un utilizator a se nregistrare dintr-o list pentru a fi vizu este de obicei vizualizarea scurt .

Cantitatea i tipurile de informa ii omise nregistrare integral pentru a crea u scurt difer de la sistem la sistem.

97

Afi area rezultatelor

Allyson Carlyle i Traci Timmons au examin 122 de cataloage bazate pe Web i au conc c urm toarele cmpuri: autor personal, publica ie sunt ntotdeauna afi ate n nr singulare implicite, ns alte cmpuri sunt afi pu in frecvent, iar cele care sunt afi ate sun inconsistent (ex. cmpuri de titlu includea declara ii de responsabilitate sau nu).

98

Afi area rezultatelor

Thomas remarc faptul c utilizatorii numai cteva mpuri utile; astfel trebui s existe linii directoare selectarea cmpurilor cele mai neces afi at.

99

10

0

Afi area rezultatelor

2) Etichetarea metadatelor n nregistr ri de asemenea de la sistem la sistem, diferen e n terminologia utilizat etichetare.

nregistr rile pentru (publica ii) seriale de probleme de etichetare mai mul nregistr rile pentru monografii. Info referitoare la fond(uri) pot crea c

utilizatorului, chiar i cu cele mai etichete disponibile.

10

1

Afi area rezultatelor

Este pus n discu ie ns i nevoia de meta etichetare. Etichetele pot crea confuzie acoper n mod necesar totul ntr-un cmp.

Dac , n loc de etichetarea fiec rui cmp, ar recurge la formatul ISBD (cu punctu standardizat i ordinea stabilit a infor etichetele care creeaz confuzie ar p eliminate.

Adi ional, formatul ISBD ar permite mai informa ii referitor la un pachet informa ion afi ate pe un ecran.

10

2

Afi area rezultatelor

Cnd este utilizat un format ISBD, numai nregistr ri au nevoie de un al doilea ecra afi area ntregii nregistr ri. Cu etichetele, nregistr ri au nevoie de un al doilea ecra afi area ntregii nregistr ri. (Aceasta se nainte de WebPAC-uri, n care nregistr necesit mai degrab derularea/ defilare deplasarea la un al doilea ecran.

Utilizatorii tind s priveasc la ceea ce li se prima vedere, nainte de derulare/defilare trecerea la cel de-al doilea ecran).

Linii directoare pentru afi aj

Aceste abord ri diferite la ambele tipuri d (i.e. afi area rezultatelor reg site i nregistr rilor) au determinat crearea directoare pentru standardizarea afi ajelor.

O sarcin de for a Federa iei Interna i Asocia iilor i Institu iilor Biblioteconomice (I 1999 a emis linii directoare pentru a bibliotecile n proiectarea sau reproiectarea urilor.

10

3

Linii directoare pentru afi aj

Aceste linii directoare constau din 37 bazate pe obiectivele catalogului i pe tip c ut ri pe care le deruleaz utilizatorii.

Principiile directoare recomand un set stan afi aje implicite, definite ca i caracteristici trebui oferite utilizatorilor care nu au sele op iuni, incluznd utilizatorii care dor demareze c utarea imediat, f r prea instruire.

10

4

Linii directoare pentru afi aj

Dac asemenea afi aje implicite ar fi imple pe scar larg , utilizatorii ar ob ine bene posibilitatea de a transfera abilit ile de ut catalogului dobndite ntr-o bibliotec la nu alte biblioteci.

Str daniile IFLA i ale numero i cercet tori concentrate pe nevoia utilizatorilor instrumente puternice, ns u or de utilizat.

10

5