Ghid de Digitizare Pilonul Tematic Biblioteci Versiunea01!25!11 2009

23
Comisia de specialitate pentru digitizare – pilonul tematic „Biblioteci”  Biblioteca Naţională a României - Octombrie 2009 1 GHID DE DIGI TIZARE – P ILONUL TEMATIC BIB LIOTECI - vers i u nea 01 / 30 .10.2 009 - I. Aspecte teoretice 1. Introducere ……………………………………………………………..….….……...2 2. Etapele desfăşurării procesului de digitizare …………………………………..3 3. Resurse informaţionale şi documentare în biblio tecile din România …...…3 4. Criteriile de selecţie ………………………………………………………………….3 5. Modelul Europeana…………..………………………………………………...……4 II. Formate. Fişiere. Metadate. 1.Terminologie…………………………………………………………...………...……6 2. Format e………………………………………………………………………..…..…..7 3. Denumirea fişierelor …………………………………………………………...….10 3.1 Excepţie: Documente din arhiva istorică………………………………….11 4. Tipologie documentară …………………………………………………….…..….12 5. Descrierea obiectelor digitizate. Metadate ………………………………...…..13 III. Aspecte tehnice 1. Ca racteris tici tehnic e recomandate …………………………………….…...….18 2. Norme de conservare pentru scanarea colecţiilor de pat rimoniu……..…21 Concluzii ……………………………………………………………………...…………23

Transcript of Ghid de Digitizare Pilonul Tematic Biblioteci Versiunea01!25!11 2009

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 1

    GHID DE DIGITIZARE PILONUL TEMATIC BIBLIOTECI - versiunea 01 / 30.10.2009 -

    I. Aspecte teoretice 1. Introducere.......2 2. Etapele desfurrii procesului de digitizare..3 3. Resurse informaionale i documentare n bibliotecile din Romnia...3 4. Criteriile de selecie.3 5. Modelul Europeana.....4 II. Formate. Fiiere. Metadate. 1.Terminologie......6 2. Formate......7 3. Denumirea fiierelor ....10

    3.1 Excepie: Documente din arhiva istoric.11 4. Tipologie documentar....12 5. Descrierea obiectelor digitizate. Metadate.....13 III. Aspecte tehnice 1. Caracteristici tehnice recomandate.....18 2. Norme de conservare pentru scanarea coleciilor de patrimoniu..21 Concluzii...23

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 2

    Ghid de digitizare pilonul tematic Biblioteci, versiunea 01/30.10.2009 a fost realizat n cadrul Comisiei de specialitate pentru digitizare - pilonul tematic Biblioteci, prin contribuia bibliotecilor din Sistemul Naional de Biblioteci, deintoare de colecii digitale i/sau patrimoniu cultural scris: B.C.U Eugen Todoran Timioara, B.C.U. Lucian Blaga Cluj-Napoca, BCU Mihai Eminescu Iai, BCU Carol I Bucureti, Asociaia Naional a Bibliotecilor Publice din Romnia, Biblioteca Academiei Romne, Biblioteca Naional a Romniei. Documentul postat pe site-ul Bibliotecii Naionale a Romniei urmeaz fi supus dezbaterii, actualizrii i completrii. II. Aspecte teoretice 1. Introducere

    Constituirea bibliotecii digitale naionale, parte component a bibliotecii digitale europene, are ca principal scop conservarea i protecia patrimoniului cultural naional existent n bibliotecile din cadrul sistemul naional de biblioteci, promovarea coleciilor i lrgirea accesului la informaie. Prin digitizarea coleciilor de documente i constituirea bibliotecii digitale naionale se asigur o bun promovare a valorilor naionale, o mai bun diseminare a informaiei i o valorificare superioar, la nivel naional i internaional, a coleciilor speciale, a documentelor rare. Obiectivele care stau la baza acestui demers se refer la: - transpunerea n format electronic a patrimoniului cultural scris; - promovarea patrimoniului cultural scris la nivel european; - protejarea valorilor de carte bibliofil i manuscrise; - protejarea documentelor aflate ntr-o stare avansat de deteriorare; - mbuntirea posibilitilor de acces la documente, local sau la distan, cu impact asupra creterii numrului de utilizatori i a categoriilor acestora; - posibilitatea consultrii simultane de ctre mai muli utilizatori a aceluiai document; - oferirea unui mod de consultare a documentelor modern, n acord cu noile tehnologii, independent de spaiul i programul de funcionare al bibliotecii (cu respectarea restriciilor de copyright); - mbuntirea calitii procesului de consultare a documentelor.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 3

    2. Etapele desfurrii procesului de digitizare a) identificarea proiectelor de digitizare n curs; b) inventarierea documentelor digitizate n bibliotecile din ar; c) identificarea prioritilor de digitizare ale bibliotecilor i a documentelor propuse spre digitizare; d) selecia documentelor/coleciilor ce urmeaz a fi digitizate; e) metodologia de lucru; f) stabilirea soluiei de digitizare; g) identificarea echipamentelor i a software-ului; h) crearea de coninut digital; i) realizarea i administrarea portalului Biblioteca Digital a Romniei; j) integrarea Bibliotecii Digitale a Romniei n Biblioteca Digital European. 3. Resurse informaionale i documentare n bibliotecile din Romnia Bibliotecile din sistemul naional de biblioteci sunt componente definitorii ale sistemului naional informaional. Prin structuri, funcionaliti, servicii i patrimoniu info-documentar ele trebuie s rspund cerinelor complexe i variate de informare. Sistemul naional de biblioteci, n raport cu funciile i atribuiile acestora, este structurat astfel:

    a) Biblioteca Naional a Romniei; b) Biblioteca Academiei Romne; c) biblioteci universitare; d) biblioteci specializate; e) biblioteci publice; f) biblioteci colare.

    Prin participarea tuturor bibliotecilor din cadrul sistemul naional de biblioteci, deintoare de documente i colecii, se va putea crea o bibliotec digital cu un coninut eterogen din punct de vedere al tipului de documente (cri, manuscrise, publicaii seriale), al perioadei de publicare, al adresabilitii. Biblioteca Digital Naional se poate realiza respectnd principiul partajrii resurselor. 4. Criteriile de selecie Criteriile de selecie pot fi i de cele mai multe ori trebuie s fie combinate pentru obinerea unui soluii optime. Se va avea n vedere respectarea regimului juridic referitor la documentele propuse pentru scanare (Legea nr. 8/1996 privind dreptul de autor i drepturile conexe; Legea nr. 334/2002 privind bibliotecile; Legea nr. 182/2000 privind protejarea patrimoniului cultural; Legea nr. 135/2007 privind arhivarea documentelor n form electronic; Legea nr. 186/2003 privind susinerea i promovarea culturii scrise).

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 4

    Criteriile de selecie sunt: - valoarea documentar: - reprezentativitatea pentru un anumit domeniu, o anumit perioad de timp sau o anumit

    regiune geografic, att la nivel naional, ct i la nivel internaional; - gradul de interes i adresabilitate; - prezervarea documentelor originale; - regimul juridic (dreptul de autor i dreptul de difuzare); - criteriul financiar; - soluia de scanare si tehnologia implicat. La nivelul bibliotecilor judeene se manifest un interes deosebit n digitizarea publicaiilor cu caracter local, care reflect istoria, cultura i civilizaia zonei respective. La nivelul bibliotecilor universitare accentul se pune pe publicaiile academice (se are n vedere curricula universitar), teze de doctorat. 5. Modelul Europeana Modelul Europeana este modelul descentralizat promovat de toate bazele de date europene. Interrelaionarea sistemului asigur posibilitatea portalului de a culege metadatele documentelor digitale din bazele de date ale deintorilor i de a le introduce n indexul general, punndu-le astfel la dispoziia utilizatorilor. Acesta este modelul utilizat la nivel european, n cadrul TEL, Europeana, Manuscriptorium. Metadatele se vor gsi n cadrul portalului, iar documentele digitale vor rmne la deintor.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 5

    Biblioteca Digital

    Naional Modulul Biblioteci

    Index central (metadate)

    Modulul Arhive audio-video

    Index central (metadate)

    Modulul Patrimoniu imobil

    Index central (metadate)

    Modulul Muzee Index central (metadate)

    Biblioteca Naional a Romniei

    (Resurse digitale)

    Biblioteca Academiei Romne

    (Resurse digitale)

    Biblioteci publice

    (Resurse digitale)

    Biblioteci universitare

    (Resurse digitale)

    Biblioteca Patriarhiei

    (Resurse digitale)

    Biblioteca Digital a Romniei

    Europeana

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 6

    II. Formate. Fiiere. Metadate. 1.Terminologie

    Digitizare reprezint procedeul prin care informaia este capturat n format digital (imagine, document text, fiier audio, etc.) cu ajutorul unui echipament tehnic digital (camer digital, scanner, etc.). Cnd vorbim despre digitizarea documentelor, de cele mai multe ori ne referim la imaginea paginii capturat de un astfel de echipament - pur i simplu o poz a documentului sau o versiune full-text, n care documentul este stocat folosind caractere text/scrise. Forma neprocesat a documentului (plain-text), reprezint varianta integral a documentului, folosind caractere ASCII sau Unicode, pentru acestea existnd posibilitatea efecturii unei cutri n text (cuvinte sau fraze), ns se pierde structura i aspectul original al documentului. O versiune codificat (encoded) a documentului va include informaii suplimentare sau markup de diferite feluri, pentru a exprima structura documentului, formatarea sau alte informaii pe care creatorul a dorit s le evidenieze i s-i ofere acestuia funcii speciale . Acest tip de codificare markup este folosit frecvent n asociere cu limbajele SGML sau XML i acest gen de informaie este aplicat documentelor cu text integral. Imagine digital reprezint setul organizat de elemente fixe, rectangulare, bidimensionale denumite pixeli, care definesc o imagine pe ecranul unui computer sau care sunt transformai ntr-un alt format, precum pagina tiprit. Documentul / Fiierul imagine digital master este rezultatul materialului analog transformat, respectiv convertit printr-un proces de reformatare digital (prin scanare, fotografiere cu aparat digital, etc.). Acesta ar trebui s reprezinte ct mai fidel posibil informaia vizual din documentul original. Un document digital master, poate servi ca nlocuitor pentru cel original sau poate fi folosit ca siguran n cazul pierderii sau deteriorrii acestuia. Pentru documentele nscute digital, adic cele care nu au fost supuse procesului de reformatare digital, documentul imagine digital master reprezint documentul original n sine. Deoarece procesul capturrii unei imagini presupune o munca intens, durata de via a unui document imagine master ar trebui s fie de cel puin 50 de ani. Prin urmare, cei care organizeaz colecia digital trebuie s aib n vedere o varietate larg de utilizri ulterioare i s stabileasc de la nceput o calitate nalt/foarte bun a imaginii. Fiiere / Documente derivate sunt create din documentul imagine digital master cu scopul de a fi editate ulterior, de a fi mrite, transformate n diferite formate, dar i pentru a fi reprezentate i transmise prin intermediul reelelor (ca de exemplu imagini create pentru accesare i imagini timbru)

    OCR (Recunoatere Optic a Caracterelor), este procesul de recunoatere cu acuratee a literelor prin care un program citete imaginea scanat a unui text i o transpune ntr-un fiier text.

    Metadate: orice date referitoare la datele specifice crerii unui obiect digital i care se refer la descrierea informaiilor caracteristice (informaii legate de publicarea acestuia, formatul, drepturi, etc.).

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 7

    SGML (Standard Generalized Markup Language) standard internaional (ISO 8879/1986) care este folosit ca metalimbaj pentru definirea limbajelor de codificare (markup).

    XML (Extensible Markup Language) extensie a SGML , aprut ca recomandare a W3C n 1998.

    TEI (Text Encoding Initiative) un consoriu internaional care public indicaii referitoare la schimbul i codificarea textelor electronice, conform specificaiilor limbajelor SGML i XML pentru prezervarea textelor literare i lingvistice folosite n mediile culturale i academice.

    EAD (Encoded Archival Description), un limbaj adaptat cerinelor standardelor SGML i XML folosit pentru prezervarea informaiilor unei arhive, dar i de ctre biblioteci.

    METS (Metadata Encoding and Transmission Standard) un standard de codificare care ndeplinete cerinele XML pentru metadatele obiectelor deinute de o biblioteca digital.

    2. Formate Procesul de digitizare trebuie s in cont de o serie de factori, precum natura materialului, scopul exemplarului digital, relevana n cadrul coleciei, suportul tehnic necesar prezervrii dar i bugetul estimat i finanrile posibile. Este important de tiut care sunt limitele formatelor disponibile, pentru a vedea dac acestea corespund scopului coleciei, dar i pentru a-i asigura accesul n viitor. Formatele digitale pentru documentul text difer foarte mult, deoarece acestea pot fi convertite cu uurin n alte formate dar i datorit capacitilor multiple de expunere. Sistemele care dein drepturi de proprietate pot fi potrivite pentru tiprirea unui document, prin instrumentele de procesare text sau formatele descrierilor de pagin (de exemplu, Microsoft Word, PDF) i permit publicarea acestora pe web, prin intermediul funciei "Salvare ca HTML". n cazul n care este necesar mutarea/migrarea datelor pe o alt platform software, exist riscul de a pierde informaiile de formatare. Pentru c astfel de sisteme depind de existena unor programe cu drept de proprietate - ai cror termeni de liceniere i existen nu pot fi definii pe termen lung - acestea nu sunt recomandate pentru scopuri de arhivare sau pentru definirea unei existene durabile n timp. De asemenea este indicat s fie identificate formatele acceptate pentru transfer, stocare i distribuie ctre utilizator, deoarece acestea pot diferi, s nu fie utilizate metode de criptare sau comprimare pentru fiierele care vor fi pstrate n arhiv i trebuie micorat numrul tipurilor de formate, pentru ca documentele digitizate s fie gestionate ct mai uor. Principalele formate de fiier utilizate sunt: Imagine: TIFF, GIF, JPG, JPG-2000, PNG, PDF

    Text: HTML, XML, PDF, UTF-8, ASCII Audio, Video: WAVE, MPEG, AVI, WMA, OGG Arhivare: RAR, ZIP

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 8

    Extensie Denumire Descriere Puncte tari/Puncte slabe

    .tiff, .tif TIFF (Tagged Image File

    Format)

    Document la rezoluie maxim recomandat; formatul a fost

    creat la nceput pentru publicarea electronic 1 64 bit

    adncime. Folosit n general pentru imagini de nalt calitate

    i pentru stocare arhivat.

    Calitate nalt; Documente foarte mari; Majoritatea

    programelor care recunosc acest format ating un maxim

    de 24-bit culoare. Distribuia pe web este limitat de dimensiunea fiierului/documentului.

    .gif GIF (Graphics Interchange

    Format)

    Acest format de 8-bit suport compresie fr pierdere de

    date, interrelaionare i transparen.

    Compresie fr pierdere de date. Format de livrare pentru web folosit cu

    regularitate.

    .jpg, .jpeg

    JPEG (Joint Photographic

    Experts Group)

    Imagine cu o rezoluie comprimat/restrns, 8-24 bit.

    Acesta variaz n funcie de calitatea i dimensiunea fiierului/documentului.

    Compresie fr pierdere de date. Cel mai folosit format

    pentru expunere pe monitor. Flexibil.

    .png PNG (Portable Network

    Graphics)

    Compresie fr pierdere de date 24 bit. Poate nlocui liber

    formatul GIF i poate fi folosit n locul formatului .tiff Suport

    interrelaionare, transparen, gamma.

    Standard liber , poate fi recunoscut doar de unele navigatoare de internet;

    combin avantajele oferite de formatul TIFF i de formatul GIF furniznd

    aceeai calitate pentru un document dar la dimensiuni

    mai mici.

    .pdf PDF (Portable Document Format)

    4-64 bit adncime. Dimensiune maxim recomandat. Folosit n

    principal pentru livrarea/ expunerea documentelor

    imagine.

    Este necesar aplicaia Adobe pentru vizualizare sau un program adiional

    care extinde funcionalitatea aplicaiei.

    .wav Wave . Windows media.

    Un format necomprimat care poate fi folosit de obicei fr a fi nevoie de un suport adiional de

    8, 16, & 32 bit. nalt calitate. Fiiere de dimensiuni mari, pot fi folosite i de calculatoare Mac

    precum i de cele obinuite PC.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 9

    HTML

    Hypertext Markup

    Langauge

    HTML este o aplicaie SGML (SGML: Standard Generalized

    Markup Language, standard internaional creat n 1986 (ISO 8879) este un meta-limbaj care definete sistemul de adnotare

    al unui text folosit n mediul electronic) a fost dezvoltat

    pentru a uura modul n care o pagin web este redat de

    navigatorul folosit.

    HTML nu ofer informaii despre structura textului;

    cteva caracteristici depind de navigatorul web folosit

    XML Extensible Markup

    Language

    Standard liber creat de W3C care conine un set de reguli

    pentru codificarea documentelor electronice.

    Asigur longevitate datelor i flexibilitate la transferul pe o

    alt platform software.

    .mpg Moving Picture Experts Group

    Format digital standardizat de ctre Moving Picture Experts Group (MPEG); ncorporeaz

    formatele audio si video MPEG-1 sau MPEG-2

    Folosit adesea pentru crearea nregistrrilor care sunt distribuite/care pot fi

    accesate pe internet.

    .avi Audio/Video Interleave

    Audio-video standard creat de Microsoft i folosit cu precdere

    de ctre Windows Media Player. Poate fi nlocuit de

    formatul MPEG

    Calitate bun, dimensiune sczut a fiierului.

    .ogg Format audio video de tip container

    Formatul de fiiere Ogg creat de Fundaia Xiph.org, a fost creat drept un cadru de lucru pentru o iniiativ mai larg cu

    inta dezvoltrii unui set de componente pentru codificarea

    i decodificarea coninutului multimedia.

    Att codificarea ct i decodificarea sunt disponibile gratuit.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 10

    3. Denumirea fiierelor Documentele rezultate n urma procesului de digitizare trebuie denumite astfel nct alctuirea coleciilor, stabilirea relaiilor logice s nu fie ngreunat. Exist dou posibiliti: 1. folosirea unei scheme alfa-numerice care s reflecte numerele folosite deja n

    catalogarea documentului 2. utilizarea unor termeni reprezentativi pentru documentul respectiv.

    Se pot stabili convenii pentru nume, tabele cu semne sau reguli (de ex. reguli referitoare la punctuaie i la majuscule) uniformizarea acestora fiind un aspect foarte important. Biblioteca Naional a Romniei propune urmtoarea structur a numelui de fiier:

    Cota/nr. inv_TD_secvena.ext unde:

    - cota sau nr.inventar

    - reprezint cota obiectului digitizat (sau numrul de inventar); - cmp alfanumeric, numr variabil de caractere;

    - TD

    - tipologia documentar; - identific tipul documentului (vezi mai jos codurile); - cmp alfanumeric din doua poziii:

    o o majuscul pentru clasa de documente; o un numr pentru tipul documentului n cadrul clasei (este 0 dac nu

    exist subclasificare). - secvena

    - poziia obiectului digitizat n cadrul unei structuri (de exemplu identific numrul paginii ntr-o carte, sau al unei melodii pe un CD);

    - cmp numeric din minim 2 cifre; - este 00 dac obiectul digitizat nu este structurat; - se completeaz obligatoriu zerourile (de ex. 07, 095, 0087 etc.).

    - .ext

    - reprezint extensia (tipul fiierului); - ex.: .tiff, .jpg etc.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 11

    3.1 Excepie: Documente din arhiva istoric

    Cota(Fondul)_Dosar_docnnn_secvena.ext Unde: - cota sau fondul

    - reprezint cota obiectului digitizat (fondul din care provine); - cmp alfanumeric, numr variabil de caractere;

    - dosar

    - reprezint numrul dosarului n cadrul fondului; - cmp alfanumeric, numr variabil de caractere; - se vor completa zerourile

    - docnnn - reprezint reprezint numrul documentului din cadrul dosarului; - cmp alfanumeric; - nnn este un numr - exemplu: doc005, doc157 etc.;

    - secvena - reprezint numrul paginii din cadrul documentului (nu al filei); - cmp numeric, numr variabil de caractere;

    - .ext - reprezint extensia (tipul fiierului); - ex.: .tiff, .jpg etc.

    NOT: grupul cota(fond)_dosar_docnnn constituie cheie de regsire a obiectelor ce

    aparin aceluiai dosar. Exemple:

    Biblioteca Naional a Romniei BNR_XI-92_M0_001 (reprezint coperta de la un manuscris) BNR_CR-XVII-I-63_C1_101.TIF (reprezint a 101 nregistrare dintr-o carte veche digitizat nu neaprat pagina 101) BNR_AI-27-1_M3_00.jpg (reprezint o scrisoare din arhiva istoric) Biblioteca Academiei Romne

    - periodice RAL_Multimedia_Fond_Titlu_AN de vrsta sau VOLUM__AN

    calendaristic _Nr._ P.tif respectiv extensia .jpg - cri/manuscrise in volum RAL_Multimedia_Fond_COTA_P sau F.tif,

    respectiv .jpeg - fotografii, documente grafice, hri RAL_Multimedia_Fond_Cota.tif

    respectiv .jpeg

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 12

    4. Tipologie documentar Tipologia documentar propus, este cea elaborat de Biblioteca Naional i aprobat de Comisia de specialitate pentru Digitizare - pilonul biblioteci http://www.bibnat.ro/dyn-doc/Studiu%20Fezabilitate/Tipologie-documentara.pdf . Literele identific grupa de documente, iar cifrele indic tipul documentului.

    C. Carte tiprit

    1. carte veche 2. incunabul 3. carte rar/bibliofil 4. carte curent

    P. Publicaii periodice 1. periodice vechi 2. periodice rare/bibliofile 3. periodice curente

    M. Manuscrise 1. carte manuscris a unei singure opere 2. carte manuscris-miscelaneu 3. manuscrise de autor 4. coresponden

    F. Microformate 1. microfi 2. microfilm

    H. Documente cartografice 1. hri (plane, n relief sau globulare); 2. atlase 3. planuri tiprite

    A. Documente audio-video 1. muzicale tiprite 2.audio muzic 3 audio voce 4. video

    G. Documente grafice 1. studiu 2. desen tehnic 3. program 4. anun 5. proclamaie 6. plan

    V. Arte vizuale: 1. gravur 2. desen 3. ex libris 4. reproducere de art 5. fotografie 6. afi 7. pictur 8. sculptur

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 13

    T. Alte tipuri de documente:

    1. teze de doctorat i rezumate ale acestora; 2. brouri; 3. cursuri universitare tiprite sau multigrafiate; 4. manuale colare; 5. documente numismatice i filatelice; 6. standarde i norme tehnice i de funcionare; 7. orice alte documente tiprite sau multiplicate prin proceduri grafice sau fizico-chimice de tipul: litografiere, fotografiere, fono i videografiere.

    5. Descrierea obiectelor digitizate. Metadate Imaginile digitale sunt descrise cu ajutorul metadatelor, acestea reprezentnd date ce permit gestionarea i utilizarea altor date. Folosirea acestora este strns legat de reguli de descriere i catalogare specifice documentelor tradiionale, nregistrrilor de arhiv i artefactelor. Diferena const n prezena metadatelor adiionale necesare pentru a facilita navigarea i managementul fiierelor de date. Tipuri de metadate:

    Metadate DESCRIPTIVE descriu coninutul resursei digitale astfel nct aceasta s

    poat fi regsit/localizat cnd este cutat i totodat s poat fi difereniat de alte resurse similare.

    Metadate de PREZERVARE, anume

    - Metadate TEHNICE: formatul, data digitizrii, caracteristici tehnice ale obiectului digital, etc.

    - Metadate ADMINISTRATIVE: aspecte ce in de gestionarea documentului digital, livrare, distribuie, informaii legate de drepturi asupra obiectului digital.

    Dac aceste metadate nu se regsesc, accesul la obiectul digital poate fi ngrdit, iar prezervarea acestuia nu se poate realiza. Metadatele care ofer informaii despre contextul tehnic al resursei (formatul fiierului, posibilitile de acces, etc.) i a altor informaii (legate de drepturile de autor, drepturile de reproducere) sunt foarte importante pentru gestionarea continu a obiectului digital. Ele ofer informaii utile n procesul de prezervare, asemenea msurilor de securitate ce trebuie luate pentru un document fizic. Fr aceste metadate nu se poate ti ce reprezint resursa, cum poate fi folosit, care a fost procesul de realizare. Metadatele pot fi stabilite pentru o ntreag colecie sau pentru fiecare exemplar n parte. Metadatele de prezervare sunt importante datorit faptului c prin intermediul lor un obiect digital poate s ofere informaii despre el nsui o perioad ndelungat de timp, facilitnd astfel prezervarea i accesul, deintorului, custodelui, tehnologiei, i chiar comunitilor utilizatorilor care se afl ntr-o permanent schimbare.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 14

    Metadate DESCRIPTIVE

    ELEMENT

    STATUT

    Titlu (Denumirea nscris pe document) Obligatoriu Autor/ Alta meniune de responsabilitate Obligatoriu Editor Obligatoriu

    Editura, Loc complet SAU parial, acolo unde exist

    Anul apariiei Obligatoriu Numr de pagini Obligatoriu (formatul) Limba textului Recomandat Descrierea documentului Recomandat

    Pentru crile vechi acest cmp va fi completat cu descrierea fizic a documentului original, de ex: dac este complet sau nu, dac documentul conine ilustraii, informaii despre calitatea hrtiei, dac documentul a fost restaurat, dac poate fi consultat fizic.

    Tipul documentului Obligatoriu Formatul documentului original Obligatoriu Deintor Obligatoriu

    ara/Instituia/Filiala deintoare Proveniena Recomandat

    Colecia din care face parte/Fondul etc. Subiectul/Tematica Recomandat Alte legturi/Relaia Recomandat Data crerii Recomandat

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 15

    Metadate de PREZERVARE (TEHNICE i ADMINISTRATIVE)

    ELEMENT

    STATUT

    Identificator Obligatoriu Folosit pentru stabilirea unui cod de identificare unic documentelor digitale care au fost create cu scopul de a fi expuse pe web - prin intermediul unui program de gestionare a obiectelor digitale, stocate pe un server sau orice alt modalitate

    Formatul documentului digital Recomandat (.jpg, .pdf, etc.) Mrimea /Rezoluia fiierului Recomandat (dac e comprimat, etc.) Aplicaia folosit Recomandat

    Numele, Versiunea, Creatorul acesteia Software folosit Recomandat (Denumire, caracteristici) Hardware folosit Recomandat (Denumire, caracteristici) Tehnica de reproducere Recomandat (Scanner, Camer digital -

    caracteristici,etc.) Data efecturii reproducerii/ crerii obiectului digital

    Recomandat

    Instituia care a efectuat reproducerea Recomandat In-house, externalizare; evidena deintorilor obiectului digital, pentru eventualele modificri

    Metoda de siguran Recomandat Procedeul de codificare: watermark, semntur digital, etc.

    Autenticitatea documentului digital Recomandat Metadatele de prezervare trebuie s includ informaie suficient pentru validarea unui obiect digital, pentru confirmarea scopului digitizrii acestuia dar i pentru confirmarea faptului c acesta nu a fost alterat/modificat fie intenionat sau neintenionat

    Relaie / Legtur cu Recomandat Structural pentru stabilirea relaiilor dintre obiecte; Derivare replic sau transformare a unui alt obiect digital

    Locaia / Directorul Obligatoriu (server, hard extern, etc.) Drepturile de management Recomandat

    n context depozit digital, se refer la aciunile efectuate n scopul prezervrii (numele persoanei autorizate, poziia ocupat)

    Drept de acces Obligatoriu Restricii referitoare la drepturile de utilizare, reproducere, distribuire; modaliti folosite

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 16

    pentru restricionare, de ex. : vizualizare n interiorul instituiei, accesibil doar utilizatorilor nregistrai, etc. sau document cu acces liber (pentru documente care aparin domeniului public), durata dreptului de acces, etc.

    Drept de autor/de proprietate intelectual Recomandat Numele autorului, Date de contact; Numele instituiei, Date de contact

    Declaraia de copyright Recomandat Pentru a satisface nevoile prototipului Europeana*, s-au adugat urmtoarele elemente: dc:relation (relaia cu alt resurs)

    Obligatoriu europeana:isShownBy referina clar URL ctre pagina web a instituiei care deine obiectul digital disponibil la cea mai bun rezoluie FIE europeana: isShownAt - referina URL ctre descrierea complet a obiectului digital pe pagina web a instituiei deintoare

    europeana:userTag

    Etichete create de ctre utilizatori nregistrai prin interfaa Europeana. Pentru aceast informaie furnizorul de coninut nu are nicio responsabilitate.

    europeana:unstored

    Recomandat Locul unde se afl stocate informaiile referitoare la obiectul digital, fr de care acestuia nu i se pot atribui elemente specifice Europeana. Include informaii necesare indexrii. Vor fi incluse toate elementele care nu se regsesc n cmpurile deja stabilite. Nu va fi afiat ca rezultat la o cutare complet.

    europeana:object

    Adugat n mod obligatoriu de ctre Europeana Referina URL la obiectul digital cu cea mai bun rezoluie disponibil pe pagina web a furnizorului de coninut pentru a genera o imagine timbru. n cazul n care nu exist deja o imagine timbru Europeana va crea cte una pentru fiecare obiect n parte iar dac sunt mai multe imagini incluse, va fi aleas prima. n cazul unui document n format PDF, se va alege drept reprezentativ pagina de titlu.

    europeana:language

    Recomandat Limba atribuit resursei cu referin la furnizorul de coninut. Este obinut automat din fiierul de autoritate al furnizorilor din Europeana. Pentru aceast informaie furnizorul de coninut nu are nicio responsabilitate.

    * Specification for the Europeana Semantic Elements V 3.1, 25/02/2009+

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 17

    europeana:provider

    Adugat n mod obligatoriu de ctre Europeana pentru uz intern Numele organizaiei care deine obiectul digital (digitizat sau nscut digital). Este controlat de fiierul de autoritate al furnizorilor din Europeana.

    europeana:type

    Obligatoriu Tipul resursei, innd cont de cele patru tipuri suportate de Europeana TEXT, IMAGINE, AUDIO i VIDEO. Aceast informaie este folosit pentru descrierea obiectului n interfaa Europeana i n cutri. Furnizorii de coninut trebuie s creeze o tipologie local a documentelor deinute.

    europeana:uri Adugat n mod obligatoriu de ctre Europeana Referina URI (nu URL) ctre resurs n contextul Europeana. Reprezint identificatorul nregistrrii i este creat pe baza identificatorilor unici furnizai n metadatele nsoitoare. Pentru situaiile n care sunt trimise dou sau mai multe obiecte care au acelai identificator, doar primul va fi pstrat de Europeana, celelalte vor fi eliminate.

    europeana:year Recomandat Anul sau perioada asociat cu documentul original n format tradiional sau cu obiectul nscut digital. Va fi scris n forma complet cu patru cifre (ex. 1523) i va reiei din valorile trimise n metadatele originale. Va fi folosit ca informaie n navigatorul cronologic. Portalul Europeana nu suport informaii cronologice de dinaintea anului 0 , spre ex. 250 . Hr., 600 . e.n sau 10,000 .e.n. ns se dorete a fi introduse n viitor.

    europeana:hasObject Adugat n mod obligatoriu de ctre Europeana pentru uz intern Indic disponibilitatea imaginilor timbru aferente obiectelor digitale.

    europeana:country Adugat n mod obligatoriu de ctre Europeana ara creia aparine furnizorul de coninut sau va fi aleas varianta Europa pentru proiecte derulate la nivelul Europei. Numele va fi extras automat din informaiile deinute de fiierul de autoritate al furnizorilor de coninut din Europeana; aceast informaie nu trebuie trimis separat de coninutul digital.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 18

    III. Aspecte tehnice 1. Caracteristici tehnice recomandate Terminologie Calitatea imaginii capturate poate fi definit prin suma dintre rezoluia scanrii, profunzimea biilor imaginii scanate, procesul de compresie aplicat, echipamentul de scanare i tehnica folosit, i ndemnarea operatorului. Rezoluia este determinat de numrul de pixeli care alctuiesc o imagine i este exprimat n dpi dots pe inch dpi sau points pe inch ppi (numr de puncte pe inch). Diferena ntre ele este dat de faptul c n dpi se msoar rezoluia documentului la imprimare iar ppi, rezoluia documentului pe ecranul calculatorului. Creterea numrului de pixeli pentru capturarea unei imagini nu va duce doar la o rezoluie mai mare i o mai mare capacitate de a delimita detalii fine, ns pe msur ce rezoluia crete, aceasta nu va determina o calitate mai bun ci doar un fiier mai mare. Important este a determina punctul n care rezoluia este considerat suficient pentru a captura toate detaliile semnificative n documentul original/surs. Profunzimea (Bit depth). Un bit (pl. bii) reprezint cea mai mic unitate de date (0 sau 1, alb sau negru). 8 bii reprezint un byte. Profunzimea biilor reprezint numrul de bii folosii pentru a defini un pixel. Cu ct aceasta este mai mare cu att este mai variat numrul de tonuri i nuane. Comprimarea este folosit pentru a reduce mrimea fiierului/documentului digital pentru procesare, stocare sau transmitere. Calitatea unei imagini poate fi afectat att de ctre tehnica folosit ct i nivelul de compresie aplicat acesteia. Tehnica de comprimare poate fi loss less - ceea ce nseamn c o imagine decomprimat va rmne identic cu cea iniial, deoarece nu exist informaii pierdute cnd fiierul este redus sau lossy, atunci cnd are loc pierdere de informaie n procesul de comprimare. Tehnici de scanare: scanare bitonal - bitonal scanning se utilizeaz un bit per pixel pentru a reprezenta

    culorile negru sau alb scanare cu nuane de gri - greyscale scanning - mai muli bii per pixel pentru

    reprezentarea mai multor nuane de gri; nivelul preferat de scar gri este de 8 bii per pixel, iar la acest nivel imaginea afiat poate selecta 256 de la diferite niveluri de gri.

    scanare color - colour scanning - se utilizeaz mai muli bii per pixel pentru a reprezenta culoare; 24 bii per pixel reprezint adevratul nivel de culoare i face posibil o selecie din 16,7 milioane de culori.( 24-bit RGB)

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 19

    Tipuri de fiiere n funcie de scopul crerii fiierelor digitale, s-au conturat trei tipuri de fiiere: fiier master: copie identic cu obiectul digitizat, de nalt rezoluie, necomprimat,

    utilizat pentru prezervare. fiier pentru acces: fiier derivat din mater, care se aproprie de original, utilizat

    pentru publicare i care asigur o vitez rezonabil la livrare. fiier pictogram (thumbnail): fiier derivat din master, de dimensiuni i rezoluie

    mic, utilizat pentru previzualizare.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 20

    Caracteristici tehnice recomandate

    Tipuri de documente Text tiprit Audio

    Tipuri de fiier

    Caracteristici tehnice Manuscrise

    Carte rar imagine OCR Hri

    Fotografii Art grafic

    muzic voce Video

    profunzime Gri 8bit/pixel Color 24bit/pixel

    Gri 8bit/pixel Color 24bit/p

    Gri 8bit/pixel Color 24bit/p

    Gri 8bit/pixel Color 24bit/p

    Gri 8bit/pixel Color 24bit/p

    Mono/Stereo 16-24 bit

    Mono/Stereo 8-16 bit

    Norma: PAL

    format fiier Tiff Tiff Tiff Tiff Tiff Wave/Ogg Wave/Ogg Mpeg2 /DVD

    compresie nu nu nu nu nu nu nu nu

    Master

    rezoluie 400/600 dpi sau 4000-6000 pixel pe dimensiunea

    mai mare

    300/400 dpi sau

    3000-5000 pixel pe

    dimensiune. mai mare

    400 dpi sau 4000-6000

    pixel pe dimensiune.

    mai mare

    300 dpi sau 3000-6000

    pixel pe dimensiune.

    mai mare

    400 dpi sau 3000-6000

    pixel pe dimensiune.

    mai mare

    128-200 kbps /44,1-48 kHz

    192 kbps/ 22 kHz

    Size: 720x480 sau mai

    mare la 48 kHz i 24 bii calitate audio

    profunzime Gri 8bit/pixel Color 24bit/pixel

    Gri 8bit/pixel Color 24bit/p

    Gri 8bit/pixel

    Gri 8bit/pixel Color 24bit/p

    Color 24bit/p Color 24bit/p Mono/Stereo

    Mono/Stereo

    Norma: PAL

    format fiier Jpeg Jpeg Pdf Jpeg Jpeg Jpeg MP3 MP3 Mpeg1/avi compresie da da da da da da da da da

    Acces

    rezoluie 120-300 dpi sau de la

    500x400pixel la 1024x768pixel

    96-120 dpi sau de la

    500x400pixel la 1024x768

    pixel

    400 dpi 200-300 dpi

    250 dpi

    250 dpi

    128 kbps /22-44,1 kHz

    28-128kbps/ 11 kHz

    Size: de la 160x120 la 640x480 la 22 kHz

    profunzime 8bit/pixel 8bit/pixel 8bit/pixel 8bit/pixel 8bit/pixel format fiier Gif Gif Gif Gif Gif compresie da da da da da

    Pictogram

    rezoluie 72 dpi sau de la 150x100

    la 200x200

    72 dpi sau de la 150x100

    la 200x200

    72 dpi sau de la 150x100

    la 200x200

    72 dpi sau de la 150x100

    la 200x200

    72 dpi sau de la 150x100

    la 200x200

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 21

    2. Norme de conservare pentru scanarea coleciilor de patrimoniu Aparatura de scanare Scanarea coleciilor de patrimoniu ( manuscrise, cri vechi, lucrri de grafic, fotografii, materiale de arhiv, hri etc.) este permis numai cu aparatur profesional, de nalt performan tehnic, special proiectat pentru asigurarea proteciei maxime a documentelor fa de factorii fizico chimici i mecanici, pe toat durata fluxului de lucru . Trebuie obligatoriu ndeplinite urmtoarele cerine eseniale: - camera digital s aib o rezoluie foarte bun, astfel nct calitatea imaginilor obinute s

    corespund tuturor exigenelor ulterioare, deoarece normele de conservare a coleciilor de patrimoniu nu permit scanri repetate pe acelai document original;

    - captarea imaginii digitale de pe document s se fac pe vertical, de sus n jos, de la o distan de cel puin 70 cm, fr atingerea suprafeei documentului;

    - sistemul de iluminare s asigure protejarea total a documentelor fa de radiaiile ultraviolete i infraroii;

    - suportul pe care se aeaz documentele n timpul scanrii trebuie s previn orice fel de deteriorare fizico-mecanic a cotoarelor i a suprafeelor legturilor. De exemplu - pentru scanarea crilor masa suport va fi compus din dou module reglabile, tip balan, care se vor adapta uor la grosimile variabile ale cotoarelor i la modificrile de greutate ale corpului de carte pe parcursul foiletrii pentru digitalizare; se vor preveni , astfel, tensionrile, plesniturile sau ruperile cotoarelor interioare i exterioare ale volumelor n timpul mnuirii pe scanner.

    Pregtirea documentelor pentru scanare n aceast etap se vor efectua urmtoarele proceduri: - evaluarea strii de conservare a documentelor selectate pentru scanare, de ctre

    specialistul n conservarea coleciilor de patrimoniu; - conservatorul va decide care dintre volumele sau documentele selectate pot fi scanate,

    avnd n vedere evitarea riscurilor privind integritatea lor i deteriorarea strii lor de conservare iniiale, n timpul procesului de scanare;

    - scanarea documentelor din categoria patrimoniu naional, a celor propuse pentru a fi clasate, a raritilor, a unicatelor i a celor foarte fragile, se va face numai cu asistena conservatorului specializat;

    - la scoaterea documentelor din depozite i trecerea lor n spaiile destinate procesului de scanare se vor avea n atenie, obligatoriu, diferenele de temperatur i de umiditate relativ ntre aceste incinte. Dac exist diferene de temperatur mai mari de 2 3 grade Celsius i diferene de umiditate relativ mai mari de 4 5 % , trebuie luate msuri de aclimatizare a pieselor, pentru a se evita apariia condensrii vaporilor de ap pe materialele componente ale acestora;

    - se vor msura zilnic, cu ajutorul unui termohigrometru digital, valorile temperaturilor i ale umiditilor relative n depozite i spaiile de lucru;

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 22

    - dac se constat diferene riscante, fiecare volum va fi nvelit n material neutru, cu rol de tampon la umiditate ( de ex. finet alb de bumbac) i numai astfel va fi dus n sala de lucru, iar aici va fi lsat, pentru aclimatizare, 45 60 minute;

    - transportarea documentelor din depozite n spaiile de lucru i retur se va face n couri de dimensiuni medii, din material plastic bine finisat, care s poat fi mnuite i de o singur persoan;

    - nainte de nceperea scanrii, toate volumele trebuie desprfuite pe toate suprafeele exterioare (coperte, cotor, trane), iar n interior fil cu fil, n zona cotorului, fr a se atinge oglinda textului sau ornamentaiile; aceast operaiune se va face dup recomandrile conservatorului, n funcie de particularitile fiecrui obiect; se vor folosi pensule de diverse dimensiuni, din pr animal, crpe de bumbac i va fi amenajat un spaiu optim pentru aceast operaiune;

    - personalul care desprfuiete trebuie s fie echipat cu halat cu mneci lungi, cu masc de reinere a pulberilor ( aezat peste nas i gur), cu ochelari de protecie la praf i cu mnui chirurgicale din latex natural, de unic folosin, care se vor trage peste mnecile halatului.

    Mnuirea documentelor pe scanner - mnuirea i foiletarea documentelor, pe toat durata procesului de scanare, se va face cu

    foarte mult atenie i ndemnare, pentru a nu produce nicio deteriorare; - mnuirea i foiletarea documentelor pe scanner se va face cu masc de protecie a cilor

    respiratorii (obligatorie la manuscrisele pe pergament!) i cu mnui foarte fine, care s se muleze strns pe mini, pentru a asigura att protecia obiectului foiletat ct i a mnuitorului, dar i o dexteritate foarte bun din partea acestuia; mnuile pot fi din latex natural (chirurgicale) sau din bumbac;

    - persoanele care sunt alergice nu trebuie s fac foiletare pe scanner; - n timpul foiletrii nu trebuie atinse: oglinda textului, miniaturile, adnotrile marginale etc.;

    pot fi atinse doar marginile albe ale filelor; - scanarea unui volum se va face cu continuitate, pn la terminarea lui; - dup finalizarea scanrii volumul/documentul va fi dus n depozit, aplicnd, atunci cnd

    este cazul, procedura de aclimatizare.

  • Comisia de specialitate pentru digitizare pilonul tematic Biblioteci

    Biblioteca Naional a Romniei - Octombrie 2009 23

    Concluzii referitoare la punerea n practic a procesului de digitizare pentru pilonul tematic Biblioteci - procesul de digitizare, prin obiectivele i scopurile lui, constituie un element strategic n

    dezvoltarea societii informaionale la nivel naional, interconectat la nivel internaional. - programul naional de digitizare va fi realizat prin colaborarea tuturor instituiilor deintoare

    de documente ce pot fi incluse n Biblioteca Digital a Romniei. - procesul de digitizare la nivel naional trebuie s aib la baz principiul partajrii. - Biblioteca Naional a Romniei prin atribuiile conferite de cadrul legal, prin structur i

    organizare poate coordona, la nivelul sistemului naional de biblioteci, activitatea de digitizare i de constituire a Bibliotecii Digitale a Romniei.

    - se va aplica principiul evitrii duplicrii eforturilor - se impune recuperarea rezultatelor proiectelor anterioare i integrarea lor ntr-un sistem

    unitar, n cadrul Bibliotecii Digitale Naionale i inventarierea tuturor documentelor scanate la nivel naional.

    - soluia de digitizare poate fi: digitizarea n cadrul bibliotecii, digitizarea prin externalizare i o soluie mixt.

    - corpusul documentar propus pentru digitizare va fi constituit att din colecii de tip patrimonial, ct i din colecii contemporane, cu un grad mare de adresabilitate i interes.

    - instituia deintoare a documentului original care a fost inclus n Biblioteca Digital a Romniei acord utilizatorilor dreptul de acces i d drept de difuzare a documentului scanat.

    - modelul descentralizat, promovat i de The European Library Europeana, este modelul tuturor bazelor de date europene i reprezint varianta optim pentru Biblioteca Digital a Romniei.