DLR Achizitionarea

download DLR Achizitionarea

of 75

Transcript of DLR Achizitionarea

  • Academia Romn Institutul de Filologie Romn A. Philippide

    Gabriela Haja Elena Dnil

    Corina Forscu Bogdan-Mihai Aldea

    DICIONARUL LIMBII ROMNE (DLR)

    N FORMAT ELECTRONIC.

    STUDII PRIVIND ACHIZIIONAREA

    Editura Alfa Iai 2005

  • 4

    Volum aprut cu sprijinul Ministerului Educaiei i Cercetrii. Refereni: Cercettor principal gr. I Cristina Florescu, Institutul de Filologie Romn A. Philippide, Academia Romn Filiala Iai Profesor universitar dr. Dan Cristea, Facultatea de Informatic, Universitatea Alexandru Ioan Cuza Iai

  • 5

    Mihai Eminescu: i fiindc spirit

    i limb sunt aproape identice, iar limba i naionalitatea asemenea, se vede uor c romnul se vrea pe sine, i vrea naionalitatea, dar aceasta o vrea pe deplin (Opere, vol. 9, Publicistica, Bucureti, Editura Academiei R.S.R., 1980, p. 252).

    Alain Danzin: n era electronic,

    este esenial pentru supravieuirea unei limbi ca ea s fie folosit n sistemele de informare electronic (Towards a European Language Infrastructure, 1992, CEC Doc. 54210/92).

    Introducere

    Acest volum prezint proiectul Dicionarul limbii romne (DLR) n format electronic. Studii privind achiziionarea, finanat de Ministerul Educaiei i Cercetrii (MEC) prin Consiliul Naional al Cercetrii tiinifice din nvmntul Superior (CNCSIS), desfurat n perioada 20032005 n Institutul de Filologie Romn A. Philippide al Academiei Romne Filiala Iai.

    Volumul se adreseaz deopotriv specialitilor n lexicografie i n lingvistic computaional precum i tuturor celor interesai de modalitatea de realizare a formatului electronic propriu DLR, n calitate de viitori utilizatori ai acestuia.

    Proiectul, a crui finalitate a fost descoperirea unei modaliti de transformare a DLR din text tiprit n text electronic adnotat1, uor de prelucrat cu ajutorul unui program specific, este rodul colaborrii ntre lingviti i informaticieni [vezi Anexa 1] i demonstreaz

    1 Textul electronic adnotat este un text analizat i marcat din punct de vedere formal astfel nct s poat fi consultat, corectat, modificat etc. de ctre specialitii lexicografi, cu ajutorul calculatorului.

    Exist posibilitatea extragerii din formatul complet a unei forme destinate numai consultrii, care s se adreseze unui public mai larg dect cel al specialitilor propriu-zii.

  • 6

    efectele constructive ale inter- i transdisciplinaritii, precum se ntmpl i n cazul altor proiecte finalizate printr-o astfel de colaborare2 n cadrul Academiei Romne.

    Materialul cuprins n volum este structurat n trei pri. Prima, Lexicografie romneasc tradiional, propune o perspectiv de ansamblu asupra evoluiei lexicografiei romneti, de la nceputuri pn n zilele noastre, cu focalizare asupra dicionarelor monolingve a celor cu caracter explicativ general i a celor academice. Se realizeaz astfel o punere n relief a contextului n care a fost iniiat proiectul fundamental al Academiei Romne, Dicionarul limbii romne, proiect a crui materializare a cunoscut destule avataruri de-a lungul unui secol. Dup o prezentare sumar a dicionarelor academice, se face o paralel ntre cele dou serii ale Dicionarului limbii romne DA (sigla volumelor publicate ntre 1906 i 1944, sub supravegherea lui Sextil Pucariu) i DLR (seria nou a Dicionarului, editat ncepnd cu anul 1965, sub coordonarea lui Iorgu Iordan, Alexandru Graur, Ion Coteanu i, ulterior, sub cea a lui Marius Sala i Gh. Mihil), pentru ca, n continuare, s fie prezentate trsturile generale specifice DLR, cele care confer valoare deosebit acestei lucrri. De asemenea, se schieaz realizrile de pn acum n domeniul informatizrii cercetrii lexicografice romneti.

    2 Un astfel de proiect, finalizat cu succes n Academia Romn, Filiala Iai la Institutul de Filologie Romn A. Philippide n colaborare cu Institutul de Informatic Teoretic, este Editarea asistat de calculator a Noului Atlas lingvistic pe regiuni. Moldova i Bucovina, ale crui rezultate situeaz Institutul ieean n avangarda cercetrii geografiei lingvistice romneti, prin mijloacele de lucru actuale create, comparabile cu cele utilizate n ri europene, avansate n acest domeniu. Ceea ce particularizeaz realizarea acestui proiect este faptul c s-a reuit crearea unor fonturi ce redau fidel aspectul fonetic al termenilor care apar scrii pe hart. Acetia nu sunt nlocuii de simboluri, ca n majoritatea lucrrilor de acest tip editate n Europa, astfel nct imaginea grafic a unui fenomen lingvistic este conservat pe suport electronic i poate fi transformat n instrument de analiz a limbii n variantele sale regionale din mai multe perspective (Informatizarea n cartografia lingvistic: NALR. Moldova i Bucovina, lucrare prezentat de Stelian Dumistrcel i Doina Hreapc la Atelierul de lucru Resurse Lingvistice Romneti i Instrumente pentru Prelucrarea Limbii Romne, publicat n http://consilr.info.uaic.ro). Un alt proiect de acest tip este Dicionarul explicativ al limbii romne (DEX), transpus n format electronic n cadrul Institutului de Cercetri pentru Inteligen Artificial (ICIA, www.racai.ro) al Academiei Romne, Bucureti.

  • 7

    A doua parte, Pai spre DLR informatizat, descrie modalitatea de realizare a principalelor obiective ale proiectului. n aceast parte, mai tehnic, sunt detaliate programul folosit, modalitatea de lucru, opiunea pentru folosirea unei euristici3 de parsare4 a textului DLR, aplicaia realizat (DLRex). Sunt schiate, de asemenea, perspectivele cercetrii lexicografice romneti, n special, i ale cercetrii lingvistice, n general, odat realizat dezideratul unui Dicionar al limbii romne informatizat, comparabil cu lucrri de acelai tip din ri romanice (Le Trsor de la langue franaise informatis, Dizionario De Mauro Paravia etc.).

    Anexele, care constituie partea a treia a volumului, cuprind informaii referitoare la echipa de cercetare, o list a lucrrilor realizate ori publicate n intervalul de desfurare a proiectului, lucrri referitoare direct ori indirect la tema de cercetare a grantului, precum i o serie de exemple ce completeaz subcapitolul referitor la filiaia sensurilor n DLR.

    n fine, rezumatul n limba englez publicat aici permite celor care nu cunosc ndeajuns limba romn dar sunt interesai de informatizarea acesteia s afle, fie i orientativ, care este situaia actual a studiilor realizate n vederea actualizrii mijloacelor de cercetare lexicografic din ara noastr.

    3 Euristica este neleas, n context computaional, ca o tehnic de

    rezolvare a problemelor care in cont la fiecare pas de rezultatele precedente i din care se deduce strategia de adoptat n continuare. Opuse metodelor algoritmice, metodele euristice nu garanteaz gsirea soluiei dup un numr finit de pai

    4 Parsarea, din punct de vedere computaional, este procedeul de analizare a unui ir de caractere (uzual text) pentru a determina structura gramatical a acestuia conform cu un formalism gramatical. n general parsarea se face n dou etape: identificarea token-ilor elementele primitive ale unui text structurat i construirea arborelui structurii sintactice care capteaz ierarhia implicit a datelor de intrare.

  • 8

  • 9

    Partea I Lexicografie romneasc tradiional

    1. Incursiune n tradiia lexicografic romneasc

    1.1. nceputurile lexicografiei romneti nceputurile lexicografiei romneti se situeaz n veacul al XVI-

    lea. Aproape simultan cu primele texte bisericeti traduse din limba slavon au aprut vocabulare bilingve slavo-romneti, n manuscris, din care s-au pstrat fragmente [Gheie, 1982: 365-464; cf. Bogdan, 1946]. Documentele cancelariilor domneti erau redactate n slavon la acea vreme i, de aceea, s-a impus realizarea unor glosare ori lexicoane care s slujeasc la nelegerea de ctre romni a acestei limbi. Alctuite rudimentar din liste bilingve, n care termenului slavon i se altur corespondentul romnesc, lucrrile din secolele al XVI-lea, al XVII-lea i unele chiar mai trzii nu respect ordonarea alfabetic a cuvintelor, iar n lista de cuvinte-titlu apar numeroase mbinri ori chiar propoziii, precum i nume proprii. Cu toate aceste minusuri, aceste lexicoane au slujit ca instrumente de lucru traductorilor de texte sacre, pstrndu-i valoarea documentar pentru lexicograful contemporan, ca surse pentru cele dinti atestri scrise ale unor cuvinte romneti.

    Sub influena filosofiei iluministe care domin cultura romn a sfritului de secol XVII i a secolului urmtor, dicionarele bilingve slavo-romne au fost nlocuite de dicionare bilingve sau poliglote n care elementul latin i cel romanic i mresc ponderea, iar numrul lucrrilor de acest tip sporete semnificativ. Pe de alt parte, centrul de greutate al lexicografiei romneti ncepe s se mute n Transilvania, care va avea contribuii nsemnate n domeniu vreme de dou secole [Seche, 1966: 8], dup ce secolul al XVII-lea aparinuse, integral, Munteniei.

    n ultimele dou decenii ale secolului al XVIII-lea apar primele dicionare tiprite. n felul acesta, lucrrile lexicografice cunosc o circulaie mult mai mare i devin resurse pentru redactarea dicionarelor ulterioare i instrumente uzuale pentru traduceri. Aflate sub semnul bilingvismului ori al poliglotismului, dicionarele din aceast perioad cunosc o evoluie ncununat de Lexiconul de la

  • 10

    Buda (Lesicon romanescu-latinescu-ungurescu-nemescu, Buda, 1825), lucrare ce marcheaz nceputul lexicografiei romneti moderne, fiind primul dicionar de mari proporii, explicativ i etimologic al limbii romne, tiprit n ntregime cu litere latine.

    Lexicografia romneasc se diversific i se specializeaz n secolul al XIX-lea; apar numeroase dicionare bilingve (dicionare germano-romne i romno-germane, francezo-romne i romno-franceze, latino-romne i romno-latine, maghiaro-romne, greco-romne, un dicionar ruso-romn i un vocabular romn-rus, de asemenea un foarte frumos vocabular italiano-romanesco), dicionare poliglote i Dialoguri bilingve i poliglote care serveau ca manuale de nvare a limbii (sau limbilor) strine.

    Secolul al XIX-lea este important n istoria lexicografiei romneti prin lucrri ca cele enumerate mai sus, dar mai cu seam prin apariia i dezvoltarea lexicografiei monolingve.

    Lexicografia romneasc monolingv a fost, nainte de anul 1825, ca i inexistent, dei sunt consemnate unele proiecte nereuite, precum cel din 1759 al lui P. P. Aaron i Gr. Maior i cel din 1780 al lui Gh. incai. Primul dicionar explicativ complet al limbii romne este cel al vornicului Iordache Golescu, Condica limbii rumneti, n care se adopt pentru prima dat sistemul de redactare a cuvintelor pe cuiburi lexicale i n care apar pe alocuri explicaii cu caracter enciclopedic. Adesea, cuvntul este ilustrat prin contexte-tip create de autor. Iordache Golescu introduce n opera sa dublele posibiliti etimologice i redacteaz, pentru prima dat n istoria lexicografiei romneti, o list de omonime. n 1857 apare, la Iai, Glosariul limbei daco-romane al lui G. Sulescu, prospect al unui programat dicionar general, istoric i etimologic al limbii romne, dicionar nepstrat ns. Un alt dicionar explicativ general al limbii romne dateaz din 1870 i aparine lui Ion Costinescu. Dei intitulat Vocabularu romano-francesu, acesta este un dicionar unilingv i conine o list bogat de cuvinte i de construcii (expresii, locuiuni, sintagme). Costinescu nregistreaz n mod sistematic mbinrile de cuvinte care aparin domeniului tehnico-tiinific. n 1830 se nfiineaz la Iai o societate literar care i propune realizarea, sub coordonarea lui Gh. Asachi, a unei enciclopedii romneti, o prim lucrare lexicografic romneasc redactat de un colectiv. Se mai nregistreaz i alte ncercri de elaborare a unor dicionare enciclopedice: Ion Heliade-Rdulescu, proiect de Dicionar de cunotine universale; Alexandru Gavra, Lesicon de conversaie storicesc religionariu (Buda, 1847). n 1847, Ion Heliade-Rdulescu tiprete, la Bucureti, Vocabularul de vorbe streine n limba

  • 11

    romana, un dicionar purist, n care autorul i propune s identifice termenii strini din limba romn i s i nlocuiasc cu termeni romneti, iar acolo unde n limba romn nu exist un astfel de termen transfer din limba latin n cea romn termenul de care are nevoie. n 1867 apare, la Bucureti, primul dicionar de sinonime din istoria lexicografiei romneti, Vocabularul de quateva vorbe synonyme, de C. Canella.

    Perioada cuprins ntre anii 1826 i 1870 se caracterizeaz printr-o dezvoltare excepional, sub raport statistic, a dicionarelor de neologisme. De altfel, n istoria lexicografiei romneti, preocuparea pentru neologisme cunoate o evoluie susinut pn n prezent. n ultimele cinci decenii, au fost publicate patru ediii succesive ale Dicionarului de neologisme (v. infra). Acest fapt ilustreaz, ntre altele, una dintre trsturile limbii romne literare i anume deschiderea spre mprumut ca modalitate de mbogire lexical i capacitatea de adaptare a neologismelor. Amintim aici Vocabularu romanu, publicat la Bucureti, n 1848, de I. D. Negulici, dicionarele lui T. Stamati, la Iai, n 1851, E. Protopopescu i V. Popescu, Bucureti, 1860, al lui G. M. Antonescu, la Bucureti, n 1862 i al lui I. Bauman, la Craiova, n 1868. n aceast perioad apare i primul dicionar de neologisme specializat, Vocabulariu de jurispruden, de Iancu M. Codrescu, Iai, 1865. Trebuie subliniat rolul pe care l-au avut aceste dicionare n punerea n circulaie, popularizarea i impunerea neologismelor. Apariia acestor dicionare are loc pe fondul procesului de modernizare a limbii romne literare din aceast perioad. Principala cale de realizare a acestui proces este orientarea latino-romanic n mbogirea lexicului, n schimbarea ortografiei (inclusiv trecerea la scrierea cu alfabet latin), n modificarea unor forme fonetice i a unor norme morfologice, n clarificarea, simplificarea i armonizarea structurii sintactice. Fenomenul, numit reromanizare [Pucariu, 1931: 345-359], latinizare sau romanizare [Ivnescu, 2000: 672-685], relatinizare [Hristea, 1984: 134-147], occidentalizare romanic [Niculescu, 1980: 249-253], direcie latino-romanic [ra, 1982/1983: 177], s-a manifestat la toate nivelurile limbii, ntr-un cadru instituionalizat, ca rezultat al unei politici lingvistice coordonate i susinute prin toate mijloacele.

    Cu deceniul al aptelea al secolului XIX ncepe, n istoria lingvisticii romneti, epoca marilor dicionare [Seche, 1966: 102]. n aceast perioad i desfoar activitatea Alexandru Cihac, care tiprete Dicionarul etimologic dacoromn, prima lucrare riguros tiinific din domeniul etimologiei romneti. Lucrarea lui Cihac se

  • 12

    ntemeiaz pe o orientare modern, ncercnd s fac, pentru prima oar n lexicografia romneasc, inventarul obiectiv al originilor lexicului romnesc. n Prefaa dicionarului, Cihac i susine, pe de o parte, opiniile net antineologizante, i, pe de alt parte, i declar admiraia pentru termenii motenii. Dintre cele dou posibiliti principale de organizare a materialului alfabetic sau pe origini Cihac o alege pe cea din urm, mai potrivit ntr-un dicionar etimologic, unde intereseaz n primul rnd delimitarea diverselor apartenene lexicale. Pentru stabilirea listei de cuvinte, lexicograful pornete de la variate i numeroase izvoare scrise; ceea ce d lucrrii un caracter tiinific indiscutabil este i indicarea exact a izvoarelor scrise sau a celor lingvistice. Tot lui Cihac i revine meritul de a fi apelat pentru prima dat la dialectele sud-dunrene.

    1.1.1. Dicionare de uz general n 1896 apare la Craiova, Dicionarul universal al limbei romne,

    de Lazr ineanu, cea mai popular oper lexicografic din istoria lingvisticii romneti, n sensul unei lucrri de popularizare, al unui dicionar explicativ general de uz curent, primul de acest fel n lexicografia romneasc. Epitetul universal inclus n titlu este justificat de autor prin caracterul enciclopedic al dicionarului, precum i prin argumentul c n acest dicionar figureaz ntregul material lexical uzual comun din limba romn, termenul universal echivalnd aici cu general. Ca dicionar al limbii uzuale, lucrarea acord o deosebit importan achiziiilor lexicale noi din toate domeniile vieii sociale: tiine i arte, meserii, industrie i comer. n decurs de patru decenii, dicionarul cunoate nou ediii succesive, ceea ce demonstreaz importana pe care aceast lucrare lexicografic a avut-o pentru publicul-int.

    n 1924 apare la Craiova Dicionarul etimologico-semantic al limbii romne, de Alexandru Resmeri, oper lexicografic n care autorul pune accent mai ales pe partea explicativ i mai puin pe seciunea etimologic.

    La nceputul secolului al XX-lea Casa editorial Socec iniiase realizarea unui Dicionar general al limbii romne, mobiliznd la nceput pe Ovid Densusianu i pe I. A. Candrea. Din acest proiect a aprut doar o prim fascicul. n 1919 se nfiineaz Casa editorial Cartea Romneasc. n planurile editoriale se preconiza realizarea unui Dicionar enciclopedic al limbii romne, proiectat n trei pri: un dicionar lingvistic explicativ, urmat de unul enciclopedic (care s cuprind nume proprii) i, la sfrit, de o list de locuiuni, maxime i

  • 13

    proverbe celebre. Prima parte a dicionarului, cea lingvistic explicativ a fost ncredinat lui I. A. Candrea, iar partea enciclopedic lui Gh. Adamescu. Dicionarul apare n 1931 i constituie cea mai deplin realizare lexicografic romneasc aprut n afara forului academic [Seche, 1966], partea cea mai important i mai valoroas a acestui demers fiind constituit din seciunea numelor comune, intitulat Dicionarul limbii romne din trecut i de astzi (CADE). n aceast prim seciune sunt cuprinse patru categorii de lexeme: cuvinte literare i populare, cuvinte regionale, neologisme i termeni tehnici neologici. Interpretarea semantic i n general partea explicativ a articolelor constituie contribuia cea mai solid a dicionarului. n privina bogiei semantice, dicionarul lui I. A. Candrea rivalizeaz n multe cazuri cu cel academic, realizat sub coordonarea lui Sextil Pucariu.

    n 1939, apare la Iai Dicionaru limbii romneti (Etimologii, nelesuri, exemple, citaiuni, arhaizme, neologizme, provincialisme), al lui August Scriban, tiprit la 36 de ani de la nceperea lui i la peste un deceniu i jumtate de la definitivarea redactrii iniiale. Acest dicionar este realizat pe baza materialului adunat de lexicograf, timp de decenii, din variate izvoare (scrise, orale informaii i comunicri obinute de la elevi i cunoscui sau din propria experien). n lucrare sunt nregistrate aproximativ 38.000 de cuvinte. Scriban include n dicionarul su toate tipurile de cuvinte pe care le-a depistat (din vocabularul popular, regional, argotic i chiar arhaic), ceea ce constituie un element de originalitate a acestei lucrri. Un rol important se acord, de asemenea, seciunii etimologice (deosebit de extinse), plasate naintea celei explicative, care are o mare ntindere. Avnd i unele limite, opera lui Scriban se remarc prin bogia excepional a materialului lexical, prin numrul mare de variante lexicale, prin definiii etc.

    n timpul redactrii marelui dicionar academic, dup al doilea rzboi mondial (v. infra), lingvitii i-au dat seama de necesitatea redactrii unor lucrri lexicografice explicative ct mai accesibile publicului larg. Astfel, s-a pus problema realizrii ntr-un timp ct mai scurt a Dicionarului limbii romne literare contemporane (DL), la care a lucrat un colectiv de 85 de lexicografi din Bucureti i din Cluj, sub conducerea lui D. Macrea. Noua lucrare (4 volume, 1955-1957) a ridicat mai multe tipuri de probleme: delimitarea perioadei istorice (autorii avnd n vedere secolele al XIX-lea i al XX-lea), alegerea izvoarelor i selectarea cuvintelor din masa vocabularului, inndu-se cont de cele dou caracteristici principale ale lucrrii, acelea de dicionar al limbii romne moderne i literare. Prima

  • 14

    nsuire a impus excluderea din list a cuvintelor, a sensurilor i a unitilor frazeologice arhaice, iar a doua caracteristic a dus la evitarea cuvintelor, a sensurilor i a unitilor frazeologice regionale, a cuvintelor argotice sau de jargon etc. Cele 4 volume numr peste 48.000 de cuvinte-titlu urmate de explicaii precise, scurte i clare, fr adugiri enciclopedice. n DL se folosete un numr mare de citate din texte beletristice (culte i populare), din opere tiinifice i din periodice, renunndu-se, ns, la seciunea etimologic. Prin selectarea cuvintelor i a sensurilor, prin alegerea formelor-titlu, prin indicaiile gramaticale, prin datele de natur ortografic i ortoepic, dicionarul tinde s fie o oper lexicografic cu caracter normativ.

    nc nainte de terminarea Dicionarului limbii romne literare contemporane, autorii au constatat c profilul lucrrii fusese greit apreciat i s-a pus problema elaborrii unei opere lexicografice paralele, reduse la proporiile unui singur volum, simplificat i accesibil, Dicionarul limbii romne moderne (DM), oper lexicografic de limb literar curent, absolut i urgent necesar. Iniial, acest Dicionar a fost gndit ca o versiune prescurtat a DL, recurgndu-se, n acest scop, la renunarea la citate, la reducerea prii explicative (prin concentrarea definiiilor, prin contopirea unor sensuri nrudite i prin eliminarea altora mai puin cunoscute) i prin folosirea unui corp de liter mai mic. DM i-a propus s fie mai unitar (prin adoptarea unor definiii-tip obligatorii acolo unde se putea) i mai accesibil, prin nlocuirea definiiilor pretenioase, tehniciste, cu explicaii mai clare, ntr-un limbaj comun. Suma de 49.649 de cuvinte constituie o list de cuvinte bogat pentru un dicionar explicativ ntr-un singur volum. Toate aceste operaii, precum i cele dou inovaii introducerea a circa 3000 de ilustraii i a indicaiilor etimologice transform DM n lucrare independent, diferit n multe privine de DL. Dicionarul limbii romne moderne devine cea mai popular lucrare lexicografic a perioadei, avnd un tiraj de aproape 150.000 exemplare.

    DM a fost depit, n multe privine, de Dicionarul explicativ al limbii romne (DEX), al crui tiraj a atins cifra de 600.000 de exemplare n cele dou decenii de apariie [MDA, 2001: VIII]. Dicionarul explicativ al limbii romne include i cuvinte populare, regionale, arhaisme i neologisme, care, alturi de definire i explicare, sunt nsoite i de etimologie. DEX este cel mai cunoscut dicionar al limbii romne, pe de o parte datorit tirajului mare, pe de alt parte deoarece este prima lucrare lexicografic transpus n format electronic i disponibil pe web la http://dexonline.ro.

  • 15

    mbogirea vocabularului limbii romne a impus realizarea unor lucrri lexicografice de neologisme. n perioada limbii romne contemporane, cel mai important Dicionar de neologisme (DN) este cel elaborat de Fl. Marcu i de Constant Maneca, aprut la Bucureti, ntr-o prim ediie, n 1961. Autorii i-au propus s nregistreze numai mprumuturile recente ale limbii romne i derivatele pe teren romnesc ale acestor mprumuturi. n ceea ce privete mprumuturile strict contemporane, i mai ales termenii tehnico-tiinifici, selectarea lor s-a fcut pe criteriul uzului, fiind acceptai doar termenii folosii n mod curent n limba literar sau mcar n literatura de specialitate. Numeroase indicaii asupra circulaiei cuvntului-titlu, asupra domeniului cruia i aparine, indicarea accentului sau, uneori, a pronunrii fac ca aceast lucrare s aib i un caracter normativ. Trstura distinctiv a acestui dicionar o constituie seciunea sa etimologic, prin sporirea n mod considerabil a explicaiilor prin etimologie multipl. Acest dicionar a fost reeditat n mai multe rnduri. Ediia a doua a acestui Dicionar de neologisme (1966) reprezint un progres evident fa de prima, prin mbogirea lucrrii cu peste 2000 de cuvinte-titlu, prin introducerea a circa 3000 de variante lexicale cunoscute la neologisme deja nregistrate, prin nmulirea indicaiilor gramaticale i ortoepice, prin revederea seciunii explicative i a celei etimologice etc. n ediia a treia, aprut n 1978, autorii mresc lista de cuvinte-titlu i rafineaz unele definiii. Restul ediiilor de pn n anul 2000 sunt semnate numai de Florin Marcu, autor care a mai publicat n 1986 un Mic dicionar de neologisme, n 1994, Neologisme, n 1996, Dicionar uzual de neologisme i n 1997, la Chiinu, Dicionar de neologisme n colecia Dicionare colare. Autorul revine la ediii mari n acelai an, cnd public la Editura Academiei Noul dicionar de neologisme, iar n 2000, Marele dicionar de neologisme, reluat n 2002. Ceea ce reprezint, n primul rnd, meritul noului dicionar este masiva augmentare a listei de cuvinte, care se ridic acum la peste 65.000 de termeni [...]. Acest lexicon concentreaz ntr-un singur volum majoritatea cuvintelor noi ale limbii romne actuale, din toate domeniile de activitate [Marcu, 2002: 8]. Elementul distinctiv al ultimei ediii este pe lng numrul foarte mare de intrri prezena la sfritul volumului a unei anexe ce cuprinde 15 tabele sinoptice care sporesc caracterul uzual al lucrrii lexicografice i i confer o not enciclopedic.

  • 16

    1.1.2. Dicionare academice n acelai deceniu apte al secolului al XIX-lea se deschide seria

    dicionarelor academice prin apariia Dicionarului limbii romne, general, istoric i etimologic, redactat de A. T. Laurian i I. C. Massim, singura lucrare de acest fel redactat sub auspiciile vechii academii5. Lucrrile preliminare pentru ntocmirea dicionarului ncep n anul 1869, cnd se preconiza realizarea unui Glosar de cuvinte romneti, a Dicionarului limbii romne i a Vocabularului de cuvinte strine n limba romn. n cursul anului 1870 ncepe munca efectiv de redactare a dicionarului de ctre Laurian i Massim. Dicionarul lui Laurian i Massim continu linia latinist tradiional i mpinge pn la ultimele limite unele dintre exagerrile acestui curent, n primul rnd purismul. Una din criticile fundamentale aduse dicionarului lui Laurian i Massim este aceea c lista de cuvinte a lucrrii a fost ncrcat cu termeni preluai direct din dicionarele latine. Cele dou volume ale dicionarului cuprind un numr de aproximativ 43.000 de cuvinte-titlu, la care se mai adaug circa 5.000 cuvinte pe care autorii le-au grupat n cadrul articolelor consacrate elementelor de compunere i de derivare (sufixe i prefixe). mpreun cu lista din Glosar, numrul de cuvinte-titlu din cele trei volume se ridic la circa 70.000. innd cont ns de numrul termenilor introdui forat n vocabularul romnesc, manifestare a tendinei latinizante, numrul cuvintelor reale se ridic la un total de 50.000 de cuvinte. ncercarea autorilor dicionarului de a mbogi vocabularul limbii romne a avut ca efect impunerea unui numr semnificativ de neologisme. Pentru prima dat n istoria lexicografiei romneti, Laurian i Massim recunosc utilitatea metodei statistice n dicionarele istorice. n privina indicaiilor etimologice, acest dicionar are meritul de a utiliza i principiul etimologiei multiple, fiind printre primele opere lexicografice din istoria lingvisticii universale care adopt aceast metod. Rod al latinismului n declin, dar depind prin multe aspecte pozitive limitele acestui curent, lucrarea lui Laurian i Massim are o

    5 La 1 aprilie 1866, se organizeaz Societatea Literar Romn, care,

    peste un an, devine Societatea Academic Romn [Pascu, 1991: 54-55). Ortografia, Gramatica i Dicionarul limbii romne au constituit de la bun nceput repere ale existenei Societii Academice Romne, ceea ce a fcut ca Secia filologic-literar s ocupe un loc privilegiat, att prin numrul de membri, ct i prin problemele dezbtute i rezolvate [Pascu, 1991: 105]. Societatea Academic Romn a fost declarat Institut Naional, sub numele de Academia Romn, la 29 martie 1879.

  • 17

    importan deosebit n istoria lexicografiei romneti, fiind pn n prezent singurul dicionar academic finalizat [Seche, 1966: 180].

    O a doua ncercare de realizare a unui dicionar academic al limbii romne, Etymologicum Magnum Romaniae (18871893) al lui Bogdan Petriceicu Hasdeu constituie un alt punct de referin pentru lexicografia romneasc. Cele trei tomuri ale lucrrii (care se oprete la cuvntul brbat) se disting printr-o bogat list de termeni. Hasdeu a ignorat aportul neologic masiv din secolul al XIX-lea, acordnd n schimb o atenie deosebit limbii romne vechi, limbii populare i graiurilor regionale de pe teritoriul dacoromn, lucrarea coninnd o list de cuvinte integral real, extras din texte. Dicionarul are o structur principial clar, cu seciuni ferme: cuvntul-titlu, variantele lui lexicale i formele gramaticale, traducerea n francez a sensurilor cuvntului-titlu, indicaii asupra circulaiei cuvntului (n timp, spaiu i n stilurile limbii), definiia, izvoarele, unitile frazeologice i etimologia. La acest dicionar impresioneaz i imensa cantitate de izvoare pe care se sprijin autorul. Seciunea etimologic ocup n dicionar un volum considerabil, neatins pn astzi de nici o alt oper lexicografic romneasc, ceea ce face din Etymologicum magnum Romaniae un punct de referin n lingvistica romneasc.

    n 1897, lingvistul ieean Alexandru Philippide preia sarcina redactrii, de la nceput, a dicionarului academic, mpreun cu o mic echip de colaboratori. Dup o etap intens de fiare, de acumulare a materialului, n preajma anului 1900, lingvistul ieean ncepe singur munca de redactare a dicionarului, n ase ani elabornd aproximativ un sfert din lucrare, de la nceputul dicionarului pn la prepoziia de inclusiv. n dicionarul su, Philippide a introdus toate neologismele i toate barbarismele, nregistrnd tot ce i-a oferit, din acest punct de vedere, parcurgerea celor 199 de izvoare din epoci diferite [Seche, 1969: 36]. Dintre caracteristicile acestui dicionar, se remarc: nlocuirea numeroaselor abrevieri inaccesibile pn atunci prin altele explicite, strngerea tuturor variantelor lexicale imediat dup forma-titlu principal, situarea citatelor imediat dup definiia pe care o ilustreaz, lrgirea seciunii unitilor frazeologice. n anul 1905 ntre Comisia academic a Dicionarului i Alexandru Philippide intervine un conflict indisolubil, ceea ce face ca lingvistul s predea fiierul lexical Academiei i s hotrasc continuarea lucrrii pe cont propriu, n afara instituiei oficiale. Apariia n 1907, a primelor dou fascicule din noul dicionar academic, preluat de Sextil Pucariu, l determin pe Philippide s renune la proiectul su, dei lucrarea, elaborat n parte, promitea s devin o oper lexicografic remarcabil.

  • 18

    Cea de-a patra ncercare efectiv de realizare a Dicionarului limbii romne i aparine lui Sextil Pucariu, ncercare fructificat n ceea ce a rmas cunoscut sub numele de Dicionarul Academiei (DA). Pentru prima oar n istoria dicionarului academic se hotrte ca elaborarea lucrrii s fie ncredinat unui colectiv mai larg, pentru a se mri ritmul i cantitatea redactrii. De aceea, s-a pornit de la ideea alctuirii a dou echipe, alturi de autorul principal, Sextil Pucariu, ns, n practic, a rmas cte un lexicograf n fiecare echip (C. Lacea i, respectiv, Th. Capidan). Folosind fiierul preluat de la A. Philippide, precum i mai multe zeci de mii de fie extrase de Pucariu, s-a trecut la redactarea propriu-zis, urmnd ca mbogirea materialului lexical s se fac n mers, paralel cu operaia de redactare. Vreme de 38 de ani, din 1906 pn n 1944, s-a realizat aproape jumtate din lucrare (2.956 de pagini tiprite nsumnd literele A-C, F-K i o bun parte din litera L, l lojni). La sfritul celui de-al doilea rzboi mondial munca la acest dicionar va nceta definitiv; nceputul literei D (d de) a rmas n faz de tipar. Pentru ntia oar n istoria lexicografiei romneti redactarea propriu-zis este dublat de o preocupare lexicologic permanent, foarte util pentru continua perfecionare a dicionarului. Introducerea semnat de Sextil Pucariu la primul tom din Dicionarul limbii romne constituie una dintre cele mai largi expuneri de motive din istoria lexicografiei romne [Seche, 1969]. n aceast introducere, Pucariu prezint principiile de alctuire a listei de cuvinte, autorul artnd c principala surs de cuvinte o reprezint dicionarele anterioare, o alt surs constituind-o extrasele din literatur, aparinnd unor texte ct mai variate, din epoci diverse. n privina criteriului de introducere a cuvintelor n lista dicionarului, DA, ca dicionar istoric i general, include att cuvinte vechi, populare i regionale, ct i mprumuturi recente care exprim o idee sau nuana unei idei pentru care limba noastr nu are un termen neechivoc [DA, 1913: XV]. Numrul cuvintelor-titlu este foarte mare; dintr-o statistic ntreprins de S. Pucariu rezult c fasciculele cuprinznd patru litere, medii ca ntindere (A, B, F i G), nsumeaz 15.444 de intrri. n DA elementele componente ale fiecrui articol au un loc stabil: dup cuvntul-titlu i indicarea categoriei lui morfologice urmeaz, n ordine, precizarea domeniului cruia i aparine cuvntul, traducerea sensurilor termenului romnesc n limba francez, indicaii asupra situaiei sale istorice sau asupra rspndirii n spaiu ori indicaii stilistice, definiia, izvoarele ei, unitile frazeologice, formele gramaticale, variantele lexicale, etimologia. De pe la mijlocul literei B nainte se schimb modul general de organizare a materialului,

  • 19

    adoptndu-se din nou metoda cuiburilor lexicale, potrivit creia derivatele sunt subsumate cuvntului-matc, figurnd n acelai articol cu acesta. Aceast concentrare a cuvintelor n cuiburi lexicale a avut i consecine negative asupra filiaiei semantice, prin simplificarea excesiv a termenilor subsumai. Sensurile au fost desprite n numeroase ramificaii, cu cele mai diverse sisteme de izolare (cifre romane i arabe, litere mari i mici, bare duble i simple etc.), mprumutate din lexicografia francez. Pentru prima dat n istoria lexicografiei romneti, organizarea semantic a materialului se face n mod sistematic pe dou linii principale: prin coordonare i prin subordonare. Este vizibil strdania autorului principal de a realiza prin modul de explicare a termenilor, o oper lexicografic lingvistic i nu una enciclopedic. Lista bibliografic a dicionarului a fost mult mbogit, ajungndu-se de la cele 199 de izvoare folosite de A. Philippide, la circa 553 de titluri n 1926. DA se deosebete de versiunile anterioare i prin faptul c numrul citatelor se poate ridica, potrivit unor necesiti difereniate, pn la cteva zeci (fa de cele trei folosite de Philippide), n aa fel nct fiecare segment dintr-o epoc istoric s fie reprezentat prin texte.

    Autorul a acordat, ns, o mai mic atenie neologismelor n ansamblul lucrrii, cu toate c aceasta nregistreaz importante progrese n comparaie cu dicionarele romneti anterioare. n dicionarul condus de Pucariu este continuat linia lui Philippide n privina unitilor frazeologice, n sensul integrrii lor n filiaia semantic a articolului, subordonndu-le direct, pe fiecare, sensurilor din care se dezvolt. Dei are i unele limite, Dicionarul limbii romne redactat sub conducerea lui Sextil Pucariu, demonstreaz caliti care fac din el o oper fundamental a lingvisticii romneti i romanice.

    Lucrrile la Dicionarul limbii romne (DLR) academic vor fi reluate ntr-o nou formul, ncepnd din 1949, dup reorganizarea Academiei Romne6. ntre anii 1949 i 1952, un colectiv relativ

    6 Principala deosebire pe care noua organizare a Academiei o cunoate

    este c se reduce importana acordat domeniului filologic n ierarhizarea domeniilor prioritare: Ordinea de succesiune a seciilor s-a inversat, n sensul c seciilor de limb i literatur, de istorie-arheologie, care ocupau primele dou locuri, deoarece pentru studierea acestor tiine cu prioritate s-a nfiinat Societatea Literar Romn, devenit Societatea Academic Romn i apoi Academia Romn [...], li s-au stabilit ultimele locuri n niruirea seciilor. Locurile mai importante au fost rezervate tiinelor cu caracter practic, aplicativ, mai necesare construirii noii societi, socialiste [Pascu, 1991: 269].

  • 20

    numeros, condus de acad. Iorgu Iordan i concentrat n Institutul de Lingvistic din Bucureti, a efectuat revizia prii tiprite de Pucariu, precum i o prim redactare a poriunilor nc neelaborate din lucrare. Redactarea marelui dicionar academic a fost ntrerupt timp de mai muli ani, pn n 1959, n favoarea Dicionarului limbii romne literare contemporane (4 volume, 1955-1957) i a Dicionarului limbii romne moderne (1958), opere lexicografice de limb literar curent, absolut i urgent necesare (v. supra).

    S-a considerat c ar fi util ca noua versiune a dicionarului academic, fr a fi propriu-zis o continuare a celui anterior, s nceap cu litera M, urmnd ca, ulterior, dup terminarea poriunii pn la Z, s fie elaborat, pe aceleai baze, ntreaga poriune de la A la L, inclusiv literele care nu apruser n versiunea lui Pucariu. Noul dicionar academic se deosebete radical de cel imediat anterior prin condiiile n care este elaborat: trei echipe largi, la Bucureti, la Cluj i la Iai care lucreaz paralel la redactarea dicionarului. La Bucureti se efectueaz, sub conducerea lui Iorgu Iordan, Alexandru Graur i Ion Coteanu, revizia final a materialului. O alt deosebire fa de DA o constituie materialul lexical, astfel c, numai la litera M, care ncepe noua versiune, se folosete o bibliografie cu 1627 de titluri. DLR nregistreaz toate cuvintele atestate n limba literar general i n limbajul literaturii artistice, n vorbirea popular i regional, n textele vechi; i propune (ca i DA) s fie mai puin deschis la cuvintele aparinnd terminologiei tehnico-tiinifice. n noua versiune, se aplic un criteriu riguros de selectare a neologismelor: au dreptul s figureze n dicionar acei termeni ai limbajelor tehnico-tiinifice care au ptruns sau care manifest tendina evident de a ptrunde n limba literar general, n limbajul literar artistic i n cel popular [DLR, 1965: VI]; hotrtoare este aadar atestarea circulaiei unui cuvnt n cel puin dou dintre stilurile funcionale ale limbii romne. n DLR, sistemul de concentrare a termenilor n cuiburi lexicale a fost prsit, fiecare lexem fiind nregistrat ca articol independent. Pentru cuvintele din aceeai serie semantic (de exemplu, nume de plante i de animale, de zile, de luni, de epoci, de ere, de uniti de msur etc.), precum i pentru cele care aparin aceluiai tip morfologic (de exemplu, diminutivele, augmentativele, abstractele etc.) au fost stabilite scheme de tratare unitare i obligatorii. Acceptnd, ca i n DA, c nlnuirea semantic n interiorul cuvntului polisemantic trebuie fcut pe principiul indicelui etimologic, iar nu al uzului, DLR n-a preluat i ideea potrivit creia indicele de vechime a atestrii se subordoneaz fr excepie indicelui/principiului etimologic. Cele

  • 21

    dou opere lexicografice se deosebesc ntre ele i prin modul de folosire a izvoarelor. Diferena cea mai evident rezult din volumul diferit de extrase de care a dispus fiecare dintre lucrri. n DLR ordinea tuturor izvoarelor ilustrative este strict cronologic, ncadrndu-se astfel n caracterul de baz al lucrrii, acela de dicionar istoric. Spre deosebire de versiunile anterioare ale dicionarului academic, n noul dicionar se renun total la traducerea n limba francez a sensurilor fiecrui articol. n DLR alineatul final al articolului, cuprinznd etimologia, este mai redus dect n versiunea anterioar, pentru c numeroase explicaii de amnunt au fost lsate pe seama Dicionarului etimologic al limbii romne, care se elaboreaz n prezent7.

    2. Dicionarul limbii romne. Serie nou (DLR)

    2.1. Stadiul actual al cercetrii lexicografice n cadrul DLR Perioada actual st sub semnul finalizrii monumentalei lucrri

    Dicionarul limbii romne. Serie nou (DLR). Trei institute de cercetare ale Academiei Romne sunt implicate n realizarea acestui proiect fundamental i prioritar: Institutul de Lingvistic Iorgu Iordan(denumit din 2002, dup re-unirea cu Institutul de Fonetic i Dialectologie Al. Rosetti, Institutul de Lingvistic Iorgu Iordan Al. Rosetti) din Bucureti, Institutul de Lingvistic S. Pucariu din Cluj-Napoca i Institutul de Filologie Romn A. Philippide din Iai.

    Institutul bucuretean a realizat volumele cuprinznd literele M, N, P, S i Z, actualmente lucrnd la finalizarea pentru tipar a celor trei volume care cuprind litera D. Institutul de la Cluj a elaborat volumele cu literele O, R, T, , U, tiprite, i a doua parte a literei L, aflat n etapa reviziei i a pregtirii pentru tipar. Institutul din Iai a finalizat volumele cu literele , V (dou pri au aprut n 1997 i 2002, ultima parte, incluznd i cuvintele care ncep cu literele W, X, Y, se afl sub tipar), pregtind pentru editare prima parte din L i volumele cuprinznd litera E. Volumele tiprite din DLR. Serie nou cuprind cca 10.000 de pagini (a 7.0009.000 semne/pagin) n 22 de volume

    7 Pn n prezent, singurul dicionar cu caracter preponderent etimologic

    finalizat este Dicionarul etimologic al limbii romne al lui Al. Ciornescu, Bucureti, Editura Saeculum I. O., 2002 (prima ediie: Alejandro Cioranescu, Diccionario Etimolgico Rumano, Biblioteca Filolgica, Universidad de La Laguna, Tenerife, Espaa, 1954-1966).

  • 22

    in octavo. Aceast cifr va fi depit la finalizarea tipririi ntregii ediii, care va cuprinde cel puin 26 de volume.

    Tabelul de mai jos cuprinde o sistematizare statistic a volumelor din seria nou a Dicionarului, aprute pn n prezent. Sunt evideniate numrul de pagini, numrul cuvintelor-titlu, precum i centrul de cercetare unde a fost redactat fiecare parte, obinnd o imagine de ansamblu asupra volumului de lucru i a ritmului de publicare.

    Dicionarul limbii romne (DLR). Serie nou. Anul

    apariiei Locul

    elaborrii Tom Parte Liter Numr

    pagini Numr intrri

    1965 1968 Bucureti VI M 1076 9653 1971 Bucureti VII 1 N 548 5493 1969 Cluj-

    Napoca VII 2 O 400 3622

    1972 Bucureti VIII 1 P 357 4006 1974 Bucureti VIII 2 P 336 3784 1977 Bucureti VIII 3 P 255 2738 1980 Bucureti VIII 4 P 393 4558 1984 Bucureti VIII 5 P 525 4692 1975 Cluj-

    Napoca IX R 641 7255

    1986 Bucureti X 1 S 388 3540 1987 Bucureti X 2 S 300 2212 1990 Bucureti X 3 S 349 2692 1992 Bucureti X 4 S 371 2757 1994 Bucureti X 5 S 721 5742 1978 Iai XI 1 271 4528 1982 Cluj-

    Napoca XI 2 T 376 5027

    1983 Cluj-Napoca

    XI 3 T 387 4217

    1994 Cluj-Napoca

    XII 1 240 3856

    2002 Cluj-Napoca

    XII 2 U 468 2347

    1997 Iai XIII 1 V 325 1747 2002 Iai XIII 2 V 426 2396 2000 Bucureti XIV Z 409 4088

    Figura 1. Lista tomurilor DLR editate pn n 2005.

  • 23

    Din Figura 1 rezult c numrul total de pagini al volumelor tiprite pn n prezent este de 9.562, iar lista cuvintelor definite n dicionar cuprinde 90.950 de intrri. Numrul citatelor din DLR, reprezentnd cca 88% din totalul textului, este, n prezent, de peste 3.200.000 (pentru ultimele aproximri, cf. [Vintil-Rdulescu, 2002: 22]).

    Dicionarul a fost elaborat cu mijloace tradiionale. Abia dup 1990 a nceput introducerea informaiei din DLR n memoria calculatoarelor i editarea volumelor cu asisten computerizat, eliminndu-se etape i faze care ngreunau mult ritmicitatea publicrii. Pe lng creterea randamentului n tiprire, exist avantajul salvrii textului pe suport electronic, ceea ce poate eficientiza mult procesul de achiziionare integral a DLR n format electronic, aa cum vom arta mai jos.

    2.1.1. DLR dicionar general explicativ al limbii romne n calitate de dicionar general, DLR nregistreaz i explic toate

    cuvintele atestate n vorbirea popular, n limba literar i n limbajul literaturii artistice. Terminologia de specialitate (v. exemplul 1) intr n DLR numai n msura n care a ptruns sau exist tendina evident de a ptrunde n limba literar general, n limbajul artistic sau n limba popular, altfel spus, dac aceast terminologie este atestat curent n cel puin dou stiluri diferite ale limbii.

    exemplul 1:

    VENTL s. n. (Tehn.) Dispozitiv cu care se regleaz nchiderea sau deschiderea unui orificiu de trecere pentru lichide i gaze; uber (1), registru (II 5), sertar (2). V. s u p a p . Prin o mic deschidere numit ventil se slobod prticelele a acestei ape care ndat se prefac n aburi. IC. LUM. (1840), 361/12. Vine aerul n reeptorul comun, unde, apsnd ventilurile de gratia zaluzelelor, le nchide. CUCIURAN, D. 29/2, cf. 28/34, STAMATI, D., POLIZU, ENC. ROM., BARCIANU, ALEXI, W., RESMERI, D., NICA, L. VAM. 268. Aparatul de sudat autogen se compune din: rezervor, butelie de oxigen, manometru, ventil de reducere. IOANOVICI, TEHN. 163, cf. ENC. AGR., SCRIBAN, D. Din [cilindru] iese fluidul prin nite organe numite ventile, supape sau sertare. SOARE, MA. 107. Alimentarea cu abur se face prin ventil separat prevzut pentru fiecare etaj. IONESCU-MUSCEL, ES. 149. Conductelecomunic prin ventile i robinete. BOGZA, A. . 30. Prin deschiderea ventilului principal, aerul comunic cu camera de vid. SANIELEVICI, R. 75, cf. LTR2, DL, DP, DM, DER, L. ROM. 1967, 493, M. D. ENC., DEX, DN3. F i g . Demonismul su refulat i-a gsit o nalt expresie n mitul demonicului: un ventil romantic care asigura linitea btrnului nelept. BLAGA, Z. 246. Ventil de siguran = supap de siguran, v. s u p a p . Cf. ENC. AGR., LTR2. S p e c . Dispozitiv de nchidere a valvei unei camere de cauciuc (la biciclet, la automobil etc.). Cf. LTR2, DER, L. ROM. 1967, 493.

    Pl.: ventile i ventiluri. Din germ. Ventil.

  • 24

    Pentru c DLR este un dicionar tip tezaur lexical, care are i un caracter istoric, sunt prezeni aici, pe lng termenii populari (v. exemplul 2), toate regionalismele (ex. 3) i arhaismele (ex. 4).

    exemplul 2: VIFOREL s. f. (Popular) Faptul de a v i f o r (1); suflare violent a

    vntului (nsoit de ninsoare); viscolire, viscoleal; (popular) viforre (1). Cf. I. GOLESCU, C., COSTINESCU, DL, DM, DEX, DSR. Dar-ai, Doamne,... De cu sear ploi, ninsoare, Peste noapte viforeal. TEODORESCU, P. P. 74.

    Pl.: viforeli. Vifor + suf. -eal.

    exemplul 3:

    VIU s. n. I. 1. (Transilv. i Ban.) Dalt. V. r z u . (1). Cf. ANON. CAR., KLEIN, D. 451, 456. Au cumprat lemnul din pdure, l-au tiat i l-au adus acas, apoi ncepnd a lucra, i-au trebuit: vieul, sfreadelul, ciocanul sau maiul i ghilul. PETROVICI, P. 213/10, cf. LB, ISER, LM, DR. IV, 161. la nu-i vieu pentru cioplit pietri. VLASIU, A. P. 474, cf. SCL 1959, 222, TAMS, ET. WB., FLOREA, T. F., com. din VACU, L. COSTIN, GR. BN. II, 208. Viie pintru viuluit butuci la roate. ALRT II 68, cf. ALR I 1 844/315. Viu d spart piatra. ALR II 6 459 bis/53, cf. 6 459 bis/64, 6 657/36, 53, 64, 76, 105, 235, 250, 316, 325, 334, 346, 6 658/36, 47, 53, 64, 76, 105, 235, 260, 316, 334, 346, 353, 6 678/36, 47, 53, 64, 260, 316, 325, 334, 6 678 bis/36, 53, 235, 250, 260, 316, 349, ALR SN II h 546, ALRM SN I h 366. Sculpteaz n lemn de tei cu viul. MAT. DIALECT. I, 198, cf. TEAHA, C. N. 220.

    2. (Transilv. i prin Ban.; i n sintagma viu de orublit, ALR SN II h 563/349) urubelni (1). Cf. ALR II 6 652/250, 325, ALR SN II h 563, ALRM SN I h 364. P. r e s t r. (Regional) Lama urubelniei (1). Cf. ALR II 6 654/64, 235, 250, 349.

    3. (Prin Transilv.) Sfredel (1). Cf. ALR I 1 830/63, 87. (Regional) Coarb (Vlcani Snnicolaul Mare). Cf. ALR SN II h 562/47, ALRM SN I h 373/47.

    4. (Prin Transilv. i prin Ban.) Priboi1 (I 1). Cf. ALR SN II h 545/53, ALRM SN I h 365/53.

    5. (Prin Transilv.) Gealu. Cf. CHEST. II 239/299. 6. (Prin Transilv. i prin Ban.) Cuitoaie (a potcovarului). Cf. ALR SN II h

    539, ALRM SN I h 354. 7. (Regional; n dogrie) Ciumpei (Dobra Deva). Cf. ALR II 6 704/105. 8. (Regional) Un fel de cuit, ntrebuinat de dogari, la facerea cercurilor

    (Dobra Deva). Cf. ALR II 6 702/105. 9. (Regional) epu (I 3 f) (Ghilad Timioara). Cf. ALR II 6 618/36. II. (Regional; n forma vilu) Fiecare dintre cei patru stlpi de lemn de la

    colurile acoperiului unei case rneti (Cricior Brad). Cf. CHEST. II 112/399.

    III. (Regional; n forma vilu) Loc n form de an (Marga Oelu Rou). L. COSTIN, GR. BN. II, 208.

    Pl.: vieie i viau (SCL 1959, 222, ALR II 6 652/325, 6 657/53, 316, 325, 334, 346, 6 658/53, 334, 346, 6 678 bis/235, 250, 260, 316, 349, ALR SN II h 546/53, h 563/250). i: vilu (SCL 1959, 222, L. COSTIN, GR. BN. II, 208, CHEST. II 112/399, ALR II 6 657/353, 6 658/353, ALR SN II h 546/353, ALRM SN I h 366/353; pl. vilaie, CHEST. II 112/399 i vilau, SCL 1959, 222, ALR II 6 657/353, ALR SN II h 546/353), jiu (KLEIN, D. 451, TAMS, ET. WB. 859), jilu (KLEIN, D. 451, TAMS, ET. WB. 859, 860) s. n.

    Din magh. vs (dial. vs).

  • 25

    exemplul 4: VNGERE s. f. (nvechit) Aciunea de a v i n g e i rezultatul ei. V.

    v i n c e . 1. Victorie1, biruin. Cf. v i n c e (1). Cf. LB. Prin vingeri i prin vingeri

    triele v scad -ast snge ce lenund le sap din temei. Nu refuzai o pace, o pace-ntremtoare! HELIADE, O. IV, 482. Dup ani ase vezi, n fine, ara ta, Ce din inim-ai trdat-o -al tu bra o apra. Vingerele-i snt nscrise p-aceti muri, o, dezertor De legi, credine. id. ib. 585, cf. ISER. Ceiali toi i nchipuia c distrugerea barbarilor la Maraton prin vincerea atenienilor era finitul rezbelului. ARISTIA, PLUT. 292/27. Mrei n cugetul lor, ngmfndu-se de precedentele vinceri, se rspndiser fr a se mai teme de nimic. id. ib. 367/13.

    2. (n forma vengere) Biruin, trimf (3). Cf. v i n c e (2). C tot nscutul de la Dumnezeu nvenge lumea, i aceasta iaste vengerea ce venge lumea: credina voastr. CORESI, L. 202/5.

    Pl.: vingeri i (nvechit, rar) vingere. i: vncere, vincre (DA II1, 871), vncere (ib.), vngere s. f.

    V. vinge.

    Cuvintele de argou (exemplul 5) au fost introduse n dicionar numai n msura n care au ptruns n limbajul familiar i/sau n cel artistic. n dicionar apar i creaiile lexicale ale unor autori de dicionare (v. ex. 6) ori ale unor scriitori (v. ex. 7), dar numai n msura n care acestea intr n uz i sunt adoptate i de ali autori sau sunt prezente n limba literar general. De asemenea apar n DLR ca intrri i cuvinte care se ntlnesc numai n expresii (v. ex. 8), precum i cuvinte ce apar numai n unele limbaje speciale (poezie popular - v. ex. 9, descntece - v. ex. 10, ghicitori - v. ex. 11 etc.).

    exemplul 5:

    VERZIOR s. f. (Argotic) Bancnot de culoare verde (I 1). Cf. BUL. FIL. IV, 130, IORDAN, STIL. 351.

    Pronunat: -zi-oa-. Pl.: verzioare. Verde + suf. -ioar.

    exemplul 6:

    VETEJEL s. f. (n dicionarele din trecut) Vetejire (I 1). Cf. BUDAI-DELEANU, LEX., LB, VALIAN, V., POLIZU, PETRI, V., COSTINESCU, BARCIANU, ALEXI, W.

    Pl.: vetejeli. i: vetezl (LB), vetezel (BARCIANU), vestezel (COSTINESCU) s. f.

    Veteji + suf. -eal. exemplul 7:

    VISCERIE s. f. (Livresc; cu sens colectiv) 1. Viscere (1). (F i g .) Visceraia aparatelor era aa de inextricabil, nct inginerul edea mereu cu o lup de ceasornicar la un ochi. CLINESCU, S. 326.

    2. F i g . Viscere (2). Lutarul se agit, vine cu arcuul pn la urechea ta, i rscolete visceraia, n limbaj comun, mruntaiele. CLINESCU, C. O. 163.

    Din lat. visceratio, -onis.

  • 26

    exemplul 8:

    VIM s. n. (Prin Mold; n e x p r .) A da (cuiva) vim = a da curaj, putere. Com. FURTUN. Mai d-le cte un vim, c-un rachiua. ib.

    Etimologia necunoscut. exemplul 9:

    VRLVIR, -OR adj. (ntr-o poezie popular) Diminutiv al lui v r l a v (1). Cf. UDRESCU, GL. Puior de vduvioar, Tnr i vrlvioar. id. ib.

    Pl.: vrlviori, -oare. Vrlav + suf. -ior.

    exemplul 10: VLSTOE adj. (Prin Maram.; ntr-un descntec; despre stele) Care

    aduce rod1 (1), belug. Una stea vlstoa, Dou stele vlstole,... Sus p stele rdica, n srunia asta o-arunca, De-aiasta a bea -a mnca s-a ncrca De unt de groscior. T. PAPAHAGI, M. 140.

    Pl.: vlstoele. Vlstos + suf. -ea.

    exemplul 11: VILVT s. m. sg. (ntr-o ghicitoare) Mo1 (1) (pe capul unor psri). Cf.

    PASCU, C. 218. Am o psric cu vilvat; eu-n sus c-o ridic, ea cnt firfilic; eu-n jos o las, ea face pac n nas (Plosca). id. ib.

    Etimologia necunoscut. O situaie aparte o au compusele, care sunt lucrate n articole

    de sine stttoare dac sunt perfect sudate (v. ex. 12) sau dac cel puin unul dintre elemente nu exist independent n limb, ori dac au fost mprumutate ca atare. Toate celelalte situaii se lucreaz, n genere, sub primul lor element constitutiv (v. ex. 13). n schimb, toate derivatele constituie intrri n dicionar (v. ex. 14).

    exemplul 12: VINRS s. n. (Regional, mai ales n Transilv.) Rachiu (din vin, din

    cereale, de prune etc.). [...] Scris i: vin ars (art. i vinul ars), vin-ars. Pl.: vinarsuri. i: vinr

    s. n. ALR I 1 673/269. Vin + ars (dup germ. Branntwein).

    exemplul 13: V2 s. f. I. 1. (De obicei determinat prin de vie) Arbust din familia

    vitaceelor, cu rdcina puternic, cu tulpina scurt, din care se dezvolt mldie lungi i subiri care se aga prin crcei, cu frunze mari, lobate, cu inflorescena n racem i cu fructe sub form de boabe suculente, sferice sau ovale, de culoare verde-glbuie, roie etc., dispuse n ciorchini; vie1 (1) (Vitis vinifera). [...] C o m p u s e : vi-alb = a) arbust agtor din familia ranunculaceelor, cu tulpina subire, cu frunze penate i cu flori albe, odorante, dispuse n panicule; crete mai ales prin pduri; curpen, (rgional) luminoas, viioar (I a), vie-pdurean (v. v i e 1 ) (Clematis vitalba). Cf. CONV. LIT. XXIII, 1062, CIHAC, I, 318, BRANDZA, FL. 33, DAM, T. 187, GRECESCU, FL. 22. Cu decoctul viei-albe, adec a curpenului se spal femeile pe cap, ca s le creasc prul lung. CANDREA, F. 310, cf. PANU, PL., INEANU, D. U., CADE, ENC. AGR., SCRIBAN, D., DL, DM, BORZA, D. 49, 301, FLORA R. P. R. II, 538,

  • 27

    DEX, DSR; b) (regional) luminoas (Clematis recta). Cf. CONV. LIT. XXIII, 571, BORZA, D. 49, 301; c) (nvechit) mprteas (Bryonia alba). Cf. GCR I, 3561/24, BARCIANU, ALEXI, W.; (regional) vi-neagr = fluiertoare (Tamus communis). Cf. CONV. LIT. XXIII, 1062, BRANDZA, FL. 447, GRECESCU, FL. 555, TDRG, PANU, PL., CADE, ENC. AGR. II, 576, BORZA, D. 167, 302, FLORA R. P. R. XI, 436, DSR; (regional) via-evreilor = a) (i n formele via-evreului, HEM 721, CONV. LIT. XXIII, 1062, BORZA, D. 161, 301, via corcilor, CONV. LIT. XXIII, 1062, TDRG, PANU, PL., BORZA, D. 161, 301, DSR) lsnicior (Solanum dulcamara). Cf. DDRF, GRECESCU, FL. 420, BIANU, D. S., TDRG, PANU, PL., BORZA, D. 161, 301, DSR; b) zrn (Solanum nigrum). Cf. BORZA, D. 161, 301. [...]

    exemplul 14:

    VERDE s. f. [...] Pl.: verdeuri i (nvechit i popular) verdee, (nvechit) verdeure. Verde + suf. -ea. VISTIERNICES s. f. Soie sau fiic de vistiernic (1); vistiereas. [...] Pronunat: -ti-er-. Pl.: vistiernicese. i: visternices s. f. Vistiernic + suf. -eas.

    Omonimia se rezolv n DLR prin raportarea la etimon, astfel c dou grupuri sonore identice formeaz uniti lexicale separate, atunci cnd au etimologie diferit (v. ex. 15).

    exemplul 15: VIR1 s. m. 1. Paznic la vie1 (2); lucrtor (i proprietar) al unei vii1; (rar)

    persoan specializat n cultura viei de vie i n producerea vinurilor, v i t i c u l t o r ; (nvechit i regional) via, (regional) vineler. V. p o d g o r e a n (II). [...]

    Pronunat: vi-er. Pl.: vieri. i: vir s. m. Vie1 + suf. -ar. VIER2 s. m. 1. Porc (1) necastrat, apt pentru reproducere; (regional)

    vierotac, vierotic. [...] Pl.: vieri. Lat. verres. VIER3 subst. (nvechit i regional; de obicei cu determinarea apei)

    Vrtej (I 1). ndat ce netine apuc de intr n vierul apei, nu mai ncape alt dect s se lase n cursul ei. TMPEANUL, G. 59/9, cf. DDRF. Veni apoi n gura alului i se opri pe loc n vierul apei. VISSARION, FL. 102.

    Pl.:? Cf. v i r 3.

    Situaia este aceeai i n cazul derivatelor care, prin evoluia fonetic, ajung s fie identice (v. ex. 16).

    exemplul 16: STRUNGR1 s. m. 1. Muncitor calificat n prelucrarea pieselor la

    strung1 (1); (regional) strujitor. [...] Pl.: strungari. [...] Strung1 + suf. -ar. STRUNGR2, - s. m., s. n., adj. I. 1. S. m. (Popular) Cioban care mn

    oile la strung1 (1) pentru a fi mulse; p. ext. persoan care ndeplinete diverse munci la stn; (regional) strungaci (1), strunga (1) [...]

    Pl.: strungari, -e. i: (regional) strungriu s. n. Strung1 + suf. -ar.

  • 28

    Sunt luate n considerare i expresiile, locuiunile (v. ex. 17), proverbele, zictorile; locul unitilor frazeologice n DLR este n funcie de termenul care imprim unitii o valoare semantic nou.

    exemplul 17: VRDE [...] L o c . a d v . n verde = (n legtur cu verbul a se

    mbrca) n haine de culoare verde (I 1). Se apleac adnc ca s srute mna unei btrne mbrcat n verde. M. I. CARAGIALE, C. 76. E x p r . A i se face (cuiva) verde naintea ochilor sau, regional, a vedea verde = a i se face (cuiva) ru (de mnie, de suprare etc.). Cf. DL, DM, M. D. ENC., DEX. Munciam pn vedeam verde i tot nu ne pltiam. GRAIUL, I, 195. [...]

    Proverbele i zictorile sunt introduse n dicionar numai dac au forme bine fixate n limb i sunt explicate pe baza izvoarelor din care au fost extrase ori n care sunt explicate (v. ex. 18).

    exemplul 18: VT [...] (n proverbe i zictori) Vitele se adap cu ap, i oamenii

    cu vorbe adnci. id. ib. X, 158. De la iarba de runc, vitele se mpung. CONV. LIT. XXV, 714, cf. ZANNE, P. I, 276. Gardul ru nva vita viclean. I. CR. I, 57. Vita cu cutare i aduce de mncare. I. GOLESCU, ap. ZANNE, P. VIII, 152. Numai cu vitele se scoate srcia din cas afar. ISPIRESCU, L. 210, cf. ZANNE, P. I, 692. Avu zile grmdite Ct carul cu patru vite = se spune a) despre cineva care ajungnd la o vrst naintat este privit ca o povar pentru cei care l ngrijesc. Cf. PANN, P. V. III, 141/11, ZANNE, P. II, 536; b) despre cineva care a scpat dintr-o primejdie, dintr-o boal etc. Cf. PANN, P. V. III, 141/11, ZANNE, P. I, 24, II, 536. Vitelor care treier nu li se leag gura (= acela care muncete are dreptul s se foloseasc i el de rezultatele muncii sale). Cf. ZANNE, P. I, 692. Omul la om trage i vita la vit. PANN, P. V. I, 13/22, cf. ZANNE, P. I, 373. Ochiul stpnului ngra vita. ZANNE, P. IV, 621, cf. 622. Parc i-a tiat vita de la gard, se spune despre un om suprat i posac. Cf. id. ib. III, 165. Au mncat i cei de-au pierdut vitele, se spune, ironic, atunci cnd ora mesei nu este respectat i se mnnc la ore trzii. Cf. CIAUANU, V. 210. Unde vitele nu rage (= departe). Cf. TEODORESCU, P. P. 387, ZANNE, P. IX, 732. [...]

    Caracterul explicativ al dicionarului se reflect n faptul c

    lexemele sunt definite i explicate n toate accepiile lor cunoscute, indiferent de frecven sau de rspndire geografic (exceptnd un numr foarte mic de regionalisme i arhaisme rare, semnalate fr glosri n unele izvoare). Spre a gsi soluii ct mai adecvate varietii mari a faptelor [de limb], s-au utilizat mai multe procedee de definire: definirea prin genul proxim i diferena specific, delimitarea valorilor semantice cu ajutorul sinonimelor, compararea termenului explicat cu termenii mai apropiai sau mai ndeprtai ca neles i indicarea funciunilor sintactice (la cuvintele instrumente gramaticale) [DLR, 1965: XI].

    2.1.2. DLR procese semantice i filiaia sensurilor Complexitatea factorilor care concureaz la evoluia semantic a

    lexicului face ca fiecare cuvnt s aib propria sa istorie, ca rezultat al unor transformri specifice, pe fondul proceselor semantice cu

  • 29

    caracter general (trecerea de la propriu la figurat, analogia, extensiunea semantic, restrngerea semantic, trecerea de la concret la abstract, trecerea de la abstract la concret, specializarea i generalizarea).

    Modificrile de natur morfologic ori sintactic petrecute de-a lungul istoriei unui cuvnt sunt strns legate de evoluia semantic; de aceea, n DLR se noteaz, de exemplu, tipurile de complemente cu care se construiesc anumite verbe, se subliniaz valorile diatezelor reflexive, se precizeaz valoarea semantic a pluralului unor substantive, se menioneaz capacitatea adjectivelor de a avea grade de comparaie ori ntrebuinarea lor adverbial, se marcheaz regimul prepoziional al unor verbe, alunecarea de la o clas morfologic la alta etc.

    Varietatea i complexitatea factorilor care determin evoluia semantic a cuvintelor se reflect n tehnica lexicografic de grupare a sensurilor.

    Exist n DLR trei tipuri fundamentale de filiaie a sensurilor: n lan, n raze i arborescent (v. Anexa 2, ex. 19, 20, 21).

    n primul caz, un sens nou se dezvolt dintr-un sens anterior, ntr-o linie simpl, continu; n cazul al doilea, fiecare sens dezvolt, radiant, mai multe sensuri; al treilea caz reprezint o combinare a primelor dou, n anumite poriuni din structura semantic a cuvntului filiaia producndu-se liniar, iar n altele dezvoltndu-se radiant.

    Aceste trei tipuri de filiaie semantic sunt redate n DLR prin semne i procedee tehnice specifice. O structur liniar se red prin numerotarea sensurilor cu acelai tip de cifre (arabe, mai ales) n succesiunea istoric a acestor sensuri, ntr-o schem de tipul:

    CUVNT TITLU indicaii morfologice 1. Definiie. Exemplul 1. sigl... Exemplul n. sigl.

    2. Definiie. Exemplul 1. sigl ... Exemplul n. sigl. ... Indicaii gramaticale, ortoepice, de circulaie, variante lexicale. Indicaii etimologice. Celelalte dou tipuri de filiaie impun utilizarea mai multor semne.

    Le enumerm n ordinea descresctoare ierarhic: litere majuscule, cifre romane, cifre arabe, litere mici i semne grafice speciale ( i - romburi albe i negre).

    Semnele grafice speciale se pot subordona, deopotriv, sensurilor notate cu cifr arab i celor notate cu liter mic, mai rar, direct celor notate cu cifr roman.

  • 30

    Romburile servesc la precizarea unei nuane de sens, la desprirea sintagmelor, a locuiunilor, a expresiilor i la izolarea cuvintelor compuse care nu sunt cuvinte-titlu (intrri). Rombul negru este urmat ntotdeauna de o definiie, pentru c marcheaz o difereniere semantic mai mare; rombul alb semnaleaz mai ales schimbrile de ordin stilistic ori gramatical. Schema general a unor astfel de articole ar putea fi, pentru filiaia radial:

    CUVNT TITLU indicaii morfologice A. indicaii morfologice I. indicaii morfologice 1. Definiie.

    Exemplu 1. SIGL... Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... II. indicaii morfologice 1. Definiie. Exemplu 1. SIGL...

    Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... B. I. indicaii morfologice 1. 1. Definiie. Exemplu 1. SIGL...

    Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... II. indicaii morfologice 1. Definiie. Exemplu 1. SIGL...

    Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... C. indicaii morfologice I. indicaii morfologice 1. Definiie.

    Exemplu 1. SIGL... Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... II. indicaii morfologice 1. Definiie. Exemplu 1. SIGL...

    Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... Indicaii gramaticale, ortoepice, de circulaie, variante lexicale. Indicaii etimologice. pentru filiaia arborescent: CUVNT TITLU indicaii morfologice I. indicaii morfologice

    1. Definiie. Exemplu 1. SIGL... Exemplul n. SIGL. 2. Definiie. Exemplul 1. SIGL ... Exemplul n. SIGL. ... II. indicaii morfologice Definiie. Exemplu 1. SIGL ... Exemplul

    n. SIGL.

  • 31

    ... Indicaii gramaticale, ortoepice, de circulaie, variante lexicale. Indicaii etimologice. Stabilirea ordinii sensurilor se realizeaz n funcie de etimon,

    atunci cnd vechimea atestrilor susine acest principiu. n caz contrar, principiul etimologic se mbin cu acela al logicii lingvistice i semantice.

    Situaia este relativ diferit din acest punct de vedere n cazul neologismelor. n definirea acestora, primul sens este considerat de obicei a fi sensul pe care l are cuvntul n primele atestri romneti scrise, chiar dac acesta difer de sensul de baz din limba de origine.

    Analizndu-se experienele din tradiia lexicografic romneasc n privina etimologiei, n DLR s-a optat pentru aplicarea a trei principii etimologice:

    principiul etimologiei interne (v. ex. 22), principiul etimologiei directe (v. ex. 23), principiul etimologiei multiple (v. ex. 24).

    exemplul 22:

    VERZIR, -OR adj., subst. I. Adj. Diminutiv al lui v e r d e (I 1); (regional) verzel. [...]

    Pl.: verziori, -oare. i: (regional) verdir, -or adj. Verde+ suf. -ior.

    exemplul 23: VIRUSOLG, - s. m. i f. Specialist n virusologie; virolog. Cf. DN3,

    DEX2. Pl.: virusologi, -e. Din fr. virusologue.

    exemplul 24: VERB s. n. 1. (Gram.) Parte de vorbire care exprim o aciune, o stare

    sau o transformare (progresiv) a subiectului i care se caracterizeaz printr-o flexiune proprie, numit conjugare. [...]

    Pl.: (1) verbe i (nvechit) verburi, (m.) verbi. i: (nvechit, rar) vrbum s. n.

    Din lat. verbum, fr. verbe, it. verbo.

    Etimologia intern presupune cutarea originii unui cuvnt n sistemul de formare a cuvintelor pe terenul limbii romne. Acest tip de etimologie privete mai ales cuvintele motenite din latin, care au generat un mare numr de derivate i compuse. Tot din latin a fost motenit i sistemul de formare a cuvintelor, care st la baza mecanismului creaiei lexicale pe teren romnesc, indiferent de originea cuvintelor ce formeaz familii lexicale ori compuse.

    Etimologia direct, curent folosit n dicionare explicative (i istorice) generale, presupune stabilirea originii cuvntului romnesc, fr a se lua n considerare i originea etimonului.

  • 32

    Etimologia multipl exprim faptul c un cuvnt poate proveni din mai multe surse, simultan sau n epoci diferite8.

    2.2. Instrumente i resurse lexicografice romneti informatizate Cercetarea lexicografic romneasc folosete mijloacele i

    metodele tradiionale. S-a manifestat totui interesul pentru utilizarea mijloacelor electronice din a doua jumtate a secolului trecut. Iorgu Iordan i, n continuare, Ion Dnil [Dnil, 2000: 36-37] au elaborat programe ample de realizare a unor baze de date i a unor instrumente care s serveasc la modernizarea metodologiei de lucru pentru realizarea dicionarelor i a studiilor generale referitoare la istoria limbii, pentru cercetarea gramatical i stilistic a limbii, analiza limbajelor speciale etc. Ca rezultat al acestor iniiative, la Institutul de Lingvistic Iorgu Iordan s-a nceput, din 1978-1980, elaborarea primei bnci computerizate de date lingvistice din Romnia, BANDASEM (Banca de date fono-morfo-semantic a limbii romne). La dezvoltarea BANDASEM a colaborat i Institutul de Lingvistic S. Pucariu din Cluj-Napoca, prin realizarea prii de fonetic/grafematic i de morfologie. S-a creat la Institutul I. Iordan modulul de semantic, proiectat pentru un Dicionar confruntativ de sinonime, de analogii i de asociaii al limbii romne (DCSAAs), redactat, cu mijloace tradiionale ns, pn la litera S. S-a mai realizat, la acelai Institut, o Banc de inovaii a limbii romne, bazat pe monitorizarea presei scrise i audiovizuale actuale, proiect suspendat n favoarea finalizrii ediiei a doua a Gramaticii Academiei. Un alt proiect, demarat n 2003, este crearea unei baze de date care s cuprind informaiile din DOOM1 ntr-o form sistematizat i care s permit elaborarea unui DOOM2 i a unor dicionare specializate, actualizarea lor permanent, precum i gruparea cuvintelor n clase, n funcie de caracteristicile lor fonetice, grafice i morfologice. Institutul I. Iordan A. Rosetti a colaborat, prin cercettorii si, cu Asociaia Romn TermRom la realizarea BDT (Banca de date terminologice) i are n proiect elaborarea sau definitivarea unor dicionare terminologice bi- i multilingve, care valorific rezultatele proiectului PRACTEAST din cadrul programului COPERNICUS al Comisiei Europene [Vintil-Rdulescu, 2002: 28-29]. Romnia este reprezentat, prin Ioana Vintil-Rdulescu

    8 Aa cum am artat mai sus, prima lucrare lexicografic n care este

    utilizat principiul etimologiei multiple este Dicionarului limbii romne, redactat de A. T. Laurian i I. C. Massim.

  • 33

    n Reeaua Panlatin de terminologie (Realiter) i n Reeaua Francofon de Amenajare Lingvistic (Rifal) [Matei, 2000: 56-58].

    La acelai institut bucuretean se afl n curs de elaborare o Banc de texte romneti, iniiat de acad. Marius Sala, care cuprinde deocamdat un corpus de texte din secolele al XVI-lea al XVIII-lea, integral digitizat, i care se prevede s cuprind cteva sute de texte din toate epocile. n prezent se lucreaz la pregtirea textelor n vederea reprezentrii lor n formatul electronic necesar prelucrrilor automate i utilizrii lor ca resurs informatizat pentru realizarea proiectelor viitoare. Se dorete ca aceast Banc de texte romneti s fie introdus ntr-un corpus comun cu Banca de texte din faza modern i contemporan a limbii romne, proiectat a se realiza la Centrul de Studii Romneti de pe lng Universitatea din Anvers [Vintil-Rdulescu, 2002: 30].

    2.3. DLR informatizat (DLRI) o necesitate i un deziderat Avnd n vedere faptul c redactarea integral a DLR urmeaz a se

    finaliza n scurt timp, prin mijloacele tradiionale de lucru, se pune problema relurii i actualizrii seriei vechi a Dicionarului limbii romne (DA), publicat nainte de 1949. Acest lucru este cu att mai necesar cu ct tirajele fasciculelor editate n prima jumtate a secolului trecut au fost reduse ca numr, nct puine biblioteci dein seria complet a acestui dicionar, iar mbtrnirea hrtiei face ca utilizarea volumelor respective s fie dificil. Pe de alt parte, volumele publicate dup 1965 au aprut n tiraje diferite i n continu scdere; acest fapt se petrece n condiiile n care un instrument ca DLR este absolut indispensabil cercettorului romn i strin interesat de studiul limbii romne. Chiar DLR suport adugiri i completri, datorit faptului c multe neologisme, ptrunse n limb de la nceputul secolului al XX-lea, regionalisme incluse n Atlasele lingvistice sau n culegeri de texte editate n ultimele decenii precum i termeni vechi extrai din documente aparinnd secolelor al XVI-lea al XVIII-lea editate n ultimele decenii [Sala, Mihil, n DLR, 2000: VI] nu au fost cuprinse n primele volume ale seriei noi i lipsesc, parial, i din celelalte tomuri.

    De aceea, ideea achiziionrii DLR n format electronic constituie o soluie la toate problemele unei reeditri a Dicionarului limbii romne de la A la Z, ceea ce presupune reluarea, unificarea, actualizarea ntregului material din DA i DLR. Avantajele utilizrii DLRI ar spori cu att mai mult cu ct este posibil valorificarea bncilor de date n curs de elaborare la Institutul Iorgu Iordan A.

  • 34

    Rosetti (Banca de texte romneti, BANDASEM, Banca de inovaii a limbii romne, baza de date DOOM, BDT, realizat de TermRom).

    Realizarea DLRI are urmtoarele avantaje: se realizeaz o ampl baz de texte/atestri utilizabile n

    actualizarea articolelor din DA i a celor din primele volume ale DLR, avnd n vedere numrul foarte mare de citate din DLR;

    se pot face completri i corectri direct n textul DLR, fr a mai fi necesar tehnoredactarea textului, aa cum s-a procedat la tomurile DLR publicate dup 1990;

    se pot observa i corecta mult mai uor inconsecvenele i diferenele existente ntre volumele DLR datorate faptului c lucrarea a fost elaborat de mai multe generaii de redactori, n trei centre diferite, n manier sensibil diferit;

    se pot extrage modele de definire (exist formule tipizate n cazul anumitor termeni precum erele geologice, lunile anului, zilele sptmnii, numele de plante i animale sau n cazul anumitor pri de vorbire, precum numeralul, pronumele .a.) care s fie generate automat, redactorului lexicograf rmnndu-i sarcina de revizuire a definiiilor;

    se pot face alinieri de sens cu dicionare strine de acelai tip, care s poat fi utilizate ulterior n ameliorarea traducerilor automate i n dezambiguizarea semantic;

    poate fi utilizat ca surs semnificativ de informaii n cercetri de lingvistic computaional dedicate limbii romne;

    tehnologia informatic ce l va nsoi va face posibil accesul ncruciat pe intrare, sens, exemplu etc., cu indexarea automat a diferitelor resurse lexicale, inclusiv a DLRI nsui;

    dar, mai ales, va constitui suport i surs de inspiraie pentru proiecte lexicografice ndrznee, ca, de exemplu, o tehnologie ce ar actualiza semiautomat coninutul dicionarului n ritm cu evoluia limbii;

    poate fi publicat mult mai ieftin pe suport electronic, valorificnd, pentru cei interesai, i informaia din MDA [Micul dicionar academic 20012004].

  • 35

    Din colaborarea ntre informaticienii ieeni i lingvitii de la Institutul A. Philippide a aprut ideea realizrii, mpreun, a unui program de transpunere a DLR din forma tiprit n format electronic, adic a realizrii unui instrument lexicografic la nivelul standardelor internaionale. n acelai timp, DLR electronic constituie o adevrat banc de date un corpus uria de cuvinte definite, explicate, ierarhizate semantic i aliniate cu alte dicionare romneti i europene. Numrul foarte mare de citate este, de asemenea, o calitate foarte important a DLR, pentru c fiecare atestare este definit i suma acestor contexte devine o resurs n realizarea unor programe de dezambiguizare semantic pentru limba romn9. La propunerea profesorului dr. Dan Cristea, a fost iniiat un proiect n cadrul cruia s se propun o tehnologie de achiziionare i s se realizeze un studiu de fezabilitate a acesteia.

    O echip format din lingviti lexicografi i informaticieni [v. Anexa 1] de la Facultatea de Informatic a Universitii Alexandru Ioan Cuza a propus acest proiect Ministerului Educaiei i Cercetrii spre susinere bugetar. Astfel, n urma competiiei de proiecte a CNCSIS pentru anul 2003, Institutul A. Philippide a obinut finanare pentru proiectul Dicionarul limbii romne (DLR) n format electronic. Studii privind achiziionarea pentru o perioad de trei ani. Proiectul a fost finalizat cu succes. Echipa de cercetare, mbogit n timp, a reuit s construiasc un instrument de achiziie a DLR n format XML10, numit convenional DLRex, care, bazat pe o euristic specific DLR i printr-o interfa12 prietenoas, permite accesarea informaiei din DLR electronic, adugarea de pagini precum i corectarea sau modificarea textului DLR, n vederea realizrii unei a doua ediii, uniformizate i actualizate. Este de remarcat c opiunea pentru o notare n XML a coninutului dicionarului permite accesul

    9 n lucrarea sa de licen, Determinarea sensurilor cuvintelor folosind DLR informatizat (i. e. eantionul propus spre achiziionare), 2005, Bogdan-Mihai Aldea a reuit s stabileasc sensul a apte verbe ncepnd cu litera V dintr-un text neadnotat (romanul 1984 al lui G. Orwell), cu un randament de peste 70%.

    10 XML eXtensible Markup Language) (http://www.w3.org/XML/) reprezint un standard de adnotare a documentelor ce conin informaie structurat. n cazul de fa, XML permite ataarea de indicaii de coninut cmpurilor unei intrri din dicionar.

    12 Interfaa om-main permite interaciunea dintre un utilizator uman i un sistem informatic, prin operarea de ctre utilizator a unor obiecte grafice meniuri, icoane, butoane.

  • 36

    la informaii prin tehnicile uzuale ale bazelor de date ct i recuperarea formatului iniial tiprit ori modificarea acestuia, dup criteriile dorite.

    Pentru nceput este nevoie de achiziionarea integral a DLR (literele M Z i D, E, L), utiliznd mijloacele deja dezvoltate. Dei n parsarea intrrilor dicionarului o gramatic formal, constituit pe baza normelor DLR, este de preferat unui set de euristici, pentru c un proces de parsare ghidat de gramatic este de natur s pun n eviden inclusiv erorile umane de formatare, elaborarea ei este o activitate extrem de laborioas, ce necesit un efort de programare ndelungat i costisitor. De aceea, n DLRex, s-a optat, deocamdat, pentru o soluie care s aduc rezultate semnificative ntr-un timp relativ scurt: elaborarea unui mecanism de extragere de tip pattern-matching13 i a unei colecii de abloane. n felul acesta, normele DLR vor fi utilizate de program numai ntr-o faz de regenerare a paginii tiprite, activitate mult mai uor de controlat.

    Faza urmtoare presupune rediscutarea i adaptarea normelor DLR la formatul electronic, pe de o parte, i, pe de alt parte, rafinarea gramaticii DLR, n urma eventualelor adaptri. Pentru realizara unui sistem automat de extragere a atestrilor, urmat ulterior de o clasificare a acestora pe sensuri, transpunerea DLR n format informatic ar trebui completat de achiziionarea corpusului de texte utilizate ca surs bibliografic. S-ar putea trece, n aceste condiii, la corectarea, unificarea i actualizarea seriei noi a Dicionarului limbii romne.

    n ceea ce privete seria veche a Dicionarului limbii romne, DA, i aceasta ar putea fi, pentru nceput, recuperat prin scanare i apoi prelucrat n vederea achiziionrii.

    n fine, ulterior acestei faze, ce s-ar putea desfura i paralel cu fazele anterioare, ar fi posibil realizarea unei noi ediii integral unificate i actualizate a Dicionarului limbii romne14.

    13 Potrivire de abloane. 14 Vezi n acest sens propunerile fcute de Cristina Florescu la Atelierul

    de lucru Resurse Lingvistice Romneti i Instrumente pentru Prelucrarea Limbii Romne, Iai, 3 noiembrie 2005 (www.consilr.info.uaic.ro)

  • 37

    Partea a II-a Pai spre DLR informatizat

    1. Premise

    n contextul de unitate prin diversitate pe care l presupune Uniunea European i pe fondul procesului tot mai accentuat al globalizrii, pstrarea limbilor i culturilor actuale se bucur de un interes deosebit, fiind susinut de organisme internaionale precum Comisia European [Tufi, Cristea, 2002]. innd seama de situaia particular a limbii romne, este evident c orice efort n direcia meninerii identitii lingvistice contribuie i la mbuntirea comunicrii ntre toi vorbitorii de limb romn, inclusiv a celor din afara granielor rspndii n ri precum Republica Moldova, Ucraina, Ungaria, Serbia, Bulgaria, alte ri ale Comunitii Europene i ale continentului american aa cum se dorete i prin actualul program guvernamental: Guvernul Romniei are datoria a aciona pentru sprijinirea dezvoltrii i exprimarea identitii culturale a romnilor din afara granielor Romniei15.

    Colaborarea strns ntre lingviti i informaticieni poate duce la atingerea acestui scop, n contextul societii informaionale actuale. Versiunea electronic a DLR unificat i actualizat obiectiv de viitor, pentru care demersul de fa nseamn o baz de pornire va oferi comunitii romnilor de pretutindeni, dar mai ales lingvitilor i, cu deosebire, romanitilor, tezaurul limbii romne, precum i mai multe posibiliti pentru aplicaiile de procesare a limbajului natural pentru limba romn, incluznd traducerea automat i cea asistat de calculator, acces multimedia inteligent la Internet, regsirea informaiei (prin cutarea unor cuvinte-cheie sau concepte), extragerea informaiei (legate de un anumit subiect, deci de un anumit cuvnt-cheie), sumarizare automat, dezambiguizare semantic, achiziia de cunotine etc.

    Prin obiectivele sale, proiectul Dicionarul limbii romne (DLR) n format electronic se integreaz ntr-un program amplu de informatizare a cercetrii lingvistice romneti, coordonat n prezent

    15 Programul de Guvernare, Capitolul 24 Politica n domeniul

    relaiilor cu romnii de pretutindeni, http://www.gov.ro/obiective/afis-docdiverse-pg.php?iddoc=268.

  • 38

    de Comisia de Informatizare pentru Limba Romn din cadrul Academiei Romne, Secia de tiina i Tehnologia Informaiei, subsumndu-se totodat obiectivelor prioritare privind informatizarea ale Ministerului Educaiei i Cercetrii. Scopul Comisiei de Informatizare pentru Limba Romn l constituie aprarea identitii limbii romne prin promovarea studiilor dedicate ei dintr-o perspectiv informaional [Cristea, Tufi, 2002].

    n perioada 2003 2005, s-au studiat modalitile de achiziionare n format electronic a Dicionarului limbii romne. Pe lng atingerea acestui obiectiv central, s-au putut crea i o serie de aplicaii ce faciliteaz utilizarea informatizat a materialului existent n DLR.

    n proiect au fost implicai tineri cercettori din domeniul lexicologiei-lexicografiei i din domeniul informaticii cu predilecie al lingvisticii computaionale, care au format o echip omogen, datorit faptului c dificultile de comunicare au fost depite prin specializarea interdisciplinar.

    Ulterior unei faze de documentare i verificare, s-a optat pentru utilizarea, ca formul de citire i convertire a DLR n format XML, a unei euristici specifice DLR, care permite recunoaterea, pe baza caracteristicilor formale ale textului, a unor cmpuri de text, fiecare cu semnificaie bine determinat. Realizarea obiectivului iniial care se referea la definirea unei gramatici lexicografice proprii DLR a fost amnat; atingerea acestui obiectiv s-a dovedit imposibil de realizat n condiiile date (restriciile de timp, mijloacele tehnice avute la dispoziie), rmnnd ca, dup ce se va finaliza achiziionarea DLR cu ajutorul instrumentul de achiziionare, prelucrare i consultare a DLR, creat n cadrul acestui proiect , s fie semnalate toate problemele privitoare la normele DLR n vederea rediscutrii i adaptrii acestora condiiilor de formalizare optim. Ulterior, va fi posibil definirea unei gramatici cu un numr rezonabil de reguli, astfel nct funcionalitatea i randamentul s fie mbuntite.

    2. Etapele de lucru Trecerea DLR din forma tiprit n format electronic a presupus

    cteva etape: scanarea unui eantion de pagini tiprite din fiecare fascicul

    a ediiei DLR; convertirea imaginii digitale n format .doc; s-a optat pentru

    formatul RTF (Word), din motive care vor fi dezvoltate infra; corectarea manual a erorilor aprute n urma scanrii i a

    convertirii;

  • 39

    procesarea textului cu ajutorul i transpunerea lui n format XML.

    Prelucrarea unei pagini din DLR, conform celor 4 etape descrise supra, este redat n Anexa 3.

    Odat parcurse aceste etape, s-a obinut un fiier XML care cuprinde peste 400 de pagini tiprite din DLR. Pentru parcurgerea tuturor etapelor necesare procesrii unei pagini tiprite au fost necesare, n medie, 45 de minute. Cea mai costisitoare operaie, din perspectiva timpului necesar, s-a dovedit a fi aceea de corectare. Numrul mare de erori a fost determinat de calitatea hrtiei i a tiparului din volumele editate nainte de 1990, de performanele tehnice ale scannerului i ale programului (OCR16) de recunoatere/convertire a imaginii digitale n text17. De aceea, pentru ameliorarea vitezei de lucru, este necesar mbuntirea instrumentelor tehnice, utilizarea unor programe de convertire adaptate recunoaterii simultane a mai multor limbi, inclusiv a celor ce nu utilizeaz litere latine, precum i accesul la textele tehnoredactate computaional dup 1990, pentru a se elimina etapele scanrii, convertirii i, parial, a corectrii, n cazul acestora. Chiar n condiiile actuale, este ncurajator faptul c s-ar putea realiza achiziionarea integral a DLR ntr-un timp real acceptabil, respectiv cca. 5300 de ore, ceea ce reprezint, raportat la o norm de opt ore, treizeci de luni de lucru pentru o singur persoan.

    n condiiile optimizrii condiiilor de lucru, se apreciaz c timpul s-ar reduce semnificativ: ar fi necesare cca. 3000 de ore, adic optsprezece luni pentru o persoan. O interfa de tipul DLRex ar face activitatea unui operator uman mai eficient i, cu siguran, mai plcut dect clasica dactilografiere/tehnoredactare.

    2.1. Limbajul de programare folosit i formatul fiierelor de intrare

    Ideea de baz a aplicaiei const n trecerea integral a DLR-ului din format tiprit sau parial digital ntr-un format integral electronic i anume n format XML. n urma scanrii filelor de dicionar, a convertirii acestora prin OCR i a corectrii de ctre lingviti lexicografi (care sunt familiarizai cu formatul standard al DLR-ului) au rezultat fiiere Word cu extensia .doc. Formatarea specific

    16 Un OCR, Optical Character Recogniser, permite transformarea

    imaginilor (texte scrise pe hrtie, captate de un scanner) n text editabil pe computere.

    17 Aceast modalitate de lucru a mai fost folosit. Un exemplu este realizarea bibliotecilor electronice din S.U.A. i din Frana.

  • 40

    diferitelor seciuni ale unui intrri din DLR permite trecerea dicionarului din format .doc n format XML.

    Pentru ca fiierele .doc s fie procesate cu succes de ctre DLRex, s-au studiat comparativ dou limbaje de programare, stabilind astfel care este cel optim din punctul de vedere al facilitrii lucrului cu fiierele de intrare. n prima faz s-a ncercat implementarea aplicaiei n Delphi 7 (http://www.borland.com/delphi/.), datorit componentelor integrate ale acestuia care proceseaz direct fiierul .doc. Dar, chiar dac la citirea dintr-un fiier .doc limbajul Delphi 7 pstreaz formatul textului, facnd diferenele dintre fragmentele scrise n format Normal, Italic, Bold etc., nu acelai lucru se ntmpl i n cazul secvenelor de text formatate cu SMALLCAPS. Cum fiecare exemplu pentru atestarea unui sens sau subsens al unui cuvnt conine i o sigl, adic o referire ctre bibliografie, iar sigla este n format smallcaps, folosirea limbajului Delphi nu ar permite recunoaterea siglelor care sunt interpretate ca text obinuit, n format Normal.

    Deoarece sigla este foarte important, iar recunoaterea ei n dicionar ar ajuta la parsarea acestuia, s-a optat pentru JAVA ca limbaj de programare, deoarece acesta lucreaz mai uor cu iruri de caractere (structuri de tip String n Java) i prelucrarea acestora este mai facil n acest mediu de programare. Pentru c JAVA citete foarte greu din binar (modul n care sunt salvate n fiiere documentele Word), s-a optat pentru ca formatul fiierelor schimbate ntre OCR i program s fie RTF (Rich Text Format).

    2.2. Modelul La baza parsrii DLR-ului st formatarea textului, conveniile de

    CUVNT parte de vorbire, sensul cuvntului [ exemplu ilustrativ SIGLA] A sensul cuvntului [ exemplu ilustrativ SIGLA] I sensul cuvntului [ exemplu ilustrativ SIGLA] 1 sensul cuvntului [ exemplu ilustrativ SIGLA] a) sensul cuvntului [ exemplu ilustrativ SIGLA] b) sensul cuvntului [ exemplu ilustrativ SIGLA] 2) sensul cuvntului [ exemplu ilustrativ SIGLA] II sensul cuvntului [ exemplu ilustrativ SIGLA] III sensul cuvntului [ exemplu ilustrativ SIGLA] B sensul cuvntului [ exemplu ilustrativ SIGLA]

    C sensul cuvntului [ exemplu ilustrativ SIGLA]

    - informaii ortoepice, gramaticale, de circulaie - informaii etimologice

    Figura 2: Schema general a unei intrri n DLR

  • 41

    numerotare a sensurilor i subsensurilor unui cuvnt-intrare ct i prezena unor simboluri speciale cum ar fi = rombul negru, = rombul alb (etc.). O intrare din dicionar pstreaz, n linii mari, formatul ilustrat n Figura 2.

    Apariia unui simbol special semnific introducerea unui nou sens al cuvntului: rombul alb marcheaz un sens apropiat de sensul sub care se afl sau indic un anumit regim gramatical, iar rombul negru introduce un sens mai deprtat. Ambele simboluri pot aprea oriunde sub un sens din schema unei intrri generale prezentate mai sus, nefiind specificat o anumit regul de apariie a acestora.

    Dup citirea unei intrri din dicionar se construiete un vector n care se memoreaz, n ordinea citirii din fiier, fiecare fragment cu formatare diferit fa de cele direct nvecinate (fragmentul ce l preced i respectiv cel de dup el). O parsare a vectorului, bazat pe modul de scriere al unei intrri din dicionar, ar putea duce la fiierul XML final.

    ns dei unele fragmente erau vecine n text i aveau i aceeai formatare, ele erau salvate n fiierul RTF cu formatri diferite. n aceast etap au ridicat probleme i unele caractere speciale precum (spaiul), (ghilimelele), . (punctul), , (virgula), care mai ales n interiorul unor secvene formatate n Italic sau Bold nu pstreaz acest format, fiind procesate cu format Normal. Aceste diferene de formatare, aprute n urma scanrii, sunt greu sesizabile de ctre un corector uman.

    Aceast inconsecven n formatarea unor seciuni ale unei intrri apare i n cazul siglelor: n interiorul acestora unele cuvinte au formatare diferit de cea specific siglei. Cele mai frecvente astfel de cuvinte sunt: id, ib, n, cf., din.

    Formatarea diferit a tipurilor de informaii (ortoepice, gramaticale, etimologice, etc.) precizate n finalul unei intrri pot conduce la erori n parsarea vectorului ce memoreaz secvenele formatate diferit, conform cu semnificaia lor n intrarea respectiv.

    2.3. Soluii n vederea evitrii erorilor de parsare Problemele mai sus menionate, generatoare de erori n momentul

    parsrii vectorului au fost evitate printr-o preprocesare a vectorului, anterioar parsrii. S-a urmrit aducerea vectorului ntr-o form mai restrns prin determinarea formatrii corecte a caracterelor ce nu-i pstrau formatarea corect (cazul caracterelor speciale i al cuvintelor

  • 42

    din interiorul siglelor) i prin aducerea la aceeai formatare a informaiilor din listele ce ncheie o intrare.

    Parsarea vectorului obinut n forma restrns core