EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale...

22
ION A. FLOREA, VASILE APOPEI, FLORIN-TEODOR OLARIU, SILVIU BEJINARIU EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR LINGVISTICE {I A TEXTELOR DIALECTALE La aproximativ jumătate de secol de la efectuarea anchetelor dialectale pentru Atlasul lingvistic român (ALR I, realizat de Sever Pop, şi ALR II, realizat de Emil Petrovici), ca urmare a evoluţiei fireşti a graiurilor populare sub influenţa modelatoare şi unificatoare a limbii literare, după 1960, s-a simţit nevoia unei noi cercetări a graiurilor populare. Proiectul Noul Atlas lingvistic român, pe regiuni (NALR sau ALRR) a fost iniţiat de regretaţii Emil Petrovici şi Boris Cazacu. Cu o reţea de cca. 1000 de localităţi anchetate (mult mai mare faţă de reţelele de anchetă ale ALR I şi ALR II, luate împreună) şi cu un chestionar de anchetă de 2543 de întrebări, NALR este lucrat de colectivele de dialectologi ai centrelor academice din Bucureşti (care au încheiat publicarea NALR-Olt., 5 volume, şi au publicat primele două volume din NALR-Munt.Dobr.), din Cluj-Napoca (autori ai ALRR-Maram., 4 volume, ai ALRR-Trans., 2 volume şi ai NALR-Ban., 2 volume), din Iaşi (autori ai NALR-Mold.Bucov., 2 volume) şi din Timişoara (autori ai NALR-Crişana, un volum). Alte două atlase lingvistice, unul consacrat studierii graiurilor românilor sud-dunăreni şi altul graiurilor de la răsărit de Prut (din care au apărut, sub titlul Atlasul lingvistic moldovenesc, 2 volume, fiecare cu 2 părţi, şi, cu titlul Atlasul lingvistic român pe regiuni. Basarabia, nordul Bucovinei, Transnistria, alte două volume, în 1993 şi 1998), fac parte din seria atlaselor lingvistice româneşti

Transcript of EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale...

Page 1: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

ION A. FLOREA, VASILE APOPEI, FLORIN-TEODOR OLARIU, SILVIU BEJINARIU

EDITAREA ASISTAT| DE CALCULATOR

A ATLASELOR LINGVISTICE

{I A TEXTELOR DIALECTALE

La aproximativ jumătate de secol de la efectuarea anchetelor

dialectale pentru Atlasul lingvistic român (ALR I, realizat de Sever Pop, şi ALR II, realizat de Emil Petrovici), ca urmare a evoluţiei fireşti a graiurilor populare sub influenţa modelatoare şi unificatoare a limbii literare, după 1960, s-a simţit nevoia unei noi cercetări a graiurilor populare. Proiectul Noul Atlas lingvistic român, pe regiuni (NALR sau ALRR) a fost iniţiat de regretaţii Emil Petrovici şi Boris Cazacu. Cu o reţea de cca. 1000 de localităţi anchetate (mult mai mare faţă de reţelele de anchetă ale ALR I şi ALR II, luate împreună) şi cu un chestionar de anchetă de 2543 de întrebări, NALR este lucrat de colectivele de dialectologi ai centrelor academice din Bucureşti (care au încheiat publicarea NALR-Olt., 5 volume, şi au publicat primele două volume din NALR-Munt.Dobr.), din Cluj-Napoca (autori ai ALRR-Maram., 4 volume, ai ALRR-Trans., 2 volume şi ai NALR-Ban., 2 volume), din Iaşi (autori ai NALR-Mold.Bucov., 2 volume) şi din Timişoara (autori ai NALR-Crişana, un volum). Alte două atlase lingvistice, unul consacrat studierii graiurilor românilor sud-dunăreni şi altul graiurilor de la răsărit de Prut (din care au apărut, sub titlul Atlasul lingvistic moldovenesc, 2 volume, fiecare cu 2 părţi, şi, cu titlul Atlasul lingvistic român pe regiuni. Basarabia, nordul Bucovinei, Transnistria, alte două volume, în 1993 şi 1998), fac parte din seria atlaselor lingvistice româneşti

Page 2: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

regionale. Importanţa acestei lucrări pentru lingvistica românească şi romanică, faptul că datele din atlas folosesc şi istoricilor, geografilor sau etnologilor, explică de ce NALR este înscris ca temă prioritară a Academiei Române. Din această poziţie privilegiată decurge, însă, şi obligaţia urgentării publicării tuturor volumelor aflate încă în stadiu de redactare.

Pentru început, am avut ca model Atlante linguistico italiano, vol. I, Il corpo umano, editat de prestigiosul Instituto dell’Atlante linguistico italiano, Centro di ricerca dell’Università degli Studi di Torino, şi apărut în 1995, la Instituto poligrafico e Zecca dello Stato, Roma. Dar NALR-Mold.Bucov. conţine, în plus, hărţi sintetice şi materiale necartografiate, ceea ce sporeşte complexitatea operaţiilor efectuate cu calculatorul.

În aceste condiţii, soluţia ideală pentru accelerarea publicării acestor lucrări a fost găsită la Iaşi prin colaborarea interdisciplinară dintre dialectologi şi informaticieni, care a început în anul 2000 sub forma proiectului Cercetări în domeniul foneticii şi fonologiei limbii române, cu aplicaţii la atlasele lingvistice româneşti regionale, la care au participat cercetătorii Horia N. Teodorescu, m. c. al Academiei (coordonator), Florin Rotaru, Silviu Bejinariu, Mariana Roman, Vasile Apopei, Florin Grigoraş, Doina Jitcă şi Daniela Nica, de la Institutul de Informatică Teoretică, şi Ion. A. Florea, de la Institutul de Filologie Română „A. Philippide”. În anul 2001, ca urmare a perspectivelor de aprofundare a cercetării (de exemplu, analiza sistemului vocalic românesc sau studiul teoretic privind stadiul actual în fonologia metrică sau naturală), tema a fost menţinută şi amplificată, prin cooptarea cercetătorilor dialectologi Stelian Dumistrăcel, Florin-Teodor Olariu, Adrian Turculeţ şi Ion-Horia Bîrleanu.

Varianta asistată de calculator a atlaselor lingvistice are o serie de avantaje, dintre care enumerăm: înlătură copierea manuală (deficitară din cauza lipsei specialiştilor desenatori); este economică sub aspectul costurilor şi al timpului de execuţie; este mai lizibilă (în sensul că se poate schimba, după necesităţi, corpul de literă) în comparaţie cu scrierea manuală. Cel mai important avantaj este, însă, că acest mod de lucru permite – ca fază premergătoare redactării – şi stocarea unei cantităţi mari de informaţie, care poate constitui baza unor lucrări interdisciplinare viitoare. Totodată, se va realiza o bază de date cu transcrierea fonetică a unui număr însemnat de cuvinte, ce vor putea fi corelate cu semnalul achiziţionat la pronunţia lor. Aceste lucrări pot avea un impact

212 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 3: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

semnificativ asupra metodelor de analiză a caracteristicilor fonetice şi fonologice ale limbii române şi pentru compararea, sub aceste aspecte, a limbii române cu alte limbi romanice sau cu limbile popoarelor învecinate.

S-au realizat deja, ca părţi ale temei de cercetare: stabilirea cadrului general, prin modelarea din punct de vedere informatic a informaţiilor grafice (conturul hărţilor, reţeaua de puncte de anchetă, poziţia răspunsurilor în raport cu punctul de anchetă corespunzător); lista localităţilor anchetate (numărul cartografic, numele localităţii, comunei şi judeţului din care face parte) şi corespondenţa cu numărul cartografic al reţelelor atlaselor lui Sever Pop (ALR I), Emil Petrovici (ALR II) şi Gustav Weigand (WLAD); a fost iniţiat Dicţionarul „Cuvinte de bază”, ce conţine fondul de cuvinte (titlurile hărţilor din vol. III, în lucru), traducerea în franceză a cuvintelor-titlu, numărul întrebării din Chestionarul NALR şi textul întrebării (însoţit uneori de un desen, o schiţă a obiectului al cărui nume este solicitat prin întrebare), ca şi corespondenţa cu alte atlase româneşti şi romanice. Toate aceste informaţii se introduc în calculator cu scriere normală.

1. Clasificarea simbolurilor grafice pentru editarea transcrierilor fonetice

De cea mai mare importanţă s-a dovedit a fi organizarea familiei de fonturi pentru transcrierea fonetică. Evident, s-a optat pentru continuitate, adică pentru acele litere, însoţite de semne grafice speciale (sedile, linioare orizontale sau verticale, semicercuri, cercuri, puncte, unghiuri ascuţite, tilde ş.a.), cu care, în atlasele lingvistice româneşti (ALR şi NALR) se marchează sunetele vorbirii, aşa cum se realizează ele în graiurile populare.

Date fiind aceste cerinţe, s-a trecut la realizarea unui font de bază (ALR_Baza) care să cuprindă simbolurile grafice pentru toate sunetele primare. Poziţia în „font” a simbolurilor grafice pentru diacritice, a fost stabilită urmărind păstrarea poziţiei implicite din familiile de fonturi uzuale (Arial, Times New Roman). Pentru realizarea sunetelor marcate cu un fenomen fonetic sau mai multe am realizat familii de fonturi ale căror denumiri le-am dat cu ajutorul fenomenelor fonetice aplicate (ex. ALR_Semivocale, ALR_Nazalizate, ALR_Seminazalizate, ALR_ScurteNazalizate, ALR….etc.). Această organizare

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 213

Page 4: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

a fonturilor a fost făcută cu scopul de a permite scrierea textelor cu transcrieri fonetice cu orice editor de text (Microsoft Word), iar textul scris cu aceste fonturi să poată fi citit chiar dacă fonturile proiectate de noi nu sunt instalate (în acest context se vor pierde numai fenomenele fonetice aplicate sunetelor primare).

Pentru generarea acestor fonturi am folosit programul FontLab 3.1, care permite definirea de simboluri grafice compuse, pornind de la o familie de fonturi TrueType existentă în sistemul de operare Windows. Pentru familiile de fonturi pe care le-am realizat am convenit să folosim ca model de plecare fontul Arial.

Facem precizarea că fenomenele fonetice şi modul lor de aplicare este diferit pentru cele două tipuri de sunete: vocale şi consoane.

În ceea ce priveşte vocalismul, am optat pentru selectarea a 17 vocale: a, ä, å, ă, â, e, ë, ĕ, i, ĭ, î, o, ö, ŏ, u, ü, û, pe care le-am numit „primare”, adică „sunete primare a căror imagine grafică se găseşte în fontul de bază (realizat pe tastatură)”. Faţă de semnele folosite curent în transcrierea NALR-Mold.Bucov. şi definite fonetic în introducerile volumelor (de hărţi sau de texte), apar în plus ŏ, „vocală posterioară delabializată, cu apertură medie, între ă şi o”, şi û, „vocală posterioară delabializată închisă, între î şi u”, semne preluate din NALR- Munt.Dobr. (şi din alte volume de hărţi şi de texte). Aceste semne redau sintetic valoarea fonetică a grafemelor suprapuse (întâlnite în NALR-Mold.Bucov) o/ă, ă/o, respectiv u/î, î/u.

Tot vocale primare se consideră şi cele trei variante accentuale ale fiecărei vocale din seria de mai sus, astfel că seria completă este formată din 17 x 4 = 68 vocale. Tote acestea se regăsesc în fontul de bază. Exemplificăm cu varietăţile vocalei [e]: e, é, E, É, ë, ē, Ë, Ē, ĕ, ę, Ĕ, Ę.

Transformările fonetice care, în principiu, pot modifica cele 17 vocale de bază (68 împreună cu variantele lor accentuale) pot fi, succesiv sau simultan, următoarele:

I. Modificarea duratei vocalei: a) scurtime [de exemplu]: e, é, E, É; b) semilungime [de exemplu]: e, é, E, É; c) lungime [de exemplu]: e, é, E, É;

II. Rostirea nazală: d) seminazalizare [de exemplu]: e, é, E, É; e) nazalizare [de exemplu]: e, é, E, É;

214 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 5: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

III. f) Coup de glotte [de exemplu]: e, é, E, É; IV. Modificarea aperturii: g) închidere [de exemplu]: e, é, E, É; h) semideschidere [de exemplu]: e, é, E, É; i) deschidere [de exemplu]: e, é, E, É; j) deschidere mare [de exemplu]: e, é, E, É;

V. Rostirea şoptită: k) semiafonizare [de exemplu]: e, é, E, É; l) afonizare [de exemplu]: e, é, E, É.

În comparaţie cu transcrierea obişnuită din volumele anterioare ale NALR-Mold.Bucov., apare acum, ca o noutate, notarea „sintetică” a semilungimii: e, o, I etc. faţă de notarea analitică folosită anterior: e/e sau e/e, o/o sau o/o, i/I sau i/I etc. La fel, fără să constituie noutăţi absolute, apar acum notările „sintetice” pentru semideschidere: e, o, I, ĕ etc. în loc de e/e, e/e, o/o, o/o, i/I, i/I, ĕ/ĕ, ĕ/ĕ, şi pentru semiafonizare: ă, e, ü în loc de ă/ă, e/e, ü/ü sau chiar ă/ă, e/e, ü/ü (mult mai rar folosite).

Cele 12 fonturi au fost grupate convenţional după criteriul poziţiei semnului faţă de vocală. Astfel, dacă lăsăm la o parte notarea accentelor (care îşi găseşte locul în fontul de bază), de sus în jos, în raport cu vocala, apar semnele:

I. Pentru durata vocalei (aşezate cel mai sus); II. Pentru nazalizarea vocalei (aşezate deasupra, dar sub cele

pentru durata vocalei); III. Pentru ocluzia glotală (aşezat „în umăr”, în faţa vocalei); IV. Pentru apertură (aşezate imediat sub vocală); V. Pentru afonizare (aşezate sub vocală, dar şi sub semnele din

seria IV, în cazul în care cele două serii apar simultan). Un asemenea aranjament este uşor de reţinut şi uşurează mult

activitatea operatorului. Aşa cum se observă din succesiunea de mai sus, cele 12 fenomene

fonetice înregistrate sub a) – l) se grupează, prin subordonare, la cinci serii de fenomene distincte, I – IV. Al treilea fenomen, III. coup de glotte, are o singură varietate de realizare, toate celelalte patru serii grupând două, trei sau patru grade de realizare unuia şi aceluiaşi fenomen. Astfel, durata vocalei, afară de cea normală, poate avea trei grade (scurtă, semilungă, lungă), apertura, afară de cea normală, poate avea patru grade (închisă, semideschisă, deschisă, foarte deschisă) iar nazalizarea şi afonizarea, două grade. Este exclusă orice combinaţie între două nuanţe

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 215

Page 6: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

fonetice, diferite doar ca grad, ce fac parte din aceeaşi serie de transformări fonetice. Astfel, o vocală nu poate fi în acelaşi timp scurtă / semilungă / lungă sau în acelaşi timp închisă / semideschisă / deschisă / foarte deschisă etc., cu alte cuvinte, fiecare membru al unei serii exclude prezenţa concomitentă a celorlalţi membri ai aceleiaşi serii.

Tot relativ la aceste transformări fonetice (a) – l), grupate în seriile I – IV) are pot modifica cele 68 vocale de bază (17 x 4 variante accentuale), am subliniat că acestea se realizează în principiu. De fapt, datorită trăsăturilor fonetice (apertura) ale unor vocale, există varietăţi care nu se pot realiza tocmai în principiu. Astfel, toată seria vocalei celei mai deschise – a, ä, å – (şi cu varietăţile accentuale) nu pot primi „caracteristica” semideschidere / deschidere / deschidere mare, după cum vocalele închise prin modul lor de articulare – seriile i, ĭ, î, u, ü, û – nu pot primi „caracteristica” închidere. Pentru aceste situaţii, ca şi pentru variantele lor accentuale, nu se creează grafeme.

Combinaţiile de două fenomene fonetice se pot realiza doar între membrii a două serii diferite. Redăm mai jos combinaţiile de două fenomene, cu precizarea că asemenea notaţii se regăsesc în mod obişnuit în materialele NALR, în care s-a folosit fie notarea sintetică (propusă şi acum), fie cea analitică (cu grafeme suprapuse):

a + d [scurtime + seminazalizare] a + e [scurtime + nazalizare] a + f [scurtime + coup de glotte] a + g [scurtime + închidere] a + h [scurtime + semideschidere] a + i [scurtime + deschidere] a + j [scurtime + deschidere mare] a + k [scurtime + semiafonizare] a + l [scurtime + afonizare] b + d [semilungime + seminazalizare] b + e [semilungime + nazalizare] b + f [semilungime + coup de glotte] b + g [semilungime + închidere] b + h [semilungime + semideschidere] b + i [semilungime + deschidere] b + j [semilungime + deschidere mare] b + k [semilungime + semiafonizare] b + l [semilungime + afonizare]

216 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 7: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

c + d [lungime + seminazalizare] c + e [lungime + nazalizare] c + f [lungime + coup de glotte] c + g [lungime + închidere] c + h [lungime + semideschidere] c + i [lungime + deschidere] c + j [lungime + deschidere mare] c + k [lungime + semiafonizare] c + l [lungime + afonizare] d + f [seminazalizare + coup de glotte] d + g [seminazalizare + închidere] d + h [seminazalizare + semideschidere] d + i [seminazalizare + deschidere] d + j [seminazalizare + deschidere mare] d + k [seminazalizare + semiafonizare] d + l [seminazalizare + afonizare] e + f [nazalizare + coup de glotte] e + g [nazalizare + închidere] e + h [nazalizare + semideschidere] e + i [nazalizare + deschidere] e + j [nazalizare + deschidere mare] e + k [nazalizare + semiafonizare] e + l [nazalizare + afonizare] f + g [coup de glotte + închidere] f + h [coup de glotte + semideschidere] f + i [coup de glotte + deschidere] f + j [coup de glotte + deschidere mare] f + k [coup de glotte + semiafonizare] f + l [coup de glotte + afonizare] g + k [închidere + semiafonizare] g + l [închidere + afonizare] h + k [semideschidere + semiafonizare] h + l [semideschidere + afonizare] i + k [deschidere + semiafonizare] i + l [deschidere + afonizare] j + k [deschidere mare + semiafonizare] j + l [deschidere mare + afonizare].

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 217

Page 8: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Iată acum câteva exemple de vocale ce conţin două fenomene fonetice: a, a, a, e, e, e, e, e etc., precum şi variantele lor accentuale: á, á, á, é, é, é, é, é, A, A, A, E, E, E, E, E, Á, Á, Á, É, É, É, É, É.

După aceleaşi reguli de combinare se obţin grafeme cu semne ce pot marca trei serii de schimbări fonetice vocalice, ba chiar şi cu patru sau cinci, cel puţin teoretic. Oricum, necesitatea de a apela la astfel de grafeme combinate cu multe semne ce indică transformări fonetice apare în practica redactării foarte rar (nu doar la NALR-Mold.Bucov., ci şi la toate celelalte atlase regionale). Aceste imagini grafice complexe au fost totuşi prevăzute, deoarece sunetele reprezentate de ele pot apărea lesne în texte dialectale.

În realizarea semnelor ce notează semivocale, am rămas la soluţia clasică, încetăţenită în dialectologia românească: obişnuitul semicerc aşezat sub grafemele vocalice. Grafemele semivocalice astfel obţinute pot fi, dacă situaţia o cere, aşezate „în rând” cu celelalte semne: ies, doi etc., sau „la umăr”, pentru a evidenţia slaba perceptibilitate: uom, lieg etc. Tot aşa, „la umăr” se pot nota şi sunetele nesilabice ultrascurte finale din: vezi, vasu, capu etc., ca şi alt sunet vocalic sau consonantic slab perceptibil: mohor, cresc, mătúşâ etc.

S-a păstrat, pentru cazurile absolut necesare, şi posibilitatea transcrierii sunetelor „intermediare”, prin scrierea suprapusă a două simboluri grafice, de exemplu: două vocale cu localizare diferită, o vocală şi o semivocală, o semivocală şi o consoană, sau două consoane diferite ca mod de articulaţie (o oclusivă şi o africată, o africată şi o fricativă ş. a. m. d.).

În ceea ce priveşte consonantismul, au fost selectate, după aceleaşi criterii ca şi la vocalism, un număr de 49 de consoane „primare”, pentru a căror realizare grafică este folosită exclusiv tastatura calculatorului: b, c, ć, Ĉ, ĉ, ċ, č, Ď, đ, D, δ, f, g, Ĝ, ĝ, ġ, ğ, H, ђ, χ, γ, j, k, l, ł,m, M, n, N, ņ, ŋ, p, R, ŕ, ŗ, ρ, с, ś, ŝ, Ş, Ť, ν, Ţ, v, w, z, ź, ż, Ŷ. Acelaşi principiu al continuităţii în transcrierea fonetică a materialului dialectal a fost respectat şi în cazul consoanelor, caracterele folosite fiind cele ale alfabetului latin, la care au fost adăugate câteva caractere preluate din alfabetul grec (γ, δ, ρ, χ, ν). În spiritul transcrierii fonetice alfabetice, pentru sunetele ce nu au corespondent în alfabetul latin s-a recurs la „suplimentări” grafice (tilde, puncte, sedile, liniuţe, unghiuri ascuţite etc.) ale caracterelor latineşti: ł, ĝ, ŕ, N, ş, ŝ, ż, D, precum şi la unele modificări grafice ale acestor caractere: ђ, ŋ.

218 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 9: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Aceste consoane „primare” pot fi modificate, în principiu, prin intermediul unor transformări fonetice ce au loc în actul concret al vorbirii. Fenomenele fonetice aferente inventarului consonantic pot fi grupate în cinci serii, după cum urmează:

I. Modificarea duratei consoanei: a) semilungime [de exemplu]: l, m, s; b) lungime [de exemplu]: l, m, s;

II. Gradul de palatalizare: c) semipalatalizare [de exemplu]: d, l, n; d) palatalizare [de exemplu]: d, l, n; e) palatalizare mare [de exemplu]: d, t;

III. f) Caracterul exploziv; p, t, c; IV. g) Caracterul silabic [de exemplu]: l, m, r, s; V. Modificarea sonorităţii consoanei: h) semiafonizare [de exemplu]: b, d, r; i) afonizare [de exemplu]: b, d, r.

Am menţionat mai sus că sunetele consonantice pot suporta în principiu aceste transformări fonetice pentru că, la fel ca şi la vocale, există consoane care prin natura lor nu pot fi modificate prin intermediul unor fenomene fonetice. Astfel, o consoană care este surdă nu va putea primi „caracteristica” afonizat / semiafonizat, după cum nici o consoană oclusivă nu va putea fi menţinută mai mult timp în procesul vorbirii, deci nu va putea primi „caracteristica” lungime / semilungime.

Pe lângă transformările fonetice datorate unui singur fenomen, consoanele pot fi supuse simultan acţiunii a două fenomene fonetice. Posibilităţile de combinare între subclasele de fenomene care se pot realiza în vederea modificării sunetului consonantic „primar” sunt următoarele:

a + c [semilungime + semipalatalizare] a + d [semilungime + palatalizare] a + g [semilungime + caracter silabic] a + h [semilungime + semiafonizare] a + i [semilungime + afonizare] b + c [lungime + semipalatalizare] b + d [lungime + palatalizare] b + g [lungime + caracter silabic] b + h [lungime + semiafonizare] b + i [lungime + afonizare]

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 219

Page 10: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

c + h [semipalatalizare + semiafonizare] c + i [semipalatalizare + afonizare] d + h [palatalizare + semiafonizare] d +i [palatalizare + afonizare] e + h [palatalizare mare + semiafonizare] e + i [palatalizare mare + afonizare] f + h [explozie + semiafonizare] f +i [explozie + afonizare] g + h [caracter silabic + semiafonizare] g +i [caracter silabic + afonizare]. Iată în continuare câteva exemple grafice ale unor asemenea

transformări fonetice: d, d, r, r, m, m, z, s, l, m, r , l, g, l, r, l etc. Spre deosebire de vocale, unde s-au putut defini reguli generale

pentru realizarea combinaţiilor de fenomene fonetice, în cazul consoanelor primare transformările fonetice se aplică numai unor consoane specifice. În plus, consoanelor primare le pot fi aplicate numai cel mult două transformări şi numai în anumite combinaţii.

Datele prezentate până acum au arătat, în mare, principiile după care ne-am orientat în stabilirea unor familii de fonturi cât mai complete, ţinând cont de întreaga tradiţie în acest sens din dialectologia românească. În cele ce urmează vom face o descriere în linii mari a modalităţii efective de punere în practică a rezultatelor obţinute în urma elaborării fonturilor.

2. Mediu pentru editarea transcrierilor fonetice

Interfaţa realizată pentru editarea transcrierilor fonetice poate fi folosită în mai multe moduri:

- editarea Dicţionarelor Atlasului Lingvistic; - editor stand-alone sau ca aplicaţie de tip server pentru inserarea de

obiecte de tip „transcriere fonetică” în alte editoare de text. Funcţionalitatea acestei interfeţe va fi exemplificată pentru situaţia

Atlasului Lingvistic, ale cărui componente sunt prezentate pe scurt în continuare.

Dicţionarele ALR sunt componente care realizează colectarea informaţiilor primare despre titlul hărţilor (cuvinte de bază), punctele de anchetă, speech (colecţie audio), transcrieri fonetice şi notele asociate transcrierilor fonetice (Figura 1).

220 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 11: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Figura 1. Conexiunile dintre informaţiile stocate în dicţionarele ALR Dicţionarul „Cuvinte de bază” conţine fondul de cuvinte (titlul

hărţilor) din atlasul lingvistic electronic, întrebările care au fost puse la anchetă, note, observaţii, şi, eventual, imagini. Pentru fiecare cuvânt este indicată şi întrebarea corespunzătoare care este pusă în momentul anchetei.

În momentul completării acestui dicţionar, utilizatorul poate vedea lista completă a cuvintelor de bază introduse, le poate sorta după diferite criterii, poate modifica articolele introduse anterior, după cum este prezentat în Figura 2.

Figura 2. Fereastra de editare a listei cuvintelor de bază

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 221

Page 12: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Dicţionarul „Puncte de anchetă” conţine informaţii (cod, nume, observaţii) despre punctele de anchetă prezentate în cadrul atlasului lingvistic. La fel ca la dicţionarul anterior, şi aici utilizatorul poate vedea lista completă a punctelor de anchetă introduse, le poate sorta după diferite criterii, poate modifica articolele introduse anterior.

Dicţionarul „Transcrieri fonetice” conţine transcrierea fonetică a răspunsului la întrebarea pusă în etapa de interviu pentru fiecare cuvânt din Dicţionarul „Cuvinte de bază” în fiecare din Punctele de anchetă, iar acolo unde este posibil şi înregistrarea audio corespunzătoare din Colecţia Audio.

Pentru claritatea hărţilor lingvistice, răspunsurile din punctele de anchetă sunt însoţite de note şi comentarii (Figura 3).

Figura 3. Editarea Dicţionarului „Transcrieri fonetice” Pentru transcrierea fonetică a cuvintelor din atlasul lingvistic

românesc este folosit un număr mare de fonturi, rezultat din numărul mare de combinaţii posibile ale fenomenelelor fonetice prezentate în capitolul 1. Aceste fonturi au fost definite astfel încât, toate „variantele fonetice” ale unui anumit caracter să fie obţinute prin selectarea caracterului respectiv într-un anumit font.

222 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 13: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Deoarece un fişier text normal nu păstrează informaţii despre fonturile folosite şi, în plus, transcrierile fonetice sunt realizate şi prin diferite poziţionări ale caracterelor, s-a folosit un mod propriu de codificare a acestora.

Transcrierile fonetice sunt codificate cu ajutorul unor obiecte de tip CAlrString. Acestea sunt, de fapt, şiruri de obiecte de tip CAlrChar, care, la rândul lor, au următoarea descriere:

- caracterul corespunzător sunetului primar (pe 16 biţi, codificare UNICODE);

- atribute: - poziţionare: normal, deasupra sau „în umăr”; - mod de subliniere:

- linie sau zigzag; - cursiv; - îngroşat;

- fenomene: - tip sunet: vocală sau consoană; - fenomene specifice aplicate (codificate pe biţi).

Fontul folosit pentru desenarea caracterului din transcrierea fonetică este ales dinamic din lista de fonturi a aplicaţiei, în momentul afişării. Dăm în continuare listele cu caracterele de bază, „primare”, ce se obţin exclusiv cu ajutorul tastaturii, precum şi combinaţiile de taste ce trebuie realizate pentru a ajunge la aceste caractere (Figura 4).

În momentul în care este deschis dicţionarul de transcrieri fonetice, se fac două tipuri de verificări:

- se verifică corespondenţa dintre fonturile folosite la ultima editare a dicţionarului şi lista curentă recunoscută de program;

- se verifică dacă toate fonturile folosite sunt instalate în Windows. Datorită cantităţii mari de informaţie care trebuie stocate pentru

Atlasul Lingvistic Român, descrierea fiecărui cuvânt este compresată folosind un algoritm de compresie LZW. La selecţia unui cuvânt de bază, descrierea sa este decompresată în memorie şi, dacă se fac modificări ale transcrierilor fonetice, aceasta este compresată şi rescrisă în fişier la selectarea unui alt cuvânt sau la închiderea dicţionarului.

Pentru scrierea informaţiilor în dicţionar am proiectat o interfaţă utilizator prietenoasă, la care operatorul trebuie să parcurgă următorii paşi:

- selectează cuvântul titlu; - selectează punctul de anchetă; - editează transcrierea fonetică, nota şi comentariul asociat cuvântu-

lui pentru punctul de anchetă respectiv.

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 223

Page 14: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Figura 4. Listă taste asociate

224 I. A. FLOREA, V. APOPEI, F. OLARIU, S. BEJINARIU

Page 15: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Figura 4. Listă taste asociate (continuare)

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 225

Page 16: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Figura 4. Listă taste asociate (continuare) La editarea transcrierilor fonetice trebuie avute în vedere două

aspecte: - selectarea sunetului primar; - selectarea fenomenelor asociate. Selectarea sunetului primar se face prin apăsarea tastei respective,

dacă sunetul are un corespondent pe tastatură, sau prin apăsarea unei combinaţii de taste, dacă sunetul nu are corespondent pe tastatură. Combinaţiile de taste sunt prestabilite în aplicaţie (la stabilirea combinaţiilor de taste am folosit recomandările de la Microsoft Word), şi, cel puţin deocamdată, nu pot fi modificate de utilizator. Pentru a veni în ajutorul celui ce editează dicţionarul, aplicaţia dispune de o fereastră în care sunt afişate combinaţiile de taste predefinite.

Pentru selectarea fenomenelor asociate sunetelor, aplicaţia prezintă două grupe de butoane cu imaginile tuturor fenomenelor posibile pentru vocale şi, respectiv, consoane. Prin apăsarea pe unul din aceste butoane se va selecta simbolul grafic corespunzător în transcrierea fonetică. Cele două grupe de butoane sunt împărţite în subgrupe corespunzătoare grupărilor de fenomene (vezi capitolul 1). Pot fi selectate mai multe fenomene, dar, cel mult câte unul din fiecare subgrupă. Selectarea unui fenomen produce dezactivarea selecţiei anterioare din subgrupa respectivă.

După selectarea caracterului dorit, utilizatorul va specifica şi poziţionarea acestuia (deasupra, „în umăr”) prin folosirea comenzilor Pg Up / Pg Down.

226 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 17: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Fereastra de editare a transcrierilor fonetice este prezentată în Figura 3. Dicţionarul cu transcrieri fonetice poate conţine înregistrările audio în

format WAV ale răspunsurilor la întrebările din anchetă pentru cuvintele incluse în dicţionarul lingvistic. Acest lucru este posibil dacă la realizarea anchetei pentru atlasele lingvistice se face şi înregistrarea pe bandă a răspunsurilor.

3. Realizarea Atlasului lingvistic român, pe regiuni

Sistemul software care modelează atlasul lingvistic electronic conţine module care realizează gestionarea următoarelor grupe de informaţii:

- simboli pentru editarea transcrierilor fonetice; - dicţionarele atlasului lingvistic (cuvinte de bază, puncte de anchetă,

transcrieri fonetice); - informaţii grafice pentru descrierea hărţilor organizate în fişiere

DXF; - hărţile atlasului lingvistic, care pot fi consultate şi/sau tipărite; Din punct de vedere funcţional, atlasul lingvistic electronic este

structurat în două componente principale: - proceduri pentru pregătirea datelor primare; - interfaţa multimedia. Aceste componente sunt prezentate în Figura 5.

Figura 5. Componentele Atlasului lingvistic electronic

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 227

Dicţionare: Transcrierifonetice + Sunet

Informaţii graficeZone geografice şiPuncte de anchetă

Simboli pentrueditarea transcrierilor

fonetice

Proceduri degenerare şi editare

Hărţilingvistice

Interfaţa multimediaPregătirea datelor

Consultare dicţionarSinteză vocală

Tipărire hărţi lingvistice

Page 18: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

În acest capitol ne vom referi la facilităţile pe care le oferă modulul software ce realizează generarea şi consultarea hărţilor ligvistice. În etapa de proiectare a acestui modul, am avut în vedere modelul interfeţelor multimedia. Din această analiză a rezultat necesitatea existenţei unui modul care să permită:

- generarea unei hărţi noi pe baza informaţiilor din dicţionarele ALR şi a informaţiilor grafice primare cuprinse în fişiere DXF;

- editarea, aranjarea în pagină şi selectarea informaţiilor care vor fi vizibile implicit;

- salvarea într-un fişier, numit „hartă lingvistică”, a selecţiilor şi modificărilor din faza de editare;

- consultarea atlasului electronic; - vizualizarea şi ascultarea informaţiilor din punctele de anchetă; - tipărirea hărţilor lingvistice.

3.1. Modulul pentru generarea şi editarea hărţilor lingvistice

Pentru reprezentarea hărţilor lingvistice s-au proiectat structuri de date bazate pe obiecte suficient de flexibile pentru a permite dezvoltări ulterioare. În cele ce urmează vom face o trecere în revistă a principalelor structuri de date realizate.

Pentru organizarea informaţiilor grafice primare am avut în vedere cerinţele impuse de tehnologia de realizare a atlaselor lingvistice. Astfel, am apelat la formatul DXF, care permite o organizare a obiectelor primare pe straturi. Am realizat fişierul NALRB.DXF, care conţine următoarele tipuri de obiecte (straturi): Chenare - limitele paginii şi chenarele hărţii; Frontiere - conturul zonei studiate (Moldova şi Bucovina); Mijloc - indică locul de pliere al hărţii, la legarea în volum; Municipii - localităţile importante afişate pe hartă; Puncte anchetă - dreptunghiurile în care se scriu codurile punctelor

de anchetă; Transcriere fonetică

- conţine dreptunghiuri pentru transcrierea fonetică;

note - dreptunghiuri cu poziţiile predefinite pentru Titlu, Nota I, Nota II, Nota III;

zone - delimitări zonale în jurul punctelor de anchetă.

228 I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 19: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Pentru editarea şi salvarea hărţilor lingvistice din conţinutul ALR s-a creat o structură de date flexibilă, care să permită în viitor extinderea editării asistate de calculator a atlaselor lingvistice româneşti regionale la nivel naţional. Astfel, a rezultat o structură de date, numită „harta lingvistică”, de forma următoare:

- header fişier; - listă cu descrieri obiecte. Descrierile de obiecte au un antet, care este comun pentru toate

tipurile de obiecte, şi un corp, care este un obiect specfic fiecărui tip în parte. Obiectele pot fi simple sau compuse. Un obiect compus conţine, la rândul lui, alte obiecte simple sau compuse.

Au fost definite următoarele tipuri de obiecte: - text; - AlrString (obiectul a fost definit pentru editarea dicţionarului cu

transcrieri fonetice); - dreptunghi; - harta cu transcrierile fonetice; - harta sintetică (lingvistică sau fonetică); - notă referitoare la continuarea transcrierilor fonetice (vezi Nota II

din NALR-Mold.Bucov.); - notă sintetică referitoare la cuvântul titlu (vezi Nota III din NALR-

Mold.Bucov.); - legendă pentru harta sintetică; - simbol pe harta sintetică; - zonă haşurată pe harta sintetică; - bitmap; - strat DXF.

3.2. Modulul pentru consultarea Atlasului lingvistic electronic

Componenta pentru consultarea atlasului permite încărcarea unei hărţi lingvistice generate - editate în etapa anterioară. Sistemul va afişa harta regiunii respective (în situaţia studiată este vorba de Moldova şi Bucovina) pe care va plasa transcrierea fonetică a răspunsurilor din

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 229

Page 20: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

punctele de anchetă împreună cu notele şi observaţiile introduse anterior în dicţionarele ALR sau de operatorul care a realizat harta (Figura 6).

Figura 6. Fereastra de editare – consultare a Atlasului lingvistic eletronic

Dacă utilizatorul doreşte să analizeze un cuvânt pentru care nu s-a

realizat, în prealabil, o hartă, dar care există în dicţionarele ALR, se realizează generarea automată a hărţii pe care se vor plasa transcrierile fonetice ale răspunsurilor din punctele de anchetă împreună cu notele şi observaţiile introduse anterior în dicţionarele ALR. La activarea modulului apare prezentată harta regiunii cu punctele de anchetă şi numele localităţilor pe care acestea le reprezintă, după care poate fi selectat cuvântul de bază dorit.

După ce harta lingvistică a fost încărcată / generată prin selecţia unui punct de anchetă, este posibilă şi redarea audio corespunzătoare transcrierii fonetice asociate acestuia (înregistrarea audio sau cuvântul sintetizat).

230 immm iiiiiii I. A. FLOREA, V. APOPEI, F.-T. OLARIU, S. BEJINARIU

Page 21: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Tot cu ajutorul acestei componente se realizează tipărirea automată a hărţilor atlasului lingvistic românesc în vederea includerii lor în volum (Figura 7).

Pentru tipărirea hărţilor au fost prevăzute următoarele facilităţi: - posibilităţi de selectare a informaţiilor ce se vor tipări; - tipărirea pe o pagină sau tipărirea pe două pagini cu respectarea

locului de pliere al hărţii indicat prin linia „mijloc”. Dacă utilizatorul doreşte tipărirea într-un mod sintetic (fără hartă),

modulul poate asigura crearea unor pagini de tip MN (Material Necartografiat). Folosind această opţiune, va fi tipărită numai lista cu transcrierile fonetice corespunzătoare cuvântului selectat, ordonate după criterii de similaritate.

Trebuie să specificăm în final că, pe măsură ce programul de faţă va fi perfecţionat, vom avea posibilitatea să dublăm transcrierile din punctele de anchetă cu o Colecţie Audio – înregistrarea audio a unor forme mai puţin obişnuite din punct de vedere fonetic. La ora actuală se depun eforturi pentru a depăşi obstacolele ce mai apar la scrierea materialului necartografiat pe coloane, în planşele ce încheie volumul de hărţi, la transcrierea textelor dialectale ca şi la realizarea hărţilor interpretative şi sintetice, iar rezultatele obţinute în aceste direcţii ne dau speranţa că, în final, programul va răspunde la toate exigenţele ştiinţifice ale editării în cele mai bune condiţii ale atlaselor şi textelor dialectale.

INFORMATIZAREA EDIT|RII ATLASELOR LINGVISTICE 231

Page 22: EDITAREA ASISTAT| DE CALCULATOR A ATLASELOR … limbii 2002/17... · 2016. 8. 1. · dialectale pentru Atlasul lingvistic român (ALR I , realizat de Sever Pop, şi ALR II, realizat

Figura 7. Imaginea unei pagini tipărite din modulul de consultare