Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii...

18
Mecanismele generative ale morfologiei derivaționale PETIC MIRCEA Institutul de Matematică și Informatică, Academia de Științe a Moldovei [email protected]

Transcript of Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii...

Page 1: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Mecanismele generative

ale morfologiei

derivaționale

PETIC MIRCEA

Institutul de Matematică și Informatică, Academia de Științe a Moldovei

[email protected]

Page 2: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

SCOPUL

studierea specificului cuvintelor derivate și

stabilirea unor mecanisme generative ale morfologiei

derivaționale.

Page 3: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Conţinutul

• Lexiconul de derivate

• Particularităţile derivatelor semianalizabile

• Proiectarea derivării cu prefixe pe o ulterioară derivare cu sufixe

• Derivate diminutive şi augmentative

• Schimbarea genului cuvintelor

• Generarea derivatelor cu prefixul in-/im-

Page 4: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Lexiconul de derivateExemple de intrări

antistatal=+anti.stat-al

reprogramabil=+re.programa-bil

Caracteristica Numărul

Derivate 15300

Rădăcini 6800

Prefixe 42

Sufixe 433

Page 5: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Lexicon de derivate

Familii lexicale

0

500

1000

1500

2000

2500

3000

3500

4000 1

2

3

4

5

6-10

11-15

>15

Page 6: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Particularităţile derivatelor

semianalizabile

De tot în lexicon – 57 de derivate

crucișătură=.(în)crucișa-ătură

[în]crucișa + suf. –ătură

despăduri=+des.(îm)păduri

dezvălui=+dez.(în)vălui

Page 7: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Proiectarea derivării cu prefixe pe o

ulterioară derivare cu sufixeRRSi RPR R-rădăcina

Si – sufixe posibile

RPRSi P-prefix

Page 8: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Proiectarea derivării cu prefixe pe o

ulterioară derivare cu sufixe363 teme pentru care in lexicon este atestată

proectarea

Exemplu

capitula

capitulant, capitulantă, capitulard, capitulare, capitulație

recapitula

recapitulare, recapitulație

! recapitulant – nu este validat

Page 9: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Derivate diminutive• -aş (copilaş), -uc (sătuc), -el (bătrânel), -iță

(fetiță), -uță (caruță), -ică (floricică), -uleț(ursuleț), -iș (podiș), -uț (căluț).

• sat - sătuc, car - căruţă, cal - căluţ alternanţa este a->ă;

• fată – fetiţă: a ->e;

• floare – floricică: oa ->o;

• frate- frăţior: at -> ăţ

• Substantiv, Adjectiv, Adverb

Page 10: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Derivate augmentative

• -andru (copilandru); -an (băietan); -oi (căsoi) , -oaie (căsoaie)

• - căsoi/căsoaie, alternanţa este a->ă;

• băiet – băieţandru t->ţ

• Substantiv, Adjectiv

Page 11: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Schimbarea genului cuvântului

=tor

va deriva în

=toare

148 cuvinte

=toare

va deriva în

=tor

42 de cuvinte

Validarea Numărul de cuvinte

RRTLN 122 (64%)

Google 49 (26%)

Nevalidate 19 (10%)

Page 12: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Schimbarea genului cuvântului

=esc

va deriva în

=ească

20 cuvinte

=ească

va deriva în

=esc

45 de cuvinte

Validarea Numărul de cuvinte

RRTLN 43 (66%)

Google 12 (18%)

Nevalidate 10 (16%)

Page 13: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Generarea derivatelor cu prefixul

in-/im-• prefixe care oferă derivatului sensul de negație,

precum: a-, i-, ne- și im-/in-

• derivatele cu im-/in-, de obicei, sunt adjective, rareori substantive și verbe.

Potrivit www.dexonline.ro:in im

ant 38 13

ent 61 12

bil 220 43

Total 4946 1249

Page 14: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Generarea derivatelor cu prefixul

in-/im-• adjectivele gen =bil formează derivatele =bil, unde {in-, im-}

de exemplu: incurabil, inestimabil

• adjectivele gen = formează derivatele de forma =, unde {in-, im-}, {-ent, -ant}

de exemplu: inaderent, impenetrabil

! alegerea lui depinde de prima literă a adjectivului , și anume în

cazul în care această literă este b sau p atunci =im-, în alte cazuri e in-

Page 15: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Generarea derivatelor cu prefixul

in-/im-• În mod automat, s-a constat că lexiconul conține

62 de derivate cu –bil

1 derivat cu –ent

37 cu –ant

Validarea Numărul de cuvinte

RRTLN 14

Google 7

Nevalidate 79

Page 16: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Generarea derivatelor cu prefixul

in-/im-• inrezolvabil(1)-nerezolvabil(1280),

insubstituibil(77)-nesubstituibil(222),

injucabil (353)-nejucabil (3050)

• inabordabil (2810)-neabordabil (699), inacceptabil (67900)-neacceptabil (7140), incalculabil (24000)-necalculabil (469)

Page 17: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Concluzii

• procesul de derivare nu prezintă un mecanism regulat;

• soluția, potrivit căreia se poate de stocat toate derivatele într-un dicționar, este una rezonabilă;

• generarea derivatelor conform unor reguli de constrângere a grupurilor de derivate, este un mecanism de supragenerare;

• etapa de validare exclude multe cuvinte formate greșite.

Page 18: Mecanismele generative ale morfologiei derivaționaleconsilr.info.uaic.ro/editii anterioare/2010/prezentari/18...cuvintelor derivate și stabilirea unor mecanisme generative ale morfologiei

Referinţe bibliografice

• Petic, M. (2010). Automatic derivational morphology contribution to Romanian lexical acquisition. Special issue: Natural Language Processing and its Application. Research in Computing Science, Mexico, vol. 46, pp. 67-78.

• Constantinescu, S. (2008). Dicționar de cuvinte derivate, Editura Herra, București.

• Iordan, I. (1970). Limba română contemporană. București, pp. 66-99.

• Santana, O, Perez, J., Carreras ,F., Rodriges ,G. (2004). Suffixal and Prefixal Morpholexical Relationships of Spanish. Lecture Notes in Artificial Intelligence, Ed. Springer-Verlag, pp. 407-418.

• Duško, V., Krstev, C. (2005). Derivational Morphology in a E-Dictionary of Serbian, In Zygmunt Vetulani (ed.), Proceedings of the 2nd Language & Technology Conference, Poznan, Poland, pp. 139-143.