Pentru texte ®n limba englezƒ ™i limba rom¢nƒ

download Pentru texte ®n limba englezƒ ™i limba rom¢nƒ

of 49

  • date post

    08-Feb-2017
  • Category

    Documents

  • view

    272
  • download

    8

Embed Size (px)

Transcript of Pentru texte ®n limba englezƒ ™i limba rom¢nƒ

  • Pentru texte n limba englez i limba romn

    MIHAELA COLHON

  • Scopul PLN este dezvoltarea unei teorii a limbajului utiliznd noiuni specifice informaticii, cum este aceea de algoritm, structuri de date, modele

    de reprezentare a cunotinelor i modele de raionament automat. Pentru a transforma computerul ntr-un ajutor adevrat n procesarea textelor, se parcurge un drum lung de nvare a structurii textelor i de formalizare a lor.

    PLN implic utilizarea coordonat i inteligent a variatelor tipuri de cunotine despre limb, reprezentate i utilizate n diferite moduri. cunotine despre limb, reprezentate i utilizate n diferite moduri.

    MORFO-

    LOGIC

    PRAGMATIC

    SEMANTIC

    SINTACTIC

    LEXICALAnaliza morfologic poate recunoate forma cuvintelor; Analiza morfo-lexicalpoate recunoate forma i existena unui cuvnt; Analiza sintactic poate mpri enunul n elementele sale sintactice.

  • Un program de parsing este o cutare n cadrul unui enun a unor posibile caracteristici structurale ale acestuia, caracteristicile fiind constrnse de faptul c ele trebuie s fie compatibile cu o anumit secven de cuvinte.compatibile cu o anumit secven de cuvinte.

    Parsingul sintactic ncearc convertireaexpresiilor din limbaj natural n structuri de arbori sau legturi de dependen ce prezint structura sintactic a expresiei. Aceste structuri sintactice sunt expediate unui interpretator semantic pentru o procesare ulterioar.

  • Adnotarea, sau etichetarea morfosintactic (n englez, Part Of Speech tagging POS tagging), este procesul de alturare a informaiei ce decurge din analiza morfologic i sintactic a unuicorpus de texte. Una din sarcini atribuirea pentru fiecare cuvnt din corpus a unei etichete de parte de vorbire (POS tag). Procesul de adnotare morfo-sintactic trebuie s acorde atenie Procesul de adnotare morfo-sintactic trebuie s acorde atenie contextului n care apare cuvantul care se adnoeaz, deoarece categoria gramatical a unui aceluiai cuvnt poate depinde de construcia n care acesta apare: gust interesant (substantiv), eu gust (verb, persoana I sg).Un tagger trebuie s delimiteze un cuvnt, s determine posibilele lui interpretri i s o atribuie pe cea corect, conform contextului. Adic s rezolve ambiguitatea.

  • n cadrul proiectului european MULTEXT-EAST au fost create coduri cu descrierile detaliate pentru POS tag-uri aplicnd formalismul atribut / valoare.Pentru limba englez s-au creat 83 de etichete, iar pentru limba romn iniial s-au definit iniial 614 pentru limba romn iniial s-au definit iniial 614 taguri, dar n final numrul de taguri a fost redus la 262.

  • No. Field Value EN RO

    1. Type common (c) x x

    proper (p) x x

    2. Gender masculine (m) x x

    feminine (f) x x

    neuter (n) x x

    3. Number singular (s) x x

    plural (p) x xplural (p) x x

    4. Case vocative (v) x

    direct (r) x

    oblique (o) x

    5. Definiteness no (n) x

    yes (y) x

    Exemple: frate Ncmsrn

    fratelui Ncmsoy surorile Ncfpry Bucureti Npmsrn

  • No. Field Value EN RO

    1. Type main (m) x xaux (a) x xmodal (o) x xcopula (c) xbase (b) x

    2. VForm indicative (i) x xsubjunctive (s) ximperative (m) xconditional (c) xinfinitive (i) x x

    Exemple:

    abandonam Vmii1s

    abandon Vmis3s trebuie Voip

    sunt Vcip1s

    infinitive (i) x xparticiple (p) x xgerund (g) x

    3. Tense present (p) x ximperfect (i) xfuture (f)past (s) x xpluperfect (l) x

    4. Person first (1) x xsecond (2) x xthird (3) x x

    5. Number singular (s) x xplural (p) x x

    6. Gender masculine (m) x xfeminine (f) x xneuter (n) x x

  • No. Field Value EN RO

    1. Type qualificative (f) x x2. Degree positive (p) x x

    comparative (c) x xsuperlative (s) x x

    3. Gender masculine (m) x xfeminine (f) x xneuter (n) x x

    4. Number singular (s) x x4. Number singular (s) x xplural (p) x x

    5. Case vocative (v) xdirect (r) xoblique (o) x

    6. Definiteness no (n) xyes (y) x

    7. Clitic no (n) xyes (y) x

    Exemple: bun Afpmsrn bunului Afpmsoy bune Afpfprn bunele Afpfpry

  • No. Field Value EN RO

    1. Type personal (p) x xdemonstrativ (d) xindefinite (i) xpossessive (s) x xinterrogative (q) xrelative (r) xreflexive (x) x xgeneral (g) xnegative (z) xint_rel (w) x

    Exemple: eu Pp1msn

    mi- Pp1msd acesta Pd-msr mea Ps1fsrs

    nimeni Pz-msr

    nsumi Ph1msrint_rel (w) xemphatic (h) x

    2. Person first (1) x xsecond (2) x xthird (3) x x

    3. Gender masculine (m) x xfeminine (f) x xneuter (n) x x

    4. Number singular (s) x xplural (p) x x

    5. Case nominative (n) x xgenitive (g) xdative (d) xaccusative (a) x xdirect (r) xoblique (o) x

    nsumi Ph1msr

  • No. Field Value EN RO

    1. Type demonstrative (d) x xindefinite (i) x xpossessive (s) x xgeneral (g) xint_rel (w) xnegative (z) x

    2. Person first (1) x xsecond (2) x xthird (3) x x

    Exemple:

    acestui Dd-mso

    toi Di-mpr mea Ds1fsrs

    care Dw-msr

    nici_un Dz-msr nsumi Dh1msrthird (3) x x

    3. Gender masculine (m) xfeminine (f) xneuter (n) x

    4. Number singular (s) x xplural (p) x x

    5. Case direct (r) xoblique (o) x

    6. Owner_number singular (s) x xplural (p) x x

    7. Owner_gender masculine xfeminine (f) xneuter (n) x

    nsumi Dh1msr

  • No. Field Value EN RO

    1. Type definite (d) xindefinite (i) xpossessive (s) xdemonstrative (d) x

    2. Gender masculine (m) xfeminine (f) xneuter (n) x

    3. Number singular (s) xplural (p) xplural (p) x

    4. Case direct (r) xoblique (o) x

    Exemple: lui Tfmso

    un Timsr

    celei Tdfso -ist Timsry

    -istul Tfmsry -istului Tfmsoy

  • No. Field Value EN RO

    1. Type general (g) xparticle (p) xnegative (z) xmodifier (m) x xspecifier (s) xint_rel (w) xportmanteau x

    2. Degree positive (p) x xcomparative (c) x xcomparative (c) x xsuperlative (s) x x

    Exemple:

    bine, acolo Rg mai,cam Rp

    nicieri Rz firete, poate Rm int_rel Rw

    ca Rc

  • No. Field Value EN RO

    1. Type preposition (p) x xpostposition (t) x

    2. Formation simple (s) xcompound (c) x

    3. Case genitive (g) xdative (d) xaccusative (a) x

    Exemple:Exemple: n Spsa

    ntr- Spsay

    datorit Spsd de_la Spca

  • No. Field Value EN RO

    1. Type coordinating (c) x xsubordinating (s) x xportmanteau (r) x

    2. Formation simple (s) xcompound (c) x

    3. Coord_Type simple (s) xrepetit (r) xcorrelat (c) xcorrelat (c) x

    4. Sub_Type negative (z) xpositive (p) x

    Exemple:

    i Crssp dar Ccssp fie...fie Ccrsp nici...nici Csrsz de_vreme_ce Csscp

  • No. Field Value EN RO

    1. Type cardinal (c) x xordinal (o) x xfractal (f) xmultiple (m) xcollect (l) x

    2. Gender masculine (m) xfeminine (f) xneuter (n) xneuter (n) x

    3. Number singular (s) xplural (p) x

    4. Case direct (d) xoblique (o) x

    5. Attribute Form digit (d) x xletter (l) x xboth (b) x xroman (r) x x

    Exemple: doi Mcmprl doilea Momsrl amndoi Mlmpr treimilor Mffpoly

  • No. Field Value EN RO

    1. Type negative (z) xinfinitive (n) xsubjunctive (s) xaspect (a) xfuture (f) x

    Exemple:Exemple: nu Qz

    n- Qz-y

    a Qn

    s Qs fi Qa

    o Qf

  • Din punct de vedere al structurii morfologice, verbele pot fi clasificate n: verbe simple: go verbe compuse: spotlightverbe cu particul adverbial: put on, put off verbe cu particul adverbial: put on, put off

    verbe cu prepoziie obligatorie: look at, listen to locuiuni verbale: take care of, make use ofSensul lexical. n limba englez, verbele se mpart n: verbe cu sens lexical plin, verbe noionale verbe cu sens lexical redus, avnd de obicei funcie gramatical: verbe copulative, verbe auxiliare, verbe modale

  • verbe copulative (be, i conform gramaticii tradiionale appear, seem, look, turn, become, get, grow, remain, stay, etc.)

    He seems ill.

    Pare bolnav.

    verbe auxiliare: (be, have, shall/should, will/would, may/might, verbe auxiliare: (be, have, shall/should, will/would, may/might, can/could, do) care au funcii sintactice, marcnd modul, timpul, aspectul, etc.:

    verbe semiauxiliare sau modale: (can/could, must, have to, may/might, shall/should, will/would, ought to, etc.)

    He was told a lie.

    I s-a spus o minciun.

    He was trying to catch the ball when he fell.

    ncerca s prind mingea cnd a czut.

    It might rain later.

    S-ar putea s plou mai trziu.

    You must finish before noon.

    Trebuie s termini nainte de prnz.

  • Pe plan sintactic, verbele cu sens lexical plin sunt predicative, adic pot forma singure predicatul unei propoziii, pe cnd verbele cu sens lexical redus sunt nepredicative avnd nevoie de o alta construcie (verb noional, nume predicativ) pentru a deveni predicate:The child is clever.The child is clever.

    Copilul este detept.Ele pot marca anumite categorii gramaticale:The film was seen by millions of people.

    Filmul a fost vzut de milioane de oameni.

  • Prezentul cu valoare de viitor este ntrebuinat n propoziii subordonate:

    de timp, introduse de when, after, before, as soon as:

    Well get home before it gets dark.

    Vom ajunge acas nainte s se ntunece.

    condiionale, introduse de if, unless, provided, in case: condiionale, introduse de if, unless, provided, in case:

    If it rains on Sunday, Ill repair my bicycle.

    Dac o s plou duminic, am s-mi repar bicicleta.

    cu verbe ca tell, hear, learn, write pentru a sublinia efectul prezent al unei cominicri trecute:

    He tells me that you have won the competition.

    Imi spune c ai ctigat competiia.

  • Past Tense simplu este folosit pentru a exprima:

    o aciune svrit i ncheiat nt