Semiotica

download Semiotica

If you can't read please download the document

description

Corpus

Transcript of Semiotica

Corpusul

Definiia corpusului n domeniul tiinific, corpus definete un ansamblu vast sau exhaustiv de documente sau date. n domeniul tiinelor limbajului, vorbim de totalitatea datelor pe care se bazeaz descrierea unui fenomen. La nceput, se considera a fi un corpus doar un ansamblu de texte care era finit sau nchis. Una din definiiile de referin pentru tiinele limbajului a fost dat de John Sinclair. Corpusul este un ansamblu de date tiinifice organizate i selecionate dup criterii specifice pentru a servi ca eantion de limb. Ele trebuie s fie organizate i selecionate, corpusul trebuind s fie reprezentativ pentru eantion i s serveasc la generalizare. Pentru constituirea unui corpus, vom avea n vedere reprezentativitatea din punct de vedere al cantitii i, apoi, a calitii. Cantitatea depinde de domeniul fenomenului i din punct de vedere al analizei, instrumentului folosit la cutare. Vorbim despre corpusuri exhaustive, dar prezint dezavantajul unei cutri greoaie. Uneori unele corpusuri se rennoiesc permanent. Exist echipe de cercetare care se concentreaz pe formarea de corpusuri. Unele strng tot ceea ce nseamn text pentru un anumit domeniu. Folosesc pentru cercetare i pentru didactic, cercetndu-se mai uor cum se comport limba(Montpelier, British Corpus). Trsturilor corpusului 1. Omogenitatea Datele care pot intra ntr-un corpus trebuie s aib cel puin un punct comun sau s ilustreze aceeai problematic. Acesta poate fi mai mult sau mai puin de timp, larg sau restrns, fr criterii de timp, parial. Acum exist tendina s fie c t mai specific. Uneori pot fi eterogene, dar avnd un fir comun poate catalogat ca i omogen. Un corpus scris este eterogen din punct de vedere al canalului. 2. Modul de tratare sau procesare La nceput acesta a fost manual, dar n general se proceseaz cu ajutorul mijloacelor informatice. 3. Articularea faptelor cu spaiul social

n ultima vreme s-a observat c observat introducerea spaiului social: limb context. Corpusul trebuie explicat din perspectiva condiiilor n care apare. 4. Specificitatea domeniului n care va fi folosit corpusul Spre exemplu, literar versus mediatic. Pe msur ce au evoluat studiile, s-a schimbat perspectiva asupra caracterului finit i s-a concluzionat c un corpus prezint cele puin dou deschideri: spre contextul celui care lucreaz i celui care interpreteaz, iar a doua deschidere ctre alte texte sau corpusuri(intertextualitate). Astfel, niciun enun nu exist n mod izolat, el fiind o formulare a unui enun anterior, mai trziu vorbindu-se de interdiscursivitate. Lingvistica de corpus Lingvistica de corpus apare la nceputul anilor 80 n spaiul scandinav i britanic, iar ulterior n Frana. Disciplina urmrete studiul limbii n context, plecnd de la un corpus dat, avnd relaii cu pragmatica, dar i cu tiinele intertextualitii, difereniinduse de acestea prin atenia acordat corpusului. Avnd n vedere folosirea programelor informatice, au aprut reprouri la adresa lingvisticii c tinde spre formalizarea limbii. Scopul final nu este automatizarea limbii, ci o mai bun organizare. Aplicabilitatea se constat n didactica limbilor moderne, traduceri, analiza discursului i n lingvistica aplicat. Modaliti de abordare a corpusului Exist dou mari posibiliti de abordare: deductiv i inductiv. Modalitatea deductiv: pornind de la o premis, concluzia va fi dat de analiza pe corpus. n urma analizei, premisa poate fi infirmat sau confirmat. Modalitatea inductiv: pleac de la analiza corpusului, fr premise teoretice, pentru a se ajunge la generalizare i teorie. n primul caz se pleac de la general la particular, iar n al doilea de la particular la general. Lingvistica de corpus propune lucrul cu texte reale. Se insist pe analiza faptelor de limb, pornind de la discursul efectiv realizat. n mod normal, un corpus pornete de la dimensiunea unei fraze i poate ajunge la mrimi considerabile.

Criterii Exist ncercri de teoretizare a constituirii corpusului, propunndu-se unele mai mult sau mai puin riguroase. Se observ o mare varietate a corpusurilor, funcie de spaiul n care acesta funcioneaz. Nu trebuie confundat noiunea de corpus cu cea de arhiv de texte. Un corpus este o arhiv funcie de ceea ce dorim s facem cu ele. ntr-un ziar, toate apariiile nu sunt un corpus, ci o resurs. Fondatorii lingvisticii de corpus sunt John Sinclair, Jeffrey Leech, Elena Tonini Boneli. Necesitatea apariiei lingvisticii corpus Aceasta apare ca o reacie la lingvistica introspectiv, care a caracterizat studierea limbajului pn n anii 80. Reprouri aduse: probleme legate de acceptabilitatea exemplelor, ignorarea problematicii variaiei limbii. Acceptabilitate: Labo-sociolingvistic. Variaia lingvistic Majoritatea limbilor prezint variaii. Majoritatea lingvitilor considerau limba ca fiind omogen, ideal, nspre care tinde toat lumea i pe care nu o atinge nimeni. Nimeni nu vorbete la fel cum scrie n dicionar. Cnd se confrunt cu gramatica se constat o mulime de variaii diacronice, dia-fazice, diaspaiale. Lingvistica de corpus s-a impus i prin necesitatea lurii n calcul a variaiei unei limbii. Lingvistica tradiional se bazeaz foarte mult pe intuiie. Lingvistica de corpus a aprut i ca necesitatea evitrii intuiiei. Analiza pe corpus dei a ndeprtat problema acceptabilitii i variaiei, are de rezolvat probleme ca: putem introduce n sistem folosirile marginale, periferice?; tot ceea ce este atestat, adic folosit de unul sau mai muli vorbitori, aparine sistemului?