1
STUDIU ASUPRA SITUAȚIEI DISCURSULUI INSTIGATOR LA URĂ ÎN
ONLINE-UL ROMÂNESC
R.M. MEZA1 Rezumat. Această cercetare urmărește discursul instigator la ură în mediul online în trei dintre cele
mai importante spații publice de expresie la ora actuală: comentariile publicate pe Facebook, pe
pagini ale unor persoane publice, pe bloguri și în ziarele online. Au fost studiate peste 2,6 milioane
de comentarii în limba română din perioada ianuarie-iunie 2015, urmărind apariția în același
context a unor referințe la grupuri care devin frecvent ținte ale discursului instigator la ură cu
elemente de limbaj violent. Rezultatele indică o frecvență relativ mică a acestui fenomen per
ansamblu – sub 1/%, pe eșantionul studiat, dar și câteva contexte și perioade bine definite în care
indicatorii folosiți pentru a detecta acest tip de discurs apar foarte frecvent, sugerând posibilități de
continuare a cercetării prin metode ce permit studiul în adâncime al acestor contexte.
I. Introducere și contextualizare Studiul de față, realizat la inițiativa PATRIR, este un demers preponderent descriptiv ce urmărește
să releve incidența și tipurile instanțelor de DIU (discurs instigator la ură) în contextul socio-
cultural românesc, observând trei modalități principale de expresie ale publicului român în mediul
online: pe pagini publice de pe platforma Facebook, în secțiuni de comentarii ale blogurilor și
principalelor ziare în variantă electronică.
În contextul actual, european și internațional, tema DIU devine tot mai importantă. Văzută ca un
loc de intersecție al exercitării dreptului la liberă exprimare, inclus în Declarația Universală a
Drepturilor Omului, cu nevoia crescândă de promovare a toleranței și respectului între oameni în
societăți și medii culturale tot mai diverse din punct de vedere rasial, etnic, religios sau al orientării
sexuale, aria DIU devine o preocupare pentru cercetători, legiuitori, societatea civilă și stakeholderi
din zona comunicării publice mediate, indiferent de canalul de comunicare.
1 Universitatea Babeș-Bolyai, Facultatea de Științe Politice, Administrative și ale Comunicării, Departamentul de Jurnalism, contact: [email protected]
2
Subtema discursului instigator la ură în mediul online este una de actualitate, care poate deschide
numeroase discuții referitoare la jurisdicție, responsabilitate, modalități de prevenție sau intervenție
care să nu încalce dreptul indivizilor la libera exprimare.
Această lucrare explorează modalități metodologice noi de identificare și clasificare a DIU în
mediul online, atât pe platformele de socializare (Facebook), cât și pe bloguri și site-uri ale unor
ziare în variantă electronică. Mediul online, ca mediu de expresie, este mai puțin reglementat și de
multe ori perceput ca un spațiu în care nu există limite externe impuse. În multe zone de expresie
– forum-uri sau grupuri de discuții, bloguri sau secțiuni de comentarii aferente acestora,
participanții la contextul de comunicare mediată online pot să se exprime în mod anonim, fapt ce
presupune un grad mai mic de responsabilitate în emiterea de mesaje. Mesajele digitale din mediul
online nu sunt volatile în marea parte a cazurilor, iar sistemele de comunicare asincronă mediată
de computer (cum sunt thread-urile de comentarii) pot întreține discuții pe perioade de timp
nedefinite cu număr potențial nelimitat de participanți sau cititori. În plus, chiar dacă platformele
care găzduiesc aceste contexte de comunicare devin de facto spații publice, ele sunt deținute de
companii private, fapt ce ridică numeroase probleme de gestionare și jurisdicție.
Din punct de vedere al cercetătorului comunicării mediate de computer, mesajele publicate în astfel
de contexte online pot constitui o resursă pentru studiul surselor, structurilor discursive și dinamicii
DIU în mediul online. Astfel de cercetări pot oferi căi de gestionare a problemei DIU de către
stakeholderi de la nivelul societății civile, guvernamental, al companiilor private sau
comunicatorilor care dețin și administrează spații de dialog public.
II. Comunicarea mediată de computer (CMC) și comentariile online Miza centrală a acestui studiu fiind discursul în mediul online, ne vom raporta la cadrul teoretic
definit pentru studiul comunicării mediate de computer (CMC), urmând apoi să trecem în revistă
câteva aspecte ale domeniului emergent al lingvisticii computaționale, care fundamentează
abordarea metodologică a studiului.
CMC se intersectează cu aria studiilor interacțiunii dintre om și computer (engl. ”human computer
interaction”: HCI) și cu paradigma lucrului cooperativ sprijinit de computer, în ambele arii fiind
identificate două tipuri principale de comunicare(Dix et al. 2004):
• Sincron – utilizatorii trebuie să fie online în același timp pentru a comunica;
• Asincron – utilizatorii nu trebuie să fie online în același timp.
Studiul CMC vizează interactivitatea în comunicarea de tip one-to-one și many-to-many în
contextele comunicaționale create pe Internet de diferite tehnologii, instrumente sau platforme de
3
comunicare: e-mail, chat, Bulletin Board Systems, Multi User Dungeons, Internet Relay Chat,
Instant Messaging, forumuri Web sau alte spații de discuții online și în ultimii ani diferite tipuri de
social media.
De asemenea, dincolo de această împărțire în funcție de modul în care interacționează participanții
la un context comunicațional online, cercetările CMC vizează două direcții principale: comunicarea
mediată sub formă text în lipsa elementelor non-verbale și paraverbale (”cues filtered-out”) și
cercetarea avatarurilor construite de către utilizatori pentru a interacționa în mediul online.
Principalul obiect de studiu al lucrării de față fiind comentariile publicate în thread-uri
conversaționale atașate unor articole de pe bloguri, știri de pe site-uri ale unor ziare electronice,
respectiv mesaje pe pagini publice de Facebook ale unor personalități, ne vom concentra pe
specificul acestei forme de CMC asincronă, de tip many-to-many.
Structura comunicațională de tip thread a apărut în contextul sistemelor de tip Bulletin Board, apoi
în forumurile sau grupurile de discuții pe Web, în cele din urmă devenind forma predilectă de
feedback în contextul sistemelor de blogging, media sharing și în site-urile de tip rețea socială.
Caracteristicile acestei structuri în contextul BBS și forumurilor Web, precum și diferențele
survenite prin adaptarea lor la platforme de blogging și sisteme de tip rețea socială sunt descrise în
(Meza 2015).
Pe scurt, în cazul majorității blogurilor sau publicațiilor online de mai mare anvergură (de obicei
create folosind sisteme de management de conținut Web ca Wordpress, Joomla, Typo3, Drupal),
cititorii pot trimite comentarii spre publicare sub fiecare articol publicat. În funcție de felul în care
este administrat acest aspect la nivelul sistemului Web, comentariile sunt trimise spre aprobare sau
publicate instantaneu. Cititorii pot comenta anonim (alegându-și pe loc un nickname) sau după
înregistrarea și autentificarea cu un cont creat pe baza unei adrese de e-mail în sistem. Unele site-
uri folosesc sisteme de filtrare automată la publicare a comentariilor bazate pe cuvinte cheie
(cuvinte interzise) sau sisteme de rating care permit celorlalți cititori să marcheze un anumit
comentariu ca fiind nepotrivit, jignitor, fals etc..
Mai recent, unele sisteme au integrat autentificarea prin conturi Google sau Facebook, uneori chiar
excluzând posibilitatea publicării de comentarii anonime, sub un nume introdus ad-hoc. Astfel de
sisteme implică de cele mai multe ori obligativitatea utilizării și asumării identității reale în raport
cu mesajul trimis spre publicare în aceste spații de dialog public, fapt ce poate duce la o
responsabilizare a contribuitorilor la discuție și în același timp având potențialul de vizibilitate
pentru respectivul articol și în interiorul platformelor sociale ca Facebook sau Google+ prin
mecanismele de partajare automată aferente acestor sisteme de comentarii. Totuși, există multe
4
spații de expresie în mediul online unde ținerea sub control a DIU implică efort constant și
responsabilizarea mai multor factori (Cohen-Almagor 2011), tehnicile automate neputând fi
utilizate încă pe scară largă și în mai multe limbi pentru a detecta forme de DIU ce implică
stereotipuri complexe sau limbaj conotativ.
III. Comentariile online și metoda analizei co-ocurențelor Din punct de vedere metodologic, detecția discursului violent, obscen sau instigator la ură pune
probleme atât cercetătorilor media în general, dar și deținătorilor platformelor care devin spații
publice de discuții. Bariera prelucrării automate a limbajului natural este una dificil de depășit, în
special pentru limbile care nu sunt de circulație internațională și implicit nu stârnesc suficient
interes din partea cercetătorilor la nivel global. Problema posibilității detectării sensului unor
sintagme este una de actualitate, iar utilizatorii (anonimi sau nu) ai platformelor de expresie
predilecte folosesc coduri lingvistice care pot trece neobservate de metodele tradiționale de detecție
a cuvintelor interzise (Hughey & Daniels 2013). De asemenea se poate pune problema riscului
blocării unor comentarii legitime care fac referire la grupuri vulnerabile, fără a fi însă instigatoare
la ură sau politic incorecte.
În absența unor instrumente bine dezvoltate și ușor de utilizat pentru cercetătorii din științele
sociale care să permită analiza textului în limba română, nu putem lua în discuție relațiile sintactice
din enunțurile din mediul online analizate, oricât de scurte ar fi, nemaivorbind de detecția
enunțurilor negative, interogative sau aspectele semantice ale ironiei și sarcasmului. O trecere în
revistă a instrumentelor disponibile și utilizate în context global și național pentru analize ale
limbajului natural se poate găsi în (Cristea & Forăscu 2006), dar multe platforme sau instrumente
folosite pe scară largă nu pot fi adaptate cu succes analizei de text în limba română. Cu toate
acestea, date fiind seturi de date suficient de mari de enunțuri relativ scurte, cum sunt comentariile
din mediul online, putem utiliza analiza co-ocurențelor pentru a ne indica măcar punctele de interes,
care pot fi ulterior explorate mai în adâncime.
Acest tip de analiză este răspândită în științele informației și comunicării, fiind utilizată în special
în biblioteconomie și scientometrie, dar și în aplicații statistice de traducere automată sau prelucrare
a limbajului natural. Abordări mai recente în zona lingvisticii computaționale aplicate pe DIU
utilizează tehnici de machine learning similare cu cele utilizate pentru analiza sentimentelor în
corelație cu tehnici de detecție a termenilor utilizați în mediile online pentru a face referire la
grupurile rasiale, etnice sau religioase (Gitari et al. 2015).
5
IV. Literatura de specialitate Pentru această lucrare vom lua în considerare ca repere principale două studii de dată recentă, unul
referitor la DIU în România, (Bădescu et al. 2014), iar celălalt referitor la problemele specifice
ridicate de DIU în mediul online, (Gagliardone et al. 2015).
Studiul coordonat de Gabriel Bădescu și Daniela Angi trece în revistă definițiile DIU pe care le
vom lua în considerare și pentru studiul de față. Pentru brevitate, vom prelua aici doar una dintre
ele:
„termenul <discurs instigator la ură> va fi înțeles ca acoperind toate formele de exprimare
care diseminează, incită, promovează sau justifică ura rasială, xenofobia, anti-semitismul
sau alte forme de ură bazate pe intoleranță, inclusiv: intoleranța exprimată de naționalismul
agresiv sau etnocentrism, discriminare și ostilitate împotriva minorităților, migranților și
persoanelor ce sunt descendenți ai imigranților”(Weber 2009) apud (Bădescu et al. 2014).
Același studiu precizează aspectele importante de urmărit în studiul incidenței DIU ca act de
comunicare:
• Conținutul (ce se spune);
• Emitenții (cine spune);
• Țintele (despre cine se spune);
• Contextul (care include și momentul actului).
Luând în considerare aceste elemente, am urmărit trecerea în revistă a rezultatelor de până acum în
studiul DIU din România cu scopul de a identifica țintele predilecte pe care le are acest tip de
discurs în societatea română contemporană, conform unui interviu cu Ioana Avădani, Directorul
Centrului pentru Jurnalism Independent: romii, evreii, maghiarii – minorități etnice și persoanele
LGBT – minorități sexuale. Aceeași sursă menționează și o tendință de scindare a valorilor
(credință versus secularism) din care poate rezulta un discurs îndreptat asupra ateilor (Bădescu et
al. 2014, p.41). Am utilizat aceste ținte (și termenii alternativi folosiți în limba română pentru a
face referință la acestea) în alcătuirea instrumentului de codificare pentru studiul de față, adăugând
și termenii referitori la următoarea cea mai importantă minoritate etnică istorică – sașii din
Transilvania. În ceea ce privește aspectul conținutului, am mai preluat de asemenea în instrumentul
de codare automată folosit în acest studiu și o serie de asocieri frecvent întâlnite în DIU între
membrii unor minorități și anumiți termeni care desemnează caracteristici sau comportamente
6
negative, adăugând acestora și altele, îndemnuri la acțiune (negativă, forțată sau violentă), precum
și expresii vulgare explicite.
În ceea ce privește specificul DIU în mediul online, în (Gagliardone et al. 2015) sunt identificate
câteva aspecte cheie care disting DIU în acest mediu față de mediile tradiționale:
Discursului instigator la ură în mediul online nu i se pot aplica măsurile elaborate pentru mediile
tradiționale (acestea fiind ineficiente sau nepotrivite), trebuie ținut cont de specificul mediului și
făcut diferența între apariții incidentale și campanii sistematice, între articole fără vizibilitate și
mesaje care devin virale.
V. Planul cercetării Scopul cercetării de față este acela de a identifica și clasifica instanțe de DIU în conținuturi
publicate în limba română din mediul online în primele 6 luni ale anului 2015.
V.1 Obiectivele studiului
• Identificarea referințelor la grupuri minoritare în comentarii publicate pe pagini publice de
Facebook, bloguri și site-uri ale ziarelor în variantă electronică;
• Identificarea raportului dintre termenii folosiți pentru a face referire la grupuri minoritare
ce devin ținte ale DIU prin măsurarea frecvențelor apariției referințelor neutre în raport cu
referințele derogative;
• Identificarea unor elemente de limbaj explicit, imprecații sau îndemnuri la acte forțate/de
violență;
• Identificarea asocierii grupurilor care sunt ținte ale DIU cu violența lingvistică prin
măsurarea co-ocurenței referințelor la grupuri minoritare și a elementelor de limbaj explicit,
imprecațiilor și îndemnurilor la acte forțate/de violență.
V.2 Întrebări de cercetare
• La ce grupuri minoritare se face referință în comentarii pe Facebook, bloguri și pe site-uri
ale unor ziare în variantă electronică?
• Ce termeni sunt folosiți frecvent pentru a face referință la grupuri minoritare?
• Ce imprecații, îndemnuri la acte forțate/de violență sau elemente de limbaj explicit se
folosesc în comentarii?
• Cât de des apar referințe la grupuri minoritare și imprecații, îndemnuri la acte forțate/de
violență sau elemente de limbaj violent în aceleași comentarii?
7
VI. Metodologia cercetării Pentru a atinge obiectivele propuse și a răspunde la întrebările de cercetare, ținând cont de
specificul mediului online (și avantajele și dezavantajele presupuse), am ales să folosim analiza de
conținut ca principală metodă de cercetare.
În cazul de față, am optat pentru analiza unor seturi mari de date - comentarii publicate în mediul
online (Facebook, bloguri, ziare electronice) folosind metode automate de codificare. Urmărim
contextul (platforma/articolul/pagina și momentul publicării), țintele DIU și conținutul discursului.
Avantajul major al acestei abordări este posibilitatea de a parcurge cantități mari de date (de ordinul
milioanelor), urmărind apariția unor termeni cheie în textul comentariilor.
Dezavantajele majore constau în dificultatea de a detecta sensul la nivelul unor sintagme,
vulnerabilitatea la ortografieri alternative (sau greșite), lipsa unor instrumente software de
prelucrare a limbajului natural în volume mari pentru limba română: instrumente de identificare și
marcare a părților de vorbire (POS tagging), liste de excludere a cuvintelor de legătură sau
deicticelor (stop words) suficient de dezvoltate, sensibilitatea instrumentelor disponibile la
utilizarea caracterelor cu diacritice din mai multe seturi de caractere diferite etc.
Având în vedere natura exploratorie a acestui studiu, am preferat să parcurgem o cantitate mare de
date, urmărind apariția în contextul fiecărui comentariu a referințelor (neutre sau negative) la
grupuri minoritare, respectiv utilizarea unor termeni asociați cu imprecații, îndemnuri la acțiuni
forțate sau violente, limbajul vulgar explicit.
Pentru detecția instanțelor de DIU, ne vom raporta la utilizarea unor termeni cu încărcătură negativă
pentru referirea la minorități, respectiv la co-ocurența oricăror referința la minorități cu imprecații,
îndemnuri la acțiuni forțate sau violente, limbaj vulgar explicit la nivelul fiecărui comentariu.
Pentru lucrarea de față am ales să studiem un eșantion de 25 de pagini publice de Facebook ale
unor persoane publice (celebrități din domeniul media și divertisment, oameni politici) pe care se
postează în principal în limba română. Numărul inițial pentru care s-a făcut colectarea de date a
fost de 26 de pagini de Facebook, dar pagina Kelemen Hunor a fost exclusă în cele din urmă
deoarece conținutul comentariilor este preponderent în limba maghiară, neputându-se aplica
tehnica de codare automată în mod uniform cu celelalte pagini.
VI.1 Pagini publice de Facebook
În continuare vom prezenta pe scurt paginile de Facebook incluse în studiu, profilul personalității
publice, precum și motivația includerii în studiul de față. Am ales preponderent pagini cu număr
mare de fani din domeniile divertisment, media și politică. Am optat pentru includerea în studiu și
8
a unor pagini cu mai puțini fani, dar care pot fi de interes în contextul DIU (personalități care
aparțin sau sunt asociate cu grupuri rasiale sau etnice minoritare sau personalități afiliate unor
grupuri / formațiuni politice din zona extremei drepte). Lista de mai jos include și poziția în
clasamentul general al paginilor de Facebook din România2. Nu am inclus de exemplu cea mai
populară pagină e Facebook a unei celebrități din România (Inna) deoarece această cântăreață din
România postează preponderent în limba engleză, având un public țintă internațional.
Lista de mai jos este ordonată alfabetic, așa cum vor apărea în graficele ulterioare.
1. Alex Velea (1.729.528 de fani, locul 21) – artist muzical, despre care unele surse online,
citând chiar reprezentanți ai minorității rome, susțin că ar fi de etnie romă.
2. Andi Moisescu (1.294.682, locul 39) personalitate media, realizator/prezentator de
emisiuni.
3. Andra (2.573.123 de fani, locul 7) – artist muzical, despre care unele surse online
(preponderent ziare/reviste senzaționaliste și grupuri de discuții) susțin că ar fi de origine
romă.
4. Antonia (2.918.787 de fani, locul 6) – artist muzical, a cărei relație cu artistul Alex Velea
a fost mediatizată intens de tabloide.
5. Bogdan Diaconu (139.558 de fani, locul 10 în topul paginilor de Facebook ale
politicienilor) – politician, membru al Camerei Deputaților, președintele Partidului
România Unită.
6. Cabral (304.718 de fani, locul 378) – fost sportiv, realizator/prezentator TV, personalitate
media, de origine româno-congoleză.
7. Cătălin Măruță (1.539.210 de fani, locul 31) – realizator/prezentator TV, a cărui relație cu
artista Andra apare relativ frecvent în atenția tabloidelor.
8. CONNECT-R OFFICIAL (2.475.790, locul 8) – artist muzical de etnie romă, cunoscut
pentru o apariție intens mediatizată în 2010 cu un tricou cu inscripția ”SUNT ȚIGAN” și
pentru luări de poziție ulterioare pe tema imaginii și stereotipurilor legate de termenii
”țigan” și ”rom” și grupul etnic din care face parte.
9. Corneliu Vadim Tudor (108.195 de fani, locul 14 în topul paginilor de Facebook ale
politicienilor) – politician, fondator și lider al Partidului România Mare, poet, fost senator,
membru al Parlamentului European, decedat la 14 septembrie 2015.
10. DoZa de Haș (777.794 de fani, locul 109) – videoblogger.
2 Conform facebrands.ro (septembrie 2015).
9
11. Eduard CRBL (1.175.437 de fani, locul 50) – artist muzical, personalitate media.
12. Elena Udrea (313.062 de fani, locul 366 în topul general, locul 4 în topul paginilor
politicienilor) – politician, membră a Camerei Deputaților, fostă ministru (PNL, PDL,
PMP).
13. Gabriela Firea (356.716 de fani, locul 313) – politician, fostă jurnalistă, membră a
Senatului României (PSD).
14. Kelemen Hunor (12.745 de fani, locul 66 în topul paginilor politicienilor) – politician de
etnie maghiară, președintele UDMR – pe această pagină majoritatea conținutului este în
limba maghiară.
15. Klaus Iohannis (1.638.598 de fani, locul 24 în topul general, locul 1 în topul paginilor
politicienilor) – politician, președintele României, de etnie germană.
16. Mihaela Rădulescu Schwartzenberg (276.176 de fani, locul 421) – personalitate media,
prezentatoare și realizatoare TV, despre care ziarele tabloide speculează că ar fi de etnie
romă (probabil datorită numelui de fată – Țiganu), căsătorită cu Bogdan Rădulescu, Ștefan
Bănică Junior și ulterior Elan Schwartzenberg (convertită în 2004 la iudaism).
17. Mircea Badea chiar el (302.599 de fani, locul 381) – prezentator/realizator TV.
18. Puya Scandalos Music (540.270 de fani, locul 181) – artist muzical hip-hop/rap, cunoscut
membru al formației La Familia.
19. Remus Cernea (130.485 de fani, locul 11 în topul paginilor politicienilor) – politician,
activist împotriva discriminării pe criterii religioase și de credință, membru al Camerei
Deputaților (Partidul Verde, Mișcarea Verzilor, USL) cu inițiative legislative în zona
finanțării cultelor religioase și căsătoriilor între persoane de același sex.
20. Simona Halep (1.234.520 de fani, locul 42) – sportivă a cărei popularitate a crescut recent,
o dată cu clasarea în topurile mondiale din tenisul feminin.
21. Sorin Ovidiu Vântu (95.288 de fani) – om de afaceri (proprietar al trustului media
Realitatea Cațavencu), personalitate publică, cunoscut și condamnat în relație cu cazul FNI,
recent foarte activ în social media, în special prin postări video pe Facebook.
22. Teo Trandafir (1.632. 909 de fani, locul 25) – realizatoare/prezentatoare TV, cu o pagină
de Facebook cunoscută pentru popularitatea postărilor publicate.
23. Tony Poptămaș (1.291.595 de fani, locul 40) – artist muzical stabilit în străinătate ale cărui
postări pe Facebook au câștigat recent mare popularitate.
24. Traian Băsescu (348.814 de fani, locul 318 în topul general, locul 3 în topul paginilor
politicienilor) – politician, fost președinte al României.
10
25. Victor Ponta (764.659 de fani, locul 111 în topul general, locul 2 în topul paginilor
politicienilor) – politician, primul ministru al României (PSD).
26. ZMENTA.ro (881.116 de fani, locul 84) – videoblogger.
VI.2 Bloguri
Am ales 10 bloguri dintre cele mai vizibile bloguri din România‚ ținând cont de mai multe topuri
publicate în prima parte a anului 2015 (topul blogurilor ZeList la data de 30 iunie 20153 și topul
publicat de refresh.ro la nivelul lunii martie 20154), dar încercând și includerea unor bloguri ai
căror autori nu sunt din capitală. Tematica blogurilor variază de la bloguri generaliste sau de nișă
(culinare sau de tehnologie) susținute de persoane care nu au expunere în mediile tradiționale, la
bloguri susținute de jurnaliști și bloguri susținute de vedete. Ordinea listei este alfabetică.
1. adihadean.ro (Adi Hădean) [locul 6 Zelist] – bucătar, blog culinar;
2. arhiblog.ro (Cetin Ametcea) [exclus voluntar din topul ZeList, dar locul 10 conform unui
top refresh.ro];
3. ciutacu.ro (Victor Ciutacu) [locul 3 ZeList] – jurnalist la Jurnalul Național și Antena2;
4. cristianchinabirta.ro (Cristian China Birta) [locul 19 conform unui top refresh.ro, locul 1
în topul bloggerilor cu care au lucrat agențiile în 2014, realizat de Revista Biz5];
5. manafu.ro (Cristian Manafu) [locul 2 ZeList] – fost jurnalist economic, tratează subiecte
din zona social media și tehnologie;
6. piticigratis.com (Radu Alexandru) [locul 11 ZeList] – umorist, blog de satiră6;
7. tolo.ro (Cătălin Tolontan) [locul 8 ZeList] – jurnalist Gazeta Sporturilor/gsp.ro;
8. tudorchirila.blogspot.ro (Tudor Chirilă) [locul 1 ZeList] – artist muzical, actor;
9. tvdece.ro (Florica/Alina Dragoș și Zicu/Răzvan Dragoș) [locul 34 ZeList];
10. zoso.ro (Vali Petcu) [exclus voluntar din topul ZeList, dar locul 3 conform unui top
refresh.ro].
VI.3 Ziare în variantă electronică
Am ales cele cinci ziare în variantă electronică incluse în acest studiu luând în considerare cifrele
(vizitatori unici) publicate de SATI7 pentru luna septembrie 2015 pentru categoria ”Știri
3 Sursa: http://www.zelist.ro/bloguri/2015-06-30 4 Sursa: http://refresh.ro/2015/04/top-bloggeri-romania-3/ 5 Sursa: http://www.revistabiz.ro/top-bloggeri-relatia-cu-agentiile-2014/ 6 A se vedea genul ”fratire” (engl. din ”fraternity” și ”satire”) – un tip de scriitură satirică scrisă în manieră incorectă politic, din punct de vedere masculin, ce abordează frecvent teme ca alcoolul și sexul. 7 Sursa: http://www.brat.ro/sati/
11
generaliste”. Am exclus agregatoarele de știri, agențiile de presă, site-urile unor televiziuni,
revistele de nișă sau ziarele locale. Ordinea listei este alfabetică.
1. adevarul.ro (Adevărul) [6 milioane de vizitatori unici]
2. evz.ro (Evenimentul Zilei) [3 milioane de vizitatori unici]
3. gandul.info (Gândul) [4,2 milioane de vizitatori unici
4. hotnews.ro (HotNews) [2,2 milioane de vizitatori unici]
5. jurnalul.ro (Jurnalul Național) [1,5 milioane de vizitatori unici]
VI.4 Instrumente de colectare a datelor
Pentru colectarea datelor din platforma Facebook, am folosit aplicația gratuită Facepager,
extrăgând în prima etapă toate postările din perioada analizată, iar apoi extrăgând comentariile (din
perioada analizată) pentru fiecare postare în parte. Aplicația colectează datele interogând API-ul
(Application Programming Interface) Facebook.
Pentru fiecare postare s-au colectat următoarele date:
• Denumirea paginii
• Tipul postării (imagine, link, video, status)
• Mesajul postării
• Numărul de shares
• Numărul de likes
• Numărul de comentarii
• Data și ora creării mesajului
Pentru fiecare comentariu subordonat fiecărei postări, în thread s-au colectat următoarele date,
menținând relația dintre fiecare pagină, postare și comentariu:
• Autorul (profil de Facebook)
• Mesajul (textul comentariului)
• Data și ora creării mesajului
Din rațiuni de complexitate a procesului de colecție am decis să colectăm comentarii doar la primul
nivel al thread-ului. Comentariile publicate la al doilea nivel al thread-ului nu au fost luate în
considerare (răspunsuri la un comentariu anume de la nivelul 1 al thread-ului).
Pentru colectarea datelor din interiorul unor sisteme de management de conținut Web (WCMS),
cum sunt cele folosite pentru a administra site-uri dinamice de tip blog sau site-uri ale unor ziare
electronice, am folosit instrumente de Web scraping (mai precis, Helium Scraper și Import.io).
12
Utilizarea acestui tip de instrumente presupune definirea unor șabloane pentru fiecare tip de pagină
Web generată de WCMS, procesul de navigare pe lista de arhivă și pe fiecare pagină a fiecărui
articol în parte putând fi apoi automatizat.
Pentru fiecare blog și ziar au fost luate în considerare toate articolele publicate în perioada analizată
și toate comentariile aferente acestora.
Datele colectate pentru cele 10 bloguri și 5 site-uri sunt următoarele:
• Titlul articolului
• Autorul articolului (în cazul ziarelor și blogurilor colective)
• Data publicării
• Numărul de comentarii
La nivelul fiecărui articol publicat, pentru fiecare comentariu s-au colectat următoarele date:
• Autorul comentariului
• Data publicării comentariului (din rațiuni ce țin de lipsa de consistență a formatului datelor,
am omis această parte a datelor pentru cele 10 bloguri din analiza finală)
• Textul comentariului
Având în vedere diferențele substanțiale între cele 15 site-uri Web de pe care s-a făcut colectarea
și elementelor precum reclamele pop-up, apar anumite limitări la nivelul preciziei extracției datelor.
Din cauza limitărilor impuse de instrumentele de colectare și curățare a datelor precum și de
resursele de calcul aflate la dispoziție, o parte din date nu au fost colectate sau au fost excluse la
momentul pregătirii datelor pentru analiză:
Pentru articolele din ziarul online Gândul, doar primele 10 comentarii au fost colectate în cazul
articolelor cu mai mult de 10 comentarii, iar comentariile introduse de utilizatori prin modulul
integrat cu Facebook nu au fost colectate.
Din totalul articolelor din arhivă publicate în primele 6 luni ale anului 2015, pentru ziarele Gândul
și HotNews, am exclus articole din secțiuni ca ”revista presei”, ”horoscop”, „magazin”,
”internațional”, ”meteo” sau ”it-c”. Din totalul de 18140 de articole publicate pe gandul.info, am
extras comentariile pentru 8462 de articole, iar din totalul de 18373 articole publicate pe hotnews.ro
am extras comentariile pentru 7518 dintre ele. Pentru evz.ro (care are sistem de ierarhizare și
raportare a abuzurilor în comentarii), am extras comentariile pentru 11647 de articole, pentru
jurnalul.ro am extras comentariile pentru 8343 de articole, iar pentru adevarul.ro comentariile
aferente la 9818 articole. Navigarea automată pe paginile publicațiilor și implicit colectarea de date
13
de acest tip poate fi adesea îngreunată de reclame pop-up sau alte elemente dinamice, de aceea
presupunem că numărul total de comentarii al acestor publicații este mai mare, dar considerăm că
eșantionul rezultat pe care s-a făcut analiza e suficient de mare pentru a fi relevant.
În cazul blogurilor, unele dintre comentariile colectate sunt trackback-uri sau spam, iar în alte
cazuri sistemele de conținut folosite de bloggeri au funcționalități ce permit ierarhizarea
comentariilor în funcție de voturi și ascunderea automată a comentariilor nepopulare – fapt ce e
posibil să ducă la ascunderea unor instanțe de DIU.
Tabel 1
BLOG Număr de articole
(ianuarie-iunie 2015)
adihadean.ro (Adi Hădean) 20
arhiblog.ro (Cetin Ametcea) 510
ciutacu.ro (Victor Ciutacu) 42
cristianchinabirta.ro (Cristian China Birta) 938
manafu.ro (Cristian Manafu) 130
piticigratis.com (Radu Alexandru) 35
tolo.ro (Cătălin Tolontan) 120
tudorchirila.blogspot.ro (Tudor Chirilă) 6
tvdece.ro (Alina Dragoș șiRăzvan Dragoș) 317
zoso.ro (Vali Petcu) 900
ZIAR
adevarul.ro 9818
evz.ro 11647
gandul.info 8462
hotnews.ro 7518
jurnalul.ro 8343
VI.5 Instrumente de analiză a datelor
Pentru analiza datelor am utilizat următoarele coduri de detecție a unor termeni cheie în textul
comentariilor (atât pentru ortografia cu diacritice, cât și fără diacritice, cu litere mici sau mari):
Referințe la minorități:
14
Am ales să codăm cuvinte cheie care fac referire la minoritățile indicate de bibliografie ca fiind de
interes pentru studiul de față. Unele grupuri au fost codate prin mai mulți termeni separați. Termenii
”bozgori”, ”jidani”, ”poponari” sunt termeni care au conotație negativă în toate contextele și
implicit se pot constitui de-sine-stătător ca instanțe de DIU. Situația termenului ”țigan/țigani” este
una specială, diferită. Deși de multe ori termenul comportă conotație negativă, este totuși foarte
răspândit în uzul comun, colocvial pentru a face referință la grupul minoritar de etnie romă,
neconstituindu-se în toate cazurile în DIU. Chiar unii membri ai acestui grup etnic preferă acest
termen celui de ”rom”, făcând eforturi pentru acceptarea sa. De asemenea, în unele cazuri (cum
sunt unele dintre comentariile la postările artistului muzical CONNECT-R), unii fani îl utilizează
în instanțe afirmative pozitive ca ”mândru că sunt țigan!”.
• Rromi / Romi (și toate formele aferente)
• Țigani (și toate formele aferente)
• Unguri / Maghiari (și toate formele aferente ambelor)
• Bozgori (și toate formele aferente)
• Evrei (și toate formele aferente)
• Jidani (și toate formele aferente)
• Sași (și toate formele aferente)
• Nemți (și toate formele aferente)
• Germani (și toate formele aferente)
• Atei / Necredincioși / Necreștini (și toate formele aferente)
• LGBT (homosexuali, lesbiene, transsexuali, poponari etc.)
Limbaj violent
Am luat în considerare mai multe tipuri de limbaj violent care, în co-ocurență cu referința la grupuri
minoritare/vulnerabile pot marca instanțe de DIU.
Imprecații/Invective/Caracteristici negative
• Lene (leneș)
• Prostie (prost, tâmpit, dobitoc, ignorant)
• Debilitate (cretin, idiot, retardat, debil, handicapat)
• Nebunie (nebun, isteric)
• Hoție (hoț, furt)
• Cerșetorie (cerșetor, cerșit, cerșetorie)
• Șmecherie (șmecher)
15
• Mafie (mafiot)
• Igienă (împuțit, nespălat)
• Crimă (criminal, ucigaș)
• Viol (violator)
Îndemn la acțiune forțată/violentă
[să/să-i/trebuie omor(âți)/împușca(ți)/spânzur(ați)/duși/băga(ți)/închi(și)/bătu(ți)]
Limbaj explicit/licențios
Termeni expliciți frecvent folosiți în insulte/înjurături, denumiri populare pentru organe genitale și
acte fiziologice.
Pentru gestionarea și prelucrarea datelor extrase am folosit MS Excel și MS Access, iar pentru
generarea vizualizărilor pe seturile de date prelucrate am folosit Tableau Public 9.1.
16
VII. Analiza și interpretarea datelor VII.1 Pagini publice de Facebook
Am analizat peste 2,5 milioane (2.525.927) de comentarii aferente postărilor de pe cele 25 de pagini
publice incluse în studiu. În Fig. 1 se poate observa numărul de comentarii analizat pentru fiecare
dintre paginile publice, cu indicarea tipului postării. Cele mai multe dintre postările publicate pe
eșantionul de conturi sunt de tip imagine.
Figura 1. Numărul de comentarii pe pagină și tipul postărilor
Figura 2. Lungimea medie a comentariilor
(în număr de caractere cu spații)
În Fig. 2 am inclus lungimile medii ale comentariilor publicate pe fiecare dintre paginile publice
incluse în eșantion. Având în vedere că folosim analiza de conținut, urmărind frecvența apariției,
respectiv a co-ocurenței unor termeni în comentarii, comentariile mai scurte oferă un context mai
restrâns pentru sensul enunțului, crescând relevanța analizei co-ocurenței termenilor. Observăm că,
în medie, comentariile făcute pe paginile oamenilor implicați în viața politică și a persoanelor
publice controversate sunt mai lungi.
17
Figura 3. Referințe la grupuri minoritare cu potențial de a fi ținte DIU (N=25.408)
În Fig. 3 putem vedea cele mai frecvente referințe la grupuri minoritare la nivelul întregului set de
date. După cum spuneam anterior, comentariile care conțin termeni ca ”jidan/i” sau ”bozgor/i” pot
fi clasificate de la bun început ca instanțe de DIU, acești termeni având conotație negativă în
referirea la evrei, respectiv la maghiari/unguri. Observăm că aparițiile acestor termeni însumează
mai puțin de 1% din totalul comentariilor analizate.
Figura 4. Referințe la grupuri cu potențial de a fi ținte ale DIU pe pagini publice de Facebook
Pasul următor al analizei comentariilor publicate în thread-urile mesajelor postate pe paginile
publice de Facebook a presupus construirea unui tabel de frecvență a apariției termenilor care fac
18
referire la grupuri care devin ținte ale DIU în paginile din eșantion. În Fig. 4 se poate observa un
număr mare de apariții ale termenilor ”țigan/i”, ”maghiari/unguri” și ”bozgor/i” în comentariile de
pe pagina politicianului naționalist Bogdan Diaconu. Pe pagina președintelui Klaus Iohannis (etnic
german) apar multe referințe la ”germani”, ”nemți” sau ”sași”, dar și la ”țigani” și ”romi”. Cele
mai multe apariții ale termenilor care desemnează grupuri LGBT, respectiv ”atei” apar pe pagina
politicianului Remus Cernea, susținător al căsătoriei între parteneri de același sex, respectiv al
opririi finanțării cultelor religioase din bugetul de stat.
Figura 5. Co-ocurența referințelor la grupuri ținte ale DIU cu elemente de limbaj violent (N=50,578)
În cele din urmă, tot la nivel de ansamblu, în figura 5 putem observa tabelul de co-ocurență între
termeni referitori la grupuri care sunt ținte ale DIU și elemente de limbaj violent. Din aparițiile
elementelor de limbaj violent identificate conform grilei automate de codare (2% din comentarii),
doar aproximativ 2.500 apar în același comentariu cu termeni care fac referire la grupurile pe care
le-am urmărit în acest studiu. Așadar, raportându-ne la nivelul dimensiunii întregului set de date în
doar 0,1% din cazuri putem observa co-ocurența celor două tipuri de termeni alese ca indicator
potențial pentru DIU.
Devine de interes, prin urmare, să urmărim dacă aceste co-ocurenț e detectate sunt distribuite
uniform, ca acte aleatorii, sau apar în anumite contexte specifice.
Figura 6 prezintă un grafic (împărțit în două segmente) care descrie aparițiile elementelor de limbaj
violent în co-ocurență cu utilizarea termenilor ”țigan/i” și ”(r)rom/i”. Cele mai multe apariții le
constatăm pe paginile lui Bogdan Diaconu, Klaus Iohannis, Mircea Badea, Teo Trandafir și Victor
19
Ponta, iar cele mai frecvente elemente de limbaj violent fac referire la prostie, debilitate, hoție,
cerșetorie sau includ elemente de limbaj explicit obscen. Pe pagina lui Bogdan Diaconu mai multe
astfel de instanțe de co-ocurență apar începând din luna aprilie, iar pe pagina lui Klaus Iohannis
apar mai multe în luna ianuarie. Pentru a simplifica vizualizarea graficului au fost excluse aparițiile
singulare ale celor doi termeni.
Figura 6. Referințe la termenii ”țigani” și ”rom” în co-ocurență cu elemente de limbaj violent pe Facebook, pe luni (N=1092)
În Fig. 7 urmărim într-un grafic similar frecvențele co-ocurențelor termenilor referitori la etnicii
maghiari, codate ca ”unguri” pentru utilizarea termenilor ”ungur/i” sau ”maghiar/i”, respectiv ca
20
”bozgori” pentru utilizarea termenului care comportă o conotație negativă în limba română. Cele
mai multe cazuri de co-ocurență apar între comentariile postate pe pagina politicianului naționalist
Bogdan Diaconu, dar un număr considerabil apar și pe pagina președintelui Klaus Iohannis. Cele
mai frecvente forme de violență în limbaj constau în imprecații din zona semantică ”prostie” și
termeni obsceni expliciți.
21
Figura 7. Referințe la termenii (”maghiari”/”unguri”) și ”bozgori” în co-ocurență cu elemente de limbaj violent pe
Facebook, pe luni (N=671)
Figura 8. Referințe la termenii ”evrei” și ”jidani” în co-ocurență cu elemente de limbaj violent pe Facebook, pe luni
(N=210)
Figura 8 prezintă apariția termenilor ”evreu/evrei”, respectiv ”jidan/i”.
22
Observăm că dincolo de apariția frecventă a termenilor din sfera semantică ”prostie”, apar cuvinte
din sfera semantică ”crimă”/”omor”. Un număr foarte mare de o apariții ale acestor co-ocurențe
observăm în luna ianuarie pe pagina oficială de Facebook a lui Klaus Iohannis. În cazul acestuia,
urmărind datele mai în adâncime, constatăm un număr relativ mare de referințe la evrei în
comentarii la postări din primele zile ale lunii ianuarie 2015 (distribuite relativ uniform pe zile),
respectiv la romi (sub termenul ”țigani”) concentrate în zilele de 7 și 10 ianuarie. Pe pagina lui
Bogdan Diaconu observăm creșteri ale co-ocurențelor elementelor de limbaj violent cu termenii
referitori la maghiari/unguri în postări din prima jumătate a lunii martie (1-15 martie 2015),
respectiv cu termenii referitori la romi în postări din 23-24 aprilie, 14-15 mai și 20 și 27 iunie.
În încheierea analizei pe comentariile publicate pe Facebook, vom prezenta un grafic (Fig. 9) care
prezintă o serie de termeni ce apar frecvent imediat după termenii ”femei/le” și ”muieri/le”. Am
încercat să explorăm în acest caz instanțe de DIU care are ca țintă femeile, folosind o metodă
diferită e decât în cazul celorlalte grupuri deoarece, în limba română, sunt dificil de detectat
automat referințele la femei. Din totalul de aproximativ 2000 de apariții ale cuvintelor căutate am
inclus doar cazurile în care următorul cuvânt face referire la o caracteristică. Chiar dacă cei mai
frecvenți termeni sunt pozitivi, apar și termeni negativi ca ”ușoare”, ”frustrate”, ”materialiste”,
”urâte” etc.
Figura 9. Termeni care fac referire la caracteristici și apar ca următorul termen după termenii ”femei”, respectiv ”muieri”
(N=215)
23
VII.2 Bloguri
Luând în considerare comentariile publicate pe cele 10 bloguri din eșantion (N=70646), avem în
figura 10 numărul total de comentarii colectate și analizate pentru fiecare blog (în unele cazuri
acestea cuprind și track-back-uri și spam) și în figura 11 lungimea medie a comentariilor de pe
fiecare blog. Observăm că per ansamblu, comentariile din blogurile analizate sunt mai lungi decât
comentariile publicate pe Facebook, dar rămân într-o zonă a enunțurilor scurte pentru care analiza
co-ocurențelor poate fi considerată relevantă.
Figura 10. Numărul de comentarii pe bloguri în perioada
ianuarie-iunie 2015 (N=70646)
Figura 11. Lungimea medie a comentariilor pe blogurile
analizate (în număr de caractere cu spații)
Figura 12 prezintă co-ocurențele termenilor referitori la grupuri care sunt frecvent ținte ale DIU cu
elemente de limbaj violent. Observăm că deși avem o frecvență considerabilă a elementelor de
limbaj violent (6%), referințe la grupurile care sunt ținte ale DIU ajung să apară în 1,3% din
comentarii, iar numărul de co-ocurențe între acestea e mic (0,14%).
Așadar, în comentariile colectate de pe bloguri co-ocurența celor două tipuri de termeni ca indicator
al DIU este mult mai mică decât pe Facebook. Trebuie menționat că o parte dintre bloguri folosesc
sisteme de ierarhizare care ascund sau șterg comentariile cu voturi negative și de asemenea faptul
că probabil publicul blogurilor formează comunități de persoane care se cunosc mai bine între ele
și interacționează mai frecvent.
24
Figura 12. Co-ocurența referințelor la grupuri ținte ale DIU cu elemente de limbaj violent (N=70646)
Figura 13. Referințe la grupuri ținte ale DIU în co-ocurență cu elemente de limbaj violent pe bloguri (N=106)
Chiar dacă numărul de co-ocurențe este mic, în figura 13 putem vedea care sunt cele mai frecvente.
Trebuie să ținem cont și de faptul că numărul de comentarii colectate pentru blogurile arhiblog.ro
și zoso.ro este mult mai mare decât cel colectate pentru celelalte bloguri.
25
Din rațiuni ce țin de prelucrarea datelor, nu am păstrat informațiile referitoare la data postării
comentariilor, acestea fiind afișate în șabloane foarte diferite pe fiecare dintre blogurile în cauză și
presupunând un efort suplimentar considerabil pentru punerea lor în concordanță pentru a putea fi
interpretate.
VII.3 Ziare în variantă electronică
În figurile 14 și 15 putem vedea numărul de comentarii colectate pentru fiecare dintre cele 5 ziare
online din eșantion, respectiv lungimile medii ale comentariilor pentru fiecare dintre acestea.
Comentariile de pe threadurile aferente articolelor publicate în ziarele online au dimensiuni
comparabile cu cele publicate pe bloguri și mai mari decât cele publicate pe Facebook.
Figura 14. Numărul total de comentarii pe ziare în
perioada de analiză (N=81389)
Figura 15. Lungimea medie a comentariilor aferente articolelor
din ziarele online (în număr de caractere cu spații)
Pentru comentariile din paginile ziarelor în variantă electronică am reușit să extragem și informații
referitoare la data publicării, fig. 16 prezentând distribuția acestora pe perioada de analiză. Data
publicării pentru o parte semnificativă din comentariile de pe site-ul hotnews.ro nu a putut fi
colectată.
26
Figura 16. Comentarii analizate în paginile articolelor ziarelor pe luni
În figura 17 putem observa tabelul de co-ocurență a celor două categorii de termeni – referințele la
grupuri care sunt frecvent ținte ale DIU (2,3%) și elemente de limbaj violent (8,3%).
Figura 17. Referințe la grupuri ținte ale DIU cu elemente de limbaj violent în ziarele online (N=81389)
Din nou, chiar dacă termenii codați apar mai frecvent decât în comentariile de pe Facebook incluse
în acest studiu, de fapt un număr mic de comentarii conțin ambele categorii de termeni (0,28%).
Figura 19 prezintă aceste co-ocurențe organizate în funcție de ziarul online. Observăm un număr
relativ mare de apariții în gândul.info, dar în cazul acestui ziar au fost colectate mult mai multe
comentarii decât în cazul celorlalte. E interesant de observat însă o frecvență relativ mai mare a
27
termenilor care fac referință la ”mafie” decât în cazul comentariilor publicate pe bloguri sau pe
Facebook. Grupul cel mai vizat este acela al romilor, iar termenul folosit în contexte negative cel
mai frecvent este acela de ”țigan”.
Figura 18. Co-ocurența referințelor la grupuri ținte ale DIU cu elemente de limbaj violent pe ziare online (N=228)
Conform distribuției pe luni, în lunile februarie, martie și aprilie apare mai multe co-ocurențe între
termenii referitori la romi și elemente de limbaj violent.
Figura 19. Referințe la grupuri ținte ale DIU în co-ocurență cu elemente de limbaj violent în ziare online pe luni (N=228)
28
Din nou, ca și în cazul comentariilor de pe Facebook, am folosit o metoda căutării următorului
cuvânt după termenul cheie pentru a vedea ce caracteristici sunt asociate femeilor în comentariile
aferente articolelor din ziarele online. Eliminând cuvintele incomplete și elementele de punctuație
dintr-un număr inițial de aproximativ 200 de rezultate, am observat apariția unor termeni ca
”frigide”, ”frumoase” și ”complexate”, dar cu frecvențe foarte mici (2-5 apariții).
29
VIII. Rezultate În final vom relua pe scurt câteva dintre observațiile făcut în analiza datelor pentru a răspunde
întrebărilor de cercetare. În setul de date extras am putut observa că grupul etnic minoritar la care
se face cel mai frecvent referință în comentariile din mediul online este cel al romilor, iar termenul
cel mai des folosit pentru a face referință este acela de ”țigan/i”. Am întâlnit de asemenea cu
frecvență semnificativă referințe la etnicii maghiari și evrei și referințe la membrii comunității
LGBT. Am remarcat de asemenea și utilizarea unor termeni peiorativi, ofensatori (”bozgori”,
”jidani”, ”poponari”) utilizați pentru a face referință la aceste minorități într-un număr considerabil
de comentarii (de pe Facebook) – aceste instanțe constituindu-se în DIU prin conotația negativă
asociată termenilor.
Actele cele mai frecvente de violență în limbaj în mediul online au cel mai frecvent ca și conținut
termeni care fac referință la prostie și debilitate (”prost”, ”tâmpit”, ”ignorant”, ”cretin”, „dobitoc”,
”retardat”, ”handicapat” etc.). Apar cu mare frecvență de asemenea și expresii obscene explicite,
dar cu mai mare frecvență relativă în comentarii de pe bloguri și ziare online (unde de cele mai
multe ori există posibilitatea publicării sub pseudonim) decât pe Facebook (unde publicarea de
comentarii se face cu contul atașat profilului personal).Totuși, îndemnurile la acte forțate sau de
violență apar foarte puțin.
Frecvența co-ocurenței referințelor la grupuri care sunt ținte ale DIU în România cu elemente de
violență în limbaj este sub 1% din comentariile analizate. Totuși, observăm că putem identifica mai
frecvent acest fel de co-ocurențe în anumite contexte publice – în special sunt ușor de observat
cazurile paginilor președintelui Klaus Iohannis (romi și evrei) și politicianului naționalist Bogdan
Diaconu (romi și maghiari). Aceste cazuri ar trebui analizate mai în adâncime, folosind metode de
analiză calitativă pentru a investiga dinamica discursului comentariilor publicate pe aceste pagini,
în special în perioadele indicate de acest studiu ca fiind de interes deosebit.
În ceea ce privește investigarea instanțelor de DIU țintite către femei, dincolo de dificultățile
metodologice ridicate de specificul lingvistic al problemei, au fost identificate câteva caracteristici,
atât pozitive, cât și negative, care sunt asociate femeilor în comentarii. Dintre termenii negativi
identificați notăm termeni ca ”frustrate” și ”complexate” din aceeași sferă semantică, putând
adăuga și ”frigide”, dar și ”ușoare” sau ”materialiste”, astfel aparent configurându-se un tip de
discurs de factură negativă ce preponderent oferă explicații, cauze pentru comportamentul femeilor.
30
IX. Concluzii Studiul de față deschide drumul unor abordări metodologice noi în cercetarea manifestării
discursului instigator la ură în mediul online din România. Metodele de colectare a datelor folosite
în această cercetare pot fi cu ușurință reproduse și extinse pentru a include mai multe contexte
online. De interes în viitor ar fi grupurile de discuții populare la nivel național în special printre
tineri ca Toți Pentru Unu (tpu.ro), pagini publice de Facebook ale unor persoane active în politică
și societatea civilă și grupuri publice de Facebook.
Interogarea API-ului Facebook fiind o metodă mult mai rapidă și mai puțin supusă la erori,
rezultatele acestui studiu pot fi extinse pe perioade mai mari de timp sau cu alte pagini de Facebook
de interes. Cu toate acestea, cercetarea grupurilor de întrebări și discuții ca TPU pot oferi informații
asupra limitelor libertății de expresie în contexte de pseudonimitate în care principalii participanți
la discuții sunt tineri. De asemenea, dată fiind popularitatea platformei și numărul mare de
contribuții zilnice, configurarea unui scraper Web constituie un efort relativ mic în raport cu
cantitatea de date ce poate fi obținută, spre deosebire de cazul unora dintre blogurile studiate aici.
Limitările utilizării analizei co-ocurențelor pentru a detecta instanțe ale DIU recomandă studierea
în adâncime, folosind metode de analiză a discursului, a celor câteva perioade și contexte în care
s-a putut observa o frecvență semnificativ mai mare a co-ocurențelor termenilor referitori la grupuri
care sunt ținte ale DIU cu termeni asociați violenței în limbaj. De asemenea din punct de vedere
metodologic, pot fi folosite în viitor tehnici de lingvistică computațională adaptate limbii române
ce ar permite detecția și clasificarea automată a instanțelor de DIU, putându-se genera și actualiza
permanent dicționare de expresii asociate acestui tip de discurs și putându-se semnala în timp real
spațiile de expresie în care incidența acestui fenomen crește.
31
Bibliografie
Bădescu, G. et al., 2014. Discursul instigator la ură în România, Accesat la: http://www.fdsc.ro/library/files/studiul_diu_integral.pdf [Accessed September 24, 2015].
Cohen-Almagor, R., 2011. Fighting hate and bigotry on the Internet. Policy & Internet. Accesat la: http://onlinelibrary.wiley.com/doi/10.2202/1944-2866.1059/abstract.
Cristea, D. & Forăscu, C., 2006. Linguistic resources and technologies for romanian language. Computer Science Journal of Moldova. Accesat la: http://www.researchgate.net/profile/Dan_Cristea/publication/220491920_Linguistic_Resources_and_Technologies_for_Romanian_Language/links/0deec53c37b04b1ea9000000.pdf.
Dix, A. et al., 2004. Human-Computer Interaction, Accesat la: http://www.amazon.com/Human-Computer-Interaction-3rd-Alan-Dix/dp/0130461091.
Gagliardone, I. et al., 2015. Countering online hate speech - UNESCO series on internet freedom, Paris. Accesat la: http://unesdoc.unesco.org/images/0023/002332/233231e.pdf.
Gitari, N. et al., 2015. A Lexicon-based Approach for Hate Speech Detection. Accesat la: http://www.sersc.org/journals/IJMUE/vol10_no4_2015/21.pdf.
Hughey, M. & Daniels, J., 2013. Racist comments at online news sites: a methodological dilemma for discourse analysis. Media, Culture & Society. Accesat la: http://mcs.sagepub.com/content/35/3/332.short.
Meza, R., 2015. Structura și dinamica sistemelor online de networking social de succes, Cluj-Napoca: Presa Universitară Clujeană. Accesat la: https://books.google.ro/books?isbn=973595835X.
Weber, A., 2009. Manual on Hate Speech, Strasbourg: Council of Europe Publishing.
Top Related