Fofiu-Analiza-de-continut
description
Transcript of Fofiu-Analiza-de-continut
Analiza de conținut
Adela Fofiu
Abstract
Analiza de conținut este o metodă de cercetare socială care astăzi împletește armonios tehnici și
proceduri cantitative și calitative. Deși inițial a fost utilizată ca metodă cantitativă, evoluția de un secol,
cel puțin, a revelat oportunitatea interpretării în studierea conținuturilor comunicării.
Capitolul de față expune pe scurt istoria analizei de conținut, discută câteva dintre defințiile sale
și trece în revistă proceduri practice și aplicații tehnice. Discuțiile sunt însoțite de ilustrări din literatura
de specialitate sau din activitatea de cercetare a studenților cu care am avut oportunitatea să lucrez de-a
lungul timpului. În cele din urmă, capitolul se concretizează cu un exemplu de utilizare cantitativ-
calitative a analizei de conținut, apelând la o combinație productivă de instrumente și tehnici digitale în
explorarea conținuturilor documentelor social-istorice.
Introducere
Dintre caracteristicile de bază ale analizei de conținut, este important de menționat că aceasta
este o metodă de cercetare non-reactivă. Metodele non-reactive colectează date empirice fără a
determina o reacție din partea subiecților studiați. Analiza de conținut în esența sa este neintruzivă, deci
nu afectează comportamentul celui observat sau studiat. Așadar, culegerea de date este discretă, iar
datele sunt nebiasate.
În viața de zi cu zi, oamenii produc constant documente, urme ale experienței lor, fie formale și
instituționale, fie informale și cotidiene1, la firul ierbii. Documentele astfel create - sociale, istorice,
media, politice - constituie o resursă generoasă de informații și cunoaștere, valoroasă prin caracterul
relativ fix și stabil al înregistrărilor. O informație o dată înregistrată într-un corp de text sau într-o
imagine, aceasta este stocată și alterările nu sunt facil de efectuat. Așadar, textul și imaginea din
documente pot fi considerate drept surse de informație pură pentru explorarea socială prin intermediul
analizei de conținut, după cum discut în următoarele subcapitole.
1 Petru Iluț, Abordarea calitativă a socioumanului (Iași: Polirom, 1998)
Metodă cantitativă, metodă calitativă sau mix metodologic ?
Istoria analizei de conținut
Analiza de conținut s-a născut ca metodă cantitativă, concentrată pe numărare și proceduri
statistice:
“Analiza de conținut … are ca obiectiv caracterizarea înțelesurilor într-un corp dat de discurs într-o
manieră cantitativă și sistematică. Analiza de conținut este semantica statistică a discursului politic. …
Analiza de conținut are ca obiectiv formulări statistice direcționate spre probleme empirice …
caracterul statistic este unul dintre atributele distinctive.”2
Anii '30-'40, când analiza de conținut începuse să fie utilizată, fără a fi în mod implicit
conceptualizată și teoretizată, au pus bazele acestei metode în registrul cantitativ. Numărarea era
considerată cea mai bună, dacă nu chiar singura tehnică de explorare, descriere și explicare a
conținuturilor produse de oameni. Interpretarea simbolurilor sau a cuvintelor în context era, la acel
moment, considerată de natură impresionistă și supusă subiectivității individuale, drept urmare lipsită
de obiectivitate și validitate.
Analiza de conținut este caracteristică studiului materialelor și documentelor produse de
oameni, ce au un conținut bogat de informație și o valoare comunicațională ridicată3. Această metodă
are ca scop ordonarea abundențe de date, informații și cunoaștere în asocieri, pattern-uri, frecvențe sau
teme care pot să reveleze aspecte subtile sau nuanțe inaccesibile la prima vedere.
Continuând înțelegerea analizei de conținut pe linie cantitativă, câteva definiții deja clasice sunt
la îndemână. Cartea lui Bernard Berelson, Content Analysis in Communication Research, e publicată în
1952. În acest volum – primul manual general despre analiza de conținut – Berelson definește această
metodă ca având ca scop descrierea obiectivă, sistematică și cantitativă a conținuturilor manifeste ale
comunicării4. În același sens, părinții analizei de conținut – Harold Lasswell, Daniel Lerner și Ithiel de
Sola Pool – afirmau în acei ani că singura motivație pentru a efectua o analiză de continut e dată de
întrebări de cercetare de natură cantitativă5.
Aceste considerații, însă, devin insuficiente de-a lungul evoluției demersului științific. Întâi,
2 Kaplan, 1949, in Roberto Franzosi, ed., Content Analysis (London: SAGE Publications, 2008), p. XXI3 Iluț, Abordarea calitativă a socioumanului4 Septimiu Chelcea, Metodologia cercetării sociologice. Metode cantitative și calitative (București: Editura Economică,
2004)5 Franzosi, Content Analysis
orice metodă de cercetare, în logica pozitivistă, trebuie să fie sistematică și obiectivă6. Deci a descrie
analiza de conținut drept metodă de cercetare sistematică și obiectivă nu este o definiție suficientă. Mai
departe, Madeleine Grawitz observă încă din 1972 că interesul pentru cuantificare scăzuse7, dat fiind că
dincolo de numărarea conținuturilor manifeste ale comunicării, se conturase necesitatea studierii
conținuturilor latente (sau impresioniste, cum le numiseră cercetătorii cantitativiști în fazele incipiente
de utilizare a analizei de conținut).
O altă definiție, mai recentă, a analizei de conținut aduce o nouă dimensiune în evoluția acestei
metode: analiza de conținut este o metodă validă pentru a face inferențe de la text la alte diferite
condiții sau proprietății ale sursei textului8. Aceasta este o adiție importantă la definirea analizei de
conținut: dacă, în etapele anterioare, metoda era utilizată la descrierea conținuturilor comunicării și ale
documentelor sociale, Krippendorff a contribuit la înțelegerea analizei de continut ca fiind potrivită
pentru a formula concluzii sau ipoteze despre autorii conținuturilor sau despre contextul creării
conținuturilor studiate. Totuși, Chelcea remarcă din nou că, în principiu, metodele de cercetare socială
în general au scop formularea de inferențe pentru a genera o mai largă cunoaștere sau înțelegere a
lumii9. Diferența între analiza de conținut și alte metode de cercetare socială, însă, este aceea că permite
formularea de inferențe indirecte: în loc să îi întrebăm pe oameni și să le folosim răspunsurile pentru a
formula inferențe, folosim analiza de conținut pe materiale produse de aceștia, cu același scop10.
Dincolo de dinamica definițiilor analizei de conținut, putem trece în revistă și istoria utilizării
aceste metode. Precursorii au folosit această metodă în mod necesar, însă fără a-i da această denumire.
De la interpretări ale Bibliei, la analiza viselor, la grafologie11, analiza de conținut a fost folosită
nesistematic în dezvoltarea cunoașterii și culturii occidentale.
La începutul secolului XX, Lasswell, Lazarsfeld și Berelson, printre alții, au fundamentat
analiza de conținut ca metodă de explorare și descriere a conținuturilor comunicării, în registru
cantitativ, cum am discutat anterior.
În anii 60, analiza de conținut a devenit atractivă și utilă într-o varietate de discipline:
psihologie, sociologie, lingvistică, istorie. În aceeași perioadă au început primele experimente de
efectuare a analizei de conținut cu ajutorul computerului. Philip Stone și echipa sa au dezvoltat în 1966
un sistem de analiză de conținut asistată de computer denumit General Inquirer12. Acest sistem a fost
6 Chelcea, Metodologia cercetării sociologice7 Madeleine Grawitz, Méthodes des sciences sociales (Paris: Précis Dalloz, 1984)8 Klaus Krippendorff, Content Analysis. An Introduction to Its Methodology (London: SAGE Publications, 2013)9 Chelcea, Metodologia cercetării sociologice10 Arthur Asa Berger, Media Research Techniques (London: SAGE Publications, 1998)11 Philipp Mayring, “Qualitative Content Analysis”, Forum: Qualitative Social Research, Volume 1, No. 2 (2000) 12 Franzosi, Content Analysis
primit cu entuziasm și apreciat drept capabil să readucă analiza de conținut la viață, după câteva decenii
de proceduri manuale foarte minuțioase și consumatoare de timp.
Din anii 70, analiza de conținut a început să fie folosită atât pentru identificarea, numărarea si
descrierea conținuturilor manifeste ale comunicărilor, cât și pentru identificarea și interpretarea
conținuturilor latente, generate din context.
Principii de bază ale analizei de conținut
– analiza de conținut este o metodă de cercetare cantitativ-calitativă care are ca scop studierea
conținuturilor manifeste și latente ale comunicării
De exemplu, Chelcea relatează cum analiza de conținut condusă pe aceste două nivele a revelat
propaganda camuflată în revista The Galilean publicată în Statele Unite ale Americii în timpul celui de
al Doilea Război Mondial. S-a construit o schemă de codificare care conținea 14 teme din emisiunile
naziste de radio din Germania în timpul războilui. Aplicarea acestor scheme pe conținuturile manifeste
ale revistei The Galileo a arătat că 1195 articole erau în acord cu temele de propagandă nazistă și 45
articole erau în dezacord, ceea ce a revelat conținutul propagandistic ascuns al revistei, ulterior
suspendată pe baza analizei13.
– categoriile de analiză sunt în centrul atenției: aceste categorii constituie schema de codificare și
sunt stabilite într-un demers continuu de feedback, până la saturație. Cu alte cuvinte, stabilirea
categoriilor de codificare poate fi făcută înainte de a începe culegerea de date, iar pe parcursul
culegerii de date, categoriile pot fi rafinate și ajustate la conținutul studiat.
De exemplu, în perioada 2010-2012 am studiat discursurile apocaliptice ale organizației Noua
Dreaptă pe blog.nouadreapta org, acum suspendat. În primă instanță, am construit o schemă de
codificare pe baza literaturii de specialitate despre apocalipsă. La momentul aplicării schemei pe
conținuturile blogului, rezultatele au fost minime, în texte regăsindu-se foarte puține dintre codurile
pregătite in avans. Astfel, al doilea pas a fost lectura unui sub-eșantion aleator de articole de blog, cu
ajutorul cărora am dezvoltat o schemă cu 21 teme inițial, dintre care am păstrat 14 pe măsura aplicării
schemei pe întreg eșantionul de articole14.
13 Chelcea, Metodologia cercetării sociologice14 Adela Fofiu, Apocalypse on the Net. Extreme Threat and the Majority-Minority Relationship on the Romanian Internet,
(Frankfurt am Main: Peter Lang, 2013)
– analiza de conținut se efectuează treptat. Întregul conținut selectat pentru analiză trebuie trecut
prin procedură, în ordinea stabilită și pas cu pas. Rigoarea aceasta este necesară pentru
asigurarea studierii valide a conținutului latent.
Acest principiu este foarte important în situația în care analiza de conținut cantitativă are ca
scop generarea de serii de timp, prin care obiectivul este identificarea variației unui trend. De exemplu,
o analiză de conținut despre stereotipuri de gen în filmele de la Holywood din ultimii 50 de ani necesită
rigoare și respectarea unui ritm clar în analizarea filmelor, astfel încât la finalul identificării și descrierii
stereotipurilor, să ne putem da seama dacă există vreo diferență între 1965, 1993 și 2013.
– încadrarea analizei într-un model de comunicare15. Cu alte cuvinte, la ce nivel vom face
inferențele pe baza rezultatelor analizei de conținut: la nivelul autorului conținutului, la nivelul
contextului socio-cultural, la nivelul situației în care conținutul a fost produs, la nivelul
efectelor conținutului.
Chelcea relatează cum în revista Insight Holland în 1980 a fost publicat raportul unei analize de
conținut efectuată pe tabloul Jocuri de copii de Pieter Bruegel cel Bătrân (1560). Analiza, care a arătat
că în contextul socio-cultural și istoric al creării tabloului copiii se jucau mai mult de 78 de jocuri, a
deschis oportunitatea multor studii, dat fiind că mai mult de jumătate din aceste experiențe de joc nu
mai erau cunoscute la momentul analizei. Mai mult, analiza jucăriilor din imagine a dus la identificarea
unui joc cunoscut încă din Antichitate, răspândit în Europa de Vest, regăsit în Japonia și cunoscut și
copiilor din România în urmă cu câteva zeci de ani, dar care astăzi e aproape dispărut. În acest exercițiu
de analiză a unui conținut de comunicare, inferențele puteau fi făcute la nivelul autorului comunicării
(câte jocuri cunoștea Bruegel cel Bătrân), la nivelul situației în care tabloul a fost pictat (câte dintre
jucăriile din tablou se aflau în preajma lui Bruegel cel Bătrân în timp ce picta) sau la nivelul contextului
socio-cultural (câte jocuri de copii erau cunoscute la jumătatea secolului al XVI-lea)16.
– criterii de validitate: trebuie să ne asigurăm că analiza de conținut are valoare predictivă înaltă.
Cu alte cuvinte, că instrumentul de culegere de date pe care l-am creat – schema de codificare –
măsoară sau evaluează ceea ce este construit să măsoare sau să evalueze și nu altceva.
15 Philipp Mayring, “Qualitative Content Analysis”16 Chelcea, Metodologia cercetării sociologice
– criterii de fidelitate: fidelitatea codificatorilor – faptul că toți analiștii aplică aceeași schemă de
codificare; consistența categoriilor – faptul că toate unitățile de înregistrare sau coduri dintr-o
categorie au același sens; și fidelitate interpretării – faptul că analiștii care utilizează aceeași
schemă de codificare și cunosc scopul cercetării ajung la aceeași interpretare a rezultatelor.
Etape și procedee de analiză de conținut
Ca orice cercetare științifică, analiza de conținut face parte dintr-un demers științific cu etape
clare:
1. Stabilirea temei de cercetare.
2. Formularea întrebărilor sau a obiectivelor de cercetare.
3. Stabilirea materialului pentru analiză. Eșantionarea.
4. Întocmirea schemei de codificare.
5. Aplicarea schemei pe materialul ales.
6. Stocarea, analiza și interpretarea datelor.
Stabilirea materialului pentru analiză. Eșantionarea
Materialul pentru analiză depinde în totalitate de tema de cercetare și poate să aibă variate
forme, așa cum documentele sociale au variate forme:
– documente scrise, publice sau private, cifrice sau necifrice, oficiale sau neoficiale – articole de
ziar, anuare statistice, jurnale intime, corespondență, proză, poezii, registre de nașteri și decese,
registre contabile, registre medicale, reviste, rețete culinare - sau documente nescrise,
audiovizuale, vizuale sau auditive – emisiuni TV, emisiuni radio, cântece, videoclipuri, legende,
mituri și povești, discursuri publice, filme, simboluri, icoane, tablouri, vestimentația,
arhitectura, designul interior, etc.
– dovezi ale ceea ce oamenii scriu, produc la televizor, ale filmelor pe care le fac, ale ceea ce spun
în public
Din această abundență de material de analiză, cercetătorul trebuie să aleagă acea formă sau
clasă de documente care corespunde cel mai bine obiectivelor de cercetare. Ulterior acestei decizii,
materialul pentru analiză poate fi eșantionat pentru a reduce semnificativ volumul de muncă.
În esență, eșantionarea documentelor pentru analiza de conținut nu diferă de eșantionarea
aleatorie utilizată în anchetele sociologice și în sondajele de opinie. În cazul unei cercetări pe bază de
analiză de conținut pe ziare și reviste, e de reținut că eșantionarea de zile neconsecutive are o
reprezentativitate mai mare decât eșantionarea de zile consecutive. Mai mult, dacă volumul
conținutului publicat în ziare sau reviste nu este mare, avem opțiunea de analiza întregul conținut. Dacă
volumul este mare, este optim să folosim un pas de eșantionare: din trei în trei numere ale ziarului, din
cinci în cinci numere ale revistei, fiecare a cincea zi din săptămână sau fiecare a zecea zi din lună, etc.17
De exemplu, Maria Purcariu, absolventă a Facultății de Științe Politice, Administrative și ale
Comunicării, Departamentul de Jurnalism, Universitatea Babeș-Bolyai, a realizat în 2013 o cercetare pe
baza analizei de conținut despre imaginea cântăreților străini în publicațiile de nișă din Marea Britanie.
Modalitatea de eșantionare pe care a folosit-o a inclus conținutul complet publicat în 2011, 2012 și
2013 pe trei site-uri de specialitate din Marea Britanie.
Desigur, se poate efectua o eșantionare și în interiorul documentelor sursă. De exemplu, dacă
unitatea de analiză este paragraful, putem include în eșantion primul paragraf de pe fiecare pagină sau
tot al cincilea paragraf. Dacă unitatea de analiză este articolul de ziar, putem include în eșantion tot al
doilea articol din fiecare număr de ziar, sau primul și ultimul din fiecare număr, etc.
Corina Mihășan, absolventă a Facultății de Științe Politice, Administrative și ale Comunicării,
Departamentul de Jurnalism, Universitatea Babeș-Bolyai, a realizat în 2012 o cercetare pe baza analizei
de conținut despre stereotipuri de gen în revista Femeia. Unitatea de analiză utilizată de Corina a fost
imaginea de pe copertă. Eșantionul final a inclus 160 imagini de pe coperta revistei Femeia publicată
lunar în 1948, 1950, 1955, 1960, 1965, 1970, 1975, 1980, 1985, 1990, 1995, 2000 ianuarie și februarie,
2006 ianuarie și octombrie, 2010 și 2012. Dată fiind vechimea acestor documente media, Corina a
întâmpinat provocări pe parcursul etapei de selectare a materialului-sursă. Nu a găsit numerele revistei
după anul 2000 la nici una dintre bibliotecile din Cluj și a fost nevoită să modifice eșantionul. Inițial,
acesta a inclus revistele începând cu anul 1948 (primul număr găsit), 1950, 1955 și apoi un pas de
eșantionare din cinci în cinci ani, până în 2012, inclusiv. Dacă eșantionul s-ar fi oprit la anul 2000,
după căutări sistematice pe internet, Corina a identificat și coperțile din anii 2000, 2006, 2012 și 2012.
Astfel, eșantionul nu a suferit schimbări, iar cercetarea a fost consistentă.
17 Chelcea, Metodologia cercetării sociologice
Unitatea de analiză
Dar ce este unitatea de analiză? Unitatea de analiză este acea parte a conținutului comunicării
sau documentelor pe care se efectuează analiza de conținut. Unitățile de analiză sunt de trei tipuri:
unități de înregistrare, unități de context și unități de numărare.
Unitatea de înregistrare este acea parte a conținutului comunicării care are valoarea unui individ
– analog anchetei sociologice. Cu alte cuvinte, unitatea de înregistrare este cea mai mică parte a
eșantionului pe care îl studiem și pe care aplicăm schema de codificare. De exemplu, unitatea de
înregistrare poate să fie un număr de ziar, un articol de ziar, un paragraf dintr-un articol de ziar,
propoziția sau cuvântul. Similar, într-un film, unitatea de înregistrare poate să fie filmul în întregime, o
scenă din film, un dialog din film, o imagine sau o componentă a imaginii.
Unitatea de context este cea care dă sens sau orientare unității de înregistrare. Unitatea de
context pentru cuvânt, de exemplu, este propoziția. În sine, cuvântul are o semnificație proprie, dar
plasat într-o propoziție, sensul se poate modifica.
De exemplu, ne interesează să aflăm cu ce frecvența este folosit cuvântul sân în tabloidele din
România. Obținem un rezultat mediu de 15 mențiuni per ediție, în cazul unui tabloid oarecare.
Localizând aceste 15 prezențe în contextul propozițiilor, se poate întâmpla să găsim că o apariție să fie
în expresia “a sta cu mâna în sân”. În funcție de obiectele cercetării noastre, putem interpreta sensul
acestei cuantificări în context.
Să ne reamintim despre analiza conținutului revistei The Galilean din SUA, descrisă succint mai
sus: aplicarea schemei de codificare a identificat prezența a 14 teme naziste în aceste conținuturi, iar
plasarea temelor în context a arătat că majoritatea menționărilor acestor teme erau în acord, aveau o
orientare pozitivă față de valorile și ideile naziste.
Unitatea de numărare, în cele din urmă, are rol de cuantificare. Ea poate să coincidă cu unitatea
de înregistrare (atunci când explorăm frecvența unor cuvinte, de exemplu), dar cel mai frecvent unitatea
de numărare măsoară caracteristici fizice18: durata unui film, a unui cântec, a unui discurs; lungimea și
lățimea unei pagini, a unui paragraf, a unei strofe, a imaginii, etc. Aceste caracteristici sunt importante
și trebuie să ținem cont de ele atunci când efectuăm analiza de conținut, dat fiind efectul cumulativ al
comunicărilor19. Stereotipurile de gen dintr-un film de 90 de minute au un alt nivel de fixare decât cele
dintr-o reclamă de 30 de secunde. Similar, o propoziție xenofobă de 15 cuvinte are un efect diferit de
un discurs xenofob de 2000 de cuvinte.
18 Chelcea, Metodologia cercetării sociologice19 Jhally, Sut, Jean Kilbourne și David Rabinovitz, Killing us softly 4 advertising's image of women (Northampton, MA:
Media Education Foundation, 2010)
Schema de codificare
Ulterior pregătirii materialului-sursă și a procesului de eșantionare, conținuturile comunicării
sunt analizate cu ajutorul unei scheme de codificare. Cel mai adesea, cercetătorul construiește o schemă
în acord cu fundamentarea teoretică și cu obiectivele sau interogațiile cercetării. Așa cum am remarcat
anterior, schema de codificare este rezultatul unui procedeu de testare și eroare, până la forma optimă
pentru obiective și pentru continuturile analizate. Desigur, se pot utiliza și scheme de codificare create
în alte proiecte de cercetare și, deci, testate, în măsura încare acestea corespund cercetării noastre.
Schemele de codificare standardizate fac încă obiectul dezbaterii în comunitatea științifică. În secțiunile
următoare voi discuta și ilustra un glosar denumit Linguistic Inquiry and Word Count (LIWC) care
poate fi folosit în analiza de conținut în discipline precum psihologia socială, sociologia, științele
politice și științele comunicării, dar nu numai. Până atunci, în următoarele pagini includ câteva exemple
de scheme de codificare nestandardizate.
Corina Mihășan - Imaginea femeii redată în revista Femeia. Evoluție în timpSchema de codificare
1. Actorii din imagine - o femeie - două femei sau mai multe - o femeie și un bărbat - o femeie și un copil sau mai mulți copii - un copil sau mai mulți copii - o familie - altceva - o femeie alături de animal de companie 2. Încadrare - cadru larg - mediu - prim-plan 3. Contact vizual - privește în cameră - da - nu - neidentificabil 4. Vârsta femeii - tânără- matură - vârstnică - neidentificabil
5. Expresia feței - zâmbitoare - seducătoare - serioasă - gânditoare - mirată - neidentificabil
6. Culoarea ochilor - albaștri - verzi - căprui - negri - nu se observă
7. Tipologia feminină - blondă - roșcată - brunetă - șatenă - neidentificabil 8. Lungimea părului - scurt și ondulat - mediu - lung - neidentificabil 9. Vestimentație - ținută de muncitor - fustă și cămașă - decolteu - rochie simplă - cămașă și pantaloni - palton - haine tradițonale - fustă scurtă - neidentificabil
10. Culori predominante - negru - alb - roșu - albastru - galben - gri - verde - roz
Ştiri de seară – „Observatorul” de la 19.00 h20
Număr de ştiri pe buletin
Număr de ştiri violente pe buletin
Ponderea numărului ştirilor violente
Durata buletinului de ştiri
Durata ştirilor violente în buletin
Ponderea duratei ştirilor violente
Durata unei ştiri violente
Locul ştirii violente în structura jurnalului:
– la început
– la mijloc
– la sfârşit
Discursuri în cotidianul Le Monde despre campania pentru referendumul francez din 1961
despre auto-determinarea Algeriei21
Da - da entuziast
- da resemnat
Nu - nu de stânga
- nu de dreapta
Abținere
Libertatea de vot
Amânare
Fără poziție
Programe și software-uri utile în analiza de conținut
În analiza de conținut, computerul joacă un rol foarte important: acela de ajutor. E foarte
20 Ioan Drăgan, Poliana Ștefănescu, Alexandra Povară, Anca Velicu, Elena Stoian, Măsurarea gradului de violenţă prezent în programele audiovizualului românesc, (București: Centrul de Studii Media și Noi Tehnologii de Comunicare, 2009)
21 Grawitz, Méthodes des sciences sociales
important să rețineți că analiza de conținut nu poate fi efectuată numai de către computer, dintr-un
motiv relativ simplu: indiferent cât de avansată este cercetarea în domeniul inteligenței artificiale,
computerele încă nu înțeleg limbajul natural. O mașină poate să identifice cuvinte și expresii și să le
numere, însă nu poate identifica și interpreta contextul. Așadar, computerul este doar o parte din
procedurile analizei de conținut care se bazează pe co-operarea sau interacțiunea om-mașină (human-
machine interaction).
În comunitatea științifică, the slaughterhouse anecdote (anecdota abatorului) este relevantă în
acest context: într-o analiză a limbajului violent în știrile televizate din SUA, colectarea de date s-a
efectuat automatizat, deci integral de către computer. Procesarea datelor în serii de timp a arătat că în
preajma orei 14:00, frecvența cuvintelor violente creștea brusc în fiecare zi, ca în următoarea oră să
scadă. Cercetătorii au întrerupt procesul de culegere de date și au ascultat știrile – deci au înlocuit
mașina – și au constatat că la ora 14:00 se anunțau prețurile zilei în industria cărnii, iar cuvântul
slaughter apărea foarte frecvent. Desigur, din punct de vedere etic, se poate folosi o diversitate de
principii conform cărora acest cuvânt să fie inclus sau să nu fie inclus în codificare – de la argumentele
activiștilor pentru drepturile animalelor, care ar considera cuvântul slaughter implicit violent și
reproducător de violență, la argumentul că slaughter este în acest context un cuvânt de nișă, tehnic,
care nu denotă violență socială interumană. Ce este important, însă, e faptul că un computer nu este
capabil să emită aceste judecăți și aprecieri și, deci, nu poate lua decizii despre includerea sau
excluderea unui cuvânt din codificarea conținuturilor.
Ținând cont de aceste aspecte, să reținem rolul computerului în efectuarea analizei de conținut22:
– computerul este un asistent care ușurează gestionarea materialului-sursă, de la stocarea
datelor, la codificare, subliniere, extragere, cartare, raportare etc.
– computerul este o arhivă care înregistrează toți pașii analizei, astfel încât posibilele erori de
lucru pot fi identificate relativ ușor și remediate.
– computerul este un instrument metodologic care facilitează și sincronizează sau conectează
analiza datelor cantitative cu analiza datelor calitative, evitând erorile umane ce pot apărea
la momentul introducerii manuale a datelor.
În 1994, la Universitatea din Surrey, Marea Britanie, s-au pus bazele CAQDAS Networking
Project23. CAQDAS, un acronim al Computer Assisted Qualitative Data AnalysiS, este un concept
inventat în 1989 de către Ray Lee și Nigel Fielding, consacrat ulterior în câmpul analizei de conținut.
22 Philipp Mayring, “Qualitative Content Analysis”23 http://www.surrey.ac.uk/sociology/research/researchcentres/caqdas
Proiectul de la Universitatea din Surrey oferă și astăzi sprijin cercetătorilor care se specializează în
utilizarea computerului pentru analiza conținutului comunicărilor, prin organizarea de conferințe,
seminarii, școli și alte evenimente academice.
CAQDAS are și înțelesul Computer Assisted Qualitative Data Analysis Software, tocmai de
aceea programele concepute pentru analiza de conținut poartă denumirea generică de CAQDAS. Aceste
programe sunt clasificate în două categorii, în funcție de accesul utilizatorilor la ele: programe libere
sau open source și programe proprietar. Dintre programele libere/open source, vă puteți instrui în
utilizarea FreeQDA24, libreQDA25, ELAN26 sau Yoshikoder27. Dintre programele proprietar, cel mai
frecvent utilizate sunt Atlas.ti28, Nvivo29 și MaxQDA30, de obicei accesibile temporar în versiuni de test.
Aceste CAQDAS au în comun câteva facilități și funcții:
– importarea de conținuturi pentru analiză
– generarea sau importarea de scheme de codificare
– aplicarea schemelor de codificare pe conținuturi, un procedeu vizibil pe conținutul studiat prin
sublinierea cu culori a secțiunilor codificate sau prin aplicarea de acolade în dreptul secțiunilor
codificate
– generarea de rapoarte numerice: frecvența unităților de înregistrare sau frecvența codurilor din
schema de codificare
– generarea de rapoarte de context: plasarea codurilor în context
– generarea de hărți conceptuale: vizualizarea relațiilor dintre coduri și a sensurilor codurilor în
context
Dincolo de disponibilitatea și utilitatea acestor CAQDAS create special pentru analiza de
conținut, consider că imaginația și creativitatea pot fi de folos în convertirea altor tipuri de programe în
instrumente utile pentru efectuarea acestei metode. De exemplu, SPSS – Statistical Package for Social
Sciences – este foarte util în prelucrarea datelor analizei de conținut cantitative în format de variabile,
iar NodeXL, o extensie a Microsoft Office Excel utilă în analiza de rețea, în special a legăturilor din
social media, poate fi utilizat în crearea de hărți conceptuale, așa cum voi ilustra în secțiunea
următoare.
24 https://github.com/produnis/FreeQDA/downloads 25 http://www.libreqda.edu.uy/ 26 http://tla.mpi.nl/tools/tla-tools/elan/ 27 http://www.yoshikoder.org/ 28 http://www.atlasti.com 29 http://www.qsrinternational.com/products_nvivo.aspx 30 http://www.maxqda.com/
Exemplu de utilizare a analizei de conținut
Până în acest punct al capitolului, ar trebui să reiasă cu claritate că analiza de conținut este o
metodă mult mai versatilă decât simpla numărare de cuvinte. Această metodă se rafinează cu atât mai
mult atunci când punem în practică programe special construite pentru gestionarea și analizarea
conținutului comunicărilor și programe pe care le putem adapta cerințelor cercetării.
În studierea temelor inter-etnice în periodicele publicate în Transilvania în timpul Primului
Război Mondial, am testat moduri inovative de efectuare a analizei de conținut pentru a conceptualiza
și vizualiza reprezentări media ale contactului inter-etnic în contextul conflictului. Printre rezultatele de
imediată utilitate – stocarea și descrierea datelor, analiza cantitativă și calitativă – utilizarea
computerului în momente distincte ale cercetării s-a concretizat într-un exemplu de valorizare a
resurselor digitale pentru dezvoltarea cercetărilor în studiile culturale, sociologie și istorie.
Obiectivele inițiale ale acestui studiu au fost 1) explorarea variației discursurilor inter-etnice în
periodice din Transilvania pe perioada Primului Război Mondial și 2) explorarea variației componentei
emoționale din discursurile media în Transilvania pe perioada Primului Război Mondial. Pe măsura
analizei datelor, un al treilea obiectiv s-a conturat: 3) explorarea asocierii discursurilor emoționale cu
discursurile despre contactul inter-etnic, în același context socio-istoric.
Eșantionarea
Pentru început, am efectuat analiza de conținut pe periodicul Unirea, foe bisericească și politică
publicat de trei ori pe săptămână la Blaj. Pentru a surprinde variațiile de interes, am ales ca perioadă de
colectare de date anii 1913-1919, cu un an înainte și după Primul Război Mondial. Acești doi ani în
plus pe lângă durata conflictului oferă posibilitatea identificării variațiilor de la context socio-politic
relativ stabil la context socio-politic conflictual. Pe parcursul acestor șapte ani, am ales ca pas de
eșantionare ziua de joi din săptămână, adică am inclus în eșantion numerele Unirii publicate joia – cu
alte cuvinte, tot al treilea număr. În prima etapă a eșantionării, acest criteriu a generat destul de multe
pauze în cronologia eșantionului, drept urmare am decis să completez aceste pauze prin includerea
numerelor publicate în cea mai apropiată zi față de joia în care periodicul nu fusese publicat: vineri sau
sâmbătă. La finalul acestei proceduri, eșantionul a numărat 356 de intrări.
Schema de codificare
În această cercetare am utilizat o schemă de codificare standardizată și una construită anume
pentru cerințele cercetării.
Schema standardizată: pentru identificarea cuvintelor care denotă emoții în discursurile media
am folosit categoriile Furie și Anxietate din Linguistic Inquiry and Word Count31 (LIWC), versiunea
din 2001 tradusă în limba română32. LIWC este un dicționar care evaluează sau calculează – în funcție
de utilizarea sa calitativă sau cantitativă – gradul în care oamenii folosesc diferite categorii de cuvinte
într-o varietate mare de texte, de la e-mailuri, discursuri publice, poezii, la articole de ziar sau
conversații cotidiene. LIWC a fost dezvoltat de James Pennebaker, Roger Booth și Martha Francis33.
Schema nestandardizată: pentru identificarea cuvintelor care denotă sau indică identitatea
etnică, am recurs la lectura câtorva ediții ale periodicului, incluzând în schemă toate cuvintele din
familiile lexicale ale “român”, “ungur”, “maghiar”, “vlah”, “austro-ungar”, “german” - identități etnice
relevante în contextul socio-politic studiat.
Procedura de lucru și instrumentele digitale utilizate
Prima etapă a gestionării conținuturilor periodicului a fost exportarea lor din format *.pdf în
format simplu *.txt, pentru ca ulterior să import fisierele rezultate în CAQDAS-ul liber Yoshikoder.
Acesta este un program de analiză de conținut ce permite analizarea textelor în diferite limbi, dezvoltat
în cadrul Identity Project la Weatherhead Center for International Affairs de la Universitatea Harvard.
Yoshikoder permite crearea sau importarea schemelor de codificare și funcționează pe baza
recunoașterii simple a șirurilor de litere. Cu alte cuvinte, rolul cercetătorului este acela de a instrui
Yoshikoder ce secvențe de litere să caute și să identifice într-un text dat. În acest sens, posibilitățile de
utilizare a Yoshikoder sunt limitate la analiza de conținut de bază, programul generând rapoarte de
frecvențe și rapoarte de context în frază. Din punct de vedere tehnic, e de reținut că Yoshikoder
identifică numai șiruri de litere continue, deci nu poate identifica expresii cu două sau mai multe
cuvinte. În plus, textul de analizat trebuie să fie pregătit înaintea importării în program în așa fel încât
diacriticele să fie lizibile – să nu fie înlocuite cu simboluri sau alte litere. Desigur, dacă textul în limba
31 http://www.liwc.net 32 Adela Fofiu, “The Romanian Version of the LIWC2001 Dictionary and its Application for Text Analysis with
Yoshikoder”, Studia UBB Sociologia LVII, 2 (2012)33 James Pennebaker, Roger Booth și Martha Francis, Linguistic Inquiry and Word Count LIWC2001 Manual (Mahwah,
NJ: Erlbaum Publishers, 2001)
română nu are diacritice, e optim ca în etapa pregătitoare acest efect al utilizării tastaturii să fie
corectat34.
O dată cu importarea documentelor de analizat, am importat schema standardizată și am creat
schema nestandardizată. De menționat că, pentru o mai bună gestionare a continuturilor analizate, am
lucrat secvențial, pe ani, importând în Yoshikoder toate edițiile periodicului dintr-un singur an și
generând rapoarte numerice anuale. Ulterior, am reunit aceste rapoarte în alt program, după cum voi
dezvolta mai târziu.
Ulterior analizei cantitative a frecvenței cuvintelor care denotă emoții și identități etnice, am
exportat rapoartele în SPSS. Am considerat că fiecare ediție a periodicului este un caz individual și că
frecvența codurilor emoțiilor “furie”, “anxietate” și “etnie” sunt variabile nominale. Am creat totodată
o variabilă nominală “timp”, asigurându-mă că toate cazurile sunt aranjate cronologic în baza de date a
SPSS și corelate corespunzător cu numărul săptămânii în care a fost publicat fiecare, de la 1 la 356. Am
creat o altă variabilă nominală, “an”, cu șapte variante (1913 → 1919), selectând varianta corectă
pentru fiecare caz.
La finalul acestei proceduri, am generat serii de timp pentru cele trei variabile de interes,
“furie”, “anxietate” și “etnie”, instructând programul să indice grafic media frecvențelor și să
departajeze anii. Acestea sunt seriile de timp rezultate:
34 Fofiu, “The Romanian Version of the LIWC2001 Dictionary and its Application for Text Analysis with Yoshikoder”
Chiar dacă cercetarea e exploratorie și, drept urmare, nu am formulat ipoteze, am avut
așteptarea personală ca o dată cu începerea războiului, frecvența cuvintelor din cele trei categorii să
crească, iar graficul să arate un trend ascendent. Pe acest fond, trendul ușor descendent care e vizibil în
toate cele trei grafice invită la explorare în profunzime, prin interpretarea conținuturilor latente și a
contextului – obiectiv ce ține de dezvoltarea proiectului Intercultural Contact in the Age of
Globalization în ansamblu.
De observat, în același timp, că simpla cuantificare a cuvintelor care denotă identitate etnică nu
este foarte informativă. Ca atare, explorarea identităților etnice specifice a devenit necesară. În acest
sens, am început acest al treilea pas al analizei cu datele din 1913. În SPSS am generat o nouă serie de
timp, pentru acest an, ulterior creării a două variabile nominale: identitatea etnică român și identitatea
etnică ungur, fiecare caz primind cuantificările din Yoshikoder.
Și de această dată graficul a depășit așteptările mele, chiar dacă nu formulasem o ipoteză. Într-o
altă cercetare, pe conținuturi media cu 100 de ani mai recente decâț cele din periodicul Unirea – blogul
organizației Noua Dreaptă în perioada 2010-2011 - frecvența discursurilor despre etnia maghiară în
România a rezultat drept mai mare decât discursurile despre grupul etnic majoritar, românii35. Pe acest
fond, așteptarea mea era ca și în situația de criză dinainte Primului Război Mondial și mai ales pe
fondul Războaielor Balcanice, periodicul Unirea să discute cu o frecvență mai mare despre Celălalt –
etnia maghiară, decât despre români. Acest rezultat diferit de așteptările mele nestructurate a invitat noi
interogații și explorări metodologice.
Ca urmare, al patrulea pas al analizei a implicat explorarea și interpretarea contextului. Întâi am
generat rapoarte de context în Yoshikoder. În acest program, asemenea rapoarte se numesc
Concordances și extrag concordanțele dintre cuvintele-cheie sau codurile din schema de codificare și
cuvintele vecine (cinci cuvinte la stânga, cinci cuvinte la dreapta). Am identificat o serie de teme
conectate cu codurile “etnie”, pe care le-am exportat manual într-un tabel Microsoft Office Excel,
cuantificând frecvența acestor teme de context. În următorul pas, am transferat, din nou manual, aceste
frecvențe în extensia NodeXL a Microsoft Office Excel. În această extensie, se înregistrează perechi de
35 Fofiu, Apocalypse on the Net
itemi care apoi sunt plasați de către program într-o hartă conceptuală care poate să redea nu doar noduri
de rețea, în cazul nostru, codurile sau temele, ci și frecvența acestora și relațiile dintre ele.
În sens vizual, harta conceptuală generată cu ajutorul NodeXL este un rezumat al discursurilor
despre etnie în periodicul Unirea în 1913. Am marcat cu buline roșii codurile și temele despre
identitatea de român, cu buline verzi cele despre identitatea de maghiar și cu buline negre temele care
erau comune, dar redate într-un discurs neutru. Dimensiunea bulinelor este un indicator al frecvenței
codurilor sau temelor în cauză. Liniile roșii indică un discurs negativ sau opus despre temele
respective. Liniile albastre indică un discurs pozitiv sau suportiv pentru temele pe care le conectează.
În acest studiu incipient din cadrul proiectul Intercultural Contact in the Age of Globalization,
interpretarea de date e un proces prematur, deoarece scopul proiectului este generarea de modele
computerizate de armonie sau conflict inter-etnic și inter-denominațional. De aceea, datele culese și
procesate în exemplul tocmai detaliat se află în stadiu intermediar, relațiile expuse în harta conceptuală
urmând a fi transformate în modele complexe cu variabile modelabile, care să poată fi utilizate în
predicție.
Concluzii
În câmpul larg al cercetării sociale, analiza de conținut se bucură în contextul actual de
dezvoltarea tehnologică și digitală. Instrumentele digitale ne permit să creăm mixuri cantitativ-calitativ
cu rezultate de cercetare generoase și, foarte probabil, inaccesibile prin tehnici convenționale de
colectare, stocare și analiză de date. Este important, însă, să nu uităm că doar computerul nu este
suficient în dezvoltarea unei cercetări, combinația human-machine fiind rețeta optimă în explorarea
empiricului. De asemenea, analiza de conținut se prezintă astăzi ca o metodă versatilă, cercetătorul
beneficiind atât de caracterul ei sistematic și obiectiv, cât și de oportunitățile de a fi creativ și inovator
din punct de vedere al aplicabilității tehnice. Cu certitudine, cultura materială și cea non-materială vor
lăsa urme documentare care vor stimula curiozitatea comunității științifice și creativitatea în cercetarea
conținuturilor lor. Cu atât mai mult, utilizarea instrumentelor și tehnicolor digitale în aplicarea analizei
de conținut contribuie semnificativ la identificarea de probleme sociale care pot fi adresate și rezolvate
(actionable problems), ne dă o viziune amplă, de perspectivă, asupra procesului și designului de
cercetare și, prin rezultatele pe care le generează, contribuie la formare unei inteligențe globale,
unificate prin comunicare și diseminare la un nou nivel în câmpul digital36.
De reținut
– analiza de conținut este o metodă cantitativ-calitativă
– schema de codificare este instrumentul esențial în aplicarea tehnicii
– e necesar să asigurați validitatea și fidelitatea metodei și a instrumentului
– eșantionarea este foarte importantă în reducerea volumului de muncă a cercetătorului și în
asigurarea reprezentativității datelor analizate
– nu ezitați să experimentați utilizarea CAQDAS !
– dar nu uitați că doar computerul nu e suficient în gestionarea și analiza datelor
Mulțumiri
Acest material este rezultatul cercetării încă în desfășurare susținute de echipa proiectului
național Clash of Civilizations or Peaceful Co-Evolution? Intercultural Contact in the Age of
Globalization37, finanțat de Autoritatea Națională pentru Cercetare Științifică, CNCS – UEFISCDI,
proiect PN-II-ID-PCE-2011-3-0771, și de programul european CENDARI – Collaborative European
Digital Archive Infrastructure38 prin grantul de vizită de studiu CENDARI Transnational Fellowship.
Mulțumesc domnului profesor Mihai Spăriosu și colegilor de la Trinity Long Room Hub Arts &
Humanities Research Institute, Dublin, Ireland pentru sprijin.
36 Hardy Schloer, “The Dawn of the Intelligent Planet” (lucrare prezentată la IBM Forum Slovenia, 7-8 aprilie 2010)37 http://intercultural.politicalanalysis.ro/ 38 http://www.cendari.eu/
Bibliografie
Berger, Arthur Asa, Media Research Techniques, London: SAGE Publications, 1998
Chelcea, Septimiu. Metodologia cercetării sociologice. Metode cantitative și calitative, București:
Editura Economică, 2004
Drăgan, Ioan, Poliana Ștefănescu, Alexandra Povară, Anca Velicu, Elena Stoian, Măsurarea gradului
de violenţă prezent în programele audiovizualului românesc, București: Centrul de Studii Media și
Noi Tehnologii de Comunicare, 2009
Fofiu, Adela, “The Romanian Version of the LIWC2001 Dictionary and its Application for Text
Analysis with Yoshikoder”, Studia UBB Sociologia LVII, 2 (2012)
Fofiu, Adela, Apocalypse on the Net. Extreme Threat and the Majority-Minority Relationship on the
Romanian Internet, Frankfurt am Main: Peter Lang, 2013
Franzosi, Roberto, ed., Content Analysis, London: SAGE Publications, 2008
Grawitz, Madeleine, Méthodes des sciences sociales, Paris: Précis Dalloz, 1984
Iluț, Petru, Abordarea calitativă a socioumanului, Iași: Polirom, 1998
Jhally, Sut, Jean Kilbourne și David Rabinovitz, Killing us softly 4 advertising's image of women,
Northampton, MA: Media Education Foundation, 2010
Krippendorff, Klaus, Content Analysis. An Introduction to Its Methodology, London: SAGE
Publications, 2013
Mayring, Philipp, “Qualitative Content Analysis”, Forum: Qualitative Social Research, Volume 1, No.
2 (2000)
Pennebaker, James, Roger Booth și Martha Francis, Linguistic Inquiry and Word Count LIWC2001
Manual, Mahwah, NJ: Erlbaum Publishers, 2001
Schloer, Hardy, “The Dawn of the Intelligent Planet”. Lucrare prezentată la IBM Forum Slovenia, 7-8
aprilie 2010