Suport Curs Statistica Sociala Multivariata

download Suport Curs Statistica Sociala Multivariata

of 84

Transcript of Suport Curs Statistica Sociala Multivariata

  • UNIVERSITATEA TRANSILVANIA DIN BRAOV Facultatea de Sociologie i Comunicare

    Departamentul de tiine Sociale i ale Comunicrii 500030 Braov, Bd. Eroilor nr. 25, www.unitbv.ro

    SUPORT DE CURS

    Program de studii: SOCIOLOGIE Disciplina: Statistic social multivariat Titular curs: Lector univ. dr. Mesean Schmitz Luiza

    Braov 2012

  • CONSTRUCIA INDICILOR

    1

    Cuprins

    Lista tabelelor .................................................................................................................................. 2 Lista figurilor ................................................................................................................................... 2 1 Raportul de cercetare pentru analiza datelor cantitative ......................................................... 3 2 Explicaia cauzal .................................................................................................................. 11

    2.1 Elemente definitorii ........................................................................................................ 11 2.2 Construirea unui model teoretic cauzal .......................................................................... 11 2.3 Construirea unui model empiric cauzal .......................................................................... 14 2.4 Strategii de cercetare pentru verificarea empiric a modelelor cauzale ......................... 18

    2.4.1 Strategia cercetrii cantitative ................................................................................ 18 2.4.2 Strategia cercetrii calitative .................................................................................. 19 2.4.3 Strategia cercetrii comparate ................................................................................ 19 2.4.4 Strategia cercetrii cantitative combinat cu cea calitativ .................................. 20

    2.5 Metode statistice utilizate pentru verificarea empiric a modelelor cauzale .................. 21 2.5.1 Metode de analiz bivariat .................................................................................... 21 2.5.2 Metode de analiz multivariat............................................................................... 22

    2.6 Erori n construirea modelelor explicative cauzale ........................................................ 23 2.6.1 Erori de msurare ................................................................................................... 23 2.6.2 Erori de interpretare ............................................................................................... 23

    3 Construirea indicilor .............................................................................................................. 26 3.1 Definirea indicilor ........................................................................................................... 26

    3.2 Tipuri de indici ............................................................................................................... 29 3.3 Construirea indicilor cu ajutorul programului SPSS ...................................................... 32

    3.3.1 Indice de numrare ................................................................................................. 32 3.3.2 Indice sumativ sau de tip medie .............................................................................. 34

    3.3.3 Indice ca raport de scoruri...................................................................................... 39 3.3.4 Indici cu formule complexe ..................................................................................... 39 3.3.5 Indice de tip scor factorial ...................................................................................... 40

    4 Regresia linear ..................................................................................................................... 43 4.1 Regresia i corelaia ........................................................................................................ 43 4.2 Condiii de aplicare a regresiei ....................................................................................... 49 4.3 Etape n construcia unui model de regresie .................................................................. 52 4.4 Obinerea regresiei lineare cu ajutorul programului SPSS ............................................. 52

    5 Analiza factorial .................................................................................................................. 57 5.1 Noiuni introductive ........................................................................................................ 57 5.2 Factori i variabile .......................................................................................................... 58 5.3 Variaie, covariaie i corelaie ....................................................................................... 60 5.4 Derivaia structurii covariaiei din structura factorial ................................................... 61 5.5 Etapele necesare determinrii factorilor ......................................................................... 62 5.6 Limitele analizei factoriale ............................................................................................. 64 5.7 Obinerea analizei factoriale cu ajutorul programului SPSS .......................................... 65

    6 Analiza Cluster ...................................................................................................................... 71

    6.1 Caracteristici generale .................................................................................................... 71 6.2 Msuri ale distanei i similaritii dintre elemente ........................................................ 73 6.3 Distana dintre clusteri .................................................................................................... 75 6.4 Algoritmul de calcul al analizei cluster ......................................................................... 76 6.5 Limite ale analizei cluster ............................................................................................... 76 6.6 Obinerea analizei cluster cu ajutorul programului SPSS .............................................. 76

    Bibliografie .................................................................................................................................... 81

  • CONSTRUCIA INDICILOR

    2

    Lista tabelelor

    Tabelul nr. 1-1: Structura populaie i a eantionului n funcie de sex .......................................... 3 Tabelul nr. 1-2: Structura populaie i a eantionului n funcie de vrst ...................................... 4 Tabelul nr. 1-3: Structura populaie i a eantionului n funcie de etnie ........................................ 4 Tabel nr. 1-4: Structura eantionului teoretic i observat n numr de cazuri dup variabila sex4 Tabel nr. 1-5: Structura eantionului teoretic i observat n numr de cazuri dup variabila vrst ............................................................................................................................................... 5 Tabel nr. 1-6: Structura eantionului teoretic i observat n numr de cazuri dup variabila etnie ................................................................................................................................................. 5

    Tabelul nr. 2-1: Scopurile i abordrile metodologice ale cercetrii sociale ................................ 20 Tabelul nr. 2-2: Forma general a tehnicilor de analiz multivariat de dependen ................... 22 Tabelul nr. 3-1: Dimensiuni i indicatori ai indicelui IDU .......................................................... 32 Tabelul nr. 3-2: Dimensiuni i indicatori ai indicelui IS .............................................................. 32 Tabelul nr. 3-3: Indicatori ai indicelui de numrare participare protest ..................................... 33 Tabelul nr. 3-4: Indicatori care msoar deschiderea spre situaii de risc .................................... 35 Tabelul nr. 3-5: Valorile indicelui consum monden n funcie de nivelul de educaie .................. 42 Tabelul nr. 5-1: Exemplificarea coeficienilor i variabilelor: 2 variabile, un coeficient comun: 59 Tabelul nr. 5-2 ncrederea n instituiile din Romnia, BOP mai 2006 ....................................... 65 Tabelul nr. 6-1: Descrierea instrumentelor de marketing digital din prisma firmelor din Braov 77

    Lista figurilor

    Figura nr. 1-1 : Eantion ponderat la nivelul firmelor din Romnia ............................................... 6 Figura nr. 2-1: Structura standard a teoriei cauzale ...................................................................... 13

    Figura nr. 2-2: Exprimarea unui model teoretic printr-un graf orientat ........................................ 16

    Figura nr. 2-3: Diagrama cauzal cu variabile latente .................................................................. 17 Figura nr. 2-4: Diagrama cauzal cu variabile observabile ........................................................... 18 Figura nr. 3-1: Opiunea COUNT pentru indicele de numrare, participare protest ................... 33 Figura nr. 3-2: Opiunea COUNT-Define values pentru indicele de numrare, participare protest ....................................................................................................................................................... 34 Figura nr. 3-3.: Fereastra Reliability Analysis .............................................................................. 35

    Figura nr. 3-4: Opiunea Statistics n Reliability Analysis ............................................................ 36 Figura nr. 3-5: Opiunea COMPUTE pentru indicele risc de tip sumativ .................................... 37 Figura nr. 3-6: Opiunea COMPUTE pentru indicele risc de tip medie ...................................... 38 Figura nr. 3-7: Opiunea COMPUTE pentru indicele venit de tip raport ...................................... 39 Figura nr. 3-8: Opiunea COMPUTE pentru indicele animale ..................................................... 40 Figura nr. 3-9: Opiunea Analiza factorial .................................................................................. 42 Figura nr. 3-10: Opiunea Analiza factorial-salvarea rezultatelor ntr-o variabil nou-indice .. 42 Figura nr. 4-1: Scatterplot options ................................................................................................. 45 Figura nr. 5-1 : Reprezentarea grafic a unui factor cu dou variabile ......................................... 58 Figura nr. 5-2: Reprezentarea grafic a unui factor cu dou variabile conform unui set de reguli ....................................................................................................................................................... 59 Figura nr. 5-3: Reprezentarea grafic a unui factor comun cu mai multe variabile ...................... 61 Figura nr. 5-4: Reprezentarea grafic a doi factori comuni cazul ortogonal ............................... 62 Figura nr. 5-5: Reprezentarea grafic a doi factori comuni cazul ortogonal ............................... 62 Figura nr. 5-6: Comanda pentru Analiza factorial-testul KMO .................................................. 66 Figura nr. 5-7: Comanda pentru Analiza factorial-extragerea factorilor ..................................... 67 Figura nr. 5-8: Comanda pentru Analiza factorial-rotaia factorilor ........................................... 68 Figura nr. 5-9: Comanda pentru Analiza factorial-construirea unui indice ................................. 68 Figura nr. 5-10: Reprezentarea grafic a valorilor proprii ale factorilor. ...................................... 69 Figura nr. 5-11: Reprezentarea grafic a asocierii dintre variabile i factori ................................ 71

  • CONSTRUCIA INDICILOR

    3

    1 Raportul de cercetare pentru analiza datelor cantitative

    1.Enunarea scopului i a obiectivelor cercetrii; enunarea ipotezelor

    2. Specificarea tipului de cercetare

    Cantitativ/calitativ;

    Descriptiv/explicativ/comparativ

    Exploratorie/testarea unor teorii

    Longitudinal

    Aplicativ

    3. Culegerea datelor

    Universul cercetrii

    Mrimea eantionului: P,, p, E=eroarea de estimare a valorilor eantionului: +/-1%; +/-3%

    Metoda de eantionare: cote, stratificat, aleatorie etc.

    Metoda de culegere a datelor: randoum route, metoda pasului, metoda areolar

    Tipul de cercetare: descriptiv Volumul eantionului=384, pentru t=1,96, p=50% i e=5%

    Tipul de cercetare: explicativ/sau analize pe subeantioane Volumul eantionului=1066, pentru t=1,96, p=50% i e=3%

    Reprezentativitate pe subeantioane Volumul eantionului=2400, pentru t=1,96, p=50% i e=2%

    Cum stabilim volumul eantionului pentru urmtoarele teme de cercetare? 1. Starea de sntate a populaiei 2. Sondaj politic reprezentativ la nivelul judeului Braov, reprezentativ i pentru mediul

    urban/rural

    3. Violena domestica asupra femeilor 4. Consumatorii de droguri 5. Fidelitatea clienilor fa de un magazin

    4. Analiza datelor

    4.1. Verificarea reprezentativitii eantionului Exemplu: n anul 2008 s-a realizat o cercetare la nivelul municipiului Braov cu scopul

    determinrii atitudinii locuitorilor fa de principalele instituii locale. Persoanele intervievate aveau vrsta peste 18 ani.

    n tabelele nr. 1.1, 1.2, 1.3. Este prezentat structura populaiei municipiului Braov i structura eantionului n funcie de sex, vrst i etnie. Datele privind structura populaiei municipiului Braov sunt preluate de la Direcia Judeean de Statistic Braov.

    Tabelul nr. 1-1: Structura populaie i a eantionului n funcie de sex

    Structura populaiei municipiului Braov dup sex

    Structura eantionului dup sex

    masculin 47.2% 49%

    feminin 52.8% 51%

    Total 100% 100%

  • CONSTRUCIA INDICILOR

    4

    Tabelul nr. 1-2: Structura populaie i a eantionului n funcie de vrst

    Structura populaiei municipiului Braov dup vrsta

    Structura eantionului dup vrst

    18-24 ani 14.1% 14.4%

    25-29 ani 11.2% 12.2%

    30-34 ani 9.4% 11.6%

    35-39 ani 9.0% 8.7%

    40-44 ani 7.6% 7.3%

    45-49 ani 8.9% 7.5%

    50-54 ani 11.2% 10.9%

    55-59 ani 8.6% 7.4%

    peste 60 ani 19.9% 20%

    Total 100% 100%

    Tabelul nr. 1-3: Structura populaie i a eantionului n funcie de etnie

    Structura populaiei municipiului Braov dup etnie

    Structura eantionului dup etnie

    roman 90.7% 92.5%

    maghiari 8.1% 6.9%

    rromi 0.3% 0%

    germani 0.6% 0.3%

    alta 0.3% 0.3%

    Total 100% 100%

    n vederea stabilirii concordanei dintre structura eantionului i cea a populaiei, se va aplica testul 2 pentru fiecare variabil n parte (sex, vrst, etnie).

    Paii necesari pentru aplicarea acestui test. Primul pas: identificarea frecvenelor observate, adic structura eantionului aa cum a

    ieit din teren, pe fiecare din cele trei variabile, n numr de persoane i nu n procente. Spre exemplu, cte persoane de sex masculin i cte de sex feminin au fost intervievate.

    Al doilea pas: identificarea frecvenele teoretice (ateptate), cele care ar fi trebui s ias din teren conform procentelor din structura populaiei, la fiecare variabil. Spre exemplu, cte persoane de sex masculin sau de sex feminin ar fi trebuit intervievate, pentru a respecta structura

    populaiei municipiului Braov, respectiv 47,2% persoane de sex masculin i 58,2% persoane de sex feminin.

    Aceste date sunt prezentate n tabelele nr.1.4

    Tabel nr. 1-4: Structura eantionului teoretic i observat n numr de cazuri dup variabila sex

    Sex Structura eantionului teoretic (frecvene teoretice, ateptate)

    Structura eantionului observat (frecvene observate)

    masculin 523 543

    feminin 585 565

    Total 1108 1108

    Al treilea pas: Se calculeaz testul 2 pentru a se stabili dac exist diferene dintre structura eantionului i cea a populaiei.

    Testul 2 are dou ipoteze (de nul i alternativ) i n funcie de rezultatele obinute se va accepta una din ele. Se calculeaz valoarea testului i se compara cu o valoare critic dintr-un tabel standard. Valoarea critic se identific n funcie de numrul gradelor de libertate i a probabilitii de garantare a rezultatelor, care de regul o lum P=95%.

  • CONSTRUCIA INDICILOR

    5

    Ipoteza de nul H 0 : Distribuia eantionului nu este semnificativ diferit de distribuia populaiei

    (eantionul este reprezentativ pentru populaia municipiului Braov)

    Ipoteza alternativ H 1 : Distribuia eantionului este semnificativ diferit de distribuia populaiei

    (eantionul nu este reprezentativ pentru populaia municipiului Braov)

    Testul calculat2 =

    teoretice

    teoreticeobservate

    F

    FF 2)(

    calculat2 =0.68+0.76=1.44

    Gradele de libertate df = (2-1)*(2-1)=1; df= (nr. linii tabel-1)* (nr. coloane tabel -1)

    valoarea

    critic2 pentru 1 grad de libertate i pentru o probabilitate de garantare a rezultatelor de 95% este

    3.84.

    calculat2 este mai mic dect critic

    2 , prin urmare se accept ipoteza de nul, deci eantionul respect structura populaiei municipiului Braov dup variabila sex.

    Tabel nr. 1-5: Structura eantionului teoretic i observat n numr de cazuri dup variabila vrst

    Vrsta

    Structura eantionului teoretic (frecvene teoretice)

    Structura eantionului observat (frecvene observate)

    18-24 ani 156 160

    25-29 ani 125 135

    30-34 ani 104 128

    35-39 ani 100 96

    40-44 ani 84 81

    45-49 ani 99 83

    50-54 ani 124 121

    55-59 ani 95 82

    peste 60 ani 221 222

    Total 1108 1108

    H 0 : Distribuia eantionului nu este semnificativ diferit de distribuia populaiei

    H 1 : Distribuia eantionului este semnificativ diferit de distribuia populaiei

    calculat2 =0.102+0.8+5.53+0.16+0.107+2.58+0.072+1.77+0.0=11.12

    df = (9-1)*(2-1)=8; df= grade de liberate= (nr. linii-1)* (nr. coloane -1)

    critic2 pentru 1 grad de libertate i pentru o probabilitate de garantare a rezultatelor de 95% este

    15.51

    calculat2 este mai mic dect critic

    2 , prin urmare se accept ipoteza de nul, deci eantionul respect structura populaiei municipiului Braov dup variabila vrst.

    Tabel nr. 1-6: Structura eantionului teoretic i observat n numr de cazuri dup variabila etnie

    Etnia Structura

    eantionului teoretic (frecvene teoretice)

    Structura eantionului observat (frecvene observate)

    roman 1005 1012

    maghiari 90 76

    rromi 3 0

    germani 7 3

    alta 3 3

    Total 1108 1108

  • CONSTRUCIA INDICILOR

    6

    H 0 : Distribuia eantionului nu este semnificativ diferit de distribuia populaiei

    H 1 : Distribuia eantionului este semnificativ diferit de distribuia populaiei

    calculat2 =0.048+2.17+3+2.28+0=7.498

    df = (5-1)*(2-1)=4; df= grade de liberate= (nr. linii-1)* (nr. coloane -1)

    critic2 pentru 1 grad de libertate i pentru o probabilitate de garantare a rezultatelor de 95% este

    9.49

    calculat2 este mai mic dect critic

    2 , prin urmare se accept ipoteza de nul, deci eantionul respect structura populaiei municipiului Braov dup variabila etnie n concluzie, putem afirma c eantionul are un grad ridicat de reprezentativitate n funcie de sex, vrst, etnie, pentru populaia municipiului Braov.

    4.2. Ponderarea rspunsurilor: ponderarea subiecilor/cazurilor sau a rspunsurilor la anumite variabile.

    Exemplu: n 2008 The Gallup Organization Romnia a realizat un studiu n rndul persoanelor juridice, cu scopul de a descrie Piaa Serviciilor de Telefonie Mobil din Romnia.

    Figura nr. 1-1 : Eantion ponderat la nivelul firmelor din Romnia

    Sursa: The Gallup Organization Romnia: Piaa Serviciilor de Telefonie Mobil. Raport de Cercetare, Eantion persoane juridice, iunie 2008

    Eantionul a avut la baz trei componente: un eantion reprezentativ de companii, o alt component bazat pe companii medii i mari (cu mai mult de 50 angajai). Motivul pentru care s-a ales focalizarea pe companii medii i mari are la baz nevoia de a dispune de un numr

  • CONSTRUCIA INDICILOR

    7

    suficient de mare de astfel de companii cu scopul de a obine informaii relevante la nivelul acestui segment. Deoarece n comparaie cu structura real a companiilor i instituiilor publice din Romnia, eantionul final are n componen mai multe companii de mrime medie i mare i mai puine companii mici, s-a impus ponderarea bazei de date. Se cunoate dintr-un studiu anterior structura companiilor care utilizeaz servicii de telefonie mobil n funcie de numrul de angajai (aa cum apare n coloana % ponderat). Pentru a fi realizat aceast structur, rspunsurile obinute de la companiile mici au fost nmulite cu o valoare supraunitar (altfel spus, am crescut importana rspunsurilor obinute de la companiile mici) n timp ce rspunsurile obinute de la companiile medii i mari au fost nmulite cu un numr subunitar, ceea ce a dus la scderea importanei lor n cadrul eantionului total.

    4.3. Ratele de non-rspuns: medierea global (se nlocuiesc valorile lips cu media), medierea pe clase (se clasific subiecii pe anumite straturi masculin/feminin, educaie) i acolo unde se gsesc valori lipsa se nlocuiesc cu media variabilei din acel strat; imputaia obiectiv (pe baza unei ecuaii de regresie) sau imputaia de tip hot-deck (vezi Tehnica sondajelor. Aplicaii i teste de evaluare:

    (http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=461&idb=)

    4.4. Analiza datelor

    Tehnicile utilizate pentru analiza datelor sunt n funcie de tipul de variabil/variabile cu care se lucreaz. Se vor analiza datele pentru fiecare obiectiv/ipotez n parte.

    a. Analiza descriptiv (univariat)

    Tabele/grafice cu o variabil pentru fiecare ntrebare din chestionar

    Indicatori ai tendinei centrale, ai dispersiei, mrimi multiple etc

    Construirea de indici

    Estimarea parametrilor la nivelul populaiei

    De cele mai multe ori n tiinele sociale variabilele sunt msurate la nivelul unui eantion extras din populaia studiat, din motive practice nefiind posibil msurarea lor n ntreaga populaie. Este esenial s distingem ntre distribuia variabilei la nivelul eantionului denumit n continuare statistic i distribuia n populaie denumit parametru. O dat msurat distribuia unei variabile la nivelul eantionului suntem pui n situaia de a estima valoarea medie pe care aceasta o are n populaie. Spre exemplu, cunoscnd distribuia venitului pentru persoanele incluse ntr-un eantion suntem interesai s aflm intervalul n care valoarea medie a venitului se ncadreaz n populaie. Aceasta estimare se face prin construirea unui interval de ncredere definit de valorile limit pe care le poate lua media statisticii date.

    Limitele intervalului de ncredere depind de:

    Probabilitatea cu care garantm nscrierea valorii din populaie n acest interval. Dac venitul mediu pentru un eantion reprezentativ este de 2 milioane/persoan, a estima valoarea din populaie nseamn a afirma cu o anumit probabilitate c n populaie acest venit se ncadreaz ntre anumite limite. Spre exemplu cu o probabilitate de 95% putem ncadra venitul mediu din populaie ntre 1,7 i 2,3 milioane. Exist deci o probabilitate de 5% ca valoarea din populaie s nu se ncadreze n acest interval i estimarea noastr s fie eronat. Dac dorim s micorm probabilitatea de a grei atunci vom mri limitele intervalului de ncredere. Astfel pentru o probabilitate de 99% vom spune de exemplu c venitul mediu din populaie se ncadreaz ntre 1,5 i 3 milioane. Aceast probabilitate este denumit i nivel de semnificaie sau ncredere.

  • CONSTRUCIA INDICILOR

    8

    Eroarea standard de eantionare (ES) este o caracteristic a distribuiei de eantionare pentru a crei realizare (teoretic) se construiesc toate eantioanele posibile de un anumit volum dintr-o populaie dat i se reprezint distribuia mediei pentru caracteristica studiat (respectiv valorile mediei funcie de frecvena cu care apar). (O proprietate important a acestei distribuii este aceea c media tuturor mediilor obinute din eantioanele de volum n va fi egal cu media din populaie). n practic, distribuia de eantionare, nu este cunoscut i eroarea standard a acestei distribuii, se estimeaz prin valorile calculate la nivelul eantionului.

    Pentru a estima eroarea standard mai nti este necesar s estimm dispersia din populaie. Aceasta este estimat pe baza dispersiei la nivelul eantionului cu formula

    22

    1s

    N

    N

    , unde N = volumul eantionului,

    1N

    Nfiind un factor de corecie. La nivelul

    eantionului cunoatem dispersia N

    xxs

    2

    2)(

    , deci 1

    )(2

    2

    N

    xxestimat .

    Eroarea standard a distribuiei de eantionare de care avem nevoie pentru a estima

    media caracteristicii n populaie se calculeaz prin formula N

    ES estimat

    , unde estimat este

    estimarea abaterii standard din populaie i N este volumul eantionului. Astfel cu ct abaterea standard a caracteristicii este mai mare, cu att vor crete i limitele intervalului de ncredere pentru valoarea medie estimat la nivelul populaiei.

    Limitele intervalului de ncredere pentru valoarea medie a caracteristicii sunt egale cu

    EStxmediu , unde t depinde de nivelul de ncredere. Pentru o probabilitate de 95% t=1,96, iar

    pentru o probabilitate de 99%, z=2,58.

    Exemplu 1. Estimarea unei medii la nivelul populaiei S presupunem c s-a realizat o cercetare pe o populaie de 1159 persoane din judeul Y. Cercetarea a fost realizat pentru identificarea unor elemente utile n campania de ntrire a brand-ului Ciuca. Persoanele intervievate au trebuit s precizeze preul pe care l-ar da pentru o sticl de Ciuca. Media preului care a rezultat din intervievarea persoanelor a fost de 8, 53 ron. Se pune ntrebarea la nivelul ntregii populaii din judeul Y cam care ar trebui s fie preul unei sticle de Ciuca, avnd n vedere c exist erori de eantionare i nu putem spune cu exactitate c acest pre ar trebui s fie de 8,53 ron aa cum a reieit din baza de date. Pentru

    aceasta se va construi intervalul de ncredere dup formula menionat mai sus, EStxmediu .

    x mediu=media preului care a rezultat din baza de date=8,53 ron

    t= 1,96 pentru P=95%

    ES=n

    , unde este deviaia standard, iar n este volumul eantionului.

    Rezultatele din baza de date cu ajutorul programului SPSS sunt urmtoarele:

    Descriptive Statistics

    N Mean

    Std.

    Deviation

    Care este preul pe care l-ai da pentru o sticl de bere Ciuca

    1159 8,53 1,24

    Deci, deviaia standard este de 1,24 ron, iar ES va fi 1,24/ 1159 . ES=0,036

  • CONSTRUCIA INDICILOR

    9

    Intevalul de ncredere va avea urmtoarele valori: IC: [8,53-1,96*0,036; 8,53+1,96*0,036]

    IC: [8,45; 8,60]

    n concluzie putem spune c la nivelul ntregii populaii preul pentru care oamenii ar cumpra o sticl de bere Ciuca este undeva ntre 8,45 ron i 8, 60 ron.

    Exemplu 2. Estimarea unei proporii la nivelul populaiei n cazul unei variabile dihotomice x cu valori 0 i 1 (consumatori de bere, unde 0

    nseamn c persoanele intervievate nu consum bere, iar valoarea 1 nseamn c persoanele intervievate consum bere) valoarea medie va fi egal cu proporia de apariie a valorii 1 la nivelul eantionului construit.

    Tot din aceeai cercetare menionat mai sus a rezultat c 44,5% dintre persoanele intervievate consum berea Ciuca n mod frecvent. Care va fi procentul la nivelul ntregii populaii.

    Dup cum am vzut n exemplul anterior, trebuie s cunoatem volumul eantionului, eroarea standard, deviaia standard.

    x mediueste dat n acest caz de procentul persoanelor care consum Ciuca.44,5%.

    n=1159 persoane

    = )1( qq , unde q=procentul persoanelor consumatoare de bere Ciuca transformat

    n probabilitate

    = )445,01(445,0 =0,496

    ES=n

    =

    04,34

    496,0=0,0145 transformat n procente va fi 1,45%

    IC: [44,5-1,96*1,45; 44,5+1,96*1,45]

    IC: [41,6%; 47,3%]

    La nivelul ntregii populaii persoanelor care consum berea Ciuca se afl undeva ntre 41,6% i 47,3% din total consumatori de bere.

    Analiza modificrilor diferiilor parametri n timp 66,5% dintre respondeni consider c actuala criza financiar ar putea contribui la

    creterea gradului de utilizarea a instrumentelor marketingului digital, datorit costurilor reduse i posibilitilor de msurarea a eficienei acestor instrumente. Dac analizm n schimb modul cum au evoluat cheltuielile cu instrumentele de marketing digital i a gradului de utilizare a instrumentelor de marketing digital, nu se confirm aceast ipotez. Procentul firmelor care au crescut numrul instrumentelor de marketing digital n anul 2009 este de dou ori mai mic dect cel din 2005-2008 sau 2003-2005. De asemenea, procentul firmelor care au alocat un bugetul mai mare instrumentelor de marketing digital n 2009 comparativ cu ceilali ani, este de trei ori mai mic.

    Testarea diferenelor dintre procente Procente utilizarea instrumente de marketing digital mai multe -anul 2009 q1=33%, n1=63 persoane

    -perioada 2005-2008 q2=67,1%, n2= 49 persoane

    -perioada 2003-2005 q3=67,5%, n3=27 persoane

    e-eroarea standard, n1, n2 volumele eantioanelor, zobs=raportul critic

    e =

    = q1 (1-q1)

    = q2 (1-q2)

  • CONSTRUCIA INDICILOR

    10

    zobs =

    1. Testm dac diferena de procente dintre cei care au spus c n anul 2009 au folosit mai multe instrumente de marketing digital i cei care au spus c n 2005-2008 au folosit mai multe instrumente de marketing digital este semnificativ.

    e=8,95%

    zobs =-3,79

    H0: diferena dintre procente nu este semnificativ diferit de zero H1: diferena dintre procente este semnificativ diferit de zero Lucrm cu P=95%, iar pentru aceast probabilitate coeficientul de ncredere t=1,96.

    zobs se afl n afara intervalului [-1,96; 1,96], prin urmare se respinge ipoteza de nul. Diferena dintre cele dou procente este semnificativ.

    2. S-a testat dac exist diferene de procente i ntre procentul persoanelor care au declarat c folosesc instrumente de marketing digital mai multe n 2003-2005 fa de 2005-2008

    zobs = 0,044 se afl n interiorul intervalului [-1,96; 1,96], prin urmare se accepta ipoteza de nul. Diferena de procente dintre perioada 2003-2005 nu este diferit de perioada 2005-2008. Cu alte cuvinte se poate spune c actuala criza economic a diminuat creterea numrului

    de instrumente de marketing digital comparativ cu numrul de instrumente de marketing digital utilizate n anul 2009 comparativ cu perioada 2003-2008. Deci ipoteza general nu se confirm.

    b. Analiza explicativ: testarea ipotezelor, construirea de modele explicative

    Analiza bivariat

    Tabele de contingen sau grafice cu dou variabile

    Testarea asocierii dintre dou variabile: coeficieni de asociere, testul hi patrat, valoarea reziduala ajustat

    Analiza comparativ: testele nonparametrice, testele parametrice

    Analiz multivariat

    Tehnici de interdependen: ecuaii structurale, regresie linear, Anova etc;

    Tehnici de independen: analiz factorial, analiz cluster etc

    4.5. Interpretarea datelor

    Cum trebuie s redactm un raport de cercetare? Care este publicul int?

    o Publicul larg dorete rezultate ; o Specialitii au nevoie de informaii metodologice; o Clienii/beneficiarii ateapt soluii;

    se interpreteaz fiecare grafic sau tabel, precum i rezultatele din output de la metodele statistice utilizate;

    la fiecare metod/tehnic utilizat se explic cum s-au luat deciziile;

    se traseaz concluzii

  • CONSTRUCIA INDICILOR

    11

    2 Explicaia cauzal

    2.1 Elemente definitorii

    Relaia cauzal reprezint o relaie ntre dou fenomene, caracterizat prin aceea c unul dintre ele l produce pe celalalt. Primul fenomen, cel care produce i care, n consecin, l explic pe celalalt, este cauza iar fenomenul produs este efectul. (Zamfir, 2005, 19).

    O caracteristic important a relaiei cauzale este distana de timp ntre producerea cauzei i obinerea efectului dat.

    Exemplu: Starea de sntatea determin stilul de via sau invers. Cum stabilim care a fost prima? Nu putem ti, dar presupunem.

    Lewis-Beck, Bryman i Futing Liao prezint n The Sage encyclopedia of social science research methods (2004, pp.204-205) teoria probabilistic a cauzalitii.

    Majoritatea cercettorilor tiinifici din lume care sunt adepii teoriei probabilistice a cauzalitii au n vedere cteva criterii: consider c X este cauza lui Y dac i numai dac X exist (probabilitatea lui X este mai mare de zero), X este aprior lui Y (X a existat n timp nainte de Y), exist o relaie statistic ntre X i Y i aceast relaie nu dispare dac se in sub control alte variabile. Metoda coeficienilor path a lui Sewell Wright n genetic n anii 1920, modelele de ecuaii simultane ale lui Herman Wold n econometrie n anii 1950, modelele cauzale ale lui Simon i Blalock n sociologie i alte tiine sociale n anii 1960 i 1970 i relaii lineare structurale de sistem (LISREL) realizate de Karl Jreskog n anii 1970 sunt cteva exemple de modele cauzale ce in de teoria probabilistic a cauzalitii.

    1,Exist totui trei probleme referitoare la aceast teorie. Prima se refer la nsi noiunea de probabilitate, care explic relaia statistic (corelaie) dar nu explic i cauzalitatea.

    2.A doua problema ine de faptul c relaiile statistice care se testeaz sunt dependente de teoria care a fost aleas.

    3.A treia problem ine de conceptul de apriori, cu ct certitudine putem afirma c un eveniment a existat nainte de fenomenul considerat efect.

    2.2 Construirea unui model teoretic cauzal

    Lazr Vlsceanu i Ctlin Zamfir, n Dicionarul de sociologie-online prezint dou etape n formularea i demonstrarea unei teorii cauzale sociale: construirea unui model la nivel teoretic i construirea unui model la nivel empiric.

    nainte de a contura un model teoretic cauzal este necesar o atenie deosebit etapei de operaionalizare a conceptelor.

    La ce trebuie s fim ateni: 1. Model explicativ la nivel macro/micro 2. La nivel micro:

    operaionalizarea conceptului,

    msurarea indicatorilor din aceeai dimensiune pe aceeai scal (dac este posibil),

    selectarea indicatorilor dac modelul este prea complex n cele mai multe cazuri n construirea unor modele cauzale lucrm cu concepte cu un

    grad ridicat de abstractizare care necesit o definire ct mai detaliat. Dup definire se va operaionaliza conceptul n dimensiuni, sub-dimensiuni i indicatori, care sunt direct msurabili. n funcie de obiectivele studiului se poate lua n calcul doar anumite dimensiuni ale conceptului, iar din fiecare dimensiune doar un set de indicatori respectiv variabile (n baza de date). n spatele unui set de indicatori dintr-o dimensiune va exista o variabil latent, (care nu este direct msurabil i se msoar prin intermediul unui set de indicatori) care va purta numele acelei dimensiuni.

  • CONSTRUCIA INDICILOR

    12

    Astfel, n analiza factorilor care influeneaz sperana de via, avnd drept scop construirea unui model cauzal care s indice influena fiecrui factor n parte, se vor contura dou dimensiuni principale: factori la nivel macro i factori la nivel micro. n cadrul fiecrei dimensiuni exist mai mult subdimensiuni, iar fiecare subdimensiune va fi compus din mai muli indicatori.

    Deoarece, n exemplul de fa, nu se pot integra n acelai model date la nivel macro i date la nivel micro se vor contura dou modele explicative cauzale. Dac vom lua modelul cauzal la nivelul factorilor micro, variabilele latente vor fi factorii socio-demografici, factorii biologici, factorii psihologici, factorii socio-culturali i factorii economici.

    De asemenea foarte important este ca indicatorii din aceeai dimensiune s fie msurai pe aceeai scal, pentru a putea fi comparabili, n caz contrar crete gradul de eroare. Acolo unde indicatorii nu sunt msurai pe aceeai scal, se pot face ajustri astfel nct scalele s fie comparabile. Dar acest lucru va duce la o cretere a dispersiilor variabilelor latente i indirect a erorilor. Acest lucru trebuie avut n vedere la faza de concepere a instrumentului de colectare a datelor (dac datele nu sunt colectate din documente sociale).

    Dintre indicatorii din fiecare dimensiune (variabilele direct observabile) vor fi selectai doar cei mai importani, pentru a putea simplifica modelul, care este destul de complex, avnd n vedere c are mai multe variabile latente i fiecare este msurat prin cel puin dou variabile direct observabile.

    n conturarea modelului teoretic cauzal exist mai multe etape: stabilirea variabilelor incluse n model, stabilirea enunurilor cauzale i definirea modelului explicativ.

    1. Prima etap: Se specific fenomenele sau variabilele incluse n model. Se disting urmtoarele tipuri de variabile: variabila de explicat, variabile exogene, endogene, acionale sau pragmatice i reziduale.

    Variabila de explicat se refer la fenomenul efect. Ctlin Zamfir n lucrarea Spre o paradigm a gndirii sociologice amintete dou tipuri de teorii sociologice cauzale: teorii centrate n jurul explicrii fenomenului efect i teorii centrate pe fenomenul cauz. Cele dou tipuri de teorii sunt similare doar c difer perspectiva de abordare. Teoriile centrate pe fenomenul cauz, analizeaz efectele multiple ale unui fenomen social important, spre exemplu efectele revoluiei tiinifice.

    Variabilele endogene sunt acele variabile care au o influen cauzal direct, nemijlocit, simpl asupra variabilei de explicat. Ele se refer la cauzele generale ale respectivului fenomen, acionnd n orice context particular. Din acest motiv le-am numit variabile cauzale abstracte. Relaiile dintre variabilele cauzale abstracte i variabila de explicat sunt universale, putnd fi formulate ca legi cauzale. Ele reprezint enunuri teoretice fundamentale ale teoriei explicative.(Zamfir, 2005, 39) Exemplu: genetici, alimentaia

    Variabilele de explicat mpreun cu variabilele endogene i cu enunurile cauzale care descriu relaia dintre fenomene formeaz teoria abstract general.

    Trebuie fcut o distincie ntre teoriile abstracte din sociologie i teoriile fundamentale care descriu relaii mai simple. Realitatea social fiind mult mai complex, teoriile abstracte trebuie s prezinte scheme care s fie baza unei analize explicative dar aceste scheme sunt specifice pentru fiecare context n parte.

    Variabile contextuale sau exogene sunt acele variabile care se refer la influena diferitelor componente ale contextului social asupra fenomenului. De exemplu, sperana de via ar putea fi prelungit de campaniile de prevenii ale sntii realizate n ara respectiv, de calitatea serviciilor medicale din acea ar sau de srcia existent n acea ar.

    Variabilele contextuale sunt punctele n care teoria abstract se conecteaz la un context social i acestea pot varia o dat cu contextul. Prin urmare, relaiile dintre variabila efect i variabilele contextuale nu pot fi enunuri a unor legi universale. Generalizarea unor astfel de enunuri poate fi vulnerabil. De aceea, aceste variabile se numesc variabile externe, tocmai pentru a se sublinia caracterul lor relativ la context. Aceste variabile nu fac parte din teoria

  • CONSTRUCIA INDICILOR

    13

    abstract. Teoria abstract trebuie suplinit cu o teorie contextual, care are rolul de a lega teoria abstract la un context social.

    Din acest motiv n sociologie exist teorii abstracte care explic un fenomen indiferent de societate, cum ar fi teoria stratificrii sociale, teoria delincvenei, dar n acelai timp exist teorii contextuale care explic aceste fenomene n anumite contexte sociale: teoria delincvenei sociale n diferite contexte.

    Variabile acionale sau pragmatice sunt variabilele referitoare la aciunile individuale sau colective, care afecteaz variabilele contextuale, iar acestea variabilele cauzale abstracte i astfel este influenat variabila efect i sunt obiectul teoriei pragmatice. Teoriile pragmatice analizeaz cum se poate aciona pentru a schimba acele variabile contextuale care influeneaz fenomenul studiat. De exemplu, cum se poate aciona astfel nct s se mbunteasc starea de sntate a oamenilor din anumite zone al rii, unde contextul este nefavorabil.

    Structur standard a teoriei cauzale se prezint astfel:

    Figura nr. 2-1: Structura standard a teoriei cauzale

    Sursa: (Zamfir, 2005, 44)

    La aceast schem pot fi adugate i variabilele reziduale care nu sunt luate n calcul n model, dar care au efect asupra variabilelor exogene. Sunt variabile care in de contextul mai larg n care are loc fenomenul analizat i nu pot fi msurate sau cercettorul nu le poate imagina.

    Conforma acestei structuri, dac ar fi s construim o teorie privind sperana de via, teoria abstract scoate n eviden o list de cauze generale responsabile de acest fenomen. Teoria contextual explic durata medie de via n funcie de anumite contexte sociale: zone cu srcie ridicat, zone cu rzboaie sau zone cu indicatori ai calitii vieii ridicai. Teoria pragmatic rspunde la ntrebri privind modul de a aciona asupra variabilelor contextuale astfel nct s se obin creteri semnificative n durata medie de via.

    Trebuie fcut o distincie ntre explicaia teoretic (Mario Bunge-1967) sau deductiv-nomologic (Carl. G. Hempel-1966) i explicaia pseudoteoretic, definit de Achim Mihu (1973). Dac prima se bazeaz pe deducere explanandum-ului din explanans, cea de a doua explic un fenomen prin apel la motivaie sau surprinderea semnificaiei unor aciuni. Cu alte cuvinte, explicarea duratei medii de via n funcie de factorii psihologici ar fi de fapt o pseudoteorie.

    Raportul cauzal ntre dou fenomene este un raport intersistemic. Orice relaie cauzal se stabilete ntre cel puin dou sisteme. Atunci cnd relaia cauzal se refer la elemente din acelai sistem, nu se mai poate vorbi de o relaie cauzal chiar dac elementele incluse n relaie sunt la niveluri diferite ale aceluiai sistem. De exemplu, a explica durata medie de via prin starea de sntate a oamenilor este de fapt explicarea conceptului de speran de via prin el nsui, chiar dac sunt la nivele diferite. Durata medie de via poate fi aproximat prin starea de sntate, practic se exprim aproximativ acelai lucru dar la un alt nivel.

    Variabile acionale

    pragmatice

    Variabile

    contextuale,

    exogene

    Variabile abstracte,

    endogene Variabila

    efect

    Teorie pragmatica, acional

    Teoria contextual, concret

    Teorie abstract

  • CONSTRUCIA INDICILOR

    14

    Factori versus condiii Se remarc faptul ca nu prea se face distincie ntre cauze i condiii. Ambele contribuie

    la explicare fenomenului dar n msuri diferite. Cauza are influen direct asupra fenomenului, n timp ce condiia doar faciliteaz sau inhib producerea fenomenului. De exemplu, religia poate influena durata medie de via dar nu este un factor direct. Prin valorile care stau la baza religiei, fiecare persoan i poate modifica stilul de via, alimentaia, obiceiurile de consum etc., care duc direct la modificri ale strii de sntate. Listele de factori folosite n explicarea unui fenomen trebuie s fie bine structurate i s se precizeze influena fiecruia n parte.

    2. A doua etap: Se formuleaz enunurile cauzale i se precizeaz natura i sensul cauzrii. Se formuleaz enunurile cauzale, precizndu-se influena fiecrei variabile asupra fenomenului studiat: dac este influen direct sau indirect, dac influeneaz pozitiv sau negativ. Toate relaiile cauzale sunt prezentate ntr-o diagrama cauzal cu scopul vizualizrii relaiilor presupuse. Aceast diagrama faciliteaz enunarea ecuaiilor pentru relaiile cauzale supuse testrii empirice.

    Enunul cauzal exprim relaia dintre fenomene sub forma unei legi universale i necesare: ori de cte ori C atunci E sau C este cauza lui E. Acest enun din punct de vedere empiric ia forma unui enun de covariaie: variaia lui C este nsoit de variaia lui E.

    Enunul cauzal explic cum un fenomen C influeneaz alt fenomen E i pe baza unor astfel de enunuri se pot face predicii. Enunurile cauzale sunt testate empiric prin ceea ce se numete testarea ipotezelor. n tiina modern, cauzalitatea nseamn de cele mai multe ori testarea ipotezelor. Tradiia testrii ipotezelor, utilizate adesea n cercetrile tiinifice, a fost iniiat de filosofi pozitiviti din secolul al XIX-lea, precum August Comte i John Stuart Mill i devin proceduri standard o dat cu cercetrile pozitiviste din secolul al XX-lea.

    3. A treia etap: Se specific modelul explicativ. Nu este suficient ns relevarea unor relaii cauzale ntre dou sau mai multe variabile, ci trebuie explicat i procesul prin care au loc aceste asocieri, cum anume o variabil influeneaz o alt variabil i ce mecanisme sociale sunt implicate n acest proces.

    n timp ce enunul cauzal rspunde la ntrebarea de ce?, modelul explicativ rspunde la ntrebarea cum?. De exemplu, se dorete construirea unui model explicativ al speranei de via a persoanelor din Romnia. Enunul cauzal va scoate n eviden factorii care pot influena sperana de via, iar modelul explicativ va identifica mecanismele prin care aceti factori se conjug influennd sperana de via.Prin modelul explicativ, legea cauzal se integreaz ntr-un corp teoretic mai general. (ZamfirError! Bookmark not defined., 2005, 19).

    2.3 Construirea unui model empiric cauzal

    Lazr Vlsceanu i Ctlin ZamfirError! Bookmark not defined., n Dicionarul de sociologie-online prezint o serie de elemente ce trebuie luate n considerare n cea de a doua etap a construirii unui model explicativ, etapa empiric. Cauzalitatea social este pus n termeni de probabilitate, de aceea la nivel empiric o relaie cauzal poate fi testat prin metode statistice. Metodele statistice care testeaz enunuri cauzale se mpart n dou categorii: metode de asociere bivariate sau metode de analiz cauzal lineare sau nonlineare precum i analiza path, ecuaii structurale. O explicaie nu poate fi suficient argumentat n lipsa dovezilor statistice sau experimentale privind asocierea variabilelor. O explicaie care nu trece de parte empiric nu poate fi considerat explicaie ci rmne la nivel de ipotez. Pe de alt parte, testarea empiric crete gradul de credibilitate a explicaiei dar nu i confer atributul de definitiv. n permanen un model explicativ poate fi mbuntit i cu fiecare testare empiric crete gradul de credibilitate al acestuia. n acelai timp un model explicativ nu poate fi construit doar pe baza unor corelaii statistice ntre variabile fr a avea n spate justificri teoretice, care ar putea explica nu doar de ce pot avea loc anumite relaii dar i n ce mod o serie de variabile influeneaz fenomenul

  • CONSTRUCIA INDICILOR

    15

    studiat. De exemplu, o explicaie a duratei medii de via n funcie de o serie de factori psihologici pe baza unor corelaii statistice nu este relevant dac nu se explic i cum anume aceti factori duc la creterea duratei medii de via. Un factor psihologic ar putea fi atitudinea fa de via i moarte n general. Este necesar o clarificare a modului n care acest factor poate influena durata medie de via.

    De regul, metodele cantitative sunt utilizate pentru a formula explicaii asupra fenomenelor la nivel macro, iar metodele calitative pentru explicaii la nivel meso sau micro. Pentru a formula o explicaie sociologic adecvat fenomenelor sociale este necesar folosirea ambelor metode de colectare i analiz a datelor. n exemplul de mai sus, se pot aplica metode cantitative care s ne releve factorii individuali care pot influena sperana de via, dar la ntrebrile cum anume influeneaz acei factori sperana de via vom utiliza metode calitative, cum ar fi interviul.

    n funcie de obiectivul urmrit, numrul de cazuri ar trebui s fie ct mai mare sau s fie reprezentativ pentru o anumit populaie, altfel explicaia poate fi incorect sau n cel mai bun caz s fie valabil doar pe anumite categorii din populaie sau n anumite contexte sociale.

    Pornind de la exemplul de mai sus, explicarea speranei de via n funcie de o serie de factori psihologici, este necesar ca testarea empiric s aib loc pe un eantion reprezentativ pentru Romnia, pentru a putea susine c modelul explicativ este valabil n acest context. Dac se dorete un model general valabil sau cel puin un model cu un grad ridicat de generalitate, indiferent de populaia analizat, ar trebui aplicat testarea empiric pe oameni din diferite ri. Analiznd date doar dintr-un ora sau numai dintr-o ar este ndoielnic gradul de acuratee a modelului. Oricum este dificil de a construi un model general valabil, mare parte din variabilele

    incluse n model sunt valabile doar n anumite contexte iar n alte contexte i pierd credibilitatea.

    Pe de alt parte, un model care este valabil ntr-un context limitat (un ora, o ar) dar care are un grad mare de precizie n descrierea relaiilor dintre variabile i fenomenul studiat este preferat fa de un model care are pretenie de generalitate (aplicat pe o populaie mult mai numeroas) dar care are o acuratee mic n descrierea legturilor.

    Dup colectarea datelor se va propune un model explicativ empiric. Se vor desemna variabilele latente i relaiile dintre ele, precum i relaiile dintre indicatori i fiecare variabil latent. Fiecare variabil latent va fi msurat prin una sau mai multe variabile direct observabile. Dar se pune ntrebarea dac variabile direct observabile msoar ntr-adevr variabilele latente? Prin urmare nainte de a testa modelul cauzal mai sunt cteva etape de verificare a variabilelor incluse n model.

    n primul rnd se va testa validitatea dimensiunilor, dac indicatorii dintr-o dimensiune chiar msoar caracteristicile eseniale ale dimensiunii. Analiza se face att calitativ ct i cantitativ prin metode statistice precum analiza factorial sau scalarea multidimensional. n anumite cazuri o variabil latent poate fi nlocuit cu o variabil, denumit variabil de control. Aceasta poate fi determinat de un singur indicator din dimensiune, de caracteristici msurabile doar pentru un segment de populaie sau msurtori pe un interval de timp limitat. n final, dup ce se parcurg paii premergtori propunerii unui model cauzal empiric se trece la faza final de validare a dimensiunilor i variabilelor direct msurabile, iar n final la validarea ntregului model empiric. Acest lucru se va realiza prin comparare cu alte modele similare sau opuse. Astfel, dou modele cauzale asemntoare vor avea o comportare relativ similar. Model ar putea fi considerat o parte esenial a modelului studiat, submodel ce poate fi soluionat independent de modelul din care deriv. Exist modele cauzale, care, din punct de vedere teoretic, se manifest n . Dac acest aspect nu se menine i la nivelul modelelor empirice corespunztoare atunci vom fi nevoii s invalidm cel puin unul dintre cele dou modele experimentale ce au fost propuse. (tefnescu, 1999, 94).

    n analiza datelor se va porni de la un model teoretic care include toate relaiile posibile dintre variabilele incluse n model. S presupunem c dorim s explicm o variabil Y n funcie

  • CONSTRUCIA INDICILOR

    16

    de patru variabile x,u,v,w. Modelul teoretic va cuprinde ansamblul de variabile Y,X,U,V,W i interaciunile dintre ele i poate fi reprezentat printr-un graf orientat ca n figura nr. 4-2.

    Figura nr. 2-2: Exprimarea unui model teoretic printr-un graf orientat

    n descrierea i explicarea unui model teoretic apar o serie de dificulti. O prim dificultate apare n stabilirea gradului de influen a fiecrei variabile asupra variabilei pe care dorim s explicm, mai ales atunci cnd nu deinem suficiente informaii asupra variabilelor n cauz. n modelul prezentat mai sus trebuie stabilit gradul de influen a variabilelor X,U,V,W asupra variabilei Y.

    O alt dificultate este dat de dificultatea stabilirii tipului de relaie dintre variabilele independente i cea dependent. De cele mai multe ori forma funciilor dintre variabile nu este cunoscut . n modelul prezentat n figura nr. 2-2 pot exista mai multe tipuri de funcii prin care ar putea fi explicat variabila Y. Fie exist un efect cumulat al celor patru variabile asupra variabilei Y, fie exist o influen a fiecrei variabile n parte asupra variabilei Y, fie exist un efect cumulat a cte dou variabile asupra variabilei Y sau alte combinaii dintre variabile.

    Pentru a se elimina aceste dificulti se va simplifica modelul teoretic ntr-un model empiric. Modelul empiric trebuie s fie uor de neles astfel nct s poat fi testat. Se vor scoate din modelul teoretic acele variabile care se presupune c au o influen foarte mic asupra variabilei dependente. Dup simplificarea modelului se va trece la testarea lui pe baza datelor empirice cu ajutorul unor proceduri statistice. i n aceast etap se mai poate simplifica modelul, eliminnd acele variabile care au o influen nesemnificativ asupra variabilei dependente, demonstrat statistic.

    Prin modelul empiric se va testa indirect modelul teoretic. Exist proceduri statistice care indic gradul n care modelul empiric aproximeaz modelul teoretic. Dac eroarea calculat este prea mare atunci se poate afirma c modelul empiric nu explic bine modelul teoretic, deoarece variabilele incluse n model explic doar o parte mic din variaia variabilei dependente, restul variaiei variabilei Y este explicat de alte variabile care nu au fost incluse n model.

    Soluionarea modelului empiric este, de regul, dificil de realizat. Din aceast cauz se introduc ipoteze suplimentare (privind forma funciilor de dependen, restricii impuse variabilelor i erorilor de msurare. Este esenial ca toate aceste noi ipoteze s nu contrazic perceperea noastr asupra modelului teoretic. Ipotezele introduse au ca scop principal tocmai simplificarea procedurilor de soluionare efectiv a modelului empiric (tefnescu, 1999,36).

    Tipuri de variabile incluse n modelul cauzal empiric. n cadrul modelului cauzal pot fi prezente trei tipuri de variabile: variabile latente,

    variabile observabile precum i variabile eroare. O variabil eroare include un set de variabile care nu au fost incluse n model i care

    explic variaia variabilei dependente. Aceast variabil indic i gradul de credibilitate a modelului.

    Variabila latent reprezint un concept abstract, nu poate fi direct msurat. Se poate msura indirect prin intermediul unui indicator sau a unui set de indicatori. Indicatorii poart denumirea de variabile observabile.

    Y

    X

    U

    V

    W

  • CONSTRUCIA INDICILOR

    17

    Variabilele (latente i observabile) ale modelului cauzal mai pot fi clasificate n variabile endogene, proprii modelului studiat i variabile exogene, exterioare modelului. O variabil exogen ntr-un model poate fi endogen n alt model. Variabilele endogene nu pot influena variabilele exogene.

    Modelul empiric va trebui s precizeze gradul de influen al variabilei latente asupra fiecreia dintre indicatorii prin care este msurat.

    Reprezentarea grafic a unui model cauzal empiric. Prin reprezentarea grafic obinem o imagine global asupra raporturilor cauzale dintre

    variabilele modelului studiat. Exist o serie de convenii privind grafurile cauzale (tefnescu, 1999, 47):

    Nodurile ataate variabilelor latente se ncercuiesc

    Nodurile corespunztoare variabilelor observabile se ncadreaz ntr-un dreptunghi

    Nodurile afiliate variabilelor perturbatoare (erorilor) rmn nemodificate;

    Variabilele latente vor fi reprezentate de majuscule subliniate (W1,W2,U1);

    Variabilele observabile vor fi scrise obinuit (X1, X2, X3);

    Variabilele perturbatoare vor fi scrise cu italic (V1, V2, Z1, Z2, Z3) Un exemplu de diagrama cauzal este prezentat mai jos n figurile nr. 4-3 i 4-4.

    Figura nr. 2-3: Diagrama cauzal cu variabile latente

    Sursa: tefnescu, 1999, 47

    Ecuaiile de structur cuprind att variabilele latente ct i variabilele observabile. W1: democraia politic n anul 1985 (variabil latent); W2: democraia politic n anul 1995 (variabil latent); U1: industrializarea n anul 1985 (variabil latent); V1, V2, Z1, Z2: variabile care nu sunt incluse n model (erorile) X1, X2, X3: variabile direct msurabile ale conceptului de industrializare; X1: produsul brut pe cap de locuitor;

    X2: consumul de energie convenional pe cap de locuitor; X3: procentul forei de munc angrenat n industrie. W1= a11*U1+V1

    W2=a21*U1+b21W1+V2

    X1=d1*U1+Z1

    X2=d2*U2+Z2

    X3=d3*U3+Z3

    U

    1

    W

    1

    W

    2

    V1

    V2

    a11

    a21

    b21

  • CONSTRUCIA INDICILOR

    18

    Figura nr. 2-4: Diagrama cauzal cu variabile observabile

    tefnescuError! Bookmark not defined., 1999, 47 O alt etap n stabilirea unui model cauzal empiric este aceea de a stabili o posibil

    relaie de asociere, condiiile ca aceast asociere s devin raport de cauzalitate i precizarea sensului cauzalitii.

    Dup ce s-a conturat un model empiric, se va ncerca confirmarea sau infirmarea unei posibile legturi dintre dou variabile oarecare ale modelului conceput. Se stabilete dac exist corelaie ntre cele dou variabile izolndu-le de influena celorlalte variabile. Pentru acest lucru se va folosi coeficientul de corelaie r a lui Pearsons. Dac se dovedete c ntre cele dou variabile exist o legtur, atunci se va analiz dac aceast legtur poate fi o relaie cauzal direct i care este sensul ei: X este cauza lui Y sau Y este cauza lui X. Se poate s existe i un dublu sens cauzal. Nu este obligatoriu s existe aceleai ponderi de influen n ambele sensuri. n stabilirea relaiilor cauzale se va ine cont de timpul dintre cele dou evenimente, un eveniment nu poate fi cauza pentru un eveniment care s-a petrecut anterior lui.

    De asemenea, este de preferat ca n modelul cauzal variabilele direct observabile s nu fie corelate ntre ele. Se va testa i acest lucru, tot prin coeficientul de corelaia a lui Pearsons. Estimarea parametrilor modelelor cauzale nu se face la ntmplare ci se bazeaz pe respectarea unor principii (distanele dintre matrici). Dup ce se aplic aceste principii, soluionarea modelului cauzal ine doar de aplicarea unor proceduri matematice. Este necesar s se realizeze mai multe variante de modele cauzale pentru a alege modelul cel mai optim, care

    poate reda ct mai fidel modelul teoretic. Rezultatele obinute au un caracter relativ, deoarece n alt context, cu mai multe informaii deinute legate de variabile din model, ar putea iei alt rezultat.

    2.4 Strategii de cercetare pentru verificarea empiric a modelelor cauzale

    2.4.1 Strategia cercetrii cantitative

    Maxwell, MittapalliError! Bookmark not defined. (2008) prezint conotaiile termenului de cercetare explicativ. Tradiional, cercetrile denumite prin termenul cercetri explicative sunt cantitative (metode de colectare a datelor sunt cantitative) i testeaz ipoteze msurnd relaiile dintre variabile iar datele sunt analizate utiliznd tehnici statistice. n sensul cel mai strict, acest termen este uneori folosit ca sinonim pentru cercetare experimental, cu implicaia c doar experimentele sunt capabile de a rspunde la ntrebri de cauzalitate. n linii mari, pot fi incluse de asemenea i alte tipuri de cercetri cantitative grupate sub numele de modele cauzale i modele de ecuaii structurale, care ncearc s identifice relaii cauzale prin analiza corelaiei dintre variabile.

    Aceast strategie de cercetare poate fi aplicat att pentru conturarea unor modele explicative n perspectiv holist ct i individualist. n perspectiv individualismului metodologic se va utiliza, ca i metod de colectare a datelor, ancheta sociologic pe baz de

    U

    1

    X1 X2 X3

    Z1 Z2 Z3

    d1 d2 d3

  • CONSTRUCIA INDICILOR

    19

    chestionar. Construirea modelelor cauzale se va face pe baza datelor colectate n urma aplicrii anchetei sociologice pe baz de chestionar i folosirii unor metode statistice specifice n etapa de analiz a datelor.

    n perspectiva holist nu se va mai folosi chestionarul ca i instrument, ci se va face o analiz asupra datelor la nivel macro, exprimate prin indicatori sociali. Emile DurkheimError! Bookmark not defined., n studiul su Sinuciderea a explicat factorii care influeneaz sinuciderea prin alte fapte sociale, msurate prin indicatori sociali, precum rata de sinucidere, rata de mortalitate, procentul persoanelor nebune etc.

    2.4.2 Strategia cercetrii calitative

    Termenii de explicaie i de cauzal au fost folosii i n diferite tipuri de cercetri calitative, dei utilizarea lor a strnit serioase controverse i din partea celor din comunitatea cercettorilor calitativiti ct i din afara ei. Datorit concepiei conform creia doar cercetrile cantitative pot analiza cauzalitatea, muli cercettori calitativiti au evitat folosirea acestui termen precum i a celui de explicaie, n timp ce alii consider chiar inadecvat i ilegitim utilizarea acestor termeni n cercetrile calitativiste. Maxwell, MittapalliError! Bookmark not defined. (2008): Utilizarea termenilor ca influen, impact, afectat i a contribui la este comun n rapoartele cercetrilor calitative, iar aceti termeni implic cauzalitatea ntr-un anumit sens. n plus, un numr tot mai mare de cercettori (i cantitativiti i calitativiti) argumenteaz acum c n anumite circumstane, abordrile cantitative nu sunt neaprat cele mai bune ci de a ajunge la concluzii explicative i c metodele calitative pot fi folosite pentru a dezvolta sistematic i pentru a testa explicaii cauzale. Alte metode dect cele cantitative vor putea stabili concluzii de cauzalitate, nu la fel de sigure ca n cercetrile cantitative dar care au o anumit relevan. O dat cu cderea pozitivismului logic, care este strns legat de cercetrile cantitative a aprut realismul care vede cauzalitatea nu ca regularitate a relaiilor dintre variabile independente i dependente ci mai degrab ca proprietile i procesele care produc rezultatele cauzale, este mai aproape de cercetrile calitative i sprijin cererile cercettorilor calitativiti de a fi capabili s traseze concluzii explicative. (Maxwell, Mittapalli, 2008).

    n perspectiva individualismului metodologic, n cercetarea calitativ se analizeaz comportamentele indivizilor i semnificaiile pe care acetia le ofer diferitelor fenomene sociale. Unitile de analiz n acest caz sunt indivizii.

    n perspectiv holist, nu se mai pune accentul pe elucidarea comportamentelor dintre indivizi ci se analizeaz n special semnificaia fenomenelor socio-culturale dar i legtura cu fenomenele psihologice. Una din cele mai importante aplicaii ale holismului este hermeneutica lui Wilhelm Dilthey. Ideea central este c semnificaiile psihologice a oricrei expresei de comportament se pot distinge numai prin relatarea ca rspunsuri la alte rspunsuri. Semnificaia unui rspuns nu este transparent ntr-un comportament unic. De exemplu, pentru a ti dac o remarc este o glum sau o insult, trebuie s se situeze ntr-un context cu alte observaii i alte comportamente. Prin el nsi comentariul este ambiguu. Contextul clarific elementele.

    2.4.3 Strategia cercetrii comparate

    Strategia comparat are ca int explorarea diversitii unui numr moderat de cazuri, ntr-o manier comprehensiv, pentru a stabili tipologii (Larionescu, 2008, 4).

    Charles Ragin (1994, 51 apud Larionescu, 2008, 58) consider cercetarea comparat ca avnd o poziie intermediar ntre cercetarea cantitativ i cea calitativ. Numrul de cazuri studiate este de regul mai mic de 50, iar accentul este pus n special pe cazuri (unitile de analiz) i mai puin pe relaia dintre variabile (caracteristicile studiate). Poate fi folosit pentru conturarea unor modele explicative la nivel macro.

    Analiza comparativ poate fi realizat att prin metode calitative, viznd interpretarea semnificaiei fenomenelor sociale, ct i prin metode cantitative, viznd explicaia cauzal.

  • CONSTRUCIA INDICILOR

    20

    Pentru o imagine mai clar a celor trei tipuri de strategii de cercetare care pot fi utilizate voi prezenta n tabelul nr. 4-1 o sinteza prezentat de Charles Ragin. Cercetarea comparat se bazeaz n principal pe explorarea diversitii i propunerea de noi teorii, dar secundar poate analiza relaii cauzale, identificnd anumite pattern-uri i astfel putnd testa sau rafina teorii.

    Tabelul nr. 2-1: Scopurile i abordrile metodologice ale cercetrii sociale

    Scopuri Cercetarea

    calitativ Cercetarea

    comparat Cercetarea

    cantitativ

    1. Identificarea unor pattern-uri generale Secundar Primar

    2. Testarea/rafinarea teoriei Secundar Secundar Primar

    3. Realizarea de predicii Secundar Primar

    4. Interpretarea semnificaiei unor fenomene istorice sau culturale majore

    Primar Secundar

    5. Explorarea diversitii Secundar Primar Secundar

    6. Exprimarea poziiei unei categorii sociale Primar

    7. Propunerea de noi teorii Primar Primar Secundar Sursa: Charles Raghin, 1994, 51 apud Larionescu, 2008, 58

    2.4.4 Strategia cercetrii cantitative combinat cu cea calitativ

    Nu putem realiza o explicaie sociologic valid doar pe baza datelor cantitative. Acestea nu sunt suficiente i trebuie completate cu date din interviuri sau alte metode calitative pentru a crea o imagine semnificativ pentru procesele sociale care au loc. O explicaie construit doar pe baza unor date statistice poate exclude rolul proceselor sociale la nivel micro. Pe de alt parte, o explicaie bazat doar pe rezultatele din cercetare calitativ risc s spun o poveste conturat doar de indivizi, neinnd cont de influena structurilor sociale la nivel macro.

    Se pot combina rezultatele metodelor cantitative i a celor calitative din cel puin trei raiuni (Udo, 2001, 7):

    1. datele rezultate din analiza cantitativ pot fi completate de datele rezultate din analiza calitativ pentru a crea un model explicativ valid i complex; se folosesc ambele metode pentru a se completa informaiile obinute prin intermediul uneia din metode.

    2. datele rezultate din analiza cantitativ converg cu cele din analiza calitativ, duc la aceleai rezultate; se folosesc ambele metode de analiza datelor pentru a valida informaiile obinute cu cealalt metod.

    3. datele rezultate din analiza calitativ pot da informaii despre alte poteniale cauze care influeneaz fenomenul studiat sau pot duce chiar la explicaii contradictorii cu cele obinute din analiza cantitativ.

    De asemenea nu se poate contura o nelegere a fenomenelor sociale fr o completare cu date de la nivel micro sau meso. Raionamentele statistice n tiinele sociale nseamn de multe ori interpretarea faptelor statistice (care reprezint fenomene la nivel macro) n lumina cunoaterii care rezult din nivelul meso i a pattern-urilor de aciune i orientare ale indivizilor, la nivel micro. Acest tip de raionament face legtura dintre nivelul macro-meso-micro (Coleman, 1990, apud Udo, 2001, 13).

    i John Creswell consider c se poate face un mixaj din cele dou tipuri de metode pentru a realiza explicaii. Datele rezultate dintr-o cercetare cantitativ pot fi explicate ulterior printr-o investigare calitativ. i Likewise, Matthew Miles i Michael Huberman consider c modelele cauzale sugerate de un sondaj de opinie pot fi dezvoltate sau explicate prin cercetare

    calitativ, pentru a construi o explicaie general puternic. Se apeleaz la testarea statistic atunci cnd se dorete testarea generalitii unui model

    explicativ, dac este valabil i n alte contexte dect cele vizate de cercettorul sau cercettorii care au construit respectivul model. De exemplu, Kawachi Ichiro i Kennedy Bruce P. (2006) n The health of nations relev faptul c banii cumpr o sntate mai bun, dar pn la un punct, acel punct fiind atins undeva n jurul valorii de 5000$ pe an pentru un individ american. Autorii

  • CONSTRUCIA INDICILOR

    21

    menionai, demonstreaz c pn la acest punct exist o relaie linear ntre venit i sperana de via, dup care orict ar crete veniturile, sperana de via numai crete la fel i rmne cam la acelai nivel. Probabil de la acel punct ncolo apar alte pericole: prea multe calorii n mncare, consumul excesiv de carne, fumatul, alcoolul, drogurile, sedentarism, job-uri stresante etc. Se

    poate testa dac aceast valoare limit de 5000$ este valabil i n alte ri nu numai n SUA. Testele statistice se pot folosi i atunci cnd se dorete construirea/rafinarea unei teorii. Pe baza datelor dintr-o cercetare pe baz de chestionar se poate analiza legtura dintre starea de sntate a persoanelor (ce aproximeaz sperana de via) i o serie de variabile, cum ar fi venitul, stilul de via, existena unei reele sociale, religia etc. Realiznd corelaii dintre variabila dependent i celelalte se poate construi modelul explicativ. Dup construirea modelului explicativ, este nevoie i de informaii obinute prin cercetarea calitativ pe baz de interviu pentru a constata ce semnificaii dau oamenii anumitor comportamente care sunt determinate drept cauze ale speranei de via, prin cercetarea cantitativ. n exemplul de mai sus, cercetarea comparativ ne poate ajuta pentru a contura un model explicativ la nivel macro, prin analiza unui numr de ri din diferite continente i a prezenei sau absenei unor atribute, cum ar fi: politica de sntate, bugetul mare alocat sistemului sanitar, clima, nivelul economic etc.

    2.5 Metode statistice utilizate pentru verificarea empiric a modelelor cauzale

    2.5.1 Metode de analiz bivariat

    Ronald F. King (2005, 78-79) prezint patru aseriuni referitoare la testarea ipotezelor i verificarea empiric a relaiilor cauzale:

    1. Covariaia Trebuie s existe o covariaie ntre variabilele analizate i s prezinte regularitate aceast

    relaie. Asocierea poate fi dihotomic (cnd poate fi observat X, poate fi observat i Y), continu (cnd X crete, crete i Y) sau combinat (cnd X este prezent n valori peste un anume prag, apare i Y). Asocierea poate fi pozitiv (dac X ...atunci Y....) sau negativ (dac X... atunci Y nu are loc...). Covariaia sistematic nu poate distinge dac X determin pe Y sau Y pe X. Cauzalitatea implic direcie.

    2. Direcionalitatea Este nevoie ca cercettorul s fac distincia dintre variabila dependent i cea

    independent pentru a se putea stabili direcionalitatea cauzal. 3. Raportarea non-aparent

    Covariaia direcionat nu este suficient spre a se putea stabili cauzalitate. Stabilirea influenei unei variabile independente asupra uneia dependente trebuie s persiste i dup ce se in sub control alte variabile care ar putea s influeneze relaia dintre cele dou variabile. Exist ns un numr infinit de variabile care ar putea influena relaia dintre cele dou variabile iar un studiu nu le poate include pe toate.

    4. Plauzibilitatea Cnd stabilim o variabil ca fiind dependent i o variabil ca independent trebuie s fie

    credibil n raport cu ce se cunoate deja n literatura de specialitate sau cel puin s avem argumente solide.

    O afirmaie cauzal nu trebuie s apar singur aproape niciodat. Totui, cercettorul trebuie s includ doar acei factori care sunt valoroi din punct de vedere teoretic i care se ateapt s afecteze lucrurile n mod semnificativ. Cu ct un model este mai cuprinztor, cu att sunt mai multe trsturi ale realitii pe care le poate reda, dar, n acelai timp, elementele sale sunt cu att mai complicate i este mai dificil s extragem implicaii clare i testabile. Cu ct un model este mai puin cuprinztor, cu att relaiile sale intrinseci devin mai uor de identificat i testat, dar, n acelai timp, acesta va reui mai puin s reprezinte domeniul complicat al

  • CONSTRUCIA INDICILOR

    22

    convingerilor, tipurilor de comportament i instituiilor umane (Ronald F. KingError! Bookmark not defined., 2005, 81-82)

    Instrumentul primar al analizei bivariate este tabelul de contingen. Acesta reprezint un mod de a clasifica indivizii simultan, n funcie de dou sau mai multe caracteristici ale populaiei studiate. Prin intermediul tabelelor se evideniaz legtura dintre dou variabile calitative, care pe baza datelor empirice, au fost transpuse n caracteristici statistice. Exprim deci o legtur statistic iar aceasta nu presupune neaprat o relaie de cauzalitate. Analiza bivariat se poate realiza pe dou variabile dihotomice, dou variabile msurate la nivel nominal sau la nivel ordinal iar pe baza tabelelor de contingen se poate constata dac dou variabile covariaz. Cu alte cuvinte se poate stabili dac valoarea unei variabile se va schimba o dat cu schimbarea valorilor celeilalte variabile.

    Pentru a testa covariaia a dou variabile calitative se pot folosi coeficieni de asociere specifici fiecrui tip de variabil, care se calculeaz pe baza tabelelor de contingen:

    pentru variabile dihotomice: Coeficientul Phi, Coeficientul Q a lui Yule. pentru variabile nominale cu mai mult de dou categorii: coeficientul de contingen C a

    lui Pearson, coeficientul V a lui Cramer, coeficientul (lambda) a lui Goodman i Kruskal.

    pentru variabile ordinale: coeficienii a lui Kendall, coeficientul al lui Goodman i Kruskal, coeficientul d a lui Somer.

    Att n interpretarea tabelelor de contingen ct i a coeficienilor de corelaie, se consider o relaie simetric ntre cele dou variabile (Rotariu, 199, 176). Prin urmare, corelaia variabilei X cu Y este aceeai cu a variabilei Y cu X. Exist situaii n care, prin natura relaiei dintre cele dou variabile (sex i sperana de via) sau prin ipotezele sau obiectivele cercetrii, vom presupune c o variabil va depinde de cealalt. n acest caz se poate folosi o serie de metode specifice acestei situaii precum, regresia linear simpl, dac variabila considerat dependent este cantitativ sau analiza discriminativ dac variabila dependent este calitativ. Nici acest tip de metode nu pot reflecta un raport cauzal ntre cele dou variabile, dar pot ajuta la prezicerea strii unei variabile cunoscnd starea unei alte variabile.

    2.5.2 Metode de analiz multivariat

    O analiz primar n ce privete relaia dintre trei sau mai multe variabile poate fi realizat pe baza unor tabele de asociere cu mai mult de dou dimensiuni, care au mai multe intrri. i acest tip de tabel, ca i cel utilizat pentru analiza relaiei dintre dou variabile stabilete covariaia i nu cauzalitatea dintre variabile.

    Tabelul nr. 2-2: Forma general a tehnicilor de analiz multivariat de dependen

    Tehnica de

    dependen Forma general Tipul variabilelor

    dependente Yi

    Tipul variabilelor

    independente Xi

    Analiza de corelaie canonic

    Y1+Y2+...Yn=

    X1+X2+...+Xn

    Metrice i nonmetrice Metrice i nonmetrice

    Analiza multivariat de varian (MANOVA)

    Y1+Y2+...Yn=

    X1+X2+...+Xn

    Metrice Non-metrice

    Analiza simpl de varian (ANOVA)

    Y1=X1+X2+...+Xn Metrice Non-metrice

    Analiza

    discriminativ multipl

    Y1=X1+X2+...+Xn Non-metrice Metrice

    Analiza de regresie

    multipl liniar Y1=X1+X2+...+Xn Metrice Metrice i nonmetrice

    Analiza conjoint Y1=X1+X2+...+Xn Metrice sau non-

    metrice

    Non-metrice

  • CONSTRUCIA INDICILOR

    23

    Analiza path/Modele

    cu ecuaii structurale (LISREL)

    Y1=X11+X12+...+X1n

    Y2=X21+X22+...+X2n

    ...

    Ym=Xm1+Xm2+...+Xmn

    Metrice Metrice i nonmetrice

    Sursa: Culic Irina (2004,70)

    La fel ca i la analiza dintre dou variabile, exist metode care pornesc demersul stabilindu-se o variabil ca fiind dependent i mai multe variabile ca independente, dar care pot stabili relaii de cauzalitate dar nu pot contura modele complexe de cauzalitate, cum ar fi regresia multipl linear i metode care pot contura teorii cauzale, cum ar fi analiza path. Analiza path este o form extins a analizei de regresie linear, care permite formalizarea unei teorii cauzale, specificnd logica interaciunilor i determinrilor dintre variabile i fenomene, i care produce estimate empirice ale efectelor variabilelor ce constituie un sistem cauzal (RotariuError! Bookmark not defined., 1999, 220).

    La modelele prezentate n tabelul nr. 4-2 se pot aduga i modelele de regresie non linear, dar sunt mai greu de anticipat. Cercettorul ar trebui s presupun tipul de relaie de la nceputul cercetrii.

    Dintre toate, modelul de analiz path este cel mai complex, deoarece n acest model se presupune c variabilele pot interaciona i c explicaia este produsul unor lanuri cauzale. Modelul poate include ipoteza c anumite variabile-cauz sunt interdependente, c unii factori determinani acioneaz att direct ct i indirect asupra fenomenului-efect, n timp ce ali factori produc numai efecte indirecte, mediate prin aciunea unor variabile-cauz care, pentru acetia, reprezint efecte. n plus n acest tip de model de analiz se poate lua n calcul i efectul timpului asupra relaiilor cauzale. Fa de alte modele, analiza path permite o conceptualizare mai complex a relaiilor dintre variabile iar relaiile presupuse sunt descrise printr-o diagram cauzal. Modelele cu ecuaii structurale se pot face n programul LISREL sau n programul AMOS, un program cu o interfa mai accesibil.

    2.6 Erori n construirea modelelor explicative cauzale

    2.6.1 Erori de msurare

    Toate investigaiile sociologice conin erori, care pornesc de la operaionalizarea conceptului ajungnd pn la analiza i interpretarea datelor. Operaionalizarea poate conine erori prin faptul c uneori este imposibil de identificat toi indicatorii posibili ai dimensiunilor conceptului, alteori sunt eliminai din schem datorit dificultilor majore de msurare. Operaionalizarea ine att de cunotinele dobndite, de teoriile vizate, dar i de abilitile cercettorului. Un alt risc ar putea fi reprezentat de faptul c unele dimensiuni pot fi suprareprezentate iar altele mai puin, i astfel unele dimensiuni sunt mai bine msurate iar altele mai puin. O alt surs de eroare este dat i de construirea instrumentului de msurare, modul de transpunere a indicatorilor n elemente ale instrumentului pot distorsiona msurarea. Modul n care este pus o ntrebare n chestionar sau un enun ntr-o scal poate duce la rezultate diferite.

    2.6.2 Erori de interpretare

    Erori pot aprea mai ales n faza de analiz i interpretare a datelor, unde cercettorul din dorina de a demonstra modelul explicativ propus poate fora anumite corelaii ntre variabile sau poate folosi anumite metode care l avantajeaz n explicaie.

    Erorile n explicaie ar putea fi evitate pornind de la operaionalizarea ct mai detaliat a conceptului, adoptarea unor instrumente specifice, transformarea indicatorilor n ntrebri care s msoare exact ceea ce i-a propus cercettorul, adic s existe o validitate ct mai mare a instrumentului. La analiza datelor, este de preferat respectarea condiiilor de folosirea a unor metode statistice pentru c altfel rezultatele pot fi distorsionate. De exemplu, regresia linear

  • CONSTRUCIA INDICILOR

    24

    poate fi folosit dac variabila dependent (pe care dorim s o explicm) are distribuia normal, altfel apar erori n analiza i interpretarea datelor. n acelai timp este nevoie i de imaginaie pentru a crea o schem complex i pentru a putea prevedea posibile variabile care ar putea influena factorii din schem iar acetia ar trebui inui sub control. Pe lng aceste elemente, Cosima RughinisError! Bookmark not defined. n Explicaia sociologic (pp.74-79) mai identific o serie de posibile erori ntr-o explicaie sociologic. 1. Cauzalitatea chimic se refer la posibilitatea ca o serie de factori combinai n diferite forme s produc acelai efect. Cu alte cuvinte, un fenomen social poate fi explicat deseori prin modele explicative diferite, fiecare fiind valabil ntr-un anumit context [] Multiplicitatea combinaiilor de cauze care pot produce un efect ne induce uneori n eroare n cercetarea cantitativ. Este posibil ca, studiind un eantion care include indivizi din contexte sociale diferite, s construim un fel de , constnd dintr-un amestec al modelelor particulare valabile n respectivele contexte( RughinisError! Bookmark not defined., 2007,74)

    2. Modele amalgamate apare atunci cnd se construiete un model explicativ privind un fenomen fr a lua n calcul c exist diferene privind acel fenomen pe anumite categorii de persoane. De exemplu, construirea unui model explicativ general al duratei medii de via pe o populaie de romni i de rromi s-ar putea s nu reueasc s explice corect variabila dependent, deoarece durate medie de via are valori mult mai mici n rndul populaiei rrom i combinaia de factori ar putea fi alta dect la romni: srcia sever, alimentaia precar, lipsa confortului, acces limitat la servicii medicale n timp ce pentru populaia romn principalii factori ar putea fi alimentaia prea bogat n proteine, pre multe produse cu e-uri, stresul, singurtatea etc. Realiznd un model explicativ general pentru ambele populaii riscm ca anumii factori s se anuleze reciproc i s apar cu influen nesemnificativ asupra variabilei ce trebuie explicat. De exemplu, variabila stres se poate anula reciproc, n populaia de etnie rrom este posibil s aib valori mici iar n populaie de etnie romn s aib valori mari. Un alt exemplu semnificativ este explicarea duratei medii de via pe populaia din urban i rural. Dac nu se fac modele explicative diferite s-ar putea ca anumii factori s se anuleze reciproc, cum este cazul variabilei alimentaie: n rural poate duce la o cretere a duratei medii de via, deoarece alimentaia este bazat n special pe legume, fructe i mai puin pe carne i n plus sunt produse ecologice, n timp ce n urban alimentaia poate scade durata medie de via, deoarece se consum alimente cu multe e-uri, exist un consum excesiv de carne i produse de tip fast-food sau semipreparate. 3. Modelele explicative eronate. Un model explicativ este eronat atunci cnd mecanismele identificate nu produc n realitate fenomenul explicat (RughiniError! Bookmark not defined., 2007,218), iar Introducerea legilor cauzale din regulariti empirice poate duce adesea la imaginarea de cauze false (Zamfir, 2005, 25). 3.1. O situaie aparte este cauzalitatea aparent, care se refer la situaia cnd statistic exist corelaie ntre dou variabile, dar nici una din variabile nu este cauz a celeilalte. Apare respectiva corelaie deoarece exist o a treia variabil care le influeneaz. De exemplu, se poate observa o corelaie statistic ntre durata medie de via i nivelul de colaritate. i am putea presupune c cu ct o persoan are nivel de colaritatea mai ridicat cu att se informeaz mai mult despre prevenie i astfel este mai protejat mpotriva bolilor. n plus, cei cu un grad mai ridicat de colaritate au un nivel mai ridicat de a nelege consecinele unor aciuni care pot duce la mbolnvire. Dei modelul explicativ pare viabil, de fapt alt variabil poate s fie responsabil de aceast corelaie. Venitul este cel care de fapt este responsabil de o corelaie dintre cele dou variabile. Nivelul de colaritate influeneaz venitul avut i acesta influeneaz starea de sntate. Veniturile deinute asigur oamenilor un anumit nivel de alimentaie, accesul la servicii medicale i medicamente, un anumit confort i condiii de trai etc. O regularitate empiric, orict de puternic ar fi ea, nu poate fi nc expresia unei legi cauzale daca nu este valid i teoretic, prin asocierea unei explicaii a procesului de producere. n lipsa acesteia, ea poate rmne o simpl curiozitate (ZamfirError! Bookmark not defined., 2005, 26). 3.2. Problema empirismului cauzelor i efectelor

  • CONSTRUCIA INDICILOR

    25

    n multe studii sociologice, cercettorii realizeaz tot felul de analize i corelaii n sperana gsirii unor relaii cauzale ntre variabile. Dar corelaiile gsite pot s nu aib o semnificaie explicativ, ca atunci cnd se gsete o corelaie statistic ntre numrul de berze dintr-o localitate i numrul de copii care se nasc n acea localitate. Chiar dac exist o relaie statistic ntre cele dou variabile, aceasta nu nseamn c berzele dintr-o localitate sunt o cauz a numrului de nateri. Faptele identificate nu coincid cu cauzele i efectele cutate. De regul, ele sunt formulate mai nti teoretic i dup aceea msurate i analizate. 4. Modele explicative simpliste. Un model explicativ simplist este o relatare compatibil cu datele empirice existente, dar incompatibil cu teoriile tiinifice curente referitoare la fenomenul respectiv (Rughini, 2007, 219). Cu alte cuvinte, se pornete de la analiza datelor, se emit concluzii fr a se explic mecanismele de producere a relaiilor. Se stabilete o relaie cauzal ntre dou variabile neinndu-se cont de variabilele intermediare ce mediaz relaia. De asemenea, dou variabile pot fi luate drept cauze, dar ele s aib un rol explicativ fr a fi n realitate cauze.

    Ctlin Zamfir, n lucrarea sa Spre o paradigm a gndirii sociologice (2005), scoate n eviden i alte erori ce pot aprea n modelele explicative. Acestea completeaz schema erorilor prezentate mai sus.

    5. Problema sensului cauzrii Testele statistice pot indica o covariaie ntre dou variabile, ceea ce presupune o legtur cauzal ntre acestea dou. Aceste teste indic doar faptul c o dat cu variaia unei variabile variaz i cealalt, dar nu se poate afirma care din ele este cauza i care este efectul. Pentru a se stabili care din variabile este cauza i care este efectul exist trei procedee: stabilirea succesiunii, presupunerea unui proces de producere i independena teoretic. n mod logic cauza precede efectul i atunci ar trebui stabilit cu claritatea succesiunea temporal a variabilelor vizate. Dar, n cercetrile sociale este foarte greu, dac nu chiar imposibil de a stabili aceast succesiune temporal, deoarece msurarea se face la un anumit moment iar de cele mai multe ori procesele sociale se ntind pe perioade mari de timp. Alt modalitate propus pentru a stabili cauza i efectul este capacitatea de a imagina un proces