Informatica Aplicata in Stiintele Sociale

download Informatica Aplicata in Stiintele Sociale

of 19

Transcript of Informatica Aplicata in Stiintele Sociale

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    1/19

    1

    INFORMATICAPLICATN

    TIINELE SOCIALE

    Prof. Alice Iancu

    2010

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    2/19

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    3/19

    3

    1. Noiuni Introductive

    Cercetarea sociologic, ipoteze i variabile

    Prin cercetarea social ceea ce se urm re te este aflarea unor r spunsuridespre realitatea socio-uman nconjur toare. Ea poate fi teoretic sau empiric . Sediferen iaz de cunoaterea comuncare apeleaz la percep iile proprii fiec ruia,are un grad nalt de subiectivitate i un grad sc zut de precizie, poate conduce laconcluzii i formarea de leg turi false, care par adev rate . Cunoa terea comunconduce laprejudeci i stereotipii sociale i le poate conferi un aer de validitate

    n realitate fals (care ns pot avea preten ia de adev r general valabil, de exempluenun uri de tipul Toat lumea tie c.....). Aceste prejudec i pot viza un grupsocial sau altul i le pot asocia cu anumite caracteristici sau comportamente (de

    exempluFemeile nu pot face politicSAU Tinerii din ziua de azi nu muncesc SAU

    Btrnii se uit toat ziua la telenovele). Cercetarea sociologic poate confirmasau infirma aceste stereotipii, n baza unui studiu precis, cu reguli i metologii

    clare.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    4/19

    4

    Orice cercetare sociologic ncepe cu una sau mai multe ipoteze. Cu altecuvinte, un chestionar sau un focus-grup, de exemplu, nu sunt astfel contruite inct

    s nu duc nic ieri, cu ntreb ri puse la ntmplare. Ipotezele vizeaz predic iidespre rela ia dintre aceste variabile- i pot fi mai generale sau mai specifice: deexemplu Vrsta influeneaz nivelul venitului SAU Copiii din mediul rural au o

    ans mai mic s ajung la facultate SAU Nivelul de trai influeneaz

    comportamentul de vot SAU Prezena mai multor copii n gospodrie conduce la

    un nivel de trai sczut SAU omajul prelungit conduce la depresie . Atunci cnd

    analiz m rela ia dintre dou variabile ntreb rile de cercetare vor c uta s identificedac ntre cele dou variabile exist o rela ie i dac aceasta este de diferen iere saude asociere. Atunci cnd dorim doar s analiz m o singur variabil atuncidemersul nostru este unul descriptiv ( de ex. Dac dorim s vedem care estemedia veniturilor n cadrul unui e antion investig m doar caracteristici ale uneivariabile: venitul)

    Prin variabilese n elege o anumit caracteristic a subiectului cercetat (deex. Vrsta, etnia, genul, nivelul studiilor, nivelul venitului, etc). Variabilele pot fi

    imp r ite n mai multe categorii dup anumite criterii.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    5/19

    5

    1) n func ie de rela ia cu ipoteza de cercetare ele pot fi exogene,independente i dependente. Variabilele exogene sunt cele care de i nuconstituie subiectul cercet rii, pot influen a rezultatele acesteia: vremea, zgomotul

    prezente n momentul cercet rii de teren sau timpul de care dispune subiectul suntvariabile exogene, n sensul n care pot afecta r spunsurile oferite dar nu fac parte

    din cercetare. De exemplu n timpul aplic rii unui chestionar sau a unei grile deinterviu poate fi foarte frig afar sau subiectul poate fi foarte gr bit, de aceea poates nu r spund la toate ntreb rile sau s r spund mai succint. De i r spunsurileoferite sunt influen ate de astfel de factori, ace tia nu sunt parte din cercetare.

    Variabilele pot fi de asemenea independente i dependente n func ie derela ia cauzal dintre ele. n acest sens ipoteza de cercetarepoate fi n eleas drepto rela ie posibil ntre o variabil independent i o variabil dependent . De ex.omajul prelungit conduce la depresie este o ipotez n cadrul c reia omajul

    prelungit este variabila independent ( cauza ) iar depresia este variabiladependent(consecin a).

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    6/19

    6

    2) n func ie de gradul de m surare variabilele pot fi nominale, ordinale sauscale (sau de interval). Variabilele nominale au valori exclusive, sunt

    neierarhizate i nu au un interval de m surare ( de ex. Religia, etnia, locul na terii.n cazul religiei, aceasta este o variabil exclusiv - subiectul poate avea o religie

    sau alta, dar nu mai multe religii deodat , nu este ierarhizat - de ex. Religiacre tin nu este mai religie dect alta i nu exist un interval de m surare areligiei). Variabilele ordinale sunt exclusive, nu au un interval de m surare dar

    sunt ierarhizate ( De exemplu la ntrebarea Ct de des citi i ziarele s presupunemc sunt oferite urm toarele r spunsuri posibile: Des, Rar, Foarte Rar. n acest cazavem din nou o variabil exclusiv - subiectul fie cite te ziarele Des, fie Rar, fieFoarte Rar, exist o ierarhie- tim c Des de exemplu nseamn de mai multe oridect Rar dar nu exist un interval de m surare- nu exist unit i de m sur pentrua ti care este distan a dintre Des i Rar sau de cte ori mai pu in nseamn FoarteRar fa de Rar). n cazul variabilelor scal(de interval) avem variabile exclusive,ierarhizate i care au un interval de m surare ( De ex. Temperatura corpului,

    num rul de ani de studiu, notele ob inute etc. De exemplu dac investig m notaob inut de responden i la o anumit materie, avem o viariabila exclusiv -respondentul fie a luat 5, fie 6, fie 7 etc, variabila este ierarhizat - 6 nseamn maimult dect 5 i exist un interval de m surare- distan a dintre 5 i 6 este deexemplu, egal cu cea dintre 6 i 7)

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    7/19

    7

    1.3Cercetare calitativi cantitativ

    Testarea ipotezelor se face prin cercetare sociologic , dup reguli binestabilite. Aceasta poate fi de dou feluri: calitativsau cantitativ, n func ie demetodologia folosit .

    Cercetarea calitativ folose te metode precum interviurile i focus-grupurile.Se urm re te ob inerea unei cunoa teri detaliate a subiectului cercetat, deseori aatitudinilor i motiva iilor subiec ilor. Vizeaz un num r mai mic de responden i.

    Cercetarea cantitativ folose te metode precum interviul structurat sauchestionarul. Sunt ob inute informa ii mai pu in detaliate, dar de la mai mul iresponden i. Reprezentativitatea statistic este important .

    SPSS este folosit pentru interpretarea datelor cantitative.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    8/19

    8

    2. Interpretarea datelor n SPSS

    Variable view i Data view

    Interpretarea datelor cantitative n SPSS. SPSS are dou foi ini iale

    n Variable View reg si i lista variabilelor i caracteristicile lor

    n DATA VIEW sunt introduse valorile fiec rei variabile pentru fiecarerespondent

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    9/19

    9

    Atunci cand introducem variabile in SPSS acces m Variable View.

    Fiecare coloan con ine caracteristici ale variabilei:I. Name : Numele variabilei. Numele variabilelor trebuie s nceap cu o

    liter , s

    aib

    1-8 caractere i sNU con in spa

    ii libere

    ATEN IE: Nupot exista intr-o baz de date doua variabile cu acelasi nume

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    10/19

    10

    II. Type: Tipul variabilelor. De i pot exista mai multe feluri de variabile,cele mai folosite sunt numerice (cifre cu sau f r zecimale), sau string (

    alfanumerice sau ir de caractere-litere). Se recomand introducerea de variabilenumerice, folosing op iunea Values (vezi mai jos) ori de cte ori este posibil. Bifa itipul de variabil dup ce face i click pe

    ATEN IE: SPSS va presupune mereu c variabilele introduse suntnumerice. Dac Nusunt numerice trebuie schimbat tipul de variabil ( de exemplun String)

    3. Windth: M rimea: num rul de caractere sau cifre

    4. Label: Eticheta variabilelor (text explicit care descrie variabilele,

    important este s fie u or n eles)

    5. Values: Aici se acord valori variabilelor. Folosim coduri numericepentru reprezentarea unor categorii non-numerice astfel : Ap sa i pe . Spresupunem c dori i s introduce i variabila Sex, unde feminin=1, masculin=2.Dup ce a i dat click pe vi se va deschide o fereastr . n caseta VALUE

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    11/19

    11

    introduce i 1. n caseta VALUE LABEL tasta i feminin. Click apoi butonul ADD.Repeta i procedura pentru valoarea 2 cu eticheta masculin. Apoi ap sa i OK.

    6. Missing : Definirea valorilor lips . O valoare lips este codificat deSPSS drept absent i nu este inclus in majoritatea analizelor.

    Valorile lips pot fi system missing ( n Data View vor ap rea drept unspa iu liber, indic lipsa r spunsurilor) sau user missing (cele specificate explicitdrept valori lips ). De exemplu dac avem bifat ntr-un chestionar viarianta:

    NS/NR ( Nu tiu, Nu r spund). Aceste r spunsuri vor primi coduri diferite, cel mai

    uzual fiind 99. Dup ce a i dat click pe bifa i DISCRETE MISSINGVALUES i introduce i 99.

    7. Column: M rimea coloanelor (asa cum apar ele n Data View)8. Align: Modul n care datele sunt aliniate (n Data View)

    9. Measure: Modalitatea de m surare (nominal , ordinal , scal )-

    Detaliat anterior

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    12/19

    12

    DUP CE VARIABILELE AU FOST DEFINITE N VARIABLE

    VIEW se trece la introducerea datelor n DATA VIEW

    Numele variabilelor anterior introduse n Variable View vor ap rea ca ni te capete de tabel . Fiecare rnd din DATA VIEW reprezint un respondent sauun caz, cazurile fiind numerotate pe vertical . n cadrul fiec rei c su e ve iintroduce o valoare corespondent variabilei. De exemplu la Sex ve i introduce1 sau 2, dup caz, urmnd desemnarea valorilor descris anterior.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    13/19

    13

    2.2 Statistica Descriptiv

    2.2.3 Frecvena (num rul de cazuri pentru care este nregistrat fiecarevaloare a unei variabile).

    ANALYZE > DESCRIPTIVE STATISTICS > FREQUENCIES.

    Selectai o variabili click OK

    EXEMPLUL 1: Variabilscal

    Varsta (ani impliniti)

    Frequency Percent Valid PercentCumulativePercent

    Valid 18 32 21.9 23.5 23.5

    19 95 65.1 69.9 93.4

    20 5 3.4 3.7 97.1

    21 2 1.4 1.5 98.5

    23 1 .7 .7 99.3

    31 1 .7 .7 100.0

    Total 136 93.2 100.0

    Missing NS NR 10 6.8

    Total 146 100.0

    Colanele cuprind

    frecvena fiec rei valori din e antion (Frecquency)- De ex. 32 decazuri au 18 ani

    procentul fiec rei valori din num rul total al cazurilor (Percent)- Deexemplu 69.9% dintre cazuri au 19 ani

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    14/19

    14

    procentul cumulat (procentul de cazuri cumulat adunat pe m sur ce

    sunt afi ate ierarhic valorile variabilei)- De exemplu 93.4% dintre

    cazuri au pn n 19 ani

    EXEMPLUL 2: VariabilNominal

    Atunci cand aveti nevoie sa accesati un calculator:

    Frequency Percent Valid Percent

    Cumulative

    Percent

    Valid am unu unde locuiesc 130 89.0 89.0 89.0

    pot folosi calculatorul unor

    prieteni

    10 6.8 6.8 95.9

    folosesc calculatorul de la o

    sala de net

    5 3.4 3.4 99.3

    nu am calculator si nici nu am

    acces la un calculator

    1 .7 .7 100.0

    Total 146 100.0 100.0

    n cazul variabilei nominale valorile sunt aranjate arbitrar, astfel nct

    procentul cumulativ nu ne spune nimic.

    ATEN IE: SPSS permite reprezentarea grafic a rezultatelor. ANALYZE >DESCRIPTIVE STATISTICS > FREQUENCIES > CHARTS sauGRAPHS i selecta i tipul de grafic dorit.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    15/19

    15

    2.2.4 Msurarea Tendinei Centrale

    ANALYZE > DESCRIPTIVE STATISTICS > FREQUENCIES > STATISTICS pentru a

    bifa m surile folosite Media: reprezint media aritmetic a valorilor nregistrate de o

    variabil .Este cea mai indicat m sur a tendin ei centrale, pentru

    variabile de tip scala i nu este potrivit pentru variabile de tip nominal

    (poate fi calculat de exemplu media pentru variabila vrst n ani mplini i-reprezentat anterior, dar nu poate fi calculat media religiilor.

    5% Trimmed Mean, este o medie calculata prin eliminarea a 5%

    dintre valorilor de la extremele distributiei. Cu ct aceasta este mai apropiata de

    media obisnuita, cu att exista mai putine valori extreme

    Mediana: este folosit mai ales pentru variabilele ordinale. mparte n

    dou grupuri egale cazurile dintr-un e antion (50% din cazuri au valoarea pesteMedian , 50% sub Median ).

    Intervalul (range): reprezint ct de mult variaz valorile uneivariabile, de la valoarea minim la cea maxim .

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    16/19

    16

    Abaterea standard (standard deviation): este cea mai comun

    m sur toare a tendin ei centrale atunci cnd valorile sunt distribuite normal;

    m soar

    ct de mult variaz

    scorurile unei variabile fa

    de valoarea ei medie. Modul: valoarea cea mai frecvent a unei variabile.

    2.2.5 Distribuia

    Distribuia normal

    Are forma unui clopot simetric.

    distribu ie normal : 68% dintre valorile sale sunt intre 1 abateri

    standard de la medie, 95% dintre valori sunt ntre 2 abateri

    standard de la medie i 99% din valori sunt intre 3 abateri

    standard de la medie.

    In distribu ia normal asimetria (skewness) este 0. distribu ie normal standard are media 0 i abaterea standard 1.

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    17/19

    17

    Distribuia asimetric

    O distribu ie este asimetric pozitiv sau negativ. Distribu iile asimetricepozitiv sunt mai frecvente.

    Ca regul general media este mai mare decat mediana in caz de asimetrie

    pozitiv . Media este mai mic dect mediana n caz de asimetrie negativ .

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    18/19

    18

    2.3 Corelaii i relaii ntre variabile

    n afar de informa iile descriptive pe care le putem ob ine despre fiecarevariabil n parte, pot fi investigate posibilele relaii dintre variabile.

    ANALYZE-DESCRIPTIVE STATISTICS-CROSSTABS

    Selecta i dou variabile, una pentru Rnduri, una pentru Coloane.Variabilele cu mai multe valori se selecteaz de obicei pe Rand, pentru a

    permite o vizualizare mai bun a tabelului

    Varsta ( ani impliniti) Total

    18 19 20 21 23 18

    Daca folositizilniccalculatorul,cat timpestimati capetreceti infata lui(ore/zi):

    1.0 3 8 0 1 0 12

    1.5 1 3 0 0 0 4

    2.0 9 19 0 0 0 282.5 2 11 0 0 0 13

    3.0 6 12 0 0 0 18

    3.5 0 4 3 0 0 7

    4.0 2 8 0 0 0 10

    4.5 2 5 1 0 0 8

    5.0 2 5 0 0 1 8

    6.0 2 3 0 0 0 5

    6.5 0 1 0 0 0 1

    7.0 1 0 0 1 0 2

    8.0 0 3 0 0 0 3

    9.0 0 1 0 0 0 1Total 30 83 4 2 1 120

    Pentru a vedea n ce m sur putem afirma existen a unei corela ii :

  • 7/22/2019 Informatica Aplicata in Stiintele Sociale

    19/19

    19

    ANALYZE-DESCRIPTIVE STATISTICS-CROSSTABS-STATISTICS

    bifa i Correlations (care folose te indicele de corela ie Pearson, recomandat pentruanaliza rela iei dintre variabile indiferent de nivelul acestora de msurare, fie csunt nominale, ordinale sau scal)

    Indicele de Semnificaie: m soar doar Probabilitatea ca rezultatul ob inuts se datoreze unui accident matematic sau s fie semnificativ statistic. Valoareamaximacceptateste 0,06. Valoarea trebuie s fie ct mai mic

    Indicele de Corelaie: m soar existen a unei rela ii statistice ntre douvariabile. Valorile sunt cuprinse n intervalul 1;-1. Cu ct valoarea este mai

    apropiat de 0 rela ia este mai slab , cu ct este mai apropiat de +1 sau -1 este maiputernic ( valori mai mari de + sau- 0.500 indic rela ii puternice). Semnul +indic o rela ie direct propor ional , iar una invers propor ional

    Value

    Asymp.Std.

    Error(a)Approx.

    T(b) Approx. Sig.

    Interval by Interval Pearson's R .700 .093 1.361 0.00(c)

    Ordinal by Ordinal Spearman Correlation .650 .093 1.068 .288(c)

    N of Valid Cases 120

    Indicele de corela ie (Pearson) Indicele de Semnifica ieEXEMPLU: Indicele de semnifica ie este 0.00 deci rezultatul este probabil

    semnificativ statistic. Indicele de corela ie este 0.700, deci rela ia dintrevariabile este relativ puternic i direct propor ional