57275354-Ghid-SPSS-2

24
I.Crearea unei baze de date în SPSS I.1. Clasificarea şi descrierea variabilelor statistice În analiza statistică a datelor o importanţă deosebită o constituie clasificarea variabilelor după modul de exprimare a stărilor: cantitative ( metrice ) calitative discrete continue Cunoaşterea tipurilor de variabile este necesară atât n e cât şi n momentul prelucrării lor. "nele fenomene economice pot f timp ce altele necesită atribuirea unei valori unităţilor statisti după o caracteristică. #iferenţierea valorilor se face prin interm scalei de măsurare . Tipuri de scală: - scala nominală are o sin$ură proprietate % identitatea % elementelor la o cate$orie. &resupune o cate$orizare a variabilei fără a indic cantitate. 'ariabilele sex: masculin vs. feminin starea civila: c reprezintă exemple de scală nominala. le pot fi notate cu cifre ( acestea nu pot fi procesate n termeni de cantitate sau ordine + scala ordinală permite se claseze elementele observate preferinţe. "n exemplu este locul ocupat de cineva la o competiţie În acest caz! numerele pot fi comparate ntre ele n termeni de m - scala de interval – pe lân$ă proprietăţile de identitate şi ordine! faptul că intervalul ntre numere are un sens! fapt ce permite să numere. Într+o astfel de scală! punctul * (zero) nu este dat n mo x: temperatura * nu e lipsa temperaturii! e doar punctul de n$/e constituie măsurarea temperaturii n cele două sisteme! Cel trecerea de la un sistem de măsurare la altul - scala raport – folosită tot pentru variabile cantitative! având ca posedă un * absolut care nseamnă lipsa caracteristicii sau propri masă ($reutate)! lun$ime! timp de reacţie! etc. #e exemplu un veni unui venit - scala de intensitate % este frecvent folosită n cercetările de mar1e compararea opiniilor ( scala de opinie)! a comportamentelor. x: aveţi despre un nou produs2 'ariantele posibile sunt: 0oarte bu proastă ! &roastă ! 0oarte proastă . 5cala de opinie ( scală 5e caracterizează prin punctul * care exprimă inexistenţa opiniei pozitiv şi ne$ativ pentru a măsura $radele de intensitate a opinii 6bservaţie: pentru a ale$e metoda statistică adecvată n fiecare c cum au fost obţinute datele (scala utilizată).

Transcript of 57275354-Ghid-SPSS-2

I.1. Clasificarea i descrierea variabilelor statistice
În analiza statistic a datelor o importan deosebit o constituie clasificarea variabilelor dup modul de exprimare a strilor:
cantitative ( metrice ) calitative
  discrete continue
Cunoaterea tipurilor de variabile este necesar atât n etapa de codificare a acestora! cât i n momentul prelucrrii lor. "nele fenomene economice pot fi direct msurabile cantitativ! n timp ce altele necesit atribuirea unei valori unitilor statistice ale unei colectiviti observate dup o caracteristic. #iferenierea valorilor se face prin intermediul scalei de msurare.
Tipuri de scal:
-  scala nominal –   are o sin$ur proprietate % identitatea % care exprim apartenena elementelor la o cate$orie. &resupune o cate$orizare a variabilei fr a indica o anumit ordine ori cantitate. 'ariabilele sex: masculin vs. feminin starea civila: cstorit! divorat! vduv! necstorit reprezint exemple de scal nominala. le pot fi notate cu cifre (*+feminin ,+masculin) nsa acestea nu pot fi procesate n termeni de cantitate sau ordine
+  scala ordinal –   permite s se claseze elementele observate conform unei ordini!  preferine. "n exemplu este locul ocupat de cineva la o competiie (primul! al doilea! -! ultimul). În acest caz! numerele pot fi comparate ntre ele n termeni de mai mult! mai puin sau e$al
- scala de interval – pe lân$ proprietile de identitate i ordine! este caracterizat i de faptul c intervalul ntre numere are un sens! fapt ce permite s se compare diferenele ntre numere. Într+o astfel de scal! punctul * (zero) nu este dat n mod natural! adic este ales arbitrar. x: temperatura * nu e lipsa temperaturii! e doar punctul de n$/e al apei. xemplul clasic l constituie msurarea temperaturii n cele dou sisteme! Celsius i 0a/ren/eit! fiind posibil trecerea de la un sistem de msurare la altul
- scala raport – folosit tot pentru variabile cantitative! având ca i caracteristic faptul c  posed un * absolut care nseamn lipsa caracteristicii sau proprietii respective. x: bani (venit)! mas ($reutate)! lun$ime! timp de reacie! etc. #e exemplu un venit de * lei nseamn inexistena unui venit
- scala de intensitate % este frecvent folosit n cercetrile de mar1etin$ pentru msurarea i compararea opiniilor ( scala de opinie)! a comportamentelor. x: ntrebare de opinie: Ce prere avei despre un nou produs2 'ariantele posibile sunt: 0oarte bun! 3un! 4ici bun nici  proast! &roast! 0oarte proast. 5cala de opinie ( scal de ratin$ ) este o scal cvasimetric. 5e caracterizeaz prin punctul * care exprim inexistena opiniei i un numr de puncte! n sens  pozitiv i ne$ativ pentru a msura $radele de intensitate a opiniilor.
 
I.2. Codificarea i introducerea datelor în SPSS
tapa de pre$tire a setului de date implic operaia de codificare a acestora n foaia de lucru Variable View i de introducere a rspunsurilor n fereastra  Data View.
Codificarea variabilelor presupune definirea atributelor acestora: numele variabile! tipul! lun$imea ( numrul de caractere )! numrul de zecimale! etic/eta ( label  )! codificarea strilor  ( values )! valorile lips! modalitile de msurare a variabilelor.
,. 4umele variabilei se editeaz n coloana  Name, trebuind s fie unic i s nu depeasc 7 caractere
8. 9ipul variabilei se definete n coloana Type  dup cum variabila este numeric ( Numeric, Comma, Dot  )! caz n care se pot introduce numere ntre$i i zecimale! sau nenumeric ( String  )
. tic/eta variabilei este necesar datorit limitrii numelui variabilei la 7 caractere. ;stfel n coloana  Label  se poate edita un nume folosind pân la 8<= caractere. ( se folosete ntrebarea din c/estionar )
>. 'alorile etic/etei ( Value
 
<. ;le$erea sistemului de msurare: Scale, rdinal, Nominal!
În definirea variabilelor n 5&55 o importan deosebit o constituie clasificarea ntrebrilor din c/estionar! n: + ntrebri nc/ise
  + ntrebri desc/ise  + ntrebri semi+desc/ise.
 
Întrebrile nc/ise necesit codificarea rspunsurilor. Codificarea variabilelor   presupune atribuirea de coduri numerice fiecrei variante! acordarea acestor coduri fiind pur  convenional. #e ex. pentru ntrebarea ?Ce specializare urmai2@! rspunsurile au fost codificate cu valori numerice de la , la A! fiind o variabil de tip numeric i ordinal.
0recvente sunt variabilele alternative! care nu pot lua decât dou valori. x : BIntenionai s urmai cursurile unui masterat2@! cu urmtoarele valori individuale pentru caracteristica alternativ:
  ++ #;! exprimând prezena caracteristicii i are asociat codul numeric ,   ++ 4"! exprimând absena caracteristicii i are asociat codul numeric *
În cazul ntrebrilor desc/ise definirea atributelor variabilei se face dup cum rspunsul este exprimat prin cuvinte sau numeric. x. : BCe propuneri avei pentru conducerea facultii2@ se va defini ca o variabil de tip String  i nominal! rspunsurile fiind exprimate prin cuvinte. În cel de+al doilea caz! vom defini variabila ca fiind de tip  Numeric i Scale. x : BCâte ore de curs ai frecventat sptmâna trecut 2 @
Codificarea ntrebrilor semi+desc/ise se caracterizeaz prin faptul c fiecare variant de rspuns va deveni o variabil alternativ! cu excepia rspunsurilor libere care se trateaz asemenea ntrebrilor desc/ise.
 
II.!. !naliza unei variabile no"inale
 A.1. Tabele de frecvene
"tilizând din bara de comenzi urmtoarele opiuni  #naly$e – Descriptive Statistics –   %re&uencies! se obine tabelul de frecvene corespunztor repartiiei eantionului n raport cu variabila considerat. ( ex: linia de studiu ):
Interpretare: 4umrul celor care au rspuns la aceast ntrebare este ,> persoane (volumul eantionului n D ,> ). #intre acetia ,<> sunt la linia român! iar 8*
aparin liniei ma$/iare ( 0reEuencF D frecvene absolute ). Cea de a doua coloan prezint frecvenele relative! exprimate n procente: 77!<G din totalul repondenilor aparin liniei române de studiu.
 
În cazul n care avem valori care lipsesc ( *issing ) datorit non+rspunsurilor se recomand excluderea acestora n momentul
realizrii $raficului.
studiu
Percent
Cumulative
 
 
Interpretare: la aceast ntrebare au rspuns doar , de persoane! din care ,87 nu au restane din anii precedeni! ceea ce reprezint !=G din totalul celor c/estionai.
  "til n acest sens este i $raficul care red structura eantionului n raport cu variabila luat n studiu
Frequency Percent Valid Percent
Cumulative Percent
  Valid nu   128 73.6 7.0 7.0   da 5 !5." !#.0 100.0   Total   173 "". 100.0   $issing
ystem 1 .#
 Total 17 100.0   aveti restante acumulate din anii &recedenti de studiu
!#.0%
 B.1. Tabele de frecvene
În meniul  #naly$e – Descriptive Statistics – %re&uencies  introducem o variabil ordinal! ex: media anului precedent: media anului &recedent
Interpretare: cei mai muli studeni (A) au o medie cuprins n intervalul +A! ceea ce reprezint <<!G din totalul celor care au rspuns la aceast ntrebare. 5e observ c ==!G din totalul repondenilor au o medie anual de cel mult A ( frecvene relative cumulate ).
 B.2. Parametrii repartiiei unidimensionale:  valoare median (He)! modal (Ho)! valori Euartile ( , !  8 !  : ).
Comanda #naly$e – Descriptive Statistics  – %re&uencies – Statistics ne conduce la desc/iderea unei ferestre n care selectm  parametrii dorii a se calcula referitor la variabila studiat. În fereastra C(arts
selectm i opiunea  +ar C(arts pentru a realiza $raficul.
 
Cumulative Percent
 Valid su'5 1 .# .# .#   5(7 1# ".! ".) "."   7("   97 55.7 5#.   66.3   "(10 58 )).) )).7 100.0   Total 17! "8." 100.0
$issing ystem ! 1.1 Total 17 100.0
 
 
Interpretare: inând cont de modul de codificare a variabilei observm c Jumtate dintre studenii c/estionai au o medie situat pân n intervalul +A iar ceilali <*G peste acest interval. Cei mai muli au o medie a anilor precedeni aflat n intervalul + A ( Ho). 0olosind valorile Euartile! distribuia eantionului n raport cu variabila Bmedia anilor@ se prezint astfel : 8<G dintre studeni au o medie situat pân la intervalul +A! 8<G n
intervalul +A! 8<G n intervalele +A i A+,*! 8<G n intervalul A+,*.  
 B.3. Grafice  #   n cazul variabilelor ordinale $raficele adecvate sunt dia$ramele de structur ( )ie) i dia$ramele  prin benzi ( +arc(art ).
* Valid 17!   $issing !
  50 ).00   75 .00
   t
#0
50
0
)0
!0
10
0
C.1. Tabele de frecvene
În meniul  #naly$e – Descriptive Statistics – %re&uencies  introducem o variabil cantitativ! discret sau continu! ex: vârsta: varsta
Cea mai mare frecven o nre$istreaz studenii care au 88 de ani ( ,*7 )! reprezentând =8!,G din totalul celor  c/estionai. #e asemenea A!G din totalul repondenilor au o vârst de cel mult 8 de ani.
C.2. Parametrii repartiiei unidimensionale  #   se obin accesând  comanda  #naly$e – Descriptive Statistics – %re&uencies – Statistics  i selectând urmtorii parametrii: valoarea medie (mean)! mediana! modala! valorile Euartile! abaterea medie ptratic (std. deviation)! variana! coeficientul de asimetrie (s1eKness)! de boltire (1urtosis). În fereastra C(arts
selectm i opiunea istogram.it( normal curve!
 Interpretare: vârsta medie a studenilor n eantion este 88!*, ani ( mean ) Jumtate din cei , de studeni au vârsta sub 88 de ani! cealalt Jumtate peste 88 de ani ( median ) cei mai muli studeni din eantion au 88 de ani ( mode ) cu *!7 ani se abate n medie vârsta fiecrui student de la vârsta medie de la nivelul eantionului de 88!*, ani ( std. deviation ) În ceea ce privete parametrii formei! se observ c seria este asimetric pozitiv! predominând studenii tineri ( s1eKnessL* ) n ceea ce privete boltirea seriei! avem o serie leptocurtic! existând mai multe valori n Jurul valorii medii decât n cazul distribuiei normale.
"ltimele trei rânduri ale tabelului prezint valorile Euartile! valori care mpart repartiia n patru pri e$ale. &ac/etul de pro$rame 5&55 permite i calculul valorilor decile.
C.3. Grafice  # n cazul variabilelor cantitative continue $raficul relevant este /isto$rama. Construirea acestui $rafic presupune urmtorul demers: 'rap(s – istogram! selectând i opiunea Display normal curve.
  Frequency Percent Valid Percent
Cumulative Percent
 Valid !0 ) 1.7 1.7 1.7   !1 )! 18. 18.5 !0.!   !!   108 62.1 #!. 8!.7   !) !# 1." 15.0   97.7   ! ! 1.1 1.! "8.8   !# 1 .# .# "".   !8 1 .# .# 100.0   Total 17) "". 100.0 $issing ystem 1 .# Total 17 100.0
* Valid 17)   $issing 1  $ean 22.01  $edian 22.00  $ode 22  td. +eviation
  .87
  .185
  .)#7
 
 
Misto$rama permite vizualizarea distribuiei variabilei! fiind folosit pentru a dia$nostica cu uurin dac distribuia este normal prin compararea /isto$ramei variabilei observate cu $raficul curbei Nauss. În acest sens este util i interpretarea valorilor parametrilor formei. În cazul variabilei ?vârsta@ se observ c aceasta nu urmeaz o le$e normal.
#ei coeficienii de asimetrie i  boltire exprim numeric n ce msur o distribuie se abate de la normalitate! nu dau  posibilitatea interpretrii $radului de semnificaie a deviaiei de la normalitate.
varsta
!8.0!#.0!.0!!.0!0.0
 
III.!naliza statistic a datelor în raport cu o variabil utiliz$nd inferen%a
statistic
III.1.1. &laborarea intervalului de încredere a valorii "edii în
ipoteza or'anizrii unui sonda( aleator si"plu % cu aJutorul comenzii #naly$e –
 Descriptive Statistics – /0plore introducem variabila studiat! având posibilitatea de a fixa nivelul
de ncredere dorit (A<G).
Oimita inferioar a intervalului
Oimita superioar a intervalului
Interpretare: &utem afirma cu o probabilitate de A<G c vârsta medie la nivelul populaiei cercetate este ntre 8,!77 i 88!,> ani. 5au! dac am efectua studiul de ,** de ori ( ,** eantioane )! n A< de eantioane media va aparine intervalului! i numai n < eantioane valoarea acesteia ar depi limitele intervalului.
  tatistictd. rror   $ean !!.01 #.#1(0!
 "5% Con/idence 2nterval /or $ean
3o-er  4ound
$a6imum !8 ange 8
 
 
 – Compare *eans – ne Sample T Test1
Test Value 0
+i//erence
 
 
ipoteza or'anizrii unui sonda( aleator stratificat  % n meniul  #naly$e – Compare
 *eans – ne-way #nova introducem variabila cantitativ ?vârsta@! dependent de variabila factor 
de $rupare ?specializarea@.
 În ptions se bifeaz opiunea Descriptives.
5e obin intervale de ncredere pentru valorile medii de la nivelul fiecrei $rupe.
* $ean td. +eviation
$inimum $a6imum
  Lower  Bound
Upper  Bound
 
 
III.2. Teste de se"nifica%ie
III.2.1. Testarea se"nifica%iei unei "edii % face parte din $rupa testelor   parametrice.  0olosind irul de comenzi  #naly$e – Compare *eans – ne Sample T Test 
introducem variabila ?vârsta@ pentru care avem valoarea medie observat e$al cu 88!*, ani dorim s verificm dac vârsta persoanelor din eantionul observat difer semnificativ de valoarea 8< de ani ( test valueD8<). 0ormulm ipoteza nul: M  * :  2   D 8< (vârsta medie nu difer semnificativ de valoarea de 8< de ani)
M , :  2   P 8<
Interpretare: valoarea nivelului de semnificaie 5i$ D *!*** Q*!*< ( confidence interval )! ceea ce duce la respin$erea ipotezei nule. xist o diferen semnificativ ntre valoarea medie din eantion i cea specificat. &entru c 5i$ Q *!*, putem afirma c intre
valoarea medie de la nivel de eantion i cea specificat exist diferene semnificative la un nivel de ncredere de AAG.
III.2.2. Testarea se"nifica%iei unei propor%ii  % din meniul  #naly$e – 
 Nonparametric Tests – +inomial testm ipoteze cu privire la o variabil cu distribuie binomial! care poate lua doar dou valori! de exemplu anul de studiu ( anul > sau anul < ):  #orim s verificm dac proporia uneia dintre cele dou $rupe de studeni definite prin variabila
anul de ?studiu@ difer semnificativ de *!<*.
;stfel formulm ipotezele : M  * : p D <*G
  M, : p P <*G
Interpretare: proporia observat n eantion pentru $rupa , ( anul > ) este de A*G! proporia specificat fiind de <*G. 'aloarea 5i$ Q*!*,! astfel c putem concluziona! cu o ncredere de AAG! c proporia studenilor din anul > difer semnificativ de proporia specificat.
Test Value !5 t d/ ig. !(
tailed9 $ean
+i//erence "5%
 
 anul de studiu
:rou& 1 15# ."0 .50   .000 :rou& ! 5 18 .10
Total 17 1.00
 
 
III.). Teste de concordan% # fac parte din cate'oria testelor nepara"etrice.
III.).1.*erificarea nor"alit%ii unei distribu%ii = modelarea statistic cere verificarea ipotezei de normalitate a variabilelor. ;stfel! este foarte important ca naintea inferenei statistice s se verifice normalitatea distribuiei populaiei. &e lân$ vizualizarea /isto$ramei i a valorilor coeficienilor de asimetrie i boltire! n 5&55 exist posibilitatea aplicrii testului Rolmo$orov % 5mirnov! astfel:  #naly$e – Nonparametric Test – ne Sample 3olmogorov-
Smirnov Test4
 0ormulm ipoteza nul M  * : ntre cele 8 distribuii! cea teoretic i cea empiric nu exist diferene semnificative ( populaia este normal distribuit n raport cu variabila ?vârsta B)! cu alternativa c variabila nu urmeaz o le$e normal. Interpretare: nivelul $radului de semnificaie! 5i$ Q
*!*< conduce la respin$erea ipotezei nule! distribuia
studiat difer semnificativ de forma distribuiei
normale.
 ;'solute .))!
 
M  * : distribuia este uniform   M, : distribuia nu este uniform
În tabelul urmtor sunt comparate frecvenele observate cu frecvenele teoretice! pe coloana  5esidual 
fiind prezentate diferenele pentru fiecare stare a variabilei. În acest exemplu se
observ c sunt 8> de studeni la secia de mar1etin$  potrivit ipotezei de e$alitate a proporiilor! n fiecare secie ar trebui s fie ,A! studeni. În coloana  5esidual 
se observ diferena fa de valorile teoretice: >!.
Interpretare: valoarea estimat a
statisticii S  8 este semnificativ la un nivel de ncredere de AAG! deoarece 5i$ Q*!*,! ceea ce conduce la respin$erea ipotezei nule. Cele nou cate$orii de studeni nu au aceeai proporie distribuia nu este uniform.
  <'served *
esidual
 C2: !5 1".) 5.7  2 18 1".) (1.)  F4 !7 1".) 7.7  $   24 19.3 4.7  $: !# 1".) #.7  2 !7 1".) 7.7
 P 1! 1".) (7.)  CT 7 1".) (1!.)
 ; 8 1".) (11.)  Total 17
ce s&eciali?are urmati@  Chi(quare !8.55!
 d/ 8  ;sym&. ig.   .000
 
 
I*. !naliza statistic a datelor în raport cu dou variabile.
  I*.1. Cazul a dou variabile no"inale
1. Tabele de repartiie bidimensionale # pentru a reda distribuia eantionului n raport cu 8 variabile se procedeaz astfel: #naly$e – Descriptive Statistics –
Crosstabs4
 
Interpretare: tabelul red distribuia studenilor din eantion n raport cu cele dou variabile! fiind construit cu aJutorul frecvenelor absolute. "ltima coloan i ultimul rând din tabelul de frecvene corespund repartiiilor mar$inale.
x: doar 8 din cei 8> de studeni c/estionai de la secia de mar1etin$ ar  ale$e alt specializare.
;ceeai distribuie a eantionului n raport cu cele dou variabile poate fii redat i cu aJutorul frecvenelor relative. 5e observ c 8,!G din totalul studenilor ar ale$e alt secie! un procent nsemnat având cei de la secia mana$ement (<!AG).
2. Grafice # adecvate n acest caz sunt dia$ramele prin coloane.
ce s&eciali?are urmati@
aceeasi
alta
3. Analiza asocierii dintre cele dou variabile  #  presupune n prima etap verificarea existenei le$turii dintre cele dou variabile cu aJutorul testului S  8 i apoi interpretarea coeficientului de contin$en pentru a analiza $radul de asociere dintre variabile. #in meniul  #naly$e – Descriptive Statistics – Crosstabs  se ale$ cele dou variabile i n fereastra Statistics se selecteaz parametrii dorii.
  daca ar /i a alegeti din nou &entru ce s&eciali?are ati
o&ta@
 
C2: !! ) !5 2 1) 17 F4 !) 1 ! MK 22 2 24 $: 15 10 !5 2 !! 5 !7 P " ) 1! CT 5 ! 7 ; ! # 8
Total 1)) )# 1#"
daca ar /i a alegeti din nou &entru ce s&eciali?are ati
o&ta@
aceeasi alta ce
s&eciali?are urmati@
+
8."%   5.9% 1.8%
2 1).0% ).0% 1#.0% P 5.)% 1.8% 7.1% CT ).0% 1.!% .1% ; 1.!% ).#% .7%
Total 78.7%   21.3% 100.0%  
M, : S  8 P *
 Pearson Chi( quare
!7.)#" 8   .001
10.1"7 1 .001
 
Interpretare: putem afirma cu o probabilitate de A<G ( 5i$.Q *!*< ) c ntre cele dou variabile exist le$tur.
'aloarea coeficientului de contin$en este de *!! fiind semnificativ diferit de *! deci le$tura dintre variabile este de intensitate medie.  
Value ;&&ro6. ig.
 *ominal 'y *ominal
I*.2. Cazul a dou variabile ordinale
1. Tabele de repartiie bidimensionale  # i n acest caz   prezint importan repartiia eantionului n raport cu cele variabile atât sub forma frecvenelor absolute! cât i relative. ;ceast prezentare a datelor presupune urmtorii pai:  #naly$e – Descriptive
Statistics – Crosstabs, n fereastra Cells  ale$ând i opiunea  )ercentages. Cele dou tipuri de frecvene! absolute i relative! se pot prezenta n acelai tabel de repartiie.
 
a cata o&tiune a / ost s&eciali?area la care studiati
87#5)!1
70
#0
50
0
)0
!0
10
0
 
 * o/ Valid Cases
  17!
 
I*.). Cazul a dou variabile cantitative
1. Tabele de repartiie bidimensionale # se parcur$ aceleai etape ca i
mai sus
 
!0181#11!108#!0
  c   a    t  e   o   r  e    d   e   s   e   m    i  n   a   r   a    t   i    /  r  e   c   v   e   n    t  a    t   s   a   &    t    t  r  e   c   u    t  a
1
1!
10
8
0
5e observ n distribuia punctelor o valoare extrem ( ,7 ore curs ) se recomand ca valorile extreme s fie nlturate naintea aplicrii testelor statistice pentru a nu influena calitatea rezultatelor.
).  Analiza corelaiei   % presupune calculul coeficientului lui &earson! utilizând meniul #naly$e – Correlate – +ivariate.
'om analiza le$tura dintre numrul de ore de curs i cele de seminar frecventate de studeni ntr+o sptmân. Coeficientul lui &earson ne ofer informaii atât despre sensul le$turii! cât i despre intensitatea le$turii.
cate ore de curs ati /recventat sa&t
trecuta
trecuta  cate ore de curs ati /recventat sa&t trecuta
Pearson Correa!"on
 cate ore de seminar ati /recventat sa&t trecuta
Pearson Correa!"on
 
 
5e obine matricea de corelaie! valorile fiind distribuite simetric fa de dia$onala principal. 'aloarea coeficientului lui &earson este de *!==<! ceea ce su$ereaz c ntre variabile exist o corelaie direct! de intensitate medie.
'aloarea acestui coeficient este semnificativ diferit de *! ipoteza existenei le$turii fiind acceptat cu o probabilitate de A<G ( 5i$.Q *!*< ).
#ac analizm din nou corelaia dintre cele dou variabile! dar dup indeprtarea valorilor extreme din eantion! rezultatele vor fi mai concludente: Correlations
  5e observ c intensitatea le$turii dup nlturarea valorilor extreme se modific! le$tura dintre cele dou variabile fiind mai bine pus n eviden.
  cate ore de seminar ati
/recventat sa&t trecuta
trecuta
Pearson Correa!"on
 cate ore de curs ati /recventat sa&t trecuta
Pearson Correa!"on
 
 
I*.,. Testarea e'alit%ii a dou "edii  ( eantioane independente ) % este un test  parametric care verific dac mediile a dou $rupe sunt e$ale. În 5&55 presupune urmtorul
demers:  #naly$e – Compare *eans –   6ndependent Samples T Test . #e exemplu! dorim s testm dac! la nivelul eantionului observat! numrul mediu de ore de curs frecventate de studenii din anul > este diferit de numrul mediu de ore de curs frecventate de studenii din anul <. 'ariabila de $rupare va fi n acest caz anul
de studiu! n definirea $rupelor inând cont
de codificrile fcute pentru strile acesteia (
, % anul >! 8 % anul < ).
M  * :  2    , D  2     8
M, :  2    , P  2     8
#orim s verificm dac numrul mediu de ore de curs frecventate de studenii din anul > ( <!8AT< )! difer semnificativ de !=<T> (numrul mediu de ore de curs
frecventate de studenii din anul < ). Construcia testului pentru compararea mediilor a dou eantioane presupune testarea n
 prealabil a e$alitii varianelor la nivelul celor dou $rupe. 5tatistica t  se calculeaz diferit dup cum dispersiile sunt e$ale sau nu la nivelul celor dou $rupe. Ca urmare! formulm ipoteza nul i alternativa referitoare la e$alitatea dispersiilor:M  * : U  8
, D U  8
, P U  8
t(test /or quality o/ $eans
  F ig. t d/  
qual variances assumed
qual variances not assumed
!.))# !!.1)0 .0!" 1.#
 Interpretare: probabilitatea de acceptare a ipotezei nule n cazul e$alitii varianelor este de *!>*8 ( L *!*< )! varianele la nivelul celor dou $rupe sunt e$ale. &entru a verifica e$alitatea mediilor folosim statistica t corespunztoare cazului n care dispersiile sunt e$ale. În acest caz! testul t este e$al cu ,!A<! cu ,=7 $rade de libertate i un nivel de semnificaie de *!*<< ( 5i$.L *!*< )! ceea ce arat c nu se poate tra$e concluzia c cele dou medii difer semnificativ.
I*.. Testarea le'turii dintre dou variabile  % dorim s verificm dac modificarea variabilei dependente V este rezultatul influenei variabilei explicative W. &entru a
  anul de studiu
* $ean td. +eviation
td. rror  $ean
 
testa existena le$turii procedm astfel: #naly$e – Compare *eans – ne .ay #nova. ;46'; este un procedeu de analiz a unei variabile numerice sub influena unei variabile de $rupare care  prezint mai multe stri.
 #e exemplu dorim s verificm dac exist le$tur ntre numrul de ore de curs frecventate i media anual.
În meniul ptions avem posibilitatea selectrii $raficului pentru a formula ipoteze cu  privire la forma le$turii dintre cele dou variabile.  
Cu cât mediile $rupelor au valori mai diferite ntre ele! cu atât variaia dintre $rupe este mai mare cu cât variaia n cadrul $rupelor este mai mic! cu atât statistica 0 este mai mare (0 D media varianei dintre $rupe
Xmedia varianei din cadrul $rupei ) i numrul orelor de curs frecventate variaz mai mult n raport cu media anual. 5e formuleaz ipoteza nul M  * : 0 D *! adic dispersia dintre $rupe este nul i deci $rupele nu sunt diferite ntre ele! adic media anual nu influeneaz numrul orelor de curs frecventate de studeni. #eoarece probabilitatea de a $rei când respin$em ipoteza este *!*,=Q *!*<! rezult c ipoteza nul se respin$e! adic media influeneaz frecvena la cursuri!. În cadrul fiecrui interval al mediei anului precedent! studenii sunt relativ omo$eni din punct de vedere al frecventrii cursurilor! media anului precedent fiind un criteriu semnificativ de se$mentare.
  um o/  quares
d/ $ean quare
  Bithin :rou&s
177).!"8 1# 10.81)
 
   d   e   c   u   r  s   a
   t   i    /  r  e   c   v   e   n
   t  a    t   s   a   &
   t    t  r