I.1. Clasificarea i descrierea variabilelor statistice
În analiza statistic a datelor o importan deosebit o constituie
clasificarea variabilelor dup modul de exprimare a strilor:
cantitative ( metrice ) calitative
discrete continue
Cunoaterea tipurilor de variabile este necesar atât n etapa de
codificare a acestora! cât i n momentul prelucrrii lor. "nele
fenomene economice pot fi direct msurabile cantitativ! n timp ce
altele necesit atribuirea unei valori unitilor statistice ale unei
colectiviti observate dup o caracteristic. #iferenierea valorilor
se face prin intermediul scalei de msurare.
Tipuri de scal:
- scala nominal – are o sin$ur proprietate %
identitatea % care exprim apartenena elementelor la o
cate$orie. &resupune o cate$orizare a variabilei fr a
indica o anumit ordine ori cantitate. 'ariabilele sex: masculin vs.
feminin starea civila: cstorit! divorat! vduv! necstorit reprezint
exemple de scal nominala. le pot fi notate cu cifre (*+feminin
,+masculin) nsa acestea nu pot fi procesate n termeni de cantitate
sau ordine
+ scala ordinal – permite s se claseze elementele
observate conform unei ordini! preferine. "n exemplu este
locul ocupat de cineva la o competiie (primul! al doilea! -!
ultimul). În acest caz! numerele pot fi comparate ntre ele n
termeni de mai mult! mai puin sau e$al
- scala de interval – pe lân$ proprietile de identitate i
ordine! este caracterizat i de faptul c intervalul ntre numere are
un sens! fapt ce permite s se compare diferenele ntre numere.
Într+o astfel de scal! punctul * (zero) nu este dat n mod natural!
adic este ales arbitrar. x: temperatura * nu e lipsa temperaturii!
e doar punctul de n$/e al apei. xemplul clasic l constituie
msurarea temperaturii n cele dou sisteme! Celsius i 0a/ren/eit!
fiind posibil trecerea de la un sistem de msurare la altul
- scala raport – folosit tot pentru variabile cantitative! având ca
i caracteristic faptul c posed un * absolut care nseamn lipsa
caracteristicii sau proprietii respective. x: bani (venit)! mas
($reutate)! lun$ime! timp de reacie! etc. #e exemplu un venit de *
lei nseamn inexistena unui venit
- scala de intensitate % este frecvent folosit n cercetrile de
mar1etin$ pentru msurarea i compararea opiniilor ( scala de
opinie)! a comportamentelor. x: ntrebare de opinie: Ce prere avei
despre un nou produs2 'ariantele posibile sunt: 0oarte bun! 3un!
4ici bun nici proast! &roast! 0oarte proast. 5cala de
opinie ( scal de ratin$ ) este o scal cvasimetric. 5e caracterizeaz
prin punctul * care exprim inexistena opiniei i un numr de puncte!
n sens pozitiv i ne$ativ pentru a msura $radele de
intensitate a opiniilor.
I.2. Codificarea i introducerea datelor în SPSS
tapa de pre$tire a setului de date implic operaia de codificare a
acestora n foaia de lucru Variable View i de introducere a
rspunsurilor n fereastra Data View.
Codificarea variabilelor presupune definirea atributelor acestora:
numele variabile! tipul! lun$imea ( numrul de caractere )! numrul
de zecimale! etic/eta ( label )! codificarea
strilor ( values )! valorile lips! modalitile de msurare
a variabilelor.
,. 4umele variabilei se editeaz n coloana Name, trebuind s
fie unic i s nu depeasc 7 caractere
8. 9ipul variabilei se definete n coloana Type dup cum
variabila este numeric ( Numeric, Comma, Dot )! caz
n care se pot introduce numere ntre$i i zecimale! sau nenumeric (
String )
. tic/eta variabilei este necesar datorit limitrii numelui
variabilei la 7 caractere. ;stfel n coloana
Label se poate edita un nume folosind pân la
8<= caractere. ( se folosete ntrebarea din c/estionar )
>. 'alorile etic/etei ( Value
<. ;le$erea sistemului de msurare: Scale, rdinal, Nominal!
În definirea variabilelor n 5&55 o importan deosebit o
constituie clasificarea ntrebrilor din c/estionar! n: + ntrebri
nc/ise
+ ntrebri desc/ise + ntrebri semi+desc/ise.
Întrebrile nc/ise necesit codificarea rspunsurilor. Codificarea
variabilelor presupune atribuirea de coduri numerice
fiecrei variante! acordarea acestor coduri fiind pur
convenional. #e ex. pentru ntrebarea ?Ce specializare urmai2@!
rspunsurile au fost codificate cu valori numerice de la , la A!
fiind o variabil de tip numeric i ordinal.
0recvente sunt variabilele alternative! care nu pot lua decât dou
valori. x : BIntenionai s urmai cursurile unui masterat2@! cu
urmtoarele valori individuale pentru caracteristica
alternativ:
++ #;! exprimând prezena caracteristicii i are asociat codul
numeric , ++ 4"! exprimând absena caracteristicii i are
asociat codul numeric *
În cazul ntrebrilor desc/ise definirea atributelor variabilei se
face dup cum rspunsul este exprimat prin cuvinte sau numeric. x. :
BCe propuneri avei pentru conducerea facultii2@ se va defini ca o
variabil de tip String i nominal! rspunsurile fiind
exprimate prin cuvinte. În cel de+al doilea caz! vom defini
variabila ca fiind de tip Numeric i Scale. x : BCâte ore
de curs ai frecventat sptmâna trecut 2 @
Codificarea ntrebrilor semi+desc/ise se caracterizeaz prin faptul c
fiecare variant de rspuns va deveni o variabil alternativ! cu
excepia rspunsurilor libere care se trateaz asemenea ntrebrilor
desc/ise.
II.!. !naliza unei variabile no"inale
A.1. Tabele de frecvene
"tilizând din bara de comenzi urmtoarele opiuni #naly$e –
Descriptive Statistics – %re&uencies! se obine
tabelul de frecvene corespunztor repartiiei eantionului n raport cu
variabila considerat. ( ex: linia de studiu ):
Interpretare: 4umrul celor care au rspuns la aceast ntrebare este
,> persoane (volumul eantionului n D ,> ). #intre acetia
,<> sunt la linia român! iar 8*
aparin liniei ma$/iare ( 0reEuencF D frecvene absolute ). Cea de a
doua coloan prezint frecvenele relative! exprimate n procente:
77!<G din totalul repondenilor aparin liniei române de
studiu.
În cazul n care avem valori care lipsesc ( *issing ) datorit
non+rspunsurilor se recomand excluderea acestora n momentul
realizrii $raficului.
studiu
Percent
Cumulative
Interpretare: la aceast ntrebare au rspuns doar , de persoane! din
care ,87 nu au restane din anii precedeni! ceea ce reprezint !=G
din totalul celor c/estionai.
"til n acest sens este i $raficul care red structura
eantionului n raport cu variabila luat n studiu
Frequency Percent Valid Percent
Cumulative Percent
Valid nu 128 73.6 7.0 7.0 da 5 !5." !#.0 100.0
Total 173 "". 100.0 $issing
ystem 1 .#
Total 17 100.0 aveti restante acumulate din anii
&recedenti de studiu
!#.0%
B.1. Tabele de frecvene
În meniul #naly$e – Descriptive Statistics –
%re&uencies introducem o variabil ordinal! ex: media
anului precedent: media anului &recedent
Interpretare: cei mai muli studeni (A) au o medie cuprins n
intervalul +A! ceea ce reprezint <<!G din totalul celor care
au rspuns la aceast ntrebare. 5e observ c ==!G din totalul
repondenilor au o medie anual de cel mult A ( frecvene relative
cumulate ).
B.2. Parametrii repartiiei unidimensionale: valoare
median (He)! modal (Ho)! valori Euartile ( , ! 8 ! :
).
Comanda #naly$e – Descriptive Statistics –
%re&uencies – Statistics ne conduce la desc/iderea unei
ferestre n care selectm parametrii dorii a se calcula
referitor la variabila studiat. În fereastra C(arts
selectm i opiunea +ar C(arts pentru a realiza
$raficul.
Cumulative Percent
Valid su'5 1 .# .# .# 5(7 1# ".! ".) "." 7("
97 55.7 5#. 66.3 "(10 58 )).) )).7 100.0
Total 17! "8." 100.0
$issing ystem ! 1.1 Total 17 100.0
Interpretare: inând cont de modul de codificare a variabilei
observm c Jumtate dintre studenii c/estionai au o medie situat pân
n intervalul +A iar ceilali <*G peste acest interval. Cei mai
muli au o medie a anilor precedeni aflat n intervalul + A ( Ho).
0olosind valorile Euartile! distribuia eantionului n raport cu
variabila Bmedia anilor@ se prezint astfel : 8<G dintre studeni
au o medie situat pân la intervalul +A! 8<G n
intervalul +A! 8<G n intervalele +A i A+,*! 8<G n intervalul
A+,*.
B.3. Grafice # n cazul variabilelor
ordinale $raficele adecvate sunt dia$ramele de structur ( )ie)
i dia$ramele prin benzi ( +arc(art ).
* Valid 17! $issing !
50 ).00 75 .00
t
#0
50
0
)0
!0
10
0
C.1. Tabele de frecvene
În meniul #naly$e – Descriptive Statistics –
%re&uencies introducem o variabil cantitativ! discret sau
continu! ex: vârsta: varsta
Cea mai mare frecven o nre$istreaz studenii care au 88 de ani ( ,*7
)! reprezentând =8!,G din totalul celor c/estionai. #e
asemenea A!G din totalul repondenilor au o vârst de cel mult 8 de
ani.
C.2. Parametrii repartiiei unidimensionale # se
obin accesând comanda #naly$e – Descriptive Statistics
– %re&uencies – Statistics i selectând urmtorii
parametrii: valoarea medie (mean)! mediana! modala! valorile
Euartile! abaterea medie ptratic (std. deviation)! variana!
coeficientul de asimetrie (s1eKness)! de boltire (1urtosis). În
fereastra C(arts
selectm i opiunea istogram.it( normal curve!
Interpretare: vârsta medie a studenilor n eantion este 88!*,
ani ( mean ) Jumtate din cei , de studeni au vârsta sub 88 de ani!
cealalt Jumtate peste 88 de ani ( median ) cei mai muli studeni din
eantion au 88 de ani ( mode ) cu *!7 ani se abate n medie vârsta
fiecrui student de la vârsta medie de la nivelul eantionului de
88!*, ani ( std. deviation ) În ceea ce privete parametrii formei!
se observ c seria este asimetric pozitiv! predominând studenii
tineri ( s1eKnessL* ) n ceea ce privete boltirea seriei! avem o
serie leptocurtic! existând mai multe valori n Jurul valorii medii
decât n cazul distribuiei normale.
"ltimele trei rânduri ale tabelului prezint valorile Euartile!
valori care mpart repartiia n patru pri e$ale. &ac/etul de
pro$rame 5&55 permite i calculul valorilor decile.
C.3. Grafice # n cazul variabilelor cantitative continue
$raficul relevant este /isto$rama. Construirea acestui $rafic
presupune urmtorul demers: 'rap(s – istogram! selectând i
opiunea Display normal curve.
Frequency Percent Valid Percent
Cumulative Percent
Valid !0 ) 1.7 1.7 1.7 !1 )! 18. 18.5 !0.! !!
108 62.1 #!. 8!.7 !) !# 1." 15.0 97.7 !
! 1.1 1.! "8.8 !# 1 .# .# "". !8 1 .# .# 100.0
Total 17) "". 100.0 $issing ystem 1 .# Total 17 100.0
* Valid 17) $issing 1 $ean 22.01 $edian 22.00
$ode 22 td. +eviation
.87
.185
.)#7
Misto$rama permite vizualizarea distribuiei variabilei! fiind
folosit pentru a dia$nostica cu uurin dac distribuia este normal
prin compararea /isto$ramei variabilei observate cu $raficul curbei
Nauss. În acest sens este util i interpretarea valorilor
parametrilor formei. În cazul variabilei ?vârsta@ se observ c
aceasta nu urmeaz o le$e normal.
#ei coeficienii de asimetrie i boltire exprim numeric n ce
msur o distribuie se abate de la normalitate! nu dau
posibilitatea interpretrii $radului de semnificaie a deviaiei
de la normalitate.
varsta
!8.0!#.0!.0!!.0!0.0
III.!naliza statistic a datelor în raport cu o variabil utiliz$nd
inferen%a
statistic
III.1.1. &laborarea intervalului de încredere a valorii "edii
în
ipoteza or'anizrii unui sonda( aleator si"plu % cu aJutorul
comenzii #naly$e –
Descriptive Statistics – /0plore introducem variabila
studiat! având posibilitatea de a fixa nivelul
de ncredere dorit (A<G).
Oimita inferioar a intervalului
Oimita superioar a intervalului
Interpretare: &utem afirma cu o probabilitate de A<G c
vârsta medie la nivelul populaiei cercetate este ntre 8,!77 i
88!,> ani. 5au! dac am efectua studiul de ,** de ori ( ,**
eantioane )! n A< de eantioane media va aparine intervalului! i
numai n < eantioane valoarea acesteia ar depi limitele
intervalului.
tatistictd. rror $ean !!.01 #.#1(0!
"5% Con/idence 2nterval /or $ean
3o-er 4ound
$a6imum !8 ange 8
– Compare *eans – ne Sample T Test1
Test Value 0
+i//erence
ipoteza or'anizrii unui sonda( aleator stratificat % n meniul
#naly$e – Compare
*eans – ne-way #nova introducem variabila cantitativ
?vârsta@! dependent de variabila factor
de $rupare ?specializarea@.
În ptions se bifeaz opiunea Descriptives.
5e obin intervale de ncredere pentru valorile medii de la nivelul
fiecrei $rupe.
* $ean td. +eviation
$inimum $a6imum
Lower Bound
Upper Bound
III.2. Teste de se"nifica%ie
III.2.1. Testarea se"nifica%iei unei "edii % face parte din
$rupa testelor parametrice. 0olosind irul de
comenzi #naly$e – Compare *eans – ne Sample T
Test
introducem variabila ?vârsta@ pentru care avem valoarea medie
observat e$al cu 88!*, ani dorim s verificm dac vârsta persoanelor
din eantionul observat difer semnificativ de valoarea 8< de ani
( test valueD8<). 0ormulm ipoteza nul: M * :
2 D 8< (vârsta medie nu difer semnificativ de
valoarea de 8< de ani)
M , : 2 P 8<
Interpretare: valoarea nivelului de semnificaie 5i$ D *!***
Q*!*< ( confidence interval )! ceea ce duce la respin$erea
ipotezei nule. xist o diferen semnificativ ntre valoarea medie din
eantion i cea specificat. &entru c 5i$ Q *!*, putem afirma c
intre
valoarea medie de la nivel de eantion i cea specificat exist
diferene semnificative la un nivel de ncredere de AAG.
III.2.2. Testarea se"nifica%iei unei propor%ii % din meniul
#naly$e –
Nonparametric Tests – +inomial testm ipoteze cu privire la o
variabil cu distribuie binomial! care poate lua doar dou valori! de
exemplu anul de studiu ( anul > sau anul < ): #orim s
verificm dac proporia uneia dintre cele dou $rupe de studeni
definite prin variabila
anul de ?studiu@ difer semnificativ de *!<*.
;stfel formulm ipotezele : M * : p D <*G
M, : p P <*G
Interpretare: proporia observat n eantion pentru $rupa , ( anul
> ) este de A*G! proporia specificat fiind de <*G. 'aloarea
5i$ Q*!*,! astfel c putem concluziona! cu o ncredere de AAG! c
proporia studenilor din anul > difer semnificativ de proporia
specificat.
Test Value !5 t d/ ig. !(
tailed9 $ean
+i//erence "5%
anul de studiu
:rou& 1 15# ."0 .50 .000 :rou& ! 5 18 .10
Total 17 1.00
III.). Teste de concordan% # fac parte din cate'oria testelor
nepara"etrice.
III.).1.*erificarea nor"alit%ii unei
distribu%ii = modelarea statistic cere verificarea
ipotezei de normalitate a variabilelor. ;stfel! este foarte
important ca naintea inferenei statistice s se verifice
normalitatea distribuiei populaiei. &e lân$ vizualizarea
/isto$ramei i a valorilor coeficienilor de asimetrie i boltire! n
5&55 exist posibilitatea aplicrii testului Rolmo$orov %
5mirnov! astfel: #naly$e – Nonparametric Test – ne Sample
3olmogorov-
Smirnov Test4
0ormulm ipoteza nul M * : ntre cele 8 distribuii! cea
teoretic i cea empiric nu exist diferene semnificative ( populaia
este normal distribuit n raport cu variabila ?vârsta B)! cu
alternativa c variabila nu urmeaz o le$e normal. Interpretare:
nivelul $radului de semnificaie! 5i$ Q
*!*< conduce la respin$erea ipotezei nule! distribuia
studiat difer semnificativ de forma distribuiei
normale.
;'solute .))!
M * : distribuia este uniform M, : distribuia nu este
uniform
În tabelul urmtor sunt comparate frecvenele observate cu frecvenele
teoretice! pe coloana 5esidual
fiind prezentate diferenele pentru fiecare stare a variabilei. În
acest exemplu se
observ c sunt 8> de studeni la secia de mar1etin$ potrivit
ipotezei de e$alitate a proporiilor! n fiecare secie ar trebui s
fie ,A! studeni. În coloana 5esidual
se observ diferena fa de valorile teoretice: >!.
Interpretare: valoarea estimat a
statisticii S 8 este semnificativ la un nivel de
ncredere de AAG! deoarece 5i$ Q*!*,! ceea ce conduce la respin$erea
ipotezei nule. Cele nou cate$orii de studeni nu au aceeai proporie
distribuia nu este uniform.
<'served *
esidual
C2: !5 1".) 5.7 2 18 1".) (1.) F4 !7 1".) 7.7
$ 24 19.3 4.7 $: !# 1".) #.7 2 !7 1".)
7.7
P 1! 1".) (7.) CT 7 1".) (1!.)
; 8 1".) (11.) Total 17
ce s&eciali?are urmati@ Chi(quare !8.55!
d/ 8 ;sym&. ig. .000
I*. !naliza statistic a datelor în raport cu dou variabile.
I*.1. Cazul a dou variabile no"inale
1. Tabele de repartiie bidimensionale # pentru a reda
distribuia eantionului n raport cu 8 variabile se procedeaz
astfel: #naly$e – Descriptive Statistics –
Crosstabs4
Interpretare: tabelul red distribuia studenilor din eantion n
raport cu cele dou variabile! fiind construit cu aJutorul
frecvenelor absolute. "ltima coloan i ultimul rând din tabelul de
frecvene corespund repartiiilor mar$inale.
x: doar 8 din cei 8> de studeni c/estionai de la secia de
mar1etin$ ar ale$e alt specializare.
;ceeai distribuie a eantionului n raport cu cele dou variabile
poate fii redat i cu aJutorul frecvenelor relative. 5e observ c
8,!G din totalul studenilor ar ale$e alt secie! un procent nsemnat
având cei de la secia mana$ement (<!AG).
2. Grafice # adecvate n acest caz sunt dia$ramele prin
coloane.
ce s&eciali?are urmati@
aceeasi
alta
3. Analiza asocierii dintre cele dou variabile #
presupune n prima etap verificarea existenei le$turii dintre
cele dou variabile cu aJutorul testului S 8 i apoi
interpretarea coeficientului de contin$en pentru a analiza $radul
de asociere dintre variabile. #in meniul #naly$e –
Descriptive Statistics – Crosstabs se ale$ cele dou variabile
i n fereastra Statistics se selecteaz parametrii dorii.
daca ar /i a alegeti din nou &entru ce s&eciali?are
ati
o&ta@
C2: !! ) !5 2 1) 17 F4 !) 1 ! MK 22 2 24 $: 15 10 !5 2 !! 5 !7 P "
) 1! CT 5 ! 7 ; ! # 8
Total 1)) )# 1#"
daca ar /i a alegeti din nou &entru ce s&eciali?are
ati
o&ta@
aceeasi alta ce
s&eciali?are urmati@
+
8."% 5.9% 1.8%
2 1).0% ).0% 1#.0% P 5.)% 1.8% 7.1% CT ).0% 1.!% .1% ; 1.!% ).#%
.7%
Total 78.7% 21.3% 100.0%
M, : S 8 P *
Pearson Chi( quare
!7.)#" 8 .001
10.1"7 1 .001
Interpretare: putem afirma cu o probabilitate de A<G ( 5i$.Q
*!*< ) c ntre cele dou variabile exist le$tur.
'aloarea coeficientului de contin$en este de *!! fiind semnificativ
diferit de *! deci le$tura dintre variabile este de intensitate
medie.
Value ;&&ro6. ig.
*ominal 'y *ominal
I*.2. Cazul a dou variabile ordinale
1. Tabele de repartiie bidimensionale # i n acest caz
prezint importan repartiia eantionului n raport cu cele
variabile atât sub forma frecvenelor absolute! cât i relative.
;ceast prezentare a datelor presupune urmtorii pai: #naly$e –
Descriptive
Statistics – Crosstabs, n fereastra Cells ale$ând i opiunea
)ercentages. Cele dou tipuri de frecvene! absolute i
relative! se pot prezenta n acelai tabel de repartiie.
a cata o&tiune a / ost s&eciali?area la care studiati
87#5)!1
70
#0
50
0
)0
!0
10
0
* o/ Valid Cases
17!
I*.). Cazul a dou variabile cantitative
1. Tabele de repartiie bidimensionale # se parcur$ aceleai
etape ca i
mai sus
!0181#11!108#!0
c a t e
o r e d
e s e m
i n a r
a t i
/ r e c
v e n
t a t s
a & t
t r e c
u t a
1
1!
10
8
0
5e observ n distribuia punctelor o valoare extrem ( ,7 ore curs )
se recomand ca valorile extreme s fie nlturate naintea aplicrii
testelor statistice pentru a nu influena calitatea
rezultatelor.
). Analiza corelaiei % presupune calculul
coeficientului lui &earson! utilizând meniul #naly$e –
Correlate – +ivariate.
'om analiza le$tura dintre numrul de ore de curs i cele de seminar
frecventate de studeni ntr+o sptmân. Coeficientul lui &earson
ne ofer informaii atât despre sensul le$turii! cât i despre
intensitatea le$turii.
cate ore de curs ati /recventat sa&t
trecuta
trecuta cate ore de curs ati /recventat sa&t
trecuta
Pearson Correa!"on
cate ore de seminar ati /recventat sa&t trecuta
Pearson Correa!"on
5e obine matricea de corelaie! valorile fiind distribuite simetric
fa de dia$onala principal. 'aloarea coeficientului lui &earson
este de *!==<! ceea ce su$ereaz c ntre variabile exist o
corelaie direct! de intensitate medie.
'aloarea acestui coeficient este semnificativ diferit de *! ipoteza
existenei le$turii fiind acceptat cu o probabilitate de A<G (
5i$.Q *!*< ).
#ac analizm din nou corelaia dintre cele dou variabile! dar dup
indeprtarea valorilor extreme din eantion! rezultatele vor fi mai
concludente: Correlations
5e observ c intensitatea le$turii dup nlturarea valorilor
extreme se modific! le$tura dintre cele dou variabile fiind mai
bine pus n eviden.
cate ore de seminar ati
/recventat sa&t trecuta
trecuta
Pearson Correa!"on
cate ore de curs ati /recventat sa&t trecuta
Pearson Correa!"on
I*.,. Testarea e'alit%ii a dou "edii ( eantioane independente
) % este un test parametric care verific dac mediile a dou
$rupe sunt e$ale. În 5&55 presupune urmtorul
demers: #naly$e – Compare *eans – 6ndependent
Samples T Test . #e exemplu! dorim s testm dac! la nivelul
eantionului observat! numrul mediu de ore de curs frecventate de
studenii din anul > este diferit de numrul mediu de ore de curs
frecventate de studenii din anul <. 'ariabila de $rupare va fi n
acest caz anul
de studiu! n definirea $rupelor inând cont
de codificrile fcute pentru strile acesteia (
, % anul >! 8 % anul < ).
M * : 2 , D 2
8
M, : 2 , P 2
8
#orim s verificm dac numrul mediu de ore de curs frecventate de
studenii din anul > ( <!8AT< )! difer semnificativ de
!=<T> (numrul mediu de ore de curs
frecventate de studenii din anul < ). Construcia testului pentru
compararea mediilor a dou eantioane presupune testarea n
prealabil a e$alitii varianelor la nivelul celor dou $rupe.
5tatistica t se calculeaz diferit dup cum dispersiile
sunt e$ale sau nu la nivelul celor dou $rupe. Ca urmare! formulm
ipoteza nul i alternativa referitoare la e$alitatea dispersiilor:M
* : U 8
, D U 8
, P U 8
t(test /or quality o/ $eans
F ig. t d/
qual variances assumed
qual variances not assumed
!.))# !!.1)0 .0!" 1.#
Interpretare: probabilitatea de acceptare a ipotezei nule n
cazul e$alitii varianelor este de *!>*8 ( L *!*< )! varianele
la nivelul celor dou $rupe sunt e$ale. &entru a verifica
e$alitatea mediilor folosim statistica t corespunztoare cazului n
care dispersiile sunt e$ale. În acest caz! testul t este e$al cu
,!A<! cu ,=7 $rade de libertate i un nivel de semnificaie de
*!*<< ( 5i$.L *!*< )! ceea ce arat c nu se poate tra$e
concluzia c cele dou medii difer semnificativ.
I*.. Testarea le'turii dintre dou variabile % dorim s
verificm dac modificarea variabilei dependente V este rezultatul
influenei variabilei explicative W. &entru a
anul de studiu
* $ean td. +eviation
td. rror $ean
testa existena le$turii procedm astfel: #naly$e – Compare
*eans – ne .ay #nova. ;46'; este un procedeu de analiz a unei
variabile numerice sub influena unei variabile de $rupare care
prezint mai multe stri.
#e exemplu dorim s verificm dac exist le$tur ntre numrul de
ore de curs frecventate i media anual.
În meniul ptions avem posibilitatea selectrii $raficului
pentru a formula ipoteze cu privire la forma le$turii dintre
cele dou variabile.
Cu cât mediile $rupelor au valori mai diferite ntre ele! cu atât
variaia dintre $rupe este mai mare cu cât variaia n cadrul $rupelor
este mai mic! cu atât statistica 0 este mai mare (0 D media
varianei dintre $rupe
Xmedia varianei din cadrul $rupei ) i numrul orelor de curs
frecventate variaz mai mult n raport cu media anual. 5e formuleaz
ipoteza nul M * : 0 D *! adic dispersia dintre $rupe este nul
i deci $rupele nu sunt diferite ntre ele! adic media anual nu
influeneaz numrul orelor de curs frecventate de studeni. #eoarece
probabilitatea de a $rei când respin$em ipoteza este *!*,=Q
*!*<! rezult c ipoteza nul se respin$e! adic media influeneaz
frecvena la cursuri!. În cadrul fiecrui interval al mediei anului
precedent! studenii sunt relativ omo$eni din punct de vedere al
frecventrii cursurilor! media anului precedent fiind un criteriu
semnificativ de se$mentare.
um o/ quares
d/ $ean quare
Bithin :rou&s
177).!"8 1# 10.81)
d e c u
r s a
t i
/ r e c
v e n
t a t s
a &
t t r