Analiza bivariată
Analiza bivariată
Constă în studierea datelor şi în testarea ipotezelor când cercetarea are în vedere investigarea simultană a relaţiilor dintre două variabile.
Cea mai simplă metodă de analiză o constituie tabelarea încrucişată (prin tabelele de contingenţă).
Realizarea tabelelor de contingentă în SPSS
Selectarea variabilelor pentru realizarea tabelelor de contingenţă
Pentru realizarea unor prezentări grafice
Pentru realizarea unor teste statistice
Pentru realizarea tabelelor de contingenta
Setarea tipului de frecvenţă
Frecvente absolute
Analiza bivariată
Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.
Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.
Au ca obiect cunoaşterea deosebirilor, deci a diferenţelor de atitudine, de comportament, de caracteristici, dintre indivizii care compun două grupuri care pot fi independente sau perechi(dependente).
Testul unei diferenţe reprezintă o cercetare a ipotezei care indică că două sau mai multe grupuri diferă sub aspectul mărimii unei variabile exprimată ca medie sau ca procent.
A. Teste de comparare a diferenţelor dintre două populaţii (grupuri)
Testul z şi testul t de comparare a mediilor provenite de la două eşantioane independente
Se are în vedere cunoaşterea semnificaţiei statistice a diferenţei existente între cele două medii, în cazul unei variabile măsurate metric.
Eşantioanele la nivelul cărora se calculează cele două medii pot fi:
de dimensiuni mari (>30), situaţie în care luăm în considerare distribuţia z
de dimensiuni mici (≤ 30) când trebuie să apelăm la distribuţia t
Situaţia 1: cele două eşantioane sunt de dimensiuni mari, respectiv n1 şi n2 > 30 iar varianţele populaţiilor sunt
cunoscute şi nu diferă semnificativ între ele. Se formulează ipoteza nulă şi se optează pentru
una din cele trei forme ale ipotezei alternative. Ipoteza nulă arată că între cele două medii
provenite de la cele două populaţii independente nu există nici o diferenţă; deci, populaţiile sunt identice din punct de vedere statistic având în vedere parametrul medie pentru variabila cercetată:
H0 : μ1 = μ2H1 : μ1 ≠ μ2H1 : μ1 > μ2H1 : μ1 < μ2
Se determină raportul critic:
Unde: reprezintă valorile medii ale primului şi
ale celui de al doilea eşantion abaterea standard comună a
diferenţelor mediilor.
2121
212121.xxxx
xxxxCR
deoarece μ1 - μ2 = 0 când H0 este adevărată
21 şi xx
21 xx
Dacă abaterile standard σ1 şi σ2 sunt cunoscute iar n1 şi n2 arată mărimea celor două eşantioane, ambele mai mari ca 30, atunci:
2
22
1
21
21 nnxx
Dacă abaterile standard nu sunt cunoscute, atunci abaterea standard a diferenţelor mediilor se aproximează prin:
1n
s
1n
sσ
2
2
2
1
2
1
2x1x
ˆ
Unde:
s1 şi s2 sunt abaterile standard calculate pe baza primului şi respectiv, celui de al doilea eşantion;
Regula de decizie
Dacă optăm pentru un nivel de semnificaţie α = 0,05 şi pentru un test bilateral, atunci valorile z care vor delimita regiunea de acceptare-respingere a ipotezei nule vor fi –1,96 şi +1,96.
se acceptă H0 dacă valoarea raportului critic se va situa între –1,96 şi +1,96 inclusiv;
se repige H0 dacă RC < -1,96 sau dacă RC > 1,96.
Dacă cele două eşantioane independente sunt de dimensiuni reduse (n1 ≤ 30 , n2 ≤30) se va folosi distribuţia t
Situatia 1: în ipoteza că cele două eşantioane provin de la populaţii repartizate normal
şi în ipoteza că varianţele celor două populaţii sunt egale.
21
21
xxobs
xxt
21
11ˆ
21 nnScxx
2
11
21
22
212
1
nn
nsnsSc
Unde:
În acest caz variabila definită mai sus urmează o repartiţie Student cu:
Raportul critic va fi:
d.f.= n1 + n2 - 2
Regula de decizie va fi:
se respinge ipoteza nulă dacă tobs > tα; df din tabelul distribuţiei t;
se acceptă ipoteza nulă dacă tobs ≤ tα; df
Situatia 2: Dacă cele două populaţii au varianţe diferite În acest caz abaterea standard a diferenţelor mediilor se va aproxima:
2
22
1
21
2x1x n
s
n
sδ
ˆ
1n
r1
1n
r
1
2
2
1
2
2
22
1
21
1
21
n
s
n
s
n
s
r
d.f.=
Numărul gradelor de libertate se va determina astfel:
21
21
xxobs
xxt
Raportul critic va fi:
Abaterea standard a diferenţelor mediilor se va aproxima:
TESTUL z DE COMPARARE A MEDIILOR A DOUĂ EŞANTIOANE INDEPENDENTEexemplu
Din două grupe de studenţi ai aceleiaşi specializări s-au constituit două eşantioane reduse (n1 = 6 şi n2 = 7) studenţii respectivi indicând în ore cât timp alocă fiecare în parte pentru studiul individual într-o săptămână normală de şcoală (nu în preajma sau în timpul sesiunii). Se doreşte a se cunoaşte dacă între studenţii celor două grupe se manifestă diferenţe semnificative în privinţa variabilei cercetate.
Prelucrarea cu SPSS Exemplul 1
Stabilirea ipotezelor
Nivelul de semnificaţie este de 0,05.
H0 : μ1 = μ2
media timpului alocat studiului individual de către studenţii primei grupe este egală cu cea a studenţilor din a doua grupă
H1 : μ1 ≠ μ 2
cele două medii nu sunt egale
Datele primare obţinute sunt următoarele (în ore):grupa 1 : 7; 9; 6; 11; 5; 8.grupa 2 : 10; 8; 7; 6; 9; 12; 9.
Se constată că media săptămânală a timpului individual de studiu este 7,7 ore la prima grupă şi 8,7 ore la a doua grupă.
Testul F ne indică faptul că varianţele la nivelul celor două grupe sunt egale deoarece nivelul de semnificaţie indicat (0,767) este mai mare decât nivelul de semnificaţie avut în vedere (0,05) şi, ca urmare, trebuie să acceptăm ipoteza nulă a varianţelor egale. În acest context testul t va avea valabilitate.
valorile t calculat sunt: –0,913 în condiţiile în care se presupune existenţa
varianţelor egale şi –0,906 în condiţiile în care se presupune inegalitatea
varianţelor.
Valoarea critică a lui t la nivelul de semnificaţie de 0,05 şi la 11 grade de libertate este ± 2,201
O alta posibilitate de a lua deciza
0,381, este mai mare decât nivelul de semificaţie α = 0,05, atunci se acceptă ipoteza nulă.
Dacă este mai mic, ipoteza nulă se respinge.
Prelucrarea cu SPSS Exemplu
Există diferenţe între bărbaţi şi femei în ceea ce priveşte aprecierea modului in care in prezent se realizeaza curatenia în oraş?
ipotezele sunt: H0 : μ1 = μ2 H1 : μ1 ≠ μ 2
SPSS-ul realizează totdeauna testul T (Student)
Sig.(2-tailed) mai mic decât 0.05, se respinge H0 si se accepta H1.
Exista diferente semnificative intre apreciarile facute de femei si barbati.
Testarea diferenţelor dintre medii în cazul eşantioanelor perechi.
Realizarea testului presupune:1. formularea ipotezei nule care arată
inexistenţa unei diferenţe între medii înainte de un anumit eveniment şi cele obţinute după :
H0 : µ1 = μ2 H1 : μ 1 ≠ μ2 ;
2. stabilirea diferenţei di dintre cele două scoruri corespunzătoare fiecărui cuplu de observări din cele n existente;
3. calculul mediei şi a dispersiei diferenţelor:
4. determinarea abaterii standard a
diferenţelor, sd , ca radical din dispersie;
n
dd
n
ii
1
1
1
2
2
n
dds
n
ii
d
calculul raportului critic pe baza relaţiei:
n
sd
n
sd
RCdd
21
deoarece μ1 - μ2 = 0 când H0 este adevărată
stabilirea regulii de decizie privind ipoteza nulă:
se acceptă ipoteza nulă dacă valoarea raportului critic determinată în contextul distribuţiei z sau t este mai mică decât valoarea teoretică din tabelul distribuţiei respective;
se respinge ipoteza nulă dacă valoarea RC este mai mare.
Exemplu:
In cazul unei firme se organizează un curs de perfecţionare pentru un număr de 16 persoane. Persoanele sunt supuse unui test înainte şi după curs. Rezultatele sunt următoarele:
n
dd
n
ii
1
1
1
2
2
n
dds
n
ii
d =234/15=15,6
sd=3,95
n
sd
n
sd
RCdd
21 =-2/3.95/4=-2,025
Tc=-2,131
RC>=Tc, se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare
Prelucrarea cu SPSS
Sig. >0,05
se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare
Testarea diferenţelor dintre două procente
a)stabilirea ipotezei nule şi a uneia din ipotezele alternative posibile:
H0 : 1 = 2
H1 : 1 ≠ 2
H1 : 1 > 2
H1 : 1 < 2
determinarea raportului critic:
2121
212121
pppp
ppppRC
unde: p1 = procentul din eşantionul grupului 1
p2 = procentul din eşantionul grupului 2
π1-π2 = procentul presupus al populaţiei 1 minus procentul presupus al
populaţiei 2
21 pp = abaterea standard a diferenţelor dintre procente
21
2121
11ˆ
nnqpSσ
pppp
Pentru a calcula estimatorul comun se foloseşte relaţia:
21
2211
nn
pnpnp
Regula de decizie: dacă se merge pe un test bilateral, în
condiţiile distribuţiei z, ipoteza nulă se va accepta dacă valoarea raportului critic se va încadra între limita pozitivă şi cea negativă a valorilor teoretice ale lui z în funcţie de nivelul de semnificaţie ales. Ipoteza nulă se va respinge dacă valoarea raportului critic va fi mai mică decât limita negativă sau mai mare decât limita pozitivă a valorilor critice z.
Exemplu
Top Related