13 Testul W,KS, MW

Post on 13-Aug-2015

21 views 1 download

Transcript of 13 Testul W,KS, MW

B. Teste de comparare a diferenţelor în cazul a două variabile.

În cercetarea de marketing sunt frecvente situaţiile când trebuie să analizăm legătura dintre două variabile care, evident, pot fi măsurate cu acelaşi tip de scală sau, fiecare, cu un alt tip de scală.

Dorim, efectiv, să aflăm dacă răspunsurile date de subiecţi la o întrebare, se corelează, sau se asociază cu răspunsurile date la o altă întrebare.

Testul 2

Testul face parte din categoria testelor neparametrice sau a testelor cu distribuţie liberă.

Distribuţia 2 are următoarele caracteristici

valoarea calculată a lui hi pătrat este întotdeauna pozitivă deoarece diferenţa dintre frecvenţele observate şi cele aşteptate se ridică la pătrat;

există o familie de distribuţii hi pătrat, membrii acesteia fiind diferenţiaţi în funcţie de numărul gradelor de libertate;

forma curbei 2 nu depinde de mărimea eşantionului ci de numărul gradelor de libertate;

distribuţia hi pătrat este pozitiv asimetrică. Cu cât numărul gradelor de libertate este mai mare cu atât mai mult curba distribuţiei hi pătrat se apropie de curba distribuţiei normale; spre exemplu, deja la 10 grade de libertate curba hi pătrat are forma unei curbe normale mai aplatizate.

Testul 2 se foloseşte pentru testarea semnificaţiei statistice a distribuţiei frecvenţelor, ca mărimi absolute sau procentuale, provenite de la două variabile măsurate cu scala nominală, având un număr dat de modalităţi, în cazul unui eşantion de mărime predeterminată.

Răspunsurile date de subiecţi trebuie să se afle într-un tabel de contingenţă.

Testarea ipotezei nule presupune compararea frecvenţelor observate, aşa cum rezultă ele din răspunsurile date de subiecţi, cu frecvenţele aşteptate, adică cu frecvenţele care au la bază o teorie despre distribuţia populaţiei, sau anumite proporţii pe care le presupunem conform ipotezei nule.

Testul 2 impune parcurgerea următoarelor etape: formularea ipotezei nule şi a ipotezei alternative;

ipoteza nulă presupune că între frecvenţele observate şi cele aşteptate nu există diferenţe semnificative. Ipoteza alternativă afirmă că există diferenţe semnificative între frecvenţele respective; H0 : Oij = Eij ; H1 : Oij ≠ Eij

stabilirea nivelului de semnificaţie ; dispunerea într-un tabel de contingenţă a

frecvenţelor observate;

calcularea frecvenţelor teoretice aşteptate presupunând că ipoteza nulă ar fi adevărată.

Frecvenţele aşteptate, notate cu Eij, se determină pornind de la frecvenţele observate astfel:

general total

j coloana totali linia total ijE

determinarea valorii 2calc.

unde: Oij = frecvenţa observată în celula ij

Eij = frecvenţa aşteptată în celula ij

r

i

c

j ij

ijijcalc E

EO

1 1

2

2

stabilirea regulii de decizie privind ipoteza nulă. Aceasta presupune compararea valorii 2calc. cu

valoarea teoretică 2; df din tabelul repartiţiei 2

având în vedere nivelul de semnificaţie ales şi numărul gradelor de libertate calculat astfel: (r-1)(c-1) unde r reprezintă numărul de rânduri iar c numărul de coloane.

Regula de decizie va fi:

se acceptă H0 dacă 2 calc. 2

; df

se respinge H0 şi se acceptă H1 dacă 2 calc. 2

; df

Testul 2 are anumite limite de aplicare şi anume:

dacă în tabelul de contingenţă sunt numai două celule, în ambele frecvenţele aşteptate trebuie să fie 5 sau mai mare decât 5 pentru ca testul să fie posibil şi corect;

pentru mai mult de două celule testul hi pătrat nu se poate aplica dacă mai mult de 20% din celulele care conţin frecvenţele aşteptate au frecvenţe mai mici decât valoarea 5.

Exemplu: TESTUL 2

Stabilirea ipotezelor : Ipoteza nulă presupune că între frecvenţele

observate şi cele aşteptate nu există diferenţe semnificative.

H0: Între aprecierile femeilor şi aprecierile bărbaţilor în ceea ce priveşte importanţa curăţeniei nu există diferenţe. H0 : Oij = Eij

H1 : Între aprecierile femeilor şi aprecierile bărbaţilor în ceea ce priveşte importanţa curăţeniei există diferenţe. H1 : Oij ≠ Eij

Testul 2 ( hi pătrat) analizat cu sistemul SPSS

stabilirea nivelului de semnificaţie =0.05

Testul 2 ( hi pătrat) analizat cu sistemul SPSS

Pasul 1. Pentru realizarea tabelelor de contingentă şi prezentarea frecvenţelor observate şi aşteptate.

Pasul 2. Pentru calcularea lui 2

Regula de decizie va fi:

se acceptă H0 dacă 2 calc. 2

; df

se respinge H0 şi se acceptă H1 dacă 2 calc. 2

; df

2 calc. =55.56

2; df = 3.84

2 calc. 2

; df , se respinge H0 şi se acceptă H1

Asymp.Sig.(2-sided) mai mic decât 0.05, se respinge H0 si se accepta H1.

Exista diferente semnificative intre apreciarile facute de femei si barbati.

Testul Kolmogorov – Smirnov

Testul Kolmogorov-Smirnov

este un test neparametric care se utilizează în cazul eşantioanelor independente când avem în vedere variabile ordinale ce au puţine modalităţi.

Se aplică fie cu scopul comparării răspunsurilor provenite de la două eşantioane independente de mărimi diferite, fie cu scopul comparării repartiţiei răspunsurilor observate cu o repartiţie definită a priori, în cazul a două eşantioane independente de aceeaşi mărime.

Dacă vom lua în considerare eşantioane independete de mărimi diferite

Se calculează frecvenţele relative cumulate F1(k) şi F2(k) unde k reprezintă o modalitate a variabilei ordinale.

Notăm cu n1 şi n2 mărimile celor două eşantioane.

Prin intermediul testului se urmăreşte să se verifice statistic dacă există diferenţe între repartiţiile celor două eşantioane.

Ipotezele statistice:

H0 : diferenţa maximă între cele două frecvenţe cumulate este zero;

H1 : diferenţa maximă între cele două frecvenţe cumulate este diferită de zero

Testul presupune identificarea unei diferenţe calculate, notată Dcalc. , ca diferenţă maximă, adică mărimea absolută cea mai mare dintre diferenţele frecvenţelor cumulate, aferente fiecărui nivel al variabilei ordinale cercetate.

Dcalc = max F1(k) – F2(k) k

Valorile Dcalc, pentru un test bilateral, se compară cu valoarea teoretică cuprisă în tabelul repartiţiei Kolmogorov – Smirnov, având în vedere un nivel de semnificaţie şi mărimea celor două eşantioane

Valorile teoretice pentru D în cazul a două eşantioane independente de mărimi diferite şi pentru = 0,05, se determină pe baza relaţiei:

21

21α nn

nn361D

,

se acceptă H0 dacă Dcalc Dcritic

se respinge H0 şi se acceptă H1 dacă Dcalc > Dcritic

Regula de decizie:

Un grup de studenţi a realizat o cercetare de marketing privind calitatea serviciilor oferite de Biblioteca Centrală. Ei au vrut să cunoască dacă există deosebiri de apreciere între studenţi şi studente. Cele două eşantioane au curpins 150 studente şi 100 studenţi. Scala ordinală are 5 valori iar nivelul de semnificaţie ales este de 0,05.

Exemplu:

Ipotezele cercetării:

H0: diferenţa maximă dintre frecvenţele relative, cumulate, pentru studenţi (F1) şi pentru studente (F2) este zero.

H1 : diferenţa maximă dintre frecvenţele cumulate studenţi - studente este diferită de zero.

Calcularea frecventelor

Pentru nivelul de semnificaţie ales α = 0,05 (test bilateral) valoarea teoretică a lui D, în cazul a două eşantioane independente de mărimi diferite (n1 şi n2 > 35) se calculează, pornind de la valorile critice D pentru testul Kolmogorov - Smirnov, pe baza relaţiei cunoscute:

0,175=100150

100+1501,36=D

diferenţa maximă dintre frecvenţele relative cumulate ale celor două populaţii este de 0,030.

Deoarece diferenţa maximă calculată

Dcalc. = 0,030 este mai mică decât valoarea teoretică, Dα = 0,175, nu putem respinge ipoteza nulă.

Acceptând ipoteza nulă rezultă că între aprecierile studenţilor şi cele ale studentelor, referitoare la calitatea serviciilor oferite de bibliotecă, nu există diferenţe semnificative.

Exemplul 2

Prelucrarea cu ajutorul sistemului SPSSPrelucrarea cu ajutorul sistemului SPSS

Dcalc se alege din valoarea absoluta cea mai mare

mai mare decat 0.05, de unde rezulta ca Ho se accepta

Testul Mann-Whitney (TESTUL U)

Se utilizeaza pentru compararea a doua grupuri. Variabila in raport cu care se testeaza este

masurata metric insa distributia nu este normala, ceea ce face ca media sa nu fie reprezentativa.

Ipotezele au in vedere: H0 : Nu exista diferente intre cele doua grupuri sub

aspectul variabilei analizate. H1 : Exista diferente intre cele doua grupuri sub

aspectul variabilei analizate.

Exemplu TESTUL MANN - WHITNEY (TESTUL U) :

R1= suma rangurilor pentru F

R2 = suma rangurilor pentru B

R

R

1 1 2 3 5 7 11 12 13 16 17 20 22 24 26 174

2 4 6 8 9 10 14 15 18 19 21 23 25 172

Se determină:

U n nn n

R

U n nn n

R

1 1 21 1

1

2 1 22 2

2

12 14 12 1415

2 174 99

12 14 12 1213

2 172 74

( )

( )

Valoarea observată a lui U :

Se va determina raportul critic:

74),min( 221 UUUUU obsobs

u

uobsu

UZ

-media distribuţiei U:

8421214

221

nn

96,1

514,044,198474

44,1937812)11412(1412

12)1(

2/

2121

z

z

nnnnu

u

-abaterea standard a distribuţiei U:

Regula de decizie:

Intre mediile provenite de la femei şi bărbaţi nu există diferenţă, mai precis ea este nesemnificativă.

1,96 Zu 1,96 se accepta H0

Zu 1,96 sau Zu 1,96 se respinge H0

deci,

Zu 0,514 1,96 se accepta H0

Prelucrarea cu ajutorul sistemului SPSS independent samples

mai mare decat 0.05, de unde rezulta ca Ho se accepta

Testul Wilcoxon (testul semnului şi al rangului)

Testul Wilcoxon se foloseşte pentru compararea mărimii diferenţelor dintre două ordonări care pot proveni de la două eşantioane dependente.

Se testează dacă două ordonări sau două variabile care se pot afla într-o legătură au aceeaşi distribuţie.

Nu există nici o informaţie cu privire la forma distribuţiei celor două variabile şi, ca atare, testul face parte din categoria testelor neparametrice.

Testul statistic este bazat pe rangurile pe care le primesc valorile absolute ale diferenţelor dintre cele două variabile.

Testul Wilcoxon se poate manifesta atât ca test bilateral cât şi unilateral.

Datele sunt măsurate fie cu o scală ordinală ce conduce la scoruri numerice, fie cu o scală interval care poate reda direct scorurile obţinute de fiecare persoană, înainte şi după realizarea experimentului.

Exemplu:Să presupunem că un

director de liceu doreşte să cunoască dacă un program special de pregătire a unui grup de elevi a avut un rezultat semnificativ pentru ca aceştia să poată participa la o olimpiadă internaţională. În tabelul următor sunt prezentate evaluările asupra nivelului pregătirii celor 11 elevi, înainte şi după programul special de pregătire.

1x 2x

Elev Scorul "înainte"

Scorul "după"

1 2 3 4 5 6 7 8 9 10 11

66 58 74 69 60 45 86 65 82 80 71

76 62 72 76 58 41 92 73 77 80 80

Stabilirea ipotezelor

Ipoteza nulă: H0 :

adică programul de pregătire nu a avut nici un impact asupra elevilor.

Ipoteza alternativă: H1:

adică programul de pregătire a avut un impact pozitiv.

21 xx

22 xx

Pornind de la scorurile realizate "înainte" şi "după" se calculează semnele şi diferenţele absolute dintre fiecare pereche de observări. Dacă două evaluări sunt identice, ele se exclud din analiză (elevul nr. 10).

Se face apoi o ordonare a diferenţelor în funcţie de mărimea lor absolută. Dacă sunt două sau mai multe perechi cu valori absolute egale ale diferenţelor, (elevii 3 şi 5) se determină un nivel mediu al scorului care exprimă ordinea (locul 1 + locul 2 = 3 : 2 = 1,5). La fel se procedează şi în cazul elevilor 2 şi 6.

În final, în funcţie de semnul + sau - al diferenţei se face repartizarea scorului ordonării (rangului obţinut) şi apoi se realizează totalul corespunzător valorilor pozitive şi celor negative. Tp simbolizează suma pozitivă iar Tn suma negativă.

Valoarea Tobs. va fi dată de cea mai mică valoare care poate fi, fie cea a lui Tp fie cea a lui Tn. În exemplul nostru, valoarea cea mai mică, 11,5, este cea a lui Tn. Deci, valoarea calculată sau observată a lui T este 11,5 (ca valoare negativă).

Regula de decizie: ipoteza nulă este respinsă dacă valoarea

calculată a lui T este egală sau mai mică decât valoarea critică a lui T care se găseşte într-un tabel special (valorile critice ale lui T în testul bilateral Wilcoxon având în vedere n, numărul de perechi, şi diferite nivele de semnificaţie).

dacă Tobs. ≤ Tα; n H0 se respinge

Tobs. > Tα; n H0 se acceptă

În cazul nostru, n =10 admitem un nivel de semnificaţie de 0,05,

T din tabel reprezintă valoarea 8.

Deoarece Tobs. = 11,5 > Ttabel = 8, se acceptă ipoteza nulă a inexistenţei unor diferenţe semnificative, adică pregătirea realizată nu a avut un impact semnificativ asupra grupului de elevi propuşi a merge la olimpiadă.

related