Modalitati de Analiza Bivariata -Variabilele Ordinale

5
20.2. Variabilele ordinale Măsurarea gradului de asociere între două variabile măsurate cu ajutorul scalelor ordinale este mai plină de semnificaţii deoarece, în afara relaţiei de echivalenţă presupusă de o scală nominală, tipul de scală ordinală permite şi ordonarea alternativelor cercetate pentru fiecare variabilă considerată. În cazul variabilelor de tip ordinal se poate face afirmaţia că acestea variază concomitent într-o anumită direcţie, care poate fi pozitivă (variaţia ambelor variabile se realizează în acelaşi sens) sau negativă (variaţia celor două variabile are loc în sensuri diferite). Relaţiile de asociere pot fi analizate sub forma relaţiilor dintre rangurile alternativelor considerate pentru cele două variabile, fie sub forma relaţiilor dintre variabilele de tip ordinal. Considerând prima modalitate de cercetare a variabilelor considerate, sub forma relaţiilor dintre ranguri , să considerăm următorul exemplu: 15 companii de turism – A, B, C, D, E, F, G, H, I, J, K, L, M, N, O – ocupă locurile 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 şi respectiv 15 în ceea ce priveşte profitabilitatea realizată la sfârşitul anului şi locurile 2, 4, 1, 5, 3, 7, 6, 9, 8, 11, 12, 10, 14, 15 şi respectiv 13 în ceea ce priveşte gradul de ocupare a locurilor de cazare. Pentru măsurarea gradului de asociere dintre rangurile deţinute de cele 15 companii în privinţa profitabilităţii, pe de o parte şi a gradului de ocupare a locurilor de cazare pe de altă parte, se poate utiliza coeficientul lui Spearman de corelaţie a rangurilor, . Formula de calcul a acestuia este următoarea: ) 1 ( 6 1 2 1 2 n n D n i i unde: - reprezintă coeficientul de corelaţie a rangurilor al lui Spearman; Di - diferenţa între cele două ranguri deţinute de compania i; n - mărimea eşantionului (numărul de companii).

description

curs

Transcript of Modalitati de Analiza Bivariata -Variabilele Ordinale

Page 1: Modalitati de Analiza Bivariata -Variabilele Ordinale

20.2. Variabilele ordinale

Măsurarea gradului de asociere între două variabile măsurate cu ajutorul scalelor ordinale este mai plină de semnificaţii deoarece, în afara relaţiei de echivalenţă presupusă de o scală nominală, tipul de scală ordinală permite şi ordonarea alternativelor cercetate pentru fiecare variabilă considerată. În cazul variabilelor de tip ordinal se poate face afirmaţia că acestea variază concomitent într-o anumită direcţie, care poate fi pozitivă (variaţia ambelor variabile se realizează în acelaşi sens) sau negativă (variaţia celor două variabile are loc în sensuri diferite).

Relaţiile de asociere pot fi analizate sub forma relaţiilor dintre rangurile alternativelor considerate pentru cele două variabile, fie sub forma relaţiilor dintre variabilele de tip ordinal.

Considerând prima modalitate de cercetare a variabilelor considerate, sub forma relaţiilor dintre ranguri, să considerăm următorul exemplu: 15 companii de turism – A, B, C, D, E, F, G, H, I, J, K, L, M, N, O – ocupă locurile 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 şi respectiv 15 în ceea ce priveşte profitabilitatea realizată la sfârşitul anului şi locurile 2, 4, 1, 5, 3, 7, 6, 9, 8, 11, 12, 10, 14, 15 şi respectiv 13 în ceea ce priveşte gradul de ocupare a locurilor de cazare.

Pentru măsurarea gradului de asociere dintre rangurile deţinute de cele 15 companii în privinţa profitabilităţii, pe de o parte şi a gradului de ocupare a locurilor de cazare pe de altă parte, se poate utiliza coeficientul lui Spearman de corelaţie a rangurilor, . Formula de calcul a acestuia este următoarea:

)1(

61

21

2

nn

Dn

ii

unde: - reprezintă coeficientul de corelaţie a rangurilor al lui Spearman;Di - diferenţa între cele două ranguri deţinute de compania i;n - mărimea eşantionului (numărul de companii).

Calculele necesare pentru aplicarea acestei formule sunt prezentate în tabelul nr.20.3.

Tabelul 20.3. Rangurile deţinute de cele 15 companii de turism cuprinse în eşantionul cercetat

Compania Rangul deţinut în ceea ce priveşte

DiProfitabilitatea Gradul de

ocupareA 1 2 1 1B 2 4 2 4C 3 1 2 4D 4 5 1 1E 5 3 2 4F 6 7 1 1G 7 6 1 1H 8 9 1 1I 9 8 1 1J 10 11 1 1

Page 2: Modalitati de Analiza Bivariata -Variabilele Ordinale

K 11 12 1 1L 12 10 2 4M 13 14 1 1N 14 15 1 1O 15 13 2 4

Folosind datele din tabelul nr. 20.3 rezultă că:

94,0)115(15

3061

2

Ştiut fiind faptul că poate lua valori între –1 (acesta indică o corelaţie inversă perfectă) şi +1 (corelaţie pozitivă perfectă), iar zero reprezintă lipsa totală de asociere dintre cele două variabile, în exemplul considerat se poate afirma că între cele două variabile, profitabilitatea companiilor de turism şi gradul de ocupare a locurilor de cazare, există o corelaţie directă şi foarte intensă.

Pentru a testa gradul de semnificaţie statistică a coeficientului de corelaţie obţinut (testul se poate realiza numai dacă n>10) se formulează ipoteza nulă

H0: pentru populaţia statistică cercetată ρ=0 şi ipoteza alternativă

H1: pentru populaţia statistică cercetată ρ≠0.

Dintr-un tabel statistic al repartiţiei normale, pentru un nivel de încredere de 0,99 (sau 0,94), valoarea coeficientului Z (coeficientul care corespunde probabilităţii cu care se garantează rezultatele) este de 2,58.

Pentru determinarea valorii calculate Zc se foloseşte următoarea formulă:

Ştiind că dacă - Zteoretic ≤ Zc ≤ Zteoretic, - se acceptă ipoteza nulă H0 ,iar în caz contrar se acceptă ipoteza alternativă H1, în exemplul considerat concluzia este că se acceptă H1, adică valoarea coeficientului de corelaţie a rangurilor în populaţia statistică cercetată diferă în mod semnificativ de zero.

Dacă se impune a doua modalitate de cercetare a relaţiilor de asociere, sub forma relaţiilor dintre variabilele de tip ordinal şi dacă în cercetarea relaţiilor dintre ranguri mai multe alternative sunt la egalitate, atunci se apelează la coeficientul γ al lui Goodman şi Kruskal.

Cu prilejul unei expoziţii culinare, să presupunem că se organizează şi degustarea de către un eşantion de 300 de persoane a unui preparat culinar dietetic, culegându-se informaţii privitoare la intenţiile acestora de a consuma în viitor preparatul respectiv (intenţiile sunt prezentate pe cinci niveluri, de la categoria 1 – sigur va cumpăra, la categoria 5 – sigur nu va cumpăra).

Pornind de la datele culese, se urmăreşte, printre altele, dacă există sau nu o corelaţie între intenţiile de cumpărare ale produsului culinar dietetic testat şi vârstă. Pentru realizarea acestui obiectiv, datele se organizează în tabelul următor:

Tabelul 20.4 Repartizarea intenţiilor de cumpărare în funcţie de vârstă

Page 3: Modalitati de Analiza Bivariata -Variabilele Ordinale

Categorie de vârstăIntenţiile de cumpărare

1 2 3 4 5

1 – (sub 20 ani)2 – (20 – 40 ani)3 – (40 – 50 ani)4 – (peste 50 ani)

5102035

10101525

15151520

2020105

252051

Chiar fără a calcula un coeficient care să sintetizeze gradul de asociere dintre cele două variabile, din simpla analiză a tabelului nr.20.4 rezultă că între intenţiile de cumpărare şi vârstă pare să fie o corelaţie inversă, în sensul că, cu cât persoanele avansează în vârstă, intenţiile de cumpărare a produsului culinar dietetic sunt mai pronunţate.

Calculul coeficientului γ al lui Goodman şi Kruskal se face folosind următoarea formulă:

unde: P şi Q sunt valori calculate, după cum se arată mai jos.Pentru a obţine valoarea lui P se începe prin a înmulţi frecvenţa din colţul din stânga-sus

cu suma frecvenţelor aflate mai jos cu un rând şi la dreapta; astfel:5 (10+15+20+20+15+15+10+5+25+20+5+1) = 805Apoi, procesul continuă în acelaşi mod, considerând frecvenţa de sus a celei de-a doua

coloane: deci 10 (15+20+20+15+10+5+20+5+1) = 1110.În continuare, se consideră frecvenţa de sus a coloanei a treia şi anume:15 (20+20+10+5+5+1) = 915În sfârşit, în cazul frecvenţei de sus a coloanei a patra rezultă:20 (20+5+1) = 520Mai departe, se consideră frecvenţele situate pe rândul doi şi trei, respectiv:10 (15+15+10+5+25+20+5+1) = 96010 (15+10+5+20+5+1) = 56015 (10+5+5+1) = 31520 (5+1) = 12020 (25+20+5+1) = 102015 (20+5+1) = 39015 (5+1) = 9010 (1) = 10

Însumând toate produsele obţinute mai sus se obţine P = 6815.Pentru calculul lui Q se procedează după aceeaşi regulă începându-se din colţul din

dreapta-sus şi mergând de la dreapta spre stânga. După efectuarea tuturor calculelor rezultă Q = 20800.

În aceste condiţii

Cunoscând că γ poate lua valori în intervalul –1 şi +1, ca şi în cazul lui ρ, în exemplul considerat se poate face afirmaţia că între intenţiile de cumpărare ale produsului culinar dietetic testat şi vârstă există o corelaţie inversă destul de intensă.

Page 4: Modalitati de Analiza Bivariata -Variabilele Ordinale