analiza legaturii

31
197 Obiectiv general: Analiza legăturii dintre diferitele caracteristici şi factorii care influenţează variabilitatea lor Obiective specifice: Dependenţa dintre fenomenele economice Regresia statistică Corelaţia statistică Asociaţia statistică

Transcript of analiza legaturii

Page 1: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

197

Obiectiv general: Analiza legăturii dintre diferitele caracteristici şi factorii care influenţează variabilitatea lor Obiective specifice: Dependenţa dintre fenomenele economice Regresia statistică Corelaţia statistică Asociaţia statistică

Page 2: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

199

6.1. Analiza repartiţiilor multidimensionale în statistica social – economică Statistica studiază fenomenele de masă în continua lor devenire în

strânsă corelaţie cu factorii care le determină. Fenomenele economice şi sociale sunt influenţate de o varietate de factori care pot fi esenţiali pentru evoluţia fenomenului sau pot avea doar o influenţă întâmplătoare.

În aceste condiţii utilizarea metodei corelaţiei în statistică este justificată de necesitatea reflectării într-o formă numerică a interdependenţei dintre diverse fenomene şi cauzele care le determină, stabilind natura, direcţia şi gradul de intensitate a legăturilor care se manifestă la un moment dat sau în dinamică.

Cum fenomenele economice nu sunt univoc determinate (de o singură cauză) problema care se pune în analiza fenomenelor de dependenţă este aceea a măsurării legăturii care există între caracteristica “X” – denumită caracteristică factorială sau independentă şi care exprimă sub formă cantitativă factorul (factorii) cauzal şi caracteristica “Y” – denumită şi caracteristica rezultativă sau dependentă care măsoară fenomenul studiat (efectul) şi exprimarea acestei legături sub forma unui indicator simplu sau sintetic de corelaţie.

Pentru ca rezultatele analizei cantitative să fie pertinente este necesar ca aceasta să fie precedată de o analiză calitativă, care să permită:

- desprinderea din ansamblul de legături existente între

fenomenele aceleiaşi colectivităţi statistice a acelora care au un caracter permanent şi care influenţează în mod obiectiv nivelul de dezvoltare a fenomenului studiat;

- colectivitatea în care se manifestă fenomenul să fie suficient de

numeroasă pentru ca să se poată manifesta legea numerelor mari. Dacă cerinţele legii numerelor mari nu sunt satisfăcute, indicatorii de corelaţie pot căpăta o interpretare eronată;

- identificarea şi ierarhizarea factorilor; atunci când fenomenul

este influenţat de mai mulţi factori este necesar să se asigure o ierarhizare a factorilor în funcţie de gradul lor de influenţă (de la mare la mic). În acelaşi timp este necesar să se stabilească dacă între factorii cauzali există sau nu legătură (autocorelare). Aceasta deoarece existenţa autocorelării influenţează în mod negativ corectitudinea indicatorilor.

Page 3: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

200

6.2. Clasificarea legăturilor dintre fenomenele economice şi sociale Legăturile între fenomenele economico-sociale pot fi clasificate după

mai multe criterii:

a) după natura relaţiei de cauzalitate avem:

- legături funcţionale – sau univoce – sunt acele legături care se stabilesc între un fenomen cauză şi un fenomen efect (apare cauza, apare şi efectul).

(x)fY = (6.1)

- legături stohastice – în care caracteristica fenomenul studiat este

determinat de influenţa mai multor factori cauzali (esenţiali sau întâmplători). În aceste condiţii fiecărei valori cauzale îi corespunde o distribuţie de valori a caracteristicii rezultative, datorită influenţei uneori contradictorii a unor factori aleatori.

)x ,x ,x ,(x f Y n321 ……= (6.2)

xi = caracteristicile factoriale

Legăturile stohastice sunt specifice fenomenelor economice.

Trebuie avut în vedere că legăturile de tip stohastic pot fi şi reciproce, adică efectul se transformă la rândul său în cauza imediată sau mediată prin intermediul unor relaţii de cauzalitate în lanţ.

În cazul legăturilor stohastice este necesar să se asigure o ierarhizare a factorilor.

Când analiza legăturii se face pe baza unor observări parţiale

(sondaje) este necesar să se verifice, în prealabil, gradul de reprezentativitate al colectivităţii de selecţie şi gradul de semnificaţie al indicatorilor de corelaţie calculaţi.

Exemplul 1 Creşte productivitatea muncii, creşte şi producţia, dacă numărul de muncitori

ămâne constant; cresc cheltuielile totale, scade profitul pentru acelaşi nivel al roducţiei;

Exemplul 2 Venitul salarial este funcţie de timp efectiv lucrat, de vechimea în muncă, de gradul de

îndemânare, etc.

Page 4: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

201

b) după numărul caracteristicilor:

- legături simple – sunt acele legături în care caracteristica rezultativă se studiază în funcţie de o singură caracteristică independentă considerată esenţială (principală), celelalte caracteristici factoriale fiind considerate constante (au o acţiune constantă în toate cazurile studiate).

Y= f (x)

- legături multiple – sunt acele legături care presupun analiza

caracteristicii rezultative în funcţie de mai mulţi factori de influenţă, concomitent cu analiza legăturilor simple dintre toate caracteristicile înregistrate.

Y= f (x1,x2,……….xn)

c) După conţinutul caracteristicilor incluse în analiza de

corelaţie:

- Asociaţia statistică – care exprimă relaţii între două sau mai multe caracteristici exprimate calitativ (taţi înalţi – copii înalţi, părinţi cu ochi albaştrii – copii cu ochi albaştri) sau dintre o caracteristică calitativă şi una numerică (nivelul veniturilor şi gradul de îndemânare).

- Corelaţia statistică – exprimă relaţia de interdependenţă dintre

două sau mai multe caracteristici statistice exprimate numeric (vechime - salariu, producţie - investiţii, etc.).

d) După direcţia de producere:

- Legătura directă – potrivit căreia caracteristica rezultativă se

modifică în acelaşi sens cu caracteristica factorială (creşte x ⇒ creşte y, scade x ⇒ scade y).

- Legătura inversă – caz în care caracteristica rezultativă se

modifică în sens invers faţă de modificarea caracteristicii factoriale (creşte x ⇒ scade y şi invers).

e) După natura legăturii: - Legătura lineară (rectilinie) – evoluţia având loc după ecuaţia

dreptei:

Page 5: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

202

- Legătura nelineară (curbilinie) – evoluţia având după ecuaţia unei funţii nelineare (exponenţiala, hiperbola, parabola, etc.)

f) După timpul în care se realizează: - Legături sincrone (concomitente) – sunt cele care pot fi

urmărite în dinamica pentru aceeaşi perioadă de timp. - Legături asincrone (cu decalaj) – sunt acele legături în care

caracteristicile factoriale acţionează asupra caracteristicii rezultative după scurgerea unei anumite perioade de timp (între volumul investiţiilor şi creşterea producţiei exista o perioadă de timp necesară punerii în funcţiune a respectivelor investiţii).

Pentru a se realiza analiza legăturii dintre fenomenele economico –

sociale trebuie soluţionate următoarele probleme: - identificarea şi ierarhizarea factorilor care determină în mod

obiectiv variaţia caracteristicii rezultative; - verificarea gradului de cuprindere a unităţilor înregistrate şi a

reprezentativităţii dacă datele provin dintr-o cercetare selectivă; - sistematizarea datelor observate; - verificarea existenţei şi formei de legătură dintre caracteristicile

corelate, în vederea alegerii corecte a funcţiei statistice – matematice care descrie cel mai corect legătura;

- calcularea indicatorilor de corelaţie în funcţie de procedeul ales

la punctul anterior şi de datele disponibile; - aplicarea testelor de semnificaţie a indicatorilor de corelaţie,

dacă datele provin dintr-o observare selectivă. 6.3. Metode de analiză

Metodele de analiză a corelaţiei pot fi:

- Metode simple – care permit determinare existenţei (nonexistenţei)

legăturii, direcţia în care ea se manifestă şi dau o imagine vizuală asupra intensităţii acesteia – metoda seriilor interdependente, metoda grafică, metoda grupărilor, tabelul de corelaţie

- Metode analitice de calcul – prin care se măsoară direcţia, forma şi

intensitatea legăturii şi care permit exprimarea raporturilor de

Page 6: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

203

interdependenţă dintre fenomene printr-un sistem de indicatori – ecuaţia de regresie, coeficienţi de corelaţie ai rangurilor, coeficienţii de asociere.

6.3.1. Metode simple a) Metoda seriilor interdependente – permite stabilirea existenţei şi

a direcţiei legăturii şi se foloseşte pentru analiza datelor provenite din diferite publicaţii, constituite sub forma de serii statistice.

Metoda presupune :

- se înscriu pe un şir valorile caracteristicii factoriale x, ordonate

strict crescător; - pe un şir paralel, se înscriu valorile lui y condiţionate de x; - compara vizual cele două serii de date, stabilind dacă exista

legătura şi direcţia acesteia. b) Metoda grupărilor Metoda grupărilor, folosită în analiza legăturilor dintre fenomene,

presupune alegerea unei caracteristici factoriale după care se face gruparea, urmând ca apoi să se centralizeze valorile celorlalte caracteristici factoriale sub forma unor distribuţii condiţionate sau a unor valori medii.

Metoda grupării permite sistematizarea datelor şi stabilirea într-o primă aproximaţie a existenţei legăturii. Caracteristica rezultativă poate să apară sub forma unor valori centralizate sau ca medie condiţionată. Pentru a putea fi folosite în calcule ulterioare, informaţiile sistematizate cu ajutorul metodei grupărilor trebuie ca:

- gruparea să se facă pe intervale egale; - numărul de intervale să coincidă atât pentru caracteristica

factorială cât şi pentru caracteristica rezultativă; - să se aleagă pentru efectuarea grupării doar acele caracteristici

care corespund unui raport obiectiv de interdependenţă (grupele şi intervalele de grupare trebuie să corespundă scopului analizei).

c) Metoda grafică – permite stabilirea pe cale vizuală dacă între

fenomenele supuse corelaţiei exista legături statistice şi dacă ele exista, care este sensul şi forma acestor legături.

Ea mai poate fi utilizată şi pentru prezentarea rezultatelor analizei de corelaţie. Metoda are la bază graficul denumit “nor de puncte”.

Page 7: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

204

Pentru aplicarea metodei se procedează astfel:

- într-un sistem de axe rectangulare xoy se reprezintă în cadranul I pe axa absciselor (ox) valorile caracteristicii factoriale (x) şi pe axa ordonatelor (oy) valorile caracteristicii rezultative (y). Pentru uşurării reprezentării originea (o) nu corespunde cu punctul 0 ci cu valorile minime ale celor două caracteristici;

- se reprezintă apoi cuplurile de valori (x,y) pentru toate unităţile colectivităţii obţinând norul de puncte. În funcţie de intensitatea şi de forma norului de puncte se stabileşte

dacă există sau nu legătura. Metoda grafică permite stabilirea existenţei şi direcţiei legăturii, dar

mai ales forma legăturii, fiind metoda care ne ajută în alegerea funcţiei analitice pentru aplicarea metodelor de determinare a celorlalţi indicatori de corelare.

Exemplificăm mai jos câteva posibilităţi:

y

xo

y

xo

Legătură liniară Legătură liniarădirectă inversă

y

xo

y

o xLipsă legătură Hiperbolă

Page 8: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

205

c) Procedeul tabelului de corelaţie Procedeul tabelului de corelaţie este o combinare a metodei grupării

cu reprezentarea grafică. Acest procedeu presupune gruparea unităţilor după ambele

caracteristici (factorială şi rezultativă). Pentru a nu denatura rezultatele la întocmirea tabelului de corelaţie trebuie să fie respectate următoarele reguli:

- pentru ambele caracteristici după care se face gruparea să se stabilească

un număr egal de grupare;

- pentru ambele caracteristici să se stabilească intervale egale de grupare;

- modul de înscriere al celor două caracteristici în tabel este următorul: - pe coloane se reprezintă caracteristica factorială în ordine

crescătoare; - pe rânduri se reprezintă caracteristica rezultativă în ordine

descrescătoare; - numărul unităţilor colectivităţii cercetate se vor trece în tabel la

intersecţia coloanelor cu rândurile tabelului. În acest caz interpretarea tabelului se face la fel cu interpretarea

graficului de corelaţie.

y y

o ox x

Lipsă legătură Exponenţială

Page 9: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

206

Tabelul de corelaţie rezultat arată astfel:

xy x1,x2, …………………xn fy

yn yn-1

: y2 y1

fn1, fn2, ………..……..fnn fn-1,1 : : :

f21 : f11, f12, ……….……..f1n

fyn : : :

fy1

fx fx1, fx2, ………………fxn Σf x1 < x2 < … < xn y1 < y2 < … < yn

Prima bisectoare (I) corespunde unei legături directe.

A doua bisectoare (II) corespunde unei legături inverse. 6.3.2. Metode analitice de măsurare a legăturilor statistice

Posibilitatea de aplicare a metodelor analitice de corelaţie, depind de natura fenomenelor cercetate, de numărul caracteristicilor factoriale etc. În funcţie de numărul factorilor ce influenţează variabila rezultativă (y) vom avea:

- regresie unifactorială (lineară sau nelineară)

Y = f(x) - regresie multifactorială

Y = f(x1, x2,…… xn) Pentru a evidenţia legea care descrie legătura statistică se folosesc

ecuaţiile de estimare corespunzătoare unei anumite funcţii analitice, funcţie cunoscută sub denumirea de “funcţie de regresie”.

Funcţia de regresie exprimă statistic modul în care caracteristica rezultativă (y) s-ar modifica dacă ar varia numai valorile caracteristicii factoriale (x), iar ceilalţi factori ar rămâne constanţi. Aceasta presupune că influenţa celorlalţi se consideră aceeaşi pentru toate unităţile colectivităţii.

Page 10: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

207

a. Regresia lineară simplă În cazul regresiei lineare simple, după trasarea graficului de corelaţie

se poate observa o tendinţă de legătură de tip liniar în care caracteristica rezultativă se modifică aproape uniform sub influenţa factorului ales drept caracteristică factorială.

Ecuaţia funcţiei de regresie este: bxa y += (6.3) Cei doi parametrii ai funcţiei a şi b au următoarea semnificaţie: - parametrul “a” de regulă nu are semnificaţie economică. Cu

toate acestea, deseori acest parametru este considerat a indica nivelul la care ar fi ajuns caracteristica “Y” sub influenţa factorilor cauzali, alţii decât cel ales drept caracteristică factorială;

- parametrul “b” – denumit şi coeficient de regresie – reprezintă

panta dreptei şi arată măsura în care se schimbă caracteristica rezultativă în cazul în care caracteristica factorială se modifică cu o unitate.

În funcţie de valorile pe care le ia parametrul “b” se poate stabili şi

direcţia legăturii astfel: Dacă

b > 0 ⇒ legătură directă (creşte x ⇒ creşte y) b < 0 ⇒ legătură inversă (creşte x ⇒ scade y) b = 0 ⇒ lipsă legătură (yx= a) ⇒caracteristica rezultativă nu este influenţată de caracteristica factorială x. Problema care se pune este de a determina valorile parametrilor a şi

b. Pentru aceasta se aplică “Metoda celor mai mici pătrate” (MCMMP). Potrivit acestei metode dacă factorul x este determinant pentru

variabila y, atunci valorile estimate – denumite şi valori teoretice – trebuie să dea abateri minime de la cele înregistrate.

Cum aceste abateri se pot produce într-un sens sau altul, compensându-se reciproc (acţiunea legii numerelor mari) ele vor fi ridicate la pătrat.

Altfel spus, dacă y depinde de x, urmând o funcţie lineară, atunci:

Page 11: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

208

( ) .minYyS 2xi

=−=∑ (6.4)

sau

( )[ ] minxbayS 2ii =+−=∑ (6.5)

Pentru a fi minimă suma S trebuie ca derivatele parţiale ale acesteia

în raport cu parametrii a şi b să fie zero.

( )[ ]( )

( )[ ][ ] 02

012

=−+−∑=∂∂

=−+−∑=∂∂

xxbaYbS

xbaYaS

ii

ii (6.6)

Rezultă sistemul de ecuaţii normale:

⎪⎩

⎪⎨⎧

∑=∑+∑

∑=∑+

i2ii

ii

yxbxa

yxbna (6.7)

Sistemul de ecuaţii normale mai poate fi obţinut şi astfel: - se scrie sub formă de ecuaţii fiecare yi; - se însumează valorile yI ⇒ prima ecuaţie;

Înmulţind fiecare ecuaţie cu xi şi însumând se obţine a doua ecuaţie.

Astfel vom avea:

y1 = a + bx1

y2 = a + bx2

:

yn = a + bxn

/

/

/

x1

x2

:

xn

y1x1 = ax1 + bx12

y2x2 = ax2 + bx22

:

ynxn = axn + bxn2

Σyi = na + b.Σxi Σxi.yi = a.Σxi + b.Σxi

2

⎪⎩

⎪⎨⎧

∑=∑+∑

∑=∑+

ii2ii

ii

yxxbxa

yxbna (6.8)

Rezolvând sistemul prin metoda determinanţilor rezultă parametrii a şi b.

Page 12: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

209

( )2i2i

iii2ii

2ii

i

2iii

ii

xxnxyxxy

xx

xnxyx

xy

a∑−∑

∑∑−∑∑=

∑∑

∑∑∑

∑∑

= (6.9)

( )2i2i

iiii

2ii

i

iii

i

xxnyxyxn

xx

xnyxx

yn

b∑−∑

∑∑−∑=

∑∑

∑∑∑

= (6.10)

Tabelul de calcul pentru determinarea parametrilor este următorul:

x y xiyi xi

2 yi = a + b.xi x1 :

xn

y1 : yn

x1y1 :

xnyn

x12

: xn

2

Σx Σy Σxiyi Σxi2

Pentru verificarea calculului parametrilor funcţiei de regresie se va

determina ΣYi care trebuie să fie egală cu ΣyI (suma valorilor empirice trebuie să fie egală cu suma valorilor calculate).

Aceasta înseamnă că prin ajustare nu se face altceva decât o redistribuire a influenţei factorilor.

Funcţia de regresie este însă numai o ipoteză statistică care exprimă regularitatea, tendinţa medie de manifestare a legăturii dintre cele două caracteristici, considerând ca variabil numai factorul înregistrat. Cum valorile caracteristicii dependente se formează sub influenţa tuturor factorilor acest lucru face ca între valorile empirice şi cele sistematice să existe diferenţe mai mari sau mai mici.

b. Regresia unifactorială curbilinie Există posibilitatea ca în urma reprezentărilor grafice să rezulte un

grafic care să indice că evoluţia caracteristicii rezultative este nelineară (parabolă, hiperbolă, semilogaritmică etc.). În acest caz, ecuaţia care descrie evoluţia fenomenului va fii alta decât funcţia lineară.

Page 13: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

210

Pentru parabola de gradul II funcţia care descrie legătura este:

2x cx bx a Y ++= (6.11)

Aplicând metoda celor mai mici pătrate vom avea:

( )[ ] .mincxbxaYS22

i =++−=∑ (6.12) Derivând în raport cu parametrii a, b, c şi egalând cu zero se obţine

sistemul de ecuaţii normale.

0cS0

bS0

aS

=∂∂

=∂∂

=∂∂

⎪⎪⎪

⎪⎪⎪

∑=∑+∑+∑

∑=∑+∑+∑

∑=∑+∑+

i2i

4i

3i

2i

ii3i

2ii

i2ii

yxxcxbxa

yxxcxbxa

yxcxbna

(6.13)

Tabelul de calcul utilizat este:

xi

yi xi2 xi

3 xi4 xiyi xi

2yi Yi = a + bxi + cxi2

x1

x2

:

xn

y1

y2

:

yn

x12

x22

:

xn2

x13

x23

:

xn3

x14

x24

:

xn4

x1y1

x2y2

:

xnyn

x12y1

x22y2

:

xn2yn

Σxi Σyi Σxi2 Σxi

3 Σxi4 Σxiyi Σxi

2yi Σyi

Page 14: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

211

6.4. Măsurarea intensităţii legăturii Măsurarea intensităţii legăturii se face utilizând o gamă diversă de

metode: - Metode parametrice - coeficientul de corelaţie lineară, raportul de

corelaţie simplu, raportul de corelaţie multiplă;

- Metode neparametrice - coeficientul de corelaţie al lui Spearman; coeficientul de corelaţie al lui Kendall; coeficientul de asociere şi tabelul de asociere.

6.4.1. Coeficientul de corelaţie lineară

În cazul corelaţiei lineare pentru măsurarea intensităţii legăturii se realizează coeficientul de corelaţie lineară şi raportul de corelaţie.

Coeficientul de corelaţie (r) este un indicator ce măsoară intensitatea legăturii de tip linear dintre caracteristicile x şi y şi se calculează ca o medie aritmetică a abaterilor normale ale celor două variabile.

yx

__

yxxy n

)yy)(xx()y,x.(covrττττ

−−∑== (6.14)

iar pentru distribuţie de frecvenţe:

yxxy

xy

__

yxxy f

f)yy)(xx()y,x.(covrττττ ∑

−−∑== . (6.15)

Dacă se înlocuieşte în relaţiile de mai sus xτ şi yτ cu formulele lor

se obţine:

])y(ny][)x(xn[

yxxynr2222xy

∑−∑−∑

∑∑−∑= (6.16)

sau pentru distribuţiile de frecvenţe:

])fyy.f][)fx(fx.f[

fy.fxfyx.fr

2yi

2ixy

2xix

2ixy

yixixyiixyxy

∑−∑∑∑−∑∑

∑∑−∑∑= (6.17)

Page 15: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

212

Coeficientul de corelaţie liniară simplă poate lua valori între -1 şi 1. Dacă ia valori între -1 şi 0 atunci între x şi y există o legătură inversă; dacă ia valori între 0 şi 1, legătura este directă, iar în cazul în care ia valoarea 0 indică lipsa legăturii.

În practică, se consideră că există următoarele limite de intensitate a legăturii:

- 0 < r < 0,2 - nu există nici un fel de legătură;

- 0,2 < r < 0,5 - legătura este slabă;

- 0,5 < r < 0,75 - legătura este medie;

- 0,75< r < 0,95 - legătura este puternică;

- 0,95< r < 1 - legătură deterministă.

Între coeficientul de corelaţie lineară ( xyr ) şi coeficientul de

regresie (b) există următoarele relaţii:

x

yrbττ

= (6.18)

sau

x

ybrττ

= . (6.19)

6.4.2. Raportul de corelaţie În cazul corelaţiei lineare se determină ,,raportul de corelaţie

lineară simplă”. Aceasta este un indicator care permite măsurarea gradului de intensitate a realizării legăturii dintre caracteristica considerată factor de influenţă şi caracteristica rezultativă. Calculul lui se bazează pe descompunerea dispersiei totale a caracteristicii ,,y” pe factori de influenţă.

În cazul utilizării ecuaţiilor de regresie avem două şiruri de abateri:

- yi - yx : abateri între valorile empirice şi valorile corespunzătoare funcţiei de regresie;

- yx- y : abateri între ecuaţia de regresie şi media caracteristicii empirice.

Page 16: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

213

Dacă vom nota cu τ 2y dispersia caracteristicii rezultative, cu τ 2

xy/y ,

dispersia faţă de linia de regresie şi cu τ 2x/xy dispersia liniei de regresie de

la valoarea medie a caracteristicii, folosind proprietatea de aditivitate a dispersiilor, rezultă:

τττ 2x/y

2y/y

2y xx

+= (6.20)

sau

n)yy(

n)yy(

n)yy( 2

_

x2

xi2

_

i −∑=

−∑=

−∑ (6.21)

unde:

- τ 2

y - arată influenţa variaţiei tuturor factorilor;

- τ 2xy/y - arată influenţa factorilor a căror acţiune este considerată

constantă în toate cazurile;

- τ 2x/xy - arată influenţa factorului ,,x”.

Dacă între caracteristicile ,,y” şi ,,x” există o legătură funcţională atunci τ 2

xy/y = 0. în realitate, o asemenea situaţie este exclusă la nivelul

fenomenelor de masă. Ea poate fi întâlnită cel mai mult la nivel de unitate simplă.

Pornind de la regula de adunare a dispersiilor, şi determinând coeficientul de determinare al factorului ,,x” ( 2

x/yR ) vom avea:

τ

τ2y

2x/xy2

x/yR = (6.22)

şi

τ

τ2y

2xy/y2

x/yK = (6.23)

Suma celor doi coeficienţi este egală cu 1:

Page 17: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

214

1KR 2x/y

2x/y =+ (6.24)

De aici rezultă că se poate determina coeficientul de determinaţie:

2

x/y2

x/y K1R −= (6.25)

sau

τ

τ2y

2xy/y1R2

x/y −= (6.26)

Pentru a se aduce la acelaşi grad cu valorile empirice, se extrage

rădăcina pătrată rezultând raportul de corelaţie ( xR ):

2_

i

2xi

n)yy(

n)yy(

2_

i

2xi

n)yy(

n)yy(

2y

x/yx/y

)yy(

)yy(11

)yy(

)yy(R

2_

i

2xi

2_

i

2xi

x

−∑

−∑−=−=

=

−∑

−∑===

−∑

−∑

−∑

−∑

τ

τ

(6.27)

Cu cât valoarea raportului de corelaţie este mai apropiată de 1, cu

atât legătura este mai intensă, iar cu cât se apropie de 0, cu atât legătura este mai puţin intensă.

Pentru a se stabili direcţia legăturii se va determina în funcţie de semnul coeficientului ,,b” din ecuaţia de regresie.

Dacă

b > 0 → legătură directă; b < 0 → legătură inversă; b = 0 → lipsă legătură . În cazul corelaţiei lineare valoarea raportului de corelaţie ( x/yR )

este egal cu valoarea coeficientului de corelaţie ( x/yr ).

Page 18: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

215

Cum în practică se studiază un număr foarte mare de cazuri, ele sunt grupate în serii de distribuţie. în acest caz, valoarea raportului de corelaţie x/yR devine:

y2

_i

xy2

xix/y

f)yy(

f)yy(1R

−∑

−∑−= (6.28)

6.5. Corelaţia multiplă în cazul distribuţiilor multidimensionale de formă liniară

Fenomenele sociale de masă sunt fenomene complexe care depind

de un număr mare de factori cauzali, uneori independenţi între ei. Ori tratarea pe baza ecuaţiilor de regresie unidimensionale reprezintă o puternică abstractizare. De aceea, în cazul fenomenelor de masă se consideră caracteristica rezultativă ca fiind factor de mai multe variabile:

y = f(x1,x2, ...,xn) unde

- xi sunt caracteristici factoriale care determină variaţia

caracteristicii rezultative. Dacă variaţia este lineară, atunci ecuaţia de regresie este:

y / x1 ,x2 , ..., xn = a0 + a1x1 + a2x2 + . . . + anxn, unde: - a1, a2 . . . an sunt coeficienţii de regresie care arată cu cât se

modifică ,y’ când xi se modifică cu o unitate; - a0 este un parametru care exprimă factorii neînregistraţi.

Sistemul de ecuaţii normale este:

⎪⎪

⎪⎪

∑=∑++∑+∑

∑=∑++∑+∑

∑=∑++∑+

n12nnn11n0

i1n1n21110

inn110

yxxa...xxaxa

...

yxxxa...xaxa

yxa...xana

(6.29)

Page 19: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

216

Pentru măsurarea gradului de intensitate a corelaţiei se foloseşte raportul de corelaţie multiplă:

2_

2nx...2x1x

nx...2x1x,y

)yy(

)yy(1R

−∑

−∑−= (6.30)

Raportul de corelaţie ia valori între (-1 şi 0) sau (0 şi +1). Cu cât

sunt luaţi în calcul mai mulţi factori, cu atât valoarea raportului de corelaţie se apropie de ±1.

Aplicaţia 1

Analizând modul cum evoluează profitul, în funcţie de volumul capitalului fix în funcţiune, în 10 societăţi comerciale care au activitatea principală producţia de bunuri de consum, s-au obţinut următoarele rezultate:

Capital fix în funcţiune

(mil. lei) Profit realizat (mil.lei)

510 660 420 680 650 960 260 390 600 1000 320 300 180 250 290 420 340 290 380 600

Se cere:

1. Stabiliţi şi măsuraţi intensitatea legăturii. 2. Estimaţi nivelul profitului pentru capital fix de 500 mil lei şi de 1000 mil lei.

1. În cazul celor două variabile capitalul fix în funcţiune reprezintă variabila cauzală, iar profitul realizat este variabila dependentă (rezultativă).

Metodele simple ce pot fi aplicate pentru verificarea legăturii şi sensul acesteia sunt:

a) Metoda seriilor paralele interdependente Pentru aplicarea metodei se ordonează perechile de date, în mod strict crescător după

valorile variabilei cauzale (x).

Capital fix în funcţiune (mil. lei)

Profit realizat (mil.lei)

180 250 260 390 290 420 320 300 340 290 380 600 420 680 510 660 600 1000 650 960

Page 20: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

217

Se observă că xi fiind ordonate crescător, valorile yi urmează aproximativ aceeaşi

tendinţă de creştere. Rezultă că există legătură, aceasta fiind o legătură directă. b) Metoda grafică Conform acestei metode se construieşte graficul funcţiei y = f(x)

0

200

400

600

800

1000

1200

180 260 290 320 340 380 420 510 600 650

capital

profit

Concluzii: - punctele de coordonate (xi,yi) se deplasează spre valori mai mari ale lui yi, odată cu

creşterea lui xi, deci există o legătură directă; - punctele, aşa cum rezultă din grafic, tind să se ordoneze în jurul unei drepte.

2. Graficul construit la punctul 1 sugerează că funcţia de regresie care descrie interdependenţa între capital fix şi profit este o funcţie lineară.

Regresie liniară: Valorile empirice ale variabilei yi sunt condiţionate de factorul x şi de factorii aleatori ε.

ε++= ii bxay Valorile funcţiei de regresie se determină pornind de la relaţia:

ii bxaY += Pentru determinarea parametrilor a şi b se va folosi metoda celor mai mici pătrate

(MCMP)

[ ] min)bxa(y 2ii =+−∑

Din această condiţie, diferenţiind în raport cu a şi b rezultă următorul sistem de ecuaţii:

⎪⎩

⎪⎨⎧

∑=∑+∑

∑=∑+

ii2ii

ii

yxxbxa

yxbna

Page 21: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

218

Parametrii a şi b se obţin prin rezolvarea sistemului de ecuaţii rezultat.

.)x(xn

yxxy

xxxnxyxxy

a 2i

2i

ii2ii

2ii

i

2iii

ii

∑−∑

∑−∑∑=

∑∑∑∑∑

∑∑

=

.)x(xn

yxyxn

xxxn

yxxyn

b2

i2i

iiii

2ii

i

iii

i

∑−∑

∑−∑=

∑∑

∑∑∑

=

Calculul este organizat în tabelul următor. xi yi x2

i xiyi y2i

1 2 3 4 7 180 250 32400 45000 62500 260 390 67600 101400 152100 290 420 84100 121800 176400 320 300 102400 96000 90000 340 290 115600 98600 84100 380 600 144400 228000 360000 420 680 176400 285600 462400 510 660 260100 336500 435600 600 1000 360000 600000 1000000 650 960 422500 624500 921600

3950 5550 1765500 2537000 3744700

∑ ix ∑ iy ∑ 2ix ∑ ii yx ∑ 2y

46,1082052500222625000

395039501765500102537000395017655005550

a −=−

=⋅−⋅⋅−⋅

=

68,120525003447500

3950395017655001055503950253700010b ==⋅−⋅⋅−⋅

=

Funcţia de regresie este: Yx = a + bxi = -108,46+1,68xi Înlocuind în funcţia de regresie valorile lui xi se vor obţine valorile teoretice (calculate)

ale lui yi (Yx), care sunt prezentate în tabel coloana 1.

Page 22: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

219

Yx (yi-Yx)2 2

i )yy( − 1 2 3

193,94 3142,72 93025

328,34 3801,95 27225 378,74 1702,39 18225 429,14 16677,14 65025 462,74 29839,11 70225 529,94 4908,4 2025 597,14 6865,77 15625 798,34 7803,96 11025 899,54 10092,21 198025 983,54 554,13 164025 5601,4 85387,79 664450

∑ xY 2xi )Yy( −∑ ∑ − 2)yy(

Cei doi parametrii ai funcţiei se interpretează astfel:

a = -108,46 nu are interpretare economică; b = 1,68 reprezintă panta dreptei şi indică faptul că, atunci când fondurile fixe cresc cu

1 milion de lei, profitul creşte cu 1,68 milioane lei.

3. Pentru a stabilii proporţia în care mărimea profitului este determinată de valoarea

fondurilor fixe în funcţiune, trebuie să se calculeze intensitatea legăturii, măsurată prin coeficientul de corelaţie (ry/x) şi prin raportul de corelaţie (Ry/x). Atunci când ry/x= Ry/x, legătura este lineară.

a) Coeficientul de corelaţie lineară (ry/x)

9335,008,3692944

344750066445002052500

3447500

)55505550374470010)(39503950176550010(55503950253700010

])y(yn][)x(xn[

yxyxnyxn)xx(

yx)y,x(cov

r2222

ix/y

==⋅

=

=⋅−⋅⋅−⋅

⋅−⋅=

=∑−∑∑−∑

∑∑−∑=−∑==σσσσ

Concluzie: legătura este directă (r>0) şi puternică (intensă) (r=0,9335).

b) Raportul de corelaţie (Ry/x).

9335,08712,01288,01664450

79,853871)yy()yy(1R 2

i

2xi

x/y ==−=−=−∑

−∑−=

Deoarece ry/x=0,9335 şi Ry/x=0,9335 se poate spune că legătura există, este lineară,

directă şi intensă.

Page 23: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

220

6.6. Metode neparametrice de măsurare a intensităţii legăturilor dintre fenomene

Metodele neparametrice de măsurare a legăturii dintre fenomene

sunt utilizate atunci când distribuţia caracteristicilor nu este normală sau când caracteristicile studiate sunt exprimate cantitativ (caracteristici calitative).

Cu ajutorul acestor metode se poate determina existenţa, direcţia şi intensitatea legăturii, făcând abstracţie de tipul de distribuţie, precum şi pentru caracteristicile calitative.

Dintre cele mai utilizate metode neparametrice enumerăm: coeficientul de asociere al lui Yule şi coeficienţii de corelaţie a rangurilor a lui Spearman şi Kendall.

6.6.1. Tabelul de asociere şi coeficientul de asociere O primă metodă neparametrică de măsurare a legăturii, utilizată

când caracteristicile sunt separate în două grupe sau sunt de forma unor caracteristici alternative, îl reprezintă coeficientul de asociere determinat pe baza tabelului de asociere.

Tabelul de asociere este format din două coloane şi două rânduri: y x

y1 y2 Total

x1 a b a+b x2 c d c+d

Total a+c b+d a+b+c+d Coeficientul de asociere al lui Yule este:

bcadbcadQ +

−= (6.31)

4. Pentru a determina nivelul profitului pentru cele două valori date ale capitalului fix în

funcţiune nu avem decât să înlocuim în funcţia de regresie cele două valori ale lui xi. Pentru xi = 500 milioane

Yxi = -108,46 + 1,68 ⋅ 500 = 731,54 mil. lei

Pentru xi = 1000 milioane

Yxi = - 108,46 + 1,68 ⋅ 1000 = 1571,54 mi. lei.

Page 24: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

221

Atunci când se aplică coeficientul de asociere pot apărea următoarele

situaţii:

a) asociere completă când avem următoarele variante:

d0ba

saud00a

- asociere completă pozitivă (coeficientul de

asociere Q=1);

dcb0

sau0cb0

asociere completă negativă (coeficientul de

asociere Q=-1).

b) independenţă totală:

db

ca = ⇒

0Q0cbad =⇒=− .

c) grad de asociere cuprins între 0 şi ±1:

db

ca ≠ 0cbad ≠−⇒ .

Q arată gradul de asociere şi direcţia. 6.6.2. Coeficientul de corelaţie a rangurilor

Aceşti coeficienţi reprezintă cazuri particulare de măsurare a

legăturii, întrucât ei sunt calculaţi pe baza numărului de ordine (rang) al caracteristicilor. Ei sunt utilizaţi şi în cadrul unor distribuţii asimetrice sau

Exemplul 3 Situaţia notelor la disciplina economie politică la o gruupă de studenţi a fost:

Nota absenţi

sub 7 peste 7 Total

sub 10 2 9 1 peste 10 8 1 9

Total 10 10 20

7670

89228912Q −== ⋅+⋅⋅−⋅ 921,0Q −=

Rezultă o legătură inversă şi puternică.

Page 25: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

222

în cazul unui număr restrâns de unităţi pentru care nu se poate verifica reprezentativitatea datelor, sau în cazul distribuţiilor unor unităţi complexe.

Pentru calcularea lor se procedează în felul următor:

- se ordonează crescător valorile, caracteristicile factoriale (x);

- se trec în dreptul lor rangurile pentru caracteristica rezultativă (y);

- se calculează diferenţa: (di) dI = rang(xi) - rang(yi);

- se determină di2

- se calculează coeficientul de corelaţie al rangurilor al lui Spearman:

)1n(ndi61r 2

2S

∑−= (6.32)

- se calculează suma S = P - Q pentru caracteristica rezultativă ,y’, unde

P → numărul de ranguri superior fiecărui rang luat în discuţie;

Q → numărul de ranguri inferior fiecărui rang luat în discuţie;

S → suma P-Q reprezintă toate acele ranguri care nu sunt în concordanţă.

- se calculează coeficientul de corelaţie al rangurilor al lui Kendall:

)1n(nSr

21K

−= (6.33)

Coeficientul de corelaţie al rangurilor al lui Kendall ia valori între -1

şi 1 şi este de regulă mai mare decât cel al lui Spearman.

Page 26: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

223

Exemplul 4 In vederea studierii legăturii între dezvoltarea economică a unei ţări, exprimată prin

produsul intern brut pe cap de locuitor, şi numărul persoanelor care folosesc INTERNET-ul se analizează următoarea serie de date:

Ţara PIB/loc Utilizatori INTERNET

Rang x

Rang y

d 2d P Q P-Q

Bulgaria 2,1 81 1 1 0 0 11 0 11 România 2,2 83 2 2 0 0 10 0 10 Polonia 5,3 230 3 5 -2 4 7 2 5 Grecia 12,9 155 4 3 1 1 8 0 8 Spania 17,2 156 5 4 1 1 7 0 7 Italia 22,0 352 6 9 -3 9 3 3 0 Franţa 24,9 314 7 6 1 1 5 0 5 Belgia 25,3 328 8 7 1 1 3 0 3 Germania 25,5 412 9 11 -2 4 1 2 -1 Austria 27,4 409 10 10 0 0 1 1 0 Danemarca 34,1 513 11 12 -1 1 0 1 -1 Elveţia 40 351 12 8 4 16 0 0 0 Total 0 38 x x 47

Se cere să se stabilească daca între cei doi indicatori există legătură şi care este intensitatea acesteia.

Rezolvare

( ) 86,011212

3861)1n(n

di61r22

2

S =−

⋅−=

∑−=

Rezultă ca intre produsul intern brut pe cap de locuitor şi numărul persoanelor care

folosesc INTERNET-ul există o legătură directă puternică.

( )72,0

1121221

47)1n(n

Sr21K =

−⋅=

−=

Şi coeficientul de corelaţie a rangurilor al lui Kendall confirmă legatura puternică şi

directă

Page 27: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

224

Termeni cheie

caracteristică factorială metode parametrice de studiere a legaturii

caracteristică rezultativă regresie legătură stohastică regresie unifactorială legătură funcţională regresie multifactorială legatură simplă regresie lineară legătură multiplă regresie nelineară legătură directă coeficient de regresie legătură inversă corelaţia legătură sincronă simplă legătură asincronă multiplă

asociere statistică coeficient de corelaţie lineară corelaţie raport de corelaţie metoda seriilor interdependente coeficient de corelaţie multiplă metoda grafică metode neparametrice de studiere a

legăturii metoda grupării coeficientul de asociere a lui Yule metoda tabelului de corelaţie coeficient de corelaţie a rangurilor

Spearman metode simple de determinare a legăturii

coeficient de corelaţie a rangurilor Kendall

Întrebări recapitulative

1. Ce presupune analiza legăturii dintre fenomenele economico-sociale?

2. Exemplificaţi tipuri de caracteristici factoriale şi caracteristici dependente.

3. Ce tipuri de legături cunoaşteţi?

4. Pentru determinarea existenţei legăturii, ce metode pot fi folosite?

Page 28: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

225

5. Care sunt indicatorii ce măsoară intensitatea legăturii?

6. În ce constă metoda celor mai mici pătrate? 7. Care este deosebirea fundamentală între metodele parametrice şi

metodele neparametrice de analiză a legăturii?

8. Pentru determinarea existenţei legăturii dintre două caracteristici, se utilizează:

a) compararea mediilor b) coeficientul de asimetrie c) coeficientul de corelaţie

9. Pentru măsurarea intensităţii unei legături nelineare dintre două

variabile, se utilizează: a) coeficientul de corelaţie lineară b) raportul de corelaţie c) coeficientul de asociere.

10. Ce particularitate a termenilor , în cazul unei legături multiple,

influenţează în mod negativ rezultatul calculelor? a) asocierea b) corelaţia c) autocorelarea.

11. Pentru măsurarea legăturii între două caracteristici alternative se

utilizează: a) coeficientul de asociere. b) raportul de corelaţie c) coeficientul de corelaţie lineară

12. Metoda grafică de analiză a legăturii permite stabilirea:

a) existenţei şi intensităţii legăturii b) existenţei si formei legăturii c) intensităţii legăturii

Page 29: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

226

Probleme propuse pentru rezolvare 1. Analizând modul cum evoluează profitul, în funcţie de volumul

capitalului fix în funcţiune, în 10 societăţi comerciale care au activitatea principală producţia de bunuri de consum, s-au obţinut următoarele rezultate:

Capital fix în funcţiune

(mil. lei) Profit net realizat

(mil. lei) 320 30 500 65 170 25 420 70 290 43 650 95 350 30 250 32 380 60 600 95

Se cere:

Stabiliţi prin metode simple dacă există legătură între cele două fenomene şi care este direcţia acesteia.

Alegeţi funcţia de regresie care descrie interdependenţa şi calculaţi valorile pentru variabila profit.

Măsuraţi intensitatea legăturii.

Stabiliţi proporţia în care mărimea profitului a fost determinată de

nivelul capitalului.

Estimaţi nivelul profitului pentru capital fix de 500 mil lei şi de 1000 mil lei.

Page 30: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

227

2. În vederea cunoaşterii legăturii ce există între cantitatea de îngrăşăminte (substanţa activă) şi producţia la hectar, s-au înregistrat datele:

Cantitatea de îngrăşăminte

la ha (zeci kg) Producţia obţinută

(q/ha) 1,5 25 2,3 38 4,5 32

6 35 7,5 38

8 36 10 40

10,5 42 11 39 12 15

Se cere:

a) Să se reprezinte grafic valorile celor două variabile.

b) Să se estimeze parametrii funcţiei de regresie şi să se calculeze valorile ajustate ale variabilei rezultative (recolta la hectar);

c) Să se caracterizeze intensitatea legăturii dintre cele două

variabile. 3. În urma efectuării unui studiu de piaţă referitor la dotarea cu

bunuri de folosinţă îndelungată (telefon mobil) s-au obţinut următoarele rezultate:

Mediul din care

provin Sexul Dotarea cu

telefoane mobile urban rural Masculin feminin

Total

Posedă telefon

187 59 136 110 246

Nu posedă telefon

58 146 90 114 204

Total 245 205 226 224 450 Să se stabilească dacă există legătură între faptul dotarea populaţiei

cu telefoane mobile şi mediul din care acestea provin sau sexul persoanei.

Page 31: analiza legaturii

Cap. 6. ANALIZA LEGĂTURII DINTRE FENOMENELE ECONOMICE

228

4. În vederea studierii legăturii între dezvoltarea economică a unei

ţări, exprimată prin produsul intern brut pe cap de locuitor şi rata mortalităţii infantile se analizează următoarea serie de date:

Ţara PIB/loc Mortalitate infantilă

Bulgaria 2,1 81 România 2,2 83 Polonia 5,3 230 Grecia 12,9 155 Spania 17,2 156 Italia 22,0 352 Franţa 24,9 314 Belgia 25,3 328 Germania 25,5 412 Austria 27,4 409 Danemarca 34,1 513 Elveţia 40 351

Se cere să se stabilească daca între cei doi indicatori există legătură

şi care este intensitatea acesteia.