Statistic a Curs 7

7
TEMA 4 TEMA 4 ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE FENOMENE FENOMENE Curs 7 4.1. Tipuri de legături între fenomenele reale 4.2. Metode şi procedee de stabilire a existenţei şi formei corelaţiei simple 4.3. Metoda regresiei 4.4. Metoda corelaţiei 4.5. Metode neparametrice pentru măsurarea corelaţiilor 4.1. TIPURI DE LEGĂTURI ÎNTRE FENOMENELE REALE Între fenomenele şi procesele reale se identifică diferite forme de influenţe reciproce, dintre care cea mai mare parte se manifestă ca legături de cauzalitate, bazate pe relaţia cauză- efect. Se deosebesc următoarele tipuri de legături: a) După natura relaţiei de cauzalitate: - Legături funcţionale: legături ce se întâlnesc foarte rar şi se manifestă atunci când fenomenul efect este influenţat de un singur fenomen cauză; - Legături statistice: legături ce se întâlnesc atunci când un fenomen este rezultatul combinării mai multor cauze ce pot acţiona în acelaşi sens sau în sensuri diferite generând forme de manifestare individuale. Se poate spune că avem de-a face cu o legătură statistică atunci când un fenomen efect depinde de un fenomen cauză, dar asupra sa mai acţionează şi alţi factori de influenţă a căror acţiune se consideră constantă din puncul de vedere al legăturii studiate. b) După numărul variabilelor considerate: - Legături simple: legătura ce se stabileşte între două variabile, din care, una este variabila cauză, factorială, notată cu X, iar cealaltă este variabila efect, rezultativă, notată cu Y; - Legături multiple: atunci când legătura se stabileşte între trei sau mai multe variabile dintre care una este rezultativă, iar celelalte sunt factoriale, notate X 1 , X 2 , ...; c) După modul de exprimare a variabilelor considerate:

description

curs

Transcript of Statistic a Curs 7

Page 1: Statistic a Curs 7

TEMA 4 TEMA 4

ANALIZA STATISTICĂ A LEGĂTURILOR DINTREANALIZA STATISTICĂ A LEGĂTURILOR DINTRE FENOMENEFENOMENE

Curs 7

4.1. Tipuri de legături între fenomenele reale4.2. Metode şi procedee de stabilire a existenţei şi formei corelaţiei simple4.3. Metoda regresiei4.4. Metoda corelaţiei4.5. Metode neparametrice pentru măsurarea corelaţiilor

4.1. TIPURI DE LEGĂTURI ÎNTRE FENOMENELE REALE

Între fenomenele şi procesele reale se identifică diferite forme de influenţe reciproce, dintre care cea mai mare parte se manifestă ca legături de cauzalitate, bazate pe relaţia cauză-efect. Se deosebesc următoarele tipuri de legături:

a) După natura relaţiei de cauzalitate:

- Legături funcţionale: legături ce se întâlnesc foarte rar şi se manifestă atunci când fenomenul efect este influenţat de un singur fenomen cauză;

- Legături statistice: legături ce se întâlnesc atunci când un fenomen este rezultatul combinării mai multor cauze ce pot acţiona în acelaşi sens sau în sensuri diferite generând forme de manifestare individuale. Se poate spune că avem de-a face cu o legătură statistică atunci când un fenomen efect depinde de un fenomen cauză, dar asupra sa mai acţionează şi alţi factori de influenţă a căror acţiune se consideră constantă din puncul de vedere al legăturii studiate.

b) După numărul variabilelor considerate:

- Legături simple: legătura ce se stabileşte între două variabile, din care, una este variabila cauză, factorială, notată cu X, iar cealaltă este variabila efect, rezultativă, notată cu Y;

- Legături multiple: atunci când legătura se stabileşte între trei sau mai multe variabile dintre care una este rezultativă, iar celelalte sunt factoriale, notate X1, X2, ...;

c) După modul de exprimare a variabilelor considerate:

- Legături de asociere: legături ce se stabilesc între variabile calitative (a căror exprimare este în cuvinte), sau între o variabilă cantitativă şi una calitativă;

- Legături de corelaţie: legături între două sau mai multe variabile cantitative. Legăturile de corelaţie pot fi simple sau multiple. Pentru simplitate le vom numi corelaţii.

d) După direcţia lor:

- Legături directe: atunci când modificarea variabilei (sau variabilelor) factoriale atrage după sine modificarea în acelaşi sens a variabilei rezultative;

- Legături inverse: Atunci când modificarea variabilei factoriale într-un sens sau altul determină modificarea variabilei rezultative în sens opus.

e) După forma de realizare a legăturii:

- Legături liniare: legături în cadrul cărora modificările rezultativei determinate de variaţia facorialei sau factorialelor se produc în progresie aritmetică;

- Legături neliniare: în cadrul acestor legături tendinţa variabilităţii rezultativei este neliniară putând fi exponenţială, parabolică etc.

Page 2: Statistic a Curs 7

f) După timpul de realizare:

- Legături concomitente (sincrone) – atunci când influenţa variabilei factoriale se observă imediat asupra variabilei rezultative;

- Legături cu decalaj (asincrone) – atunci când influenţa variabilei factoriale se observă după un anumit timp.

Analiza statistică a legăturilor dintre fenomenele reale cuprinde în fapt mai multe probleme fundamentale şi anume: stabilirea existenţei legăturii, problema regresiei care constă în descrierea legii de variaţie medie a unei variabile în funcţie de altă variabilă cu ajutorul funcţiei de regresie şi problema măsurării intensităţii legăturii printr-un coeficient numeric independent de unităţile de măsură ale variabilelor corelate.

Utilizarea corectă a metodelor statistice pentru cercetarea legăturilor dintre fenomene presupune o analiză prealabilă pentru identificarea corectă a legăturilor de cauzalitate. Valoarea caracterizării legăturilor dintre fenomenele economice depinde în mod hotărâtor de respectarea unor condiţii preliminare:

- determinarea şi explicarea cauzelor reale care generează legătura respectivă;

- verificarea existenţei legăturii cu una din metodele elementare;

- stabilirea formei ecuaţiei de regresie ce descrie relaţia dintre variabila rezultativă şi variabilele factoriale incluse în model;

- existenţa unui număr mare de date statistice omogene.

4.2. METODE DE STUDIERE A LEGĂTURILOR

DINTRE FENOMENE

Un prim pas în analiza legăturilor dintre fenomene îl reprezintă stabilirea existenţei acesteia şi dacă există identificarea formei acesteia. În acest scop pot fi aplicate atât metode şi procedee simple cât şi metode analitice bazate pe instrumentarea de modele matematice. Metodele şi procedeele de interpretare a existenţei şi formei legăturilor au menirea de a ne oferi posibilitatea cunoaşterii existenţei sau lipsei de legătură; direcţiei de realizare a legăturii; aprecierea vizuală a formei şi intensităţii legăturii. Cel mai frecvent folosite astfel de metode sunt: metoda grupărilor, metoda tabelului de corelaţie şi metoda grafică.

4.2.1. METODA GRUPĂRILOR

- Această metodă constă în gruparea unităţilor statistice în funcţie de variaţia factorialei şi calculul mediilor de grupă pentru variabila rezultativă.

Tabelul 4.1. Modul de prezentare a tabelului pentru metoda grupării

Variantele caracteristicii factoriale xi

Variantele caracteristicii rezultative yi

Media grupei

x1 y11, y12, ...y1j..., y1p

x2 y21, y22, ...y2j..., y2p

... ... ...xi yi1, yi2, ...yij..., yip

... ... ...xk yk1, yk2, ...ykj..., ykp

Page 3: Statistic a Curs 7

Comparând tendinţa mediilor cu tendinţa valorilor se pot stabili următoarele aspecte:

- existenţa corelaţiei, aceasta fiind sugerată de tendinţele celor două şiruri de date. Dacă valorile celor k medii de grupă sunt egale, între cele două variabile, Y şi X, nu există corelaţie;

- sensul corelaţiei, acesta fiind dat de sensul celor două tendinţe. Dacă cresc sau

scad ca urmare a creşterii sau scăderii în mod corespunzător a valorilor înseamnă că

între cele două variabile este o corelaţie directă. Dacă scad pe măsură ce cresc, între cele două variabile este o corelaţie inversă.

4.2.2. METODA TABELULUI DE CORELAŢIE

Această metodă constă în gruparea unităţilor statistice după ambele variabile, tabelul de corelaţie fiind de fapt tabelul distribuţiei bidimensionale, caracteristica principală fiind variabila factorială, iar caracteristica secundară cea rezultativă. Această metodă se aplică în cazul unui număr mare de observaţii.

Tabelul. 4.1. Tabelul de corelaţie

Grupe după caracteristica X

Subgrupe după caracteristica Y Total grupa iG(y1) ... G(yj) ... G(yp)

G(x1) f11 ... f1j ... f1p

G(x2) f21 ... f2j ... f2p

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

G(xi) fi1 ... fij ... fpi

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

G(xk) fk1 ... fkj ... fkp

Total grupa j

Cu ajutorul acestui tabel se pot cunoaşte:

- existenţa corelaţiei, ce va fi sugerată de modul de amplasare a frecvenţelor fij în jurul uneia dintre diagonalele tabelului. Dacă aceste frecvenţe sunt dispuse haotic în tot spaţiul din interiorul tabelului, avem fie o corelaţie foarte slabă, fie nu există o legătură de corelaţie între cele două variabile;

- sensul corelaţiei – este dat de sensul deplasării frecvenţelor de-a lungul uneia dintre diagonalele tabelului. Dacă aceste frecvenţe se deplasează din zona valorilor mici ale celor două variabile spre zona valorilor mari, corelaţia este directă. Dacă deplasarea frecvenţelor se face din

Page 4: Statistic a Curs 7

zona valorilor mari ale rezultativei spre zona valorilor mici pe măsură ce valorile cresc, între cele două variabile există o corelaţie inversă;

- natura corelaţiei, este sugerată de aliura fâşiei frecvenţelor. Dacă aceste frecvenţe se dispun în jurul diagonalei în aşa fel încât suma frecvenţelor situate deasupra diagonalei să fie aproximativ egală cu suma frecvenţelor situate dedesubtul acesteia, corelaţia este liniară. Dacă fâşia frecvenţelor are o tendinţă neliniară, atunci corelaţia este de acelaşi tip;

- intensitatea corelaţiei, poate fi apreciată în funcţie de gradul de aglomerare a frecvenţelor în jurul uneia dintre diagonale. Cu cât frecvenţele sunt situate mai aproape de diagonală, deci cu atât fâşia este mai îngustă, cu atâtintensitatea corelaţiei este mai mare. Cu cât gradul de împrăştiere a frecvenţelor este mai mare cu atât intensitatea corelaţiei este mai slabă.

4.2.3. METODA GRAFICĂ

Această metodă constă în costruirea corelogramei şi interpretarea acesteia.

Pe abscisă se trec valorile - ale variabilei X considerată factorială, iar pe

ordonată valorile ale variabilei rezultative Y.

Intersecţiile dintre perpendicularele ridicate de pe abscisă din dreptul valorilor

şi paralele duse de pe ordonată din dreptul valorilor formează corelograma sau graficul norului de puncte.

Cu ajutorul corelogramei se pot cunoaşte următoarele aspecte:

- existenţa corelaţiei, sugerată de existenţa unghiului α dintre tendinţa corelogramei şi orizontală. Dacă linia de tendinţă este paralelă cu orizontala, deci unghiul α dintre ele este nul, între cele două variabile nu există corelaţie;

- sensul corelaţiei, este dat de sensul tendinţei coelogramei;

- natura corelaţiei, este sugerată de aliura tendinţei corelogramei;

- intensitatea corelaţiei, este apreciată în funcţie de mărimea unghiului α.

Cu cât unghiul este mai mare cu atât intensitatea este mai mare. Semnificative sunt valori ale măsurii unghiului cuprinse între 0 şi 45º. În figurile 4.1-4.3 sunt reprezentate grafic prin corelogramă diverse tipuri de legături.

După ce se verifică existenţa legăturii statistice cu una din metodele prezentate se pot efectua în continuare calculele cerute de metoda regresiei şi indicatorii de corelaţie.

Corelatie directa

x

y

y=ax+b

Corelatie inversa

x

y

y=ax-b

Fig. 4.1. Legături liniare

Page 5: Statistic a Curs 7

Legatura functionala inversa

x

y

y=a-bx

Legatura functionala directa

x

y

y=bx

Fig. 4.2. Legături liniare de tip funcţional

Lipsa de corelatie

x

y

Lipsa de corelatie

x

y

Fig. 4.3. Independenţă între variabile